Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Основные характеристики вариационного ряда

Построение вариационного ряда является только первым шагом в изучении статистических данных. Для более глубокого исследования материала необходимы обобщающие количественные показатели, вскрывающие общие свойства статистической совокупности. Существуют две группы характеристик вариационного ряда: 1) меры уровня, или средние, 2) меры рассеяния.

Меры уровня, или средние. Наиболее употребительными в статистических исследованиях являются три вида средних: средняя арифметическая, мода и медиана.

Выбор типа средней для характеристики вариационного ряда зависит от цели, для которой исчисляется средняя, от особенностей исходного материала и от возможностей той или иной средней.

Прежде чем перейти к характеристике отдельных видов средней, сформулируем некоторые, самые общие требования к средней.

Средняя, представляет собой количественную характеристику качественно однородной совокупности. Нарушение этого требования приводит к неверным выводам, искажает суть явления.

Приведем пример, рассмотренный В. И. Лениным. Исследуя арендные отношения в крестьянских хозяйствах Таврической губернии, В. И. Ленин установил, что среди бедняцких элементов деревни в среднем на одно хозяйство арендовалось 2,4 дес. земли, а среди кулацких элементов - 48,6 дес. Формальный подход дает математически верную среднюю для всех крестьянских хозяйств- 12,4 дес. Но подобная средняя является совершенно фиктивной. "Не смешно ли брать "средний" размер аренды, складывая вместо крестьян, из которых один берет 2 десятины, за безумную - цену (15 руб.), очевидно, из крайней нужды, на разорительных условиях. А другой берет 48 десятин, сверх достаточного количества своей земли, "покупая" землю оптом несравненно дешевле, по 3,55 руб. за десятину?" (Ленин В. И. Поли. собр. соч., т. 3, с. 73).

Кроме того, необходимо, чтобы средняя не была слишком абстрактной, а имела ясный смысл в решении задачи.

Далее, желательно, чтобы процедура вычисления средней была проста. При прочих равных условиях предпочтение отдается той средней, которая проще вычисляется.

И, наконец, при выборе средней желательно свести к минимуму влияние случайных колебаний выборки. Так, если одной и той же совокупности взять несколько групп элементов, то средние, им соответствующие, будут, как правило, различаться по величине. Рекомендуется использовать вид средней, у которой эти различия минимальны.

Наиболее распространенной мерой уровня - является средная арифметическая:

Ср.арифметичкская: х1+х2+х3 деленное на N

Средняя арифметическая в3вещенная – исполь3уется в тех случаях, когда нужно найти среднее арифметическое данных уже сведеных в вариационный ряд.

 

где - знак суммирования от 1 до k; xi-варианты с порядковым номером i; - объем совокупности (число элементов совокупности); ni- частота варианта xi, k - число варианта. Если вместо частоты заданы частости qi, то формула имеет вид

 

 

Пример 5. Вычислим среднюю арифметическую для данных табл.

 

Кроме средней арифметической широкое распространение имеет другой вид мер уровня - медиана.

Медианой (обозначим Mе) называется такое значение варьирующего признака, которое приходится на середину вариационного ряда. Медиану исполь3уют, когда число наблюдений достаточно велико. Медиану можно исполь3овать, когда нахождение средней арифметической нецелесообра3но и3-3а неравномерности вариационного ряда.

5 10 10 55 68

Медиана 10

Если число вариант четно (k=2m). Me,=(xm+xm+1)/2, т.е. медиана принимается равной полу сумме находящихся в середине ряда вариант.

Медиану не следует использовать, когда число наблюдений невелико.

Наряду со средней арифметической и медианой важное значение как мера уровня имеет мода.

Модой (обозначим Мо) называется варианта, наиболее часто встречающаяся в данном вариационном ряду.

Для дискретного ряда мода равна варианте с наибольшей частотой или частостью.

Для интервального вариационного ряда модальный интервал, т. е. интервал, содержащий моду, определяется по наибольшей' частоте (частости) в случае равных интервалов и по наибольшей плотности в случае неравных интервалов. Значение варианты, равное моде, отыскивается приближенными методами.

Довольно грубое приближение можно получить, взяв за моду центральное значение модального интервала, т. е. среднее арифметическое границ интервала.

Пример 9. Вычислим моду по данным табл. 6. В последнем столбце табл. 6 вычислены плотности распределения.

Наибольшая плотность соответствует интервалу 4-8. Это и есть модальный интервал.

Рассчитываем моду:

Mo=(4+8)/2=6 (дес.).

Таким образом, получаем, что наиболее типичным по размеру посева хозяйством русских переселенцев, Чимкентского уезда в 1908 г. было хозяйство, засевавшее 6 дес. земли.

Мода имеет те же достоинства, что и медиана. Мода и медиана эффективно используются в качестве мер уровня, но сравнительно со средней арифметической реже употребляются как исходный материал для более сложных методов математической статистики.

Меры рассеяния. Рассмотренные выше средние показывают уровень вариационного ряда, другими словами, позволяют ряд чисел охарактеризовать одним числом. Однако средние не содержат в себе информации о том, насколько хорошо они представляют всю совокупность. Одинаковые или близкие по величине средние могут относиться к весьма различным рядам. Для пояснения этого положения рассмотрим условный пример.

Пример 10. В табл. 7 приведены данные о возрасте (для простоты число их невелико).

Рассчитав, получаем, что средний возраст в 1-й и 2-fi группах одинаков и равен 36. Но простейшее сравнение этих двух рядов показывает, что одинаковые средние представляют две совершенно различные по возрастному составу группы, а именно: в 1-ю группу входят люди в зрелом возрасте, тогда как во 2-ю-старики и дети. Иначе говоря, варианты первого ряда довольно тесно группируются вокруг своей средней, т. е. средняя представительна, тогда как во втором ряду обнаруживается сильный разброс (рассеяние) вариант. Чтобы отметить подобные различия, в статистике прибегают к расчету показателей, характеризующих рассеяние признака (мер рассеяния).

Рассмотрим основные меры рассеяния: размах вариации, дисперсию и среднее квадратичное отклонение.

Размах вариации показывает разность между наибольшим и наименьшим значениями признака (R=xmax-xmin). Ра3мах вариации иногда на3ывают интервал. Достоинством этого показателя является простота расчета. Однако возможности его применения ограничены, так как эта характеристика является наиболее грубой из всех мер рассеяния.

Во-первых, при расчете этого показателя рассеяния признака используются только крайние значения признака, остальные же во внимание не принимаются. Во-вторых, размах вариации существенно зависит от случайных колебаний выборка.

Более ценными для характеристики рассеяния признака являются показатели, при расчете которых используются отклонения всех вариант от некоторой средней (например, средней арифметической, медианы). К таким мерам рассеяния, в частности, относятся дисперсия и среднее квадратичное отклонение. Последние меры рассеяния меньше любой другой меры подвержены случайным колебаниям выборки. Среднее квадратичное отклонение и дисперсия нашли широкое применение почти во всех разделах математической статистики.

Дисперсия, или средний квадрат отклонения (обозначим σ2) есть средняя арифметическая из квадратов отклонений вариант от их средней арифметической, т. е. в математической записи

Часто для исследования удобно представлять меру рассеяния в тех же единицах измерения, что и варианты. Тогда вместо дисперсии используют среднее квадратичное отклонение, которое является квадратным корнем из дисперсии, т. е. среднее квадратичное отклонение вычисляется по формуле

Рассмотренные выше меры рассеяния (размах вариации, дисперсия, среднее квадратичное отклонение) являются абсолютными величинами, судить по ним о степени колеблимости признака не всегда можно, в некоторых задачах необходимо использовать относительные показатели рассеяния. Таким показателем является коэффициент вариации.

Коэффициент вариации (обозначим V) представляет собой отношение среднего квадратичного отклонения к средней арифметической, выраженное в процентах, т. е.

 

Коэффициент вариации позволяет: 1) сравнивать вариацию одного и того же признака у разных групп объектов, 2) выявить степень различия одного и того же признака у одной и той же группы объектов в разное время, 3) сопоставить вариацию разных признаков у одних и тех же групп объектов.

 

 

<== предыдущая лекция | следующая лекция ==>
Графическое представление вариационных рядов | Информация, сообщение, сигналы
Поделиться с друзьями:


Дата добавления: 2013-12-13; Просмотров: 7059; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.018 сек.