Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Показатели вариации. Структурные средние используются для характеристики структуры совокупности

Структурные средние

 

Структурные средние используются для характеристики структуры совокупности. К ним относятся мода и медиана.

Мода - это значение признака, которое наблюдается наибольшее число раз.

В дискретном ряду модой является вариант с наибольшей частотой. Для интервального ряда мода исчисляется по формуле:

(f мо - f мо-1)

Мо = Xмо + i мо ————————————

(f мо - f мо-1) + (f мо - f мо+1)

 

где Xмо - нижняя граница модального интервала;

i мо - величина модального интервала;

f мо - частота, соответствующая модальному интервалу;

f мо-1 - частота интервала, предшествующего модальному;

f мо+1 - частота интервала, следующего за интервальным.

Модальным интервалом называется интервал с наибольшей частотой.

 

Медиана - это значение признака, приходящееся на середину ранжированного ряда наблюдений.

Если дискретный ряд имеет четное количество вариантов, за медиану принимается средняя арифметическая двух серединных значений. То есть, медиана делит ряд на две равные части: одни значения ряда меньше медианы, другие - больше.

В интервальном статистическом ряду распределения медиана располагается там, где накопленная частота составляет половину или больше полусуммы частот. При этом накопленная частота значений перед медианой меньше половины численности совокупности. Медиана для интервального ряда распределения рассчитывается по формуле:

Σf / 2 – Sме-1

Ме = Хме + i ме ——————

f ме

где Хме - нижняя граница медианного интервала;

i ме - величина медианного интервала;

i ме f - полусумма частот ряда распределения;

Sме-1 - накопленная частота интервала, предшествующего медианному интервалу;

f ме - частота медианного интервала.

 

Для определения медианного интервала следует сначала вычислить порядковый номер медианы, который равен полусумме частот. Медианным интервалом будет являться тот интервал, где будет находиться порядковый номер (ранг), превышающий полусумму частот. Порядковый номер медианы рассчитывается по формуле:

Σ f

q ме = —— + 0,5.

Как уже было сказано, средние величины характеризуют наиболее общие свойства, закономерности всех единиц совокупности. Индивидуальные различия признаков в средних явно не проявляются. Тем не менее, при изучении статистической совокупности необходимо бывает исследовать общие черты формирования обобщающих показателей. Для этого рассчитываются показатели вариации.

Показатели вариации выполняют следующие функции:

1. Дополняют средние величины;

2. Определяют границы вариации признака;

3. Характеризуют степень однородности совокупности;

4. Выражают взаимосвязь признаков.

Показатели вариации делятся на три группы – абсолютные, средние и относительные.

К абсолютным показателям относятся размах вариации, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение. Относительные показатели исчисляются путем деления абсолютных показателей выариации на среднюю арифметическую или на медиану. Относительными показателями вариации являются коэффициенты вариации, осцилляции, относительное линейное отклонение и др.

Простейшим показателем вариации является размах вариации:

R = xмах – x мин

Вариационный размах показывает, насколько велико различие между единицами совокупности, имеющими самое большое и самое маленькое значения признака. Размах вариации помогает определять влияние постоянно действующих факторов (причин) на устойчивое колебание изучаемых варьируемых признаков.

При использовании этого показателя следует иметь в виду, что крайние значения признака могли быть вызваны случайными обстоятельствами и поэтому являются аномальными. В этом случае вариационный размах дает искаженную амплитуду колебаний против нормальных (обычных) размеров. В целях исключения влияния случайных факторов перед исчислением размаха вариации необходимо исключить из совокупности аномальные значения признака. Например, при исчислении среднего показателя числа умерших за год на основе данных за несколько лет, не следует не принимать в расчет данные за год, в котором произощло землятресение, приведшее к многочисленным жертвам, так как землятресения происходят не часто и не являются обычным условием развития общества.

Вариационный размах, отражая нормальные (обычные) границы колеблемости признака, не полностью характеризует его вариацию. Размах вариации не отражает изменение вариантов внутри совокупности и распределение их вокруг центра – средней величины.

Мерами рассеяния наблюдений вокруг средней арифметической являются среднее линейное отклонение, дисперсия и среднее квадратическое отклонение.

Среднее линейное отклонение находится как средняя арифметическая из абсолютных значений отклонений вариант х от их средней величины х‾:

 

 

∑│х i- х‾ │ f i

d = ——————

∑ f i

 

В числителе отклонения вариант от средней величины взяты по модулю (абсолютной величине), иначе сумма будет равна нулю в соответствие со свойством средней арифметической. Поэтому среднее линейное отклонение желательно применять только в тех случаях, когда суммирование показателей без учета знаков (-) и (+) имеет экономический смысл.

То, что в среднем линейном отклонении суммируются одновременно и положительные и отрицательные значения, является недостатком этого показателя. Поэтому математики и статистики стали искать другой метод оценки вариации признака, при котором все отклонения имели бы положительное значение. В качестве такого простейшего показателя стали применять показатели отклонений вторых степеней - дисперсия σ2 и среднее квадратическое отклонение σ.

Дисперсия признака представляет собой средний квадрат отклонений индивидуальных значений признака х от их средней величины. Она может вычисляться по формуле простой арифметической и взвешенной арифметической в зависимости от исходных данных. Если данные не сгруппированы расчет ведется по простой арифметической, для сгруппированных данных – по взвешенной арифметической.

 

∑(х - х‾)2

σ2 = ———— - общая дисперсия признака х, рассчитанная по формуле

n средней арифметической простой;

 

∑(х - х‾)2 f

σ2 = ————— - общая дисперсия признака х, по формуле

∑ f средней арифметической взвешенной.

 

Среднее квадратическое отклонение σ = ± √ σ2

 

При нормальном распределении существует зависимость между величиной среднего квадратического отклонения и количеством наблюдений:

- в пределах (х ср. ± 1σ) располагается 68,3% количества наблюдений;

- в пределах (х ср. ± 2 σ) - 95,4%;

- в пределах (х ср. ± 3 σ) - 99,7% количества наблюдений.

На практике почти не встречается отклонение, превышающее 3 σ, поэтому отклонение 3 σ считается максимальным, а это положение называют "правилом трех сигм".

Для распределений близких к нормальному совокупность считается однородной, если коэффициент вариации не превышает 33%.

Общая дисперсия признака х характеризует вариацию признака, которая зависит от всех условий в данной совокупности. Кроме общей дисперсии могут исчисляться также межгрупповая и внутригрупповая дисперсии.

Межгрупповая дисперсия отражает вариацию изучаемого признака х под влиянием признака-фактора, положенного в основу группировки. Она характеризует колеблемость групповых средних x j около общей средней xo:

 

∑(х j – х о)2 f

δ2 = —————

∑ f

 

Внутригрупповые дисперсии характеризуют вариацию индивидуальных значений признака вокруг групповых средних внутри отдельных групп х j под влиянием случайных факторов:

∑(х – х j)2 f

σ2 j = —————

∑ f

 

Между тремя видами дисперсий существует закон или правило сложения дисперсий:

σ2 = δ2 + σ2 j ср.

где σ2 j - средняя из внутригрупповых дисперсий;

∑ σ2 j f j

σ2 j ср. = —————

∑ f j

 

Иначе говоря, общая дисперсия, возникающая под воздействием всех факторов, равна сумме дисперсии, возникающей за счет влияния группировочного признака и дисперсии, появляющейся под влиянием прочих факторов.

Относительным показателем вариации является коэффициент вариации, характеризующий колеблемость признака в процентах от средней величины:

σ

V = —— 100

х ср.

 

Коэффициент вариации используется для оценки однородности статистической совокупности. Если его значение меньше 40% - совокупность считается однородной.

 

 

<== предыдущая лекция | следующая лекция ==>
Средние величины. Степенные средние | Способы отбора единиц совокупности и виды выборки
Поделиться с друзьями:


Дата добавления: 2014-01-20; Просмотров: 374; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.023 сек.