Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Метод средних величин, вариационный анализ,




Характеристики рядов распределения, сущность средней величины; виды средних величин и их свойства; показатели вариации и способы их расчета; виды дисперсий; правило сложения дисперсий; показатели формы; статистические гипотезы

При изучении социально экономических явлений их характеризующие признаки изменяются, варьируются под воздействием многих причин, называемых в статистике факторами. Исследование вариации является составным элементом анализа, позволяющего оценить колебания признака, его связь с факторами.

Совокупность значений признака называют распределением признака, а представление его осуществляется в виде вариационного ряда (ряд распределения). Вариационный ряд – это сгруппированные значения признака.

С целью обеспечения обработки таких распределений и свертки информации, заключенной в статистических данных, вариационные ряды описывают с помощью определенных числовых характеристик. Такими характеристиками для одномерных статистических рядов являются следующие:

1) частотные характеристики;

2) характеристики центра распределения;

3) характеристики рассеяния (вариации);

4) характеристики формы.

Частотными характеристиками являются:

1 ) частота повторения признака или число вариаций признака, входящего в соответствующий интервал – ;

2) кумулятивная частота (накопленная частота) – ;

3 ) частость;

4) плотность частоты, то есть частота приходящуюся на единицу интервала – .

Характеристики (показатели) центра распределения отражаются в виде:

1) модао) – наиболее часто встречающееся значение признака:

2) медианае) – середина ранжированного ряда;

3) средняя величина (Х) – обобщающий показатель, отражающий типичный уровень варьирующего признака. Она обобщает количественную вариацию признака, погашая индивидуальные различия единиц совокупности, обусловленных случайными обстоятельствами. Имеет большое значение в статистике как один из главных параметров, характеризующих ряд распределения.

Первые две величины используются редко, наибольшее значение в статистике имеют средние величины, которые применяются для разных задач в виде:

1) средней арифметической (наиболее часто используемая): ;

2) средней гармонической (если между показателями существует обратная зависимость, как, например, между числом изготовленных деталей и затратами времени на одно изделие): ;

3) средней геометрической (для рядов динамики): ;

 

4) средней квадратической (в специальных задачах):,

где n – количество значений; xi – текущее значение.

Все приведенные средние отвечают свойству мажорантности средних:

 

Если статистические данные сгруппированы, то используются средние взвешенные, в частности, средняя арифметическая взвешенная:

или, используя частости, .

Средняя арифметическая обладает рядом свойств:

1) если из всех значений признака вычесть некоторую константу С, то и среднее уменьшается на ту же величину;

2) если все значения признака умножить на постоянную С, то и среднее умножается на С;

3) алгебраическая сумма отклонений значений признака от средней арифметической равна нулю;

4) сумма квадратов отклонений значений признака от средней арифметической меньше аналогичной суммы от любой другой меры положения.

Несомненно, что кроме центра распределения единиц совокупности очень важным является степень разбросанности значений относительно центра. Для характеристики этого используется показатель – дисперсия (), которая определяет меру рассеяния вариации признака относительно центра распределения. Часто таким центром является средняя арифметическая, поэтому:

, взвешанная

или через частости .

Дисперсия обладает рядом вычислительных свойств:

1) дисперсия постоянной величины равна нулю;

2) если из всех значений признака вычесть некоторую константу С, то дисперсия не изменится;

3) если все значения признака умножить на С, то дисперсия умножается на С2;

4) дисперсия равна разности средней из квадратов значений признака и квадрата средней арифметической:

 

Дисперсия является вторым главным параметром ряда распределения и характеризует величину разбросанности вариантов признака относительно центра за счет действия всевозможных факторов.

Используя сложную группировку (аналитическую), можно выделить группы, относящиеся к одному признаку–фактору. Если в каждой группе найти частные дисперсии (вариативность признака, зависящая от разных факторов), а затем найти среднюю из этих дисперсий, то она и определит нам разбросанность признака за счет всех факторов, исключая признак-фактор:

 

,

где дисперсия в группе, fi – объем группы, m – количество групп.

Вычислим также межгрупповую дисперсию, которая возникает за счет признака–фактора: ,

где – среднее арифметическое в группе, среднее арифметическое всей совокупности.

Сложив эти дисперсии, должны получить общую дисперсию для всей совокупности, зависящую от всех факторов. То есть:

 

.

 

Полученное выражение представляет теорему сложения дисперсий.

Кроме дисперсии, которая является основной характеристикой рассеяния, существуют другие абсолютные и относительные показатели вариации признака.

Абсолютные показатели отличаются тем, что имеют ту же размерность, что и сам признак:

1) вариационный размах , показывающий пределы изменения признака;

2) среднее абсолютное (линейное) отклонение, показывающее отклонение в абсолютном выражении относительно середины распределения

 

 

3) среднеквадратическое отклонение .

Относительные показатели. Все они определяют долю абсолютной разбросанности, приходящуюся на единицу среднего значения. Если эта доля превышает 33%, то распределение неоднородно, то есть, возможно, отсутствует целостность, велико влияние случайных факторов на изменчивость признаков и т.д.:

1) коэффициент осцилляции ;

2) коэффициент колеблемости (линейного отклонения) ;

3) коэффициент вариации .

Показатели формы. Все показатели формы так или иначе связаны с нормальным распределением, котороеможет быть представлено графически в виде симметричной куполообразной кривой (рис. 2.). Куполообразная форма кривой показывает, что большинство значений концентрируется вокруг центра измерения. Уравнение нормальной кривой (см. рис. 2):

 
 

 


 

,

 

где Y i – ордината кривой нормальногораспределения, π = 3,1415, е = 2,7182 – математические константы, математическое ожидание, σ – среднеквадратическое отклонение.

 

 

Рис. 2. Нормальное распределение

 

Основные особенности кривой нормального распределения.

1. Кривая симметрична относительно максимальной ординаты, которая соответствует значению х =Мо = Me = = a, ее величина равна:

 
 


.

 

 

2. Кривая асимптотически приближается к оси абсцисс. Следовательно, чем больше значения отклоняются от , тем реже они встречаются. Одинаковые по абсолютному значению, но противоположные по знаку отклонения значений переменной Y от равновероятны.

3. Кривая имеет 2 точки перегиба, находящиеся на расстоянии ±σ от .

4. При = const с увеличением σ кривая становится более пологой. При σ = const с изменением кривая не меняет свою форму, а лишь сдвигается вправо или влево по оси абсцисс.

5. В промежутке ± σ находится 68,3% всех значений признака. В промежутке ± 2σ находится 95,4% всех значений признака. В промежутке ± 3σ находится 99,7% всех значений признака.

6. Параметры нормального распределения: , σ2

7. Нормальное распределение с параметрами: = 0 и σ =1 называется стандартным нормальным распределением.

 

Теперь обратимся к показателям формы.

1. Показатель симметричности распределения — коэффициент асимметрии As. Показывает уход симметрии распределения влево или вправо относительно нормаль

 

ного закона и представляет собой третий центральный момент, деленный на куб среднего квадратического отклонения:

.

 

Симметричным является распределение, в котором значения любых двух вариантов, равноотстоящих от центра распределения по обе стороны, равны между собой. Для симметричных одновершинных распределений средняя арифметическая, мода и медиана равны между собой, поэтому нормальное распределение симметрично. Положительная величина показателя асимметрии указывает на наличие левосторонней асимметрии, отрицательная – на наличие правосторонней асимметрии (рис. 3).

Рис. 3. Асимметрия распределения: а) правосторонняя;

б) левосторонняя

 

Величина As может изменяться от – 1 до +1 (для одновершинных распределений). Чем ближе по модулю As к 1, тем асимметрия существеннее.

2. Показатель островершинности распределения – эксцесс. Эксцесс (Ех) представляет собой выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения. Он рассчитывается для симметричных распределений. Наиболее точным является показатель, использующий центральный момент четвертого порядка (М 4)

 

Для нормального распределения отношение М 4 / σ4 = 3, следовательно, эксцесс равен нулю. Наличие положительного эксцесса означает, что распределение имеет вид более островершинный, чем нормальное; отрицательное значение эксцесса означает плосковершинный характер распределения, в отличие от нормального (рис. 4).

 

 

Рис. 4. Эксцесс распределения

 

Нередко полученное статистическое распределение проверяют: можно ли считать данное распределение нормальным. Если распределение отвечает нормальному закону, то на него действуют все приложения теории вероятностей.

Для проверки близости данного распределения к нормальному выдвигается статистическая гипотеза. Статистические гипотезы бывают двух видов: нулевая (Н0 – расхождения нет) и альтернативная (Н1 – существенно расходятся). Для проверки существуют критерии, из которых чаще всего используются χ2 (хи-квадрат), называемый также критерием Пирсона, и t – критерий.

При проверке по критерию Пирсона определяется практическое значение χ2 существующего распределения и сравнивается с теоретическим. Последнее определяется по таблице для заранее намеченной вероятности (если вероятность не оговаривается, то принимают 0,95) и определенной степени свободы, и они сравниваются.

Нулевая гипотеза формулируется таким образом: расхождение теоретического и практического значений χ2 на уровне принятой вероятности несущественно, если практическое значение критерия меньше табличного. А это, в свою очередь, означает, что данное распределение близко по своим свойствам к нормальному закону.

Пример. Имеется распределение отметок 90 учащихся, полученных в контрольной работе. При этом десять учащихся получили оценку 5, двадцать четыре – 4, тридцать – 3, двадцать – 2 и шесть учащихся выполнили работу с оценкой 1. Составим таблицу вычислений.

Для того, чтобы при заданном уровне вероятности (р) проверить гипотезу о нормальном распределении практического ряда, нужно (все вычисления лучше производить в табл., см. табл. 1):

1) вычислить выборочную среднюю = (Σ xi fi) / Σ fi = 262/90 = 3,13;

2) вычислить дисперсию σ2 = Σ(xi)2 fi / Σ fi = 106,41/ 90 = 1,18,

и среднее квадратическое отклонение σ = = 1,1;

3) вычислить теоретические частоты, для чего:

а) определить t = (xi) / σ;

б) по таблице значений плотности вероятности для нормированного нормального закона распределения [3, прил. 4] найти Ф(t);

в) вычислить теоретические частоты, используя формулу ui = (nh /σ)×Ф(t), где n – количество данных, h – шаг между вариантами, или в числовом выражении ui = (90 ×1/1,1)×Ф(t) = (81,82)×Ф(t) = КФ(t), полученные значения округлить и записать в графу ui (см. табл.);

4) сравнить теоретическое и эмпирическое распределение с помощью критерия Пирсона, для этого

а) определить разность эмпирических и теоретических частот Δ ui = fi – ui;

б) найти расчетный χ2расч. = Δ ui2 /ui и вычислить сумму;

в) по таблице распределения Пирсона [3, табл. 5] (распределение χ2) по заданному уровню вероятности и числу степеней свободы вычислить χ2таб. Число степеней свободы вычисляется: k = s – 1 – m, где s – число групп, m – число параметров в законе (в нормальном законе два параметра: среднее арифметическое и дисперсия), поэтому число степеней свободы для данного случая – 2. Отсюда, для вероятности 0,95 и числу степеней свободы 2, χ2таб = 6,0;

г) в расчете получилось χ2расч. < χ2таб., поэтому нет оснований на уровне принятой вероятности отвергнуть нулевую гипотезу.

Таблица 1

 

Таблица вычислений

 

Оценка хi Частота fi xifi xi (xi)2 fi t Ф(t) КФ(t) ui Δ ui Δ ui2/ ui
      1,87 34,97 1,7 0,094 7,69 7,7 2,3 0,687
      0,87 18,17 0,79 0,292 23,89      
      0.13 0,51 0,12 0,396 32,4 32,4 2,4 0,0309
      1,13 25,54 1,03 0,235 19.22 19,2 0,8 0,0333
      2,13 27,22 1,94 0,061 4.991     0,2
Всего       106,41           0,9512

 

5. Вывод. Следовательно, заданное распределение на уровне вероятности 0,95 отвечает нормальному закону. Если бы было иначе, пришлось бы принять альтернативную гипотезу, что данное распределение для выбранной вероятности не отвечает нормальному закону.

 




Поделиться с друзьями:


Дата добавления: 2014-01-11; Просмотров: 1226; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.051 сек.