Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Немного о дисперсионном анализе 3 страница




Рассчитывают b = åank´Dk (в нашем примере 1,49863) и сумму квадратов отклонений SS = å(xi)2(в нашем примере 2,636). Остается определить W = b2: SS = 1,498632: 2,636 =»0,852 и сравнить с соответствующим табличным значением (оно равно 0,842). Так как Wрасч > Wa, распределение можно рассматривать как нормальное.

Таблица 6.12

Граничные значения W-критерия Шапиро-Уилки для

проверки гипотезы о нормальности распределения

n a=0,05 a=0,01 n a=0,05 a=0,01 n a=).05 0,01a
  0,842 0,781   0,908 0,873   0,930 0,904
  0,850 0,792   0,911 0,878   0,931 0,906
  0,859 0,805   0,914 0, 881   0,933 0,908
  0,866 0,814   0,916 0,884   0,935 0,912
  0,874 0,825   0,918 0,888   0,938 0,916
  0,881 0,835   0,920 0,891   0,940 0,919
  0,887 0,844   0,923 0,894   0,942 0,922
  0,892 0,851   0, 924 0,896   0,944 0,924
  0,897 0,858   0,926 0,898   0,945 0,927
  0,901 0,863   0,927 0,900   0,947 0,929
  0,906 0,868   0,929 0,902   0,947 0,930

 

c2-критерий. Для выборок объемом n ³ 40, упорядоченных в форме интервального вариационного ряда, существует более мощный критерий согласия — c2-критерий, его использование предпочтительно. Рассмотрим процедуру c2-критерия на конкретном примере определения, можно ли считать распределение совокупности достаточно близким к нормальному, чтобы в расчетах считать его таковым. Возьмем 50 результатов, показанных в беге на 100 м.

12,4–13,1 13,2–13,9 14,0–14,7 14,8–15,5 15,6–16,3 16,4–17,1 17,2–17,9

1 2 9 15 17 5 1

Выборка задана интервальным вариационным рядом: верхняя строка – интервалы, заданные их границами, нижняя — частоты интервалов.

1-й этап. Формируем гипотезу Н0: f(x) = f ¢(x), где f(x) — наше распределение, f ¢(x) — нормальное распределение, и выбираем уровень значимости a = 0,05.

2-й этап. Рассчитываем выборочные среднее () и среднее квадратическое (s).

3-й этап. Вычисляем значения интервальных частот (n¢) нормального распределения, для чего нужно вероятности значений вариант при нормальном распределении умножить на объем (n) нашей выборки: n¢i = n{Ф0[(хвi) ½ s] –Ф1[(хнi) ½ s]}, где (х) ½ s = u, Ф0 и Ф1 – функции Лапласа, хнi и хнi – соответственно верхняя и нижняя границы i -того интервала вариационного ряда. Конкретные значения функции Лапласа (Ф) найдем по табл. 6.12.

Таблица 6.12

Удвоенные значения функции Лапласа (Ф) (ноль и запятая

убраны, значения показаны в десятитысячных долях

u 0,00 0,02 0,04 0,06 0,08 u 0,00 0,02 0,04 0,06 0,08
0,0           1,9          
0,1           2,0          
0,2           2,1          
0,3           2,2          
0,4           2,3          
0,5           2,4          
0,6           2,5          
0,7           2,6          
0,8           2,7          
0,9           2,8          
1,0           2.9          
1,1           3,0          
1,2           3,1          
1,3           3,2          
1,4           3,3          
1,5           3,4          
1,6           3,5          
1,7           3,6          
1,8           3,7          

 

Построим расчетную таблицу для нашего примера и поэтапно заполним ее столбцы.

Таблица 6.13

Расчетная таблица c2-критерия

№ п/п Границы интервалов Частоты интервалов ni Нормированные границы интервалов Частоты нормального распределения n¢i nii (ni ) i
хвi xнi uнi uвi
  12,4 13,2   }12 –3,33 –2,44 0,345 }12,551    
  13,2 14,0   –2,44 –1,56 2,603 –0,551 0,024
  14,0 14,8   –1,56 –0,67 9,603    
  14,8 15,6   –0,67 0,22   –1,780 0,189
  15,6 16,4   0,22 1,11   3,027 0,658
  16,4 17,2   } 6 1,11 2,00 5,538 } 6,578 –0,578 0,051
  17,2 18,0   2,00 2,89 1,040    

Сумма: = 50 = 49,882 = 0,992

1- столбец — порядковые номера интервалов. 2-й и 3-й — границы интервалов. 4-й столбец — частоты этих интервалов, причем первые 3 объединены в один (в интервале должно быть не менее 5 вариант) и последние 2 — тоже. 5-й и 6-й столбцы — соответствующие нормированные границы интервалов. 7-й столбец — частоты соответствующего рассматриваемой нашей совокупности нормального (теоретического) распределения (первые 3 и последние 2 также объединены). 8-й столбец — разность интервальных частот нашего и нормального распределений. Сумма чисел 9-го столбца — и есть расчетное значение c2-критерия. У нас c2 =),992, сравниваем это значение с табличным (см. табл. 6.14), при этом число степеней свободы n = k –3 (в нашем случае k = 4, значит n = 1. При n = 1 табличное значение c2 = 3,84. Следовательно, поскольку c2 < c20,05 , наше эмпирическое распределение соответствует нормальному на уровне значимости 0,05. В заключение приведем таблицу критических значений c2-критерия (критерия «хи-квадрат»).

Таблица 6.14

Критические значения c2-критерия

n a n a n a
0,05 0,01 0,05 0,01 0,05 0,01
  3,84 6,63   19,68 24,72   32,67 38,93
  5,99 9,21   21,03 26,22   33,92 40,29
  7,81 11,34   22,36 27,69   35,17 41, 64
  9,49 13,28   23,68 29,14   36,42 42,98
  11,07 15,09   25,00 30,58   37,65 44,31
  12,59 16,81   26,30 32,00   38,89 45,64
  14,07 18,48   27,59 33,41   40,11 46,96
  15,51 20,09   28,87 34,81   41,28 48,28
  16,92 21,67   30,14 36,19   42,56 49,59
  18,31 23,21   31,41 37,57   43,77 50,89

 

Сравнивать выборки, ориентируясь на их средние арифметические, — не единственный путь определения значимости их различия. Выборки из одной генеральной совокупности, формируемые существенно случайным образом и так, чтобы быть репрезентативными этой генеральной совокупности, с большой вероятностью имеют сходные распределения частот и вариативности, а если распределения и вариативности значительно различаются, это можно воспринимать как свидетельство принадлежности выборок к разным генеральным совокупностям. Поскольку для совокупностей с нормальным распределением частот информативной характериcтикой как самого распределения, так и его вариативности является дисперсия (s2), ее можно использовать для сравнения таких совокупностей. Адекватным критерием является F-критерий Фишера (табл. 6.15 граничных значений этого критерия). Возьмем те же выборки: (критерий определяется делением квадрата большей дисперсии на квадрат меньшей, в данном случае s x2 на s y2). Поскольку Fp < F0,05 , следует сделать вывод: различие выборок незначимо, оно может быть случайным — 0-гипотеза (Но) подтверждается.

Таблица 6.15

Граничные значения F-критерия Фишера при a = 0,05

 

n1 n2                    
                     
  19,0 19,3 19,4 19,4 19,4 19,5 19,5 19,5 19,5 19,5
  9,55 9,01 8,78 8,70 8,66 8,62 8,58 8,56 8,54 8,54
  6,94 6,26 5,96 5,86 5,80 5,74 5,70 5,66 5,65 5,64
  5,79 5,05 4,74 4,62 4,56 4,50 4,44 4,40 4,38 4,37
  5,14 5,39 4,06 3,94 3,87 3,81 3,75 3,71 3,69 3,68
  4,46 3,69 3,34 3,22 3,15 3,08 3,03 2,98 2,96 2,94
  4,10 3,33 2,97 2,84 2,77 2,70 2,64 2,59 2,56 2,55
  3,88 3,11 2,76 2,62 2,54 2,46 2,40 2,35 2,32 2,31
  3,74 2,96 2,60 2,46 2,39 2,31 2,24 2,19 2,16 2,14
  3,63 2,85 2,49 2,35 2,28 2,20 2,13 2,07 2,04 2,07
  3,55 2,77 2,41 2,27 2,19 2,11 2,04 1,98 1,95 1,93
  3,49 2,71 2,35 2,21 2,12 2,04 1,96 1,90 1,87 1,85
  3,38 2,60 2,24 2,09 2,00 1,92 1,84 1,77 1,74 1,72
  3,32 2,53 2,16 2,02 1,93 1,84 1,76 1,69 1,66 1,62
  3,18 2,40 2,02 1,88 1,78 1,69 1,60 1,52 1,48 1,44
  3,09 2,30 1,92 1,77 1,68 1,57 1,48 1,39 1,34 1,30
  3,04 2,26 1,87 1,72 1,62 1,52 1,42 1,32 1,26 1,22
  3,02 2,23 1,85 1,70 1,60 1,49 1,38 1,28 1,22 1,16

Дисперсионный анализ позволяет оценивать влияние на вариативность рассматриваемого признака отдельных факторов или их сочетаний. На упрощенном примере рассмотрим однофакторный дисперсионный анализ. Пример: по 5 конькобежцев (обозначим их 1, 2,... 5) из 3 различных спортивных школ (назовем их А, Б и В) пробежали 500 м, их результаты показаны в табл. 6.12. Общее число спортсменов N = n1+n2+n3 =15.

Таблица 6.16

Результаты спортсменов рассматриваемых групп

Участники С п о р т ш к о л ы
А Б В
       
       
       
       
       
Средние арифметические      

Средние арифметические в группах А, Б и В различны, но неизвестно, случайны эти различия или же характеризуют различия в контингенте спортивных школ. Чтобы выяснить это, нужно проделать следующие операции.

1. Вычислим среднее арифметическое результатов всех 15 спортсменов: так как n1 = n2 = n3, = 49+47+45 = 47, а общая сумма квадратов отклонений (общая вариация Qобщ) равна:

 

Qобщ= åå()2 = (50 – 47)2+ (45 – 47)2+ (45 – 47)2+ (51 – 47)2+

+ (54 – 47)2+ (45 – 47)2+ (43 – 47)2+ (47 – 47)2+ (51 – 47)2+ (49 – 47)2+

+(45 – 47)2+ (43 – 47)2+ (45 – 47)2+ (48 – 47)2+ (44 – 47)2 =

= 9+4+4+16+49+4+16+0+16+4+4+16+4+1+9 = 156

2. Вычислим межгрупповую (межклассовую) вариацию:

Qмг= å = (49 – 47)2 × 5+ (47 – 47)2 × 5+ (45 – 47)2×5 = 40

(здесь индекс «i» относится к номерам групп).

3. Внутригрупповая (внутриклассовая) вариация (Qвг):

Qвг= åå()2= (50 – 49)2+ (45 – 49)2+ (45 – 49)2 + (51 – 49)2+

+ (54 – 49)2+ (45 – 47)2+ (43 – 47)2+ (47 – 47)2 + (51 – 47)2+ (49 – 47)2+

+ (45 – 45)2+ (43 – 45)2+ (45 – 45)2+ (48 – 45)2+ (44 – 45)2 = 116 (здесь

индекс «i» относится к номерам групп, а «j» — к номерам ва-

риант в группах).

4. Проверка: Qобщ должно быть равно Qмг+Qвг. Действительно, в данном случае 156 = 40+116 — наши подсчеты верны.

5. Вычислим общую дисперсию: s общ = Qобщ ï (N – 1) = =156 ï 14 @ 11,1 (N = 15 — общее число испытуемых).

6. Вычислим межгрупповую дисперсию: s мг = Qмг ï (k – 1) = = 40 ï 2 = 20 (k = 3 — число сравниваемых групп, в данном случае — сравниваемых спортшкол).

7. Вычислим внутригрупповую дисперсию:

s вг = Qвг ï (N – k) = 116 ï (15 – 3) @ 9,7.

8. Определяем, подсчитав Fр , значимо ли проявляется в результатах спортсменов принадлежность к той или иной спортшколе:

Fр = s мг ï s вг = 20 ï 9,7 @ 2,1.

Табличное значение F-критерия Fт = 4. Поскольку Fр < Fт, мы должны заключить, что нет основания приписывать различия в оценках (при уровне значимости a = 0,05) различным уровням подготовленности контингента рассматриваемых спортшкол.

Средствами дисперсионного анализа можно находить ответы и на вопросы иного рода, но это уже находится за рамками нашего курса спортивной метрологии.




Поделиться с друзьями:


Дата добавления: 2015-04-30; Просмотров: 517; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.03 сек.