КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Немного о дисперсионном анализе 3 страница
Рассчитывают b = åank´Dk (в нашем примере 1,49863) и сумму квадратов отклонений SS = å(xi – )2(в нашем примере 2,636). Остается определить W = b2: SS = 1,498632: 2,636 =»0,852 и сравнить с соответствующим табличным значением (оно равно 0,842). Так как Wрасч > Wa, распределение можно рассматривать как нормальное. Таблица 6.12 Граничные значения W-критерия Шапиро-Уилки для проверки гипотезы о нормальности распределения
c2-критерий. Для выборок объемом n ³ 40, упорядоченных в форме интервального вариационного ряда, существует более мощный критерий согласия — c2-критерий, его использование предпочтительно. Рассмотрим процедуру c2-критерия на конкретном примере определения, можно ли считать распределение совокупности достаточно близким к нормальному, чтобы в расчетах считать его таковым. Возьмем 50 результатов, показанных в беге на 100 м. 12,4–13,1 13,2–13,9 14,0–14,7 14,8–15,5 15,6–16,3 16,4–17,1 17,2–17,9 1 2 9 15 17 5 1 Выборка задана интервальным вариационным рядом: верхняя строка – интервалы, заданные их границами, нижняя — частоты интервалов. 1-й этап. Формируем гипотезу Н0: f(x) = f ¢(x), где f(x) — наше распределение, f ¢(x) — нормальное распределение, и выбираем уровень значимости a = 0,05. 2-й этап. Рассчитываем выборочные среднее () и среднее квадратическое (s). 3-й этап. Вычисляем значения интервальных частот (n¢) нормального распределения, для чего нужно вероятности значений вариант при нормальном распределении умножить на объем (n) нашей выборки: n¢i = n{Ф0[(хвi – ) ½ s] –Ф1[(хнi – ) ½ s]}, где (х – ) ½ s = u, Ф0 и Ф1 – функции Лапласа, хнi и хнi – соответственно верхняя и нижняя границы i -того интервала вариационного ряда. Конкретные значения функции Лапласа (Ф) найдем по табл. 6.12. Таблица 6.12 Удвоенные значения функции Лапласа (Ф) (ноль и запятая убраны, значения показаны в десятитысячных долях
Построим расчетную таблицу для нашего примера и поэтапно заполним ее столбцы. Таблица 6.13 Расчетная таблица c2-критерия
Сумма: = 50 = 49,882 = 0,992 1- столбец — порядковые номера интервалов. 2-й и 3-й — границы интервалов. 4-й столбец — частоты этих интервалов, причем первые 3 объединены в один (в интервале должно быть не менее 5 вариант) и последние 2 — тоже. 5-й и 6-й столбцы — соответствующие нормированные границы интервалов. 7-й столбец — частоты соответствующего рассматриваемой нашей совокупности нормального (теоретического) распределения (первые 3 и последние 2 также объединены). 8-й столбец — разность интервальных частот нашего и нормального распределений. Сумма чисел 9-го столбца — и есть расчетное значение c2-критерия. У нас c2 =),992, сравниваем это значение с табличным (см. табл. 6.14), при этом число степеней свободы n = k –3 (в нашем случае k = 4, значит n = 1. При n = 1 табличное значение c2 = 3,84. Следовательно, поскольку c2 < c20,05 , наше эмпирическое распределение соответствует нормальному на уровне значимости 0,05. В заключение приведем таблицу критических значений c2-критерия (критерия «хи-квадрат»). Таблица 6.14 Критические значения c2-критерия
Сравнивать выборки, ориентируясь на их средние арифметические, — не единственный путь определения значимости их различия. Выборки из одной генеральной совокупности, формируемые существенно случайным образом и так, чтобы быть репрезентативными этой генеральной совокупности, с большой вероятностью имеют сходные распределения частот и вариативности, а если распределения и вариативности значительно различаются, это можно воспринимать как свидетельство принадлежности выборок к разным генеральным совокупностям. Поскольку для совокупностей с нормальным распределением частот информативной характериcтикой как самого распределения, так и его вариативности является дисперсия (s2), ее можно использовать для сравнения таких совокупностей. Адекватным критерием является F-критерий Фишера (табл. 6.15 граничных значений этого критерия). Возьмем те же выборки: (критерий определяется делением квадрата большей дисперсии на квадрат меньшей, в данном случае s x2 на s y2). Поскольку Fp < F0,05 , следует сделать вывод: различие выборок незначимо, оно может быть случайным — 0-гипотеза (Но) подтверждается. Таблица 6.15 Граничные значения F-критерия Фишера при a = 0,05
Дисперсионный анализ позволяет оценивать влияние на вариативность рассматриваемого признака отдельных факторов или их сочетаний. На упрощенном примере рассмотрим однофакторный дисперсионный анализ. Пример: по 5 конькобежцев (обозначим их 1, 2,... 5) из 3 различных спортивных школ (назовем их А, Б и В) пробежали 500 м, их результаты показаны в табл. 6.12. Общее число спортсменов N = n1+n2+n3 =15. Таблица 6.16 Результаты спортсменов рассматриваемых групп
Средние арифметические в группах А, Б и В различны, но неизвестно, случайны эти различия или же характеризуют различия в контингенте спортивных школ. Чтобы выяснить это, нужно проделать следующие операции. 1. Вычислим среднее арифметическое результатов всех 15 спортсменов: так как n1 = n2 = n3, = 49+47+45 = 47, а общая сумма квадратов отклонений (общая вариация Qобщ) равна:
Qобщ= åå()2 = (50 – 47)2+ (45 – 47)2+ (45 – 47)2+ (51 – 47)2+ + (54 – 47)2+ (45 – 47)2+ (43 – 47)2+ (47 – 47)2+ (51 – 47)2+ (49 – 47)2+ +(45 – 47)2+ (43 – 47)2+ (45 – 47)2+ (48 – 47)2+ (44 – 47)2 = = 9+4+4+16+49+4+16+0+16+4+4+16+4+1+9 = 156 2. Вычислим межгрупповую (межклассовую) вариацию: Qмг= å = (49 – 47)2 × 5+ (47 – 47)2 × 5+ (45 – 47)2×5 = 40 (здесь индекс «i» относится к номерам групп). 3. Внутригрупповая (внутриклассовая) вариация (Qвг): Qвг= åå()2= (50 – 49)2+ (45 – 49)2+ (45 – 49)2 + (51 – 49)2+ + (54 – 49)2+ (45 – 47)2+ (43 – 47)2+ (47 – 47)2 + (51 – 47)2+ (49 – 47)2+ + (45 – 45)2+ (43 – 45)2+ (45 – 45)2+ (48 – 45)2+ (44 – 45)2 = 116 (здесь индекс «i» относится к номерам групп, а «j» — к номерам ва- риант в группах). 4. Проверка: Qобщ должно быть равно Qмг+Qвг. Действительно, в данном случае 156 = 40+116 — наши подсчеты верны. 5. Вычислим общую дисперсию: s общ = Qобщ ï (N – 1) = =156 ï 14 @ 11,1 (N = 15 — общее число испытуемых). 6. Вычислим межгрупповую дисперсию: s мг = Qмг ï (k – 1) = = 40 ï 2 = 20 (k = 3 — число сравниваемых групп, в данном случае — сравниваемых спортшкол). 7. Вычислим внутригрупповую дисперсию: s вг = Qвг ï (N – k) = 116 ï (15 – 3) @ 9,7. 8. Определяем, подсчитав Fр , значимо ли проявляется в результатах спортсменов принадлежность к той или иной спортшколе: Fр = s мг ï s вг = 20 ï 9,7 @ 2,1. Табличное значение F-критерия Fт = 4. Поскольку Fр < Fт, мы должны заключить, что нет основания приписывать различия в оценках (при уровне значимости a = 0,05) различным уровням подготовленности контингента рассматриваемых спортшкол. Средствами дисперсионного анализа можно находить ответы и на вопросы иного рода, но это уже находится за рамками нашего курса спортивной метрологии.
Дата добавления: 2015-04-30; Просмотров: 540; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |