КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Немного о дисперсионном анализе 1 страница
А б Рис. 6.4. Доверительные интервалы: а — при меньшей, б — при большей доверительной вероятности.
делают вероятностно обоснованный вывод в отношении проверяемой статистической гипотезы (нулевой или альтернативной). Различают параметрические и непараметрические критерии значимости. Параметрические — только для анализа совокупностей, полученных измерениями в шкале интервалов или в шкале отношений и при нормальном распределении. Непараметрические — для анализа также и совокупностей, полученных измерениями в шкале порядка (шкале рангов). Операции по вычислению параметрических критериев включают вычисление дисперсии (s2) или произведенных из нее характеристик: среднего арифметического (s) либо ошибки репрезентативности (s). 6.2.4. Непараметрические критерии значимости. Самый простой для вычислений непараметрический критерий — критерий знаков (Z-критерий). Им пользуются для сравнения только попарно связанных (связанных) выборок. Пример: количество подтягиваний в конкретной группе лыжников в марте (Х) и в июне (Y). Х: 14, 17, 16, 17, 13, 15, 14, 18, 19, 14, 16, 22, 15, 20, 12. Y: 18, 22, 18, 16, 15, 19, 20, 16, 18, 14, 14, 25, 17, 24, 19. + + + – + + + – – 0 – + + + + Вычитая из вариант 2-й выборки сопряженные с ними варианты 1-й, определяем лишь знаки разностей. Чаще в таблицах стоит граничная сумма меньшего количества одинаковых знаков (при этом в таблицах стоят меньшие числа, это удобно). Наиболее употребительны уровни значимости 0,1, 0,05, 0,01, 0,001, 0,0001, для каждого уровня значимости свои граничные значения, служащие числовыми критериями). Подсчитанное количество знаков (расчетное значение) сравнивают с табличным значением для принятого уровня значимости (a) и количества (n) сопряженных пар (но исключаются пары, в которых разность равна нулю: в нашем примере остается 14 пар). Если расчетное значение (Z р) больше табличного — принимают 0-гипотезу,
Таблица 6.1 Граничные значения количеств реже встречающихся знаков (Z-критерий, или критерий знаков)
меньше или равно — отвергают ее (напомним: при выбранном уровне значимости). В нашем случае количество знаков, которых меньше, равно 4. По таблице Z-критерия для n = 14 и a = 0,05 граничное значение 3, поэтому вывод — различие выборок незначимо. Безразлично, из 1-й выборки вычитать 2-ю или из 2-й —1-ю: просто во втором случае на месте плюсов окажутся минусы, а на месте минусов — плюсы, число же знаков, которых меньше, одинаково в обоих случаях. В связи с простотой требуемых вычислений, Z-критерий широко применяют для предварительного оценивания экспериментальных результатов, особенно при больших n сравниваемых выборок. Но в Z-критерии не приняты в расчет величины разностей в сопряженных парах, отчего его мощность (разрешающая способность) мала, то есть мала достоверностьопределения значимости различия выборок. Существуют более мощные непараметрические критерии: Вилкоксона, Уайта, ван дер Вардена. В этих критериях значимости присвоением ранга каждой варианте учитываются их количественные значения (для связанных выборок — количественные значения разностей в сопряженных парах). Рассмотрим Т-критерии Вилкоксона для связанных (попарно связанных, сопряженных — табл. 6.2) и несвязанных (табл. 6.3.) выборок. Таблица 6.2. Критические значения Т-критерия Вилкоксона для связанных выборок
В качестве примера и для сравнения критериев проведем анализ тех же выборок, которые сравнивали выше по Z-критерию. Определим разности di = (xi – yi) и общий по обеим выборкам ранг каждой такой разности — отдельно ранги положительных (R–) и отрицательных (R+) разностей (нулевую разность не учитывают, эту сопряженную пару не берут в расчет).
Х: 14, 17, 16, 17, 13, 15, 14, 18, 19, 14, 16, 22, 15, 20, 12 Y: 18, 22, 18, 16, 15, 19, 20, 16, 18, 14, 14, 25, 17, 24, 19 d: –4 –5 –2 +1 –2 –4 –6 +2 +1 0 +2 –3 –2 –4 –7 R– 10 12 5 5 10 14 8 5 10 14 R+ 1,5 5 1,5 5
Ранги присваивать по возрастанию модулей всех значений разностей в сопряженных парах, без учета знака. Эти ранги показаны под каждым числом уменьшенным шрифтом курсивом с пометкой знака разности. Меньшая сумма рангов (в данном случае сумма рангов положительных разностей åR+) равна 13. Так как в таблице критерия Вилкоксона для связанных выборок при n =14 и a = 0,05 граничное значение равно 21, заключаем, что выборки различаются значимо. Мы видим: применение более мощного критерия, учитывающего количественные значения разностей в сопряженных парах, привело к иному выводу, чем при применении менее мощного — критерия знаков. Верить следует более мощному критерию. Таблица 6.3,а. Критическое значение Т-критерия Вилкоксона для несвязанных выборок
Рассмотрим непараметрический Т-критерий Вилкоксона для сравнения несвязанных выборок (таблица критических значений приведена ниже). В соответствии с процедурой расчета критерия необходимо как бы объединить их и присвоить ранги вариантам этой объединенной выборки, не забывая, однако, к какой из выборок относятся варианты. Покажем, как это делается. Возьмем для примера результаты юношей в беге на 100 м в 11-м (выборка Х) и в 10-м (выборка Y) классах средней школы: X: 13,5 14,3 14,0 14,9 14,2 14,0 13,0 13,7 Y: 15,2 14,0 14,8 14,3 14,9 13,8 14,0 14,9 14,4 14,7 14,1.
Расположим выборки следующим образом (своего рода «лесенкой»: 1 2 3 6, 5 6,5 10 11,5 17 X: 13,3 13,5 13,7 14,0 14,0 14,2 14,3 14,9 Y: 13,8 14,0 14,0 14,1 14,3 14,4 14,7 14,8 14,9 14,9 15,2 4 6,5 6,5 9 11,5 13 14 15 17 17 19 SRx = 57,5; SRy = 132,5; SR = SRx+SRy =190 Выборка Х записана над чертой, над каждой вариантой указан ее ранг, выборка Y записана под чертой, и ранг каждой варианты указан под ней. Ранги высчитывают совместно для обеих выборок, их сумму проверяют по формуле: SR = n(n+1) ï 2. Здесь n = 8+11 = 19. Затем подсчитывают суммы рангов — отдельно по выборке Х и по выборке Y, меньшую из этих выборочных сумм рангов (на нашем примере Rx = 57,5) сравнивают с граничным значением по таблице Т-критерия Вилкоксона для связанных выборок, соответствующим nx = 8, ny = 11. При a = 0,05 табличное значение Тan= 55. Поскольку SRx > Tan= 55, различие следует считать незначимым. Критерий Ван дер Вардена — это мощный непараметрический критерий, немногим уступающий по мощности параметрическому критерию Стьюдента. Его, как и другие непараметрические критерии, можно применять для сравнения любых выборок: тип распределения этих выборок может как угодно отличаться от нормального и варианты могут быть получены измерениями не только в шкалах отношений или интервалов, но и в шкале рангов (шкале порядка). Процедура достаточно сложна. Рассмотрим ее на примере сопоставления результатов 2 групп студентов в беге на короткие дистанции и применявших разные методики подготовки. Эффективность методики оценивалась по улучшению (уменьшению времени) результата в беге на 100 м. Приращения таковы:
группа 1: 0,3 0,4 0,4 0,5 0,5 0,5 0,8 0,9 1,0 1,1 группа 2: 0,2 0,3 0,3 0,4 0,4 0,4 0,4 0,5 0,5 0,6
Равносильный для результатов вычислений вариант — занятые членами двух групп (тоже по 10 спортсменов в каждой) места на соревнованиях — то есть измерения проведены в шкале порядка, так что t-критерий Стьюдента применять нельзя:
группа 1: 2–4 5–10 5–10 11–15 11–15 11–15 17 18 19 20 группа 2: 1 2–4 2–4 5–10 5–10 5–10 5–10 11–15 11–15 16. Однако примерный расчет проведем на первом варианте), результаты представлены в табл. 6.4, их можно описать по этапам. 1. Располагаем в первых двух столбцах варианты упорядоченных выборок DХ и DУ по возрастанию таким образом, что совпадающие значения вариант разных выборок расположены в разных строках. Таблица 6.4 Расчетная таблица критерия ван дер Вардена
S = 4,00 2. В 3-й столбец записываем порядковые номера «i» вариант (нумерация общая для вариант обеих выборок) — напомним, выборки упорядочены. 3. Выбираем любую из выборок (здесь — выборка DХ), и вносим в 4-й столбец значения i ½ (n+1) для каждой из ее вариант и для вариант выборки DУ, совпадающих со значениями вариант выборки DХ. 4. Находим по табл. 6.5 значений функции y[i ½ (n+1)] значения, соответствующие конкретным величинам i ½ (n+1), и заносим их в 5-й столбец (y — греч. «пси»). 5. Для вариант с совпадающими значениями рассчитываем средние значения y и заносим их в 6-й столбец. 6. Последний столбец — полученные значения y для отобранной выборки (DХ). Подсчитываем их сумму — в нашем случае Sy = 4,00. Это и есть расчетное значение Х-критерия ван дер Вардена (если выбрать в качестве базовой выборку DУ, изменится лишь знак суммы). Таблица 6.5 Значения функции y[i ½ (n+1)]
7. Сравниваем расчетное значение критерия с табличным (граничным, критическим) по табл. 6.6 (здесь ns = n1+n2 , значения критерия даны для уровней значимости 0,05 и 0,01). Если расчетное значение равно или больше граничного, нулевая гипотеза (Но) отвергается, если меньше — подтверждается (не отвергается). В нашем случае Но отвергается: 4,00 > 3,86 (ns = 20 и n1 – n2 = 0).
Дата добавления: 2015-04-30; Просмотров: 1063; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |