![]() КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Критерий Уилкоксона
Область применения. Критерий Уилкоксона применяется в той же ситуации, что и критерий Манна-Уитни. В отличие от этого критерия и критерия знаков, он имеет дело не со знаками некоторых случайных величин, а с их рангами. Исторически критерий Уилкоксона был одним из первых критериев, основанных на рангах (о рангах см. п. 3). Рассмотрим ранги элементов объединения двух выборок Пусть, например, первая выборка состоит из чисел 6, 17 и 14, вторая — изчисел 5 и 12. Тогда ранги величин первой группы есть 2, 5, 4, второй — 1, 3. Нетрудно понять, что последовательность рангов совокупности oбъема т+n является некоторой перестановкой чисел 1,..., m+n. Верно и обратное: любая перестановка чисел 1,..., m + п может оказаться ранговой последовательностью. Так что множество возможных ранговых последовательностей — это совокупность перестановок чисел 1, 2,..., m+n. Их общее число равно (m + n)!. Зная распределения случайных величин Посмотрим, как изменяется распределение вероятностей среди ранговых последовательностей (т.е. среди перестановок) при отступлениях от однородности выборок. В качестве нарушений однородности мы будем рассматривать те же ситуации, что и при обсуждении критерия Манна-Уитни в предыдущем пункте: левосторонние альтернативы Таким образом, ранги в какой-то мере способны характеризовать, например, положение одной выборки по отношению к другой и в то же время они не зависят от неизвестных нам распределений выборок х и у. Это обстоятельство и легло в основу ранговых методов, широко применяемых в настоящее время в различных задачах. Вернемся к непосредственному обсуждению критерия Уилкоксона. Назначение. Критерий Уилкоксона используется для проверки гипотезы об однородности двух выборок. Нередко одна из выборок представляет характеристики объектов, подвергшихся перед тем какому-то воздействию (обработке). В этом случае гипотезу однородности можно назвать гипотезой об отсутствии эффекта обработки. Данные. Рассматриваются две выборки Допущения. 1. Выборки 2. Законы распределения выборок F и G непрерывны. Гипотеза. В введенных выше обозначениях гипотезу об однородности выборок можно записать в виде Н: F = G. Метод. 1. Рассмотрим ранги игреков в общей совокупности выборок х и у. Обозначим их через 2. Вычислим величину
называемую статистикой Уилкоксона. 3. Зададим уровень значимости a или выберем метод, связанный с определением наименьшего уровня значимости, приведенный ниже. 4. Для проверки Н на уровне значимости a против правосторонних альтернатив Гипотезу следует отвергнуть против правосторонней альтернативы при уровне значимости a, если 5. Для проверки H на уровне значимости a против левосторонних альтернатив 6. Гипотеза H отвергается на уровне 2 a против двусторонней альтернативы
Напомним, что альтернативы должны выбираться из содержательных соображений, связанных с условиями получения экспериментальных данных. 7. Более гибкое правило проверки Н связано с вычислением наименьшего уровня значимости, на котором гипотеза Н может быть отвергнута. Для разных альтернатив речь идет о вычислении вероятностей: Гипотеза отвергается, если соответствующая вероятность оказывается малой. Приближение для больших выборок. На практике часто приходится сталкиваться с ситуацией, когда объемы выборок т и п выходят за пределы, приведенные в таблицах. В этом случае используют аппроксимацию распределения W предельным распределением статистики W при Обозначим через za верхнее критическое значение стандартного нормального распределения. Его можно найти с помощью таблицы квантилей нормального распределения для любого 0 < a < 0.5. Благодаря симметрии распределения нижнее критическое значение равно - za. Правило проверки H перефразируем так: • отвергнуть H на уровне a против альтернативы • отвергнуть H на уровне a против альтернативы • отвергнуть H на уровне 2 a против альтернативы Правило, связанное с вычислением наименьшего уровня значимости, при использовании нормального приближения выглядит так: отвергнуть H (против соответствующих альтернатив), если оказывается малой вероятность
Функция нормального распределения и ей обратная, которая называется функцией квантилей стандартного нормального распределения, подробно табулированы. Упомянутое ранее верхнее критическое значение za с помощью функции Ф можно определить как решение уравнения Замечание. Указанное выше нормальное приближение для вычисления критических значений статистики W хорошо действует даже для небольших значений m и п, если только a не слишком мало. (Так, для т = п = 8 приближенные квантили практически не отличаются от точных.) Обсуждение. Рассмотрим подробнее свойства статистики W и соображения положенные в основу критерия Уилкоксона. Область определения. Случайная величина W может принимать все целые значения от минимального значения Заметим, что W не изменится, если произвольно переменить порядок следования чисел, служащих рангами игреков (как не изменится и при перенумерации самих игреков). Чтобы упростить обсуждение, можно поэтому говорить далее о рангах игреков, упорядоченных по возрастанию. Пусть Распределение вероятностей. Статистика Уилкоксона была определена нами как сумма (упорядоченного) набора рангов игреков Пусть m = 3 и n = 2. Вычислим число всех возможных пар рангов игреков. Оно равно
Таким образом, получаем следующее распределение W:
Отметим, что распределение W симметрично относительно точки Рассмотрим случайную величину Распределение статистики W при нарушении гипотезы. Чтобы оправдать сделанный выше выбор критических событий (критериев) для проверки Н против рассмотренных альтернатив, надо изучить распределение статистик U и W при этих альтернативах. Когда F и G не одинаковы, распределения U и W уже не свободны от их влияния. Поэтому точно вычислить и указать распределения U и W можно (в принципе) только для каждой конкретной пары F и G. Тем не менее, характер изменения распределений статистик U и W при переходе от гипотезы к альтернативам — не всем, но некоторым, — установить можно. Это легко сделать для односторонних альтернатив. Например, когда На рис. 1 мы попытались наглядно представить это положение, условно представляя распределение статистики W при гипотезе и при альтернативах с помощью плотностей, — хотя искомые распределения дискретны и плотностей не имеют. Но так получается выразительнее. (При желании можно считать, что нарисованные непрерывные кривые изображают что-то вроде огибающих графиков дискретных вероятностей.) Рис. 1 Из рис. 1 ясно, что гипотеза Н должна отвергаться при слишком больше или при слишком малых значениях W в зависимости от того, какие альтернативы мы рассматриваем. При том выборе критериев, который был описан выше их мощность возрастает при удалении Связь со статистикой Манна-Уитни. Нетрудно проверить, что для всех m, n: Совпадения. Мы описали критерий Уилкоксона для проверки гипотезы об однородности двух выборок в условиях, когда функции распределений данных непрерывны и, тем самым, в выборках не должно быть совпадающих наблюдений. Однако на практике совпадающие наблюдения — не редкость. Чаще всего это происходит не потому, что нарушается условие непрерывности, а из-за ограниченной точности записи результатов измерений (например, рост человека обычно измеряется с точностью до 1 см). Применение критерия Уилкоксона к таким данным приводит к приближенным выводам, точность которых тем ниже, чем больше совпадающих значений. Когда среди наблюдений встречаются одинаковые, им приписываются средние ранги. По определению, средний ранг числа Упомянутые группы одинаковых наблюдений называют связками. Количество элементов в связке называют ее размером. Наличие связей влияет на асимптотические распределения статистики Уилкоксона. Так, при использовании нормальной аппроксимации следует в формуле для вычисления W *заменить DW на
где При больших по размеру связках и (или) большом их числе применение критерия Уилкоксона сомнительно.
Дата добавления: 2014-12-26; Просмотров: 750; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |