Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Теорема Пирсона




Лабораторная работа №15. Изучение критерия хи-квадрат Пирсона

Рассмотрим задачу по проверке близости теоретической и эмпирической функций распределения для дискретного распределения. При этом закон распределения задаётся набором вероятностей р1,..., рk, а гипотеза сводится к тому, что эти вероятности приняли определенные значения. То есть гипотеза Н0: р1 = р10, р2 = р20,..., рk = рk0. Для решения такой задачи используется теорема Пирсона.

Пусть n - число независимых повторений некоего опыта, который заканчивается одним из k (k - натуральное число) элементарных исходов А1,..., Аk, причём вероятности этих исходов - р1,..., рk, p1 +... + рk = 1. Обозначим через m1,...,mk (m1 +... + mk = n) то количество опытов, которые закончились исходами А1,...,Аk. Введем случайную величину . Тогда при неограниченном росте n → ∞ случайная величина асимптотически подчиняется распределению с (k - 1) степенями свободы.

Для проверки гипотезы Н0 о том, что вероятности р1,…, рk приняли определенные значения Н0: р1 = р10, р2 = р20,..., рk = рk0, рассмотрим следующую статистику:

Статистика называется статистикой хи-квадрат Пирсона для простой гипотезы.

Фактически величина X²/n представляет собой квадрат некоего расстояния между двумя k-мерными векторами: вектором наблюдаемых относительных частот (mi/n) и вектором предсказанных ненаблюдаемых вероятностей (рi0). От евклидового расстояния это расстояние отличается тем, что разные координаты входят в него с разными весами. Если верна гипотеза Н0, то асимптотическое поведение X² при n → ∞ указывает теорема Пирсона. Чтобы понять, что происходит, когда Н0 неверна, заметим, что по закону больших чисел (mi/n) → рi при n → ∞ для всех допустимых i = 1,...,k. Поэтому при n → ∞: . Если гипотеза неверна, то X² → ∞ при n → ∞. Значит, гипотеза Н0 должна быть отвергнута, если полученное в опыте значение X² слишком велико. Термин "слишком велико" означает, что наблюденное значение X² имеет малую вероятность, то есть превосходит критическое значение, которое легко рассчитать в Maple или взять из таблиц распределения хи-квадрат. Так как вероятность Р( ≥ X²) - малая величина, то маловероятно случайно получить такое же, как в опыте, или еще большее расхождение между вектором частот и вектором вероятностей.

Асимптотический характер теоремы Пирсона, лежащий в основе этого правила, требует осторожности при его практическом использовании. На него можно полагаться только при больших n. Достаточно велико должно быть и n, и все и произведения npi. Проблема применимости аппроксимации (непрерывное распределение) к статистике X², распределение которой дискретно, оказалась сложной. Согласно имеющемуся опыту, аппроксимация применима, если все ожидаемые частоты npi > 10. Если число различных исходов k велико, граница для npi может быть снижена (до 5 или даже до 3, если k порядка нескольких десятков). Чтобы соблюсти эти требования, на практике порой приходится объединять несколько исходов и переходить к схеме Бернулли с меньшим k.

Описанный способ для проверки согласия можно прилагать не только к испытаниям Бернулли, но и к произвольным группам данных. Предварительно наблюдения надо превратить в испытания Бернулли путем группировки. Делают это так: пространство наблюдений разбивают на конечное число непересекающихся областей, а затем для каждой области подсчитывают наблюденную частоту и гипотетическую вероятность. При разбиении надо заботиться о том, чтобы правило проверки гипотезы об исходном распределении данных было достаточно чувствительным к возможным альтернативам, то есть нельзя, например, все данные объединить в одну область.

Вопрос о сравнении наблюденных в опыте частот с теми, которые предписывает теория (ради проверки этой теории) возникает во многих задачах. Рассмотрим способ сопоставления наблюдаемых частот с частотами, рассчитанными по модели. Обозначим наблюдаемые частоты через Н; ожидаемые (теоретические) частоты - Т. Если модель правильно описывает действительность, числа Н и Т должны быть близки друг к другу, сумма квадратов отклонений (Н - Т)² не должна быть большой. Разумно в общую сумму отдельные слагаемые вносить с различными весами, поскольку чем больше Т, тем больше Н может от него отклоняться за счет действия случая без отступления от модели. В качестве меры близости наблюдаемых и ожидаемых частот используется величина:

,


где сумма берется по всем ячейкам таблицы сопряженности, служащая мерой согласия опытных данных с теоретической моделью. Если в конкретном опыте величина X² оказывается чрезмерно большой, считают, что ожидаемые частоты слишком сильно отличаются от наблюдаемых и отвергают нулевую гипотезу. Распределение случайной величины X² в случае, когда гипотеза верна, находят, используя следующую теорему.




Поделиться с друзьями:


Дата добавления: 2014-12-24; Просмотров: 1225; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.011 сек.