Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Основные понятия проверки статистических гипотез




Во многих практических задачах реализации выборки применяются для проверки гипотез (предположений) о свойствах закона распределения генеральной совокупности.

Определение. Статистической гипотезой называется предположение о параметрах, свойствах закона распределения генеральной совокупности.

Пример 8.2 “Математическое ожидание г.с., распределенной по показательному закону, равно 10”, ”Г.с. имеет нормальный закон распределения” – статистические гипотезы. “Завтра будет снег”, “Существуют внеземные цивилизации” – не являются статистическими гипотезами.

В дальнейшем под гипотезой будем понимать исключительно статистические гипотезы. Гипотеза называется простой, если она однозначно определяет закон распределения г.с. В противном случае гипотеза называется сложной. В приведенных выше гипотезах первая – простая, потому, что гипотеза определяет точно один показательный закон распределения с параметром l = 1/10. Вторая гипотеза является сложной, потому что она определяет бесконечно много нормальных законов распределения с разными математическими ожиданиями и дисперсиями.

Параметрическими гипотезами называются гипотезы о параметрах распределения г.с. Например, первая из вышеприведенных гипотез является параметрической.

Нулевой (или основной) гипотезой H 0 называется проверяемая гипотеза. Альтернативной (или конкурирующей) гипотезой называется, гипотеза, которая принимается в случае, когда основная гипотеза отвергается. Альтернативных гипотез у одной и той же основной гипотезы может быть несколько. Например, если принять за основную гипотезу “Математическое ожидание г.с. равно 10”, то в качестве альтернативной могут быть: “Математическое ожидание г.с. меньше 10”, ”Математическое ожидание г.с. равно 9”.

При проверке гипотез применяется некоторое правило. Критерием K проверки гипотез называется правило, по которому принимается или отвергается гипотеза H 0. Обычно в критерии участвует некоторая статистика Z=Z (X 1, …, Xn), по значению которой решается вопрос, принять или отвергнуть основную гипотезу. Z называется статистикой критерия.

Общая схема критерия K выглядит следующим образом. Задается некоторая малая вероятность a (обычно a = 0.1, 0.05, 0.01), называемая уровнем значимости критерия. В основе критерия лежит принцип теории вероятностей: маловероятные события (события с вероятностью a) считать практически невозможными. Из области значений V статистики Z критерия выделяется подмножество Vk, такое, что условная вероятность события Z Î Vk при условии, что гипотеза H 0 верна, мала (равна a): P (Z Î V k / H 0 ) = a. Множество Vk называется критической областью. Пусть теперь по реализации выборки вычислено значение zв статистики критерия Z. Если zв Î Vk, то это означает, что произошло маловероятное событие. Тогда по приведенному выше принципу скорей всего неверна гипотеза H 0 и она должна быть отвергнута. Если zв Î V \ Vk, то гипотеза H 0 может быть принята. Множество V \ Vk называется область принятия основной гипотезы.

Рассмотрим критерий проверки параметрической гипотезы H 0 : q = q 0 при альтернативной гипотезе H 1: q <q 0. Пусть p (z / H 0 ) – плотность условного закона распределения статистики Z. За область принятия основной гипотезы принимается такой промежуток [ z 1, +¥), что P (Z ³ z 1/ H 0 ) = 1– a, P (Z < z 1/ H 0 ) = a (рис. 8.3).

Из второго равенства видно, что z 1= za – квантиль распределения статистики Z порядка a.

 

Рисунок 8.3  

Таким образом, критической областью является промежуток (–¥, za), а областью принятия основной гипотезы – промежуток

[ za, +¥).

Критерий состоит в следующем. По реализации выборки из г.с. вычисляем значение zв статистики критерия Z. Вычисляются (по таблице) квантиль za. Если zв ³ za, то основная гипотеза q = q 0 принимается. Если zв < za, то основная гипотеза q = q 0 отвергается (принимается альтернативная гипотеза q <q 0).

Пример 8.3 Расход бензина автомобиля составляет m =10 л. на 100 км. После модернизации двигателя проведено испытания с 25 автомобилями и получено выборочное среднее расхода бензина л. на 100 км. Считая расход бензина X нормально распределенной случайной величиной c дисперсией , проверить основную гипотезу H 0 : m =10 на уровне значимости a = 0.05 при альтернативной гипотезе H 1 : m <10.

Из условий задачи следует, что если гипотеза m =10 верна, то г.с. X распределена нормально с математическим ожиданием m =10 и дисперсией . Тогда известно [ ], что случайная величина имеет стандартное нормальное распределение. В качестве статистики критерия возьмем эту случайную величину. Квантиль распределения случайной величины U порядка a = 0.05 найдем по таблице N [ ] u 0.05 = – u 0.95 = –1.645.

Вычислим выборочное значение критерия U: .

Так как uв = –1.75< ua = –1.645, то uв попало в критическую область, поэтому основная гипотеза m =10 отвергается и принимается альтернативная гипотеза m <10. Таким образом, можно сделать практический вывод: с вероятностью 0.95 можно утверждать, что модернизация двигателя действительно привела к уменьшению расхода бензина.

Как видно, основная или альтернативная гипотезы принимаются или отвергаются с некоторой вероятностью. Это означает, что возможны ошибки при принятии того или иного решения. В теории проверки статистических гипотез различают ошибки первого и второго рода.

Ошибкой первого рода называется вероятность отвергнуть правильную основную гипотезу, т.е. P (Z Î Vk / H 0 ) = a. Таким образом, уровень значимости совпадает с ошибкой первого рода.

Ошибкой второго рода называется вероятность принять ошибочную основную гипотезу, т.е. P (Z Î V\Vk / H 1 ) = b.

 

8.3 Критерий согласия Х 2

Критерием согласия называют критерии проверки статистических гипотез о виде закона распределения г.с. Примером статистической гипотезы о виде закона распределения г.с. X является: “Г.с. X имеет нормальный (равномерный и т.д.) закон распределения”. Такая гипотеза принимается за основную гипотезу H 0.

Рассмотрим подробно эффективный критерий согласия Пирсона Х 2 (критерий хи-в-квадрате).

Пусть проверяется гипотеза “Г.с. X имеет гипотетическую функцию распределения ”, где – неизвестные параметры распределения, вид функции F известен, l ³1. Рассмотрим случай непрерывного распределения.

На первом этапе по реализации выборки объема n строится интервальный статистический ряд с k = [1+3.32 lg n ] +1 частичными промежутками (см. п. 8.1). Пусть получены равные промежутки с границами в точках

. Рассмотрим промежутки

. (8.2)

Пусть по выборке найдены точечные оценки неизвестных параметров (методом максимального правдоподобия). Тогда при помощи гипотетической функции распределения можно найти вероятности

(8.3)

.

Известно, что при достаточно больших значениях объема выборки n случайная величина

(8.4)

имеет распределение близкое к распределению – хи-в-квадрате со степенью свободы s = k– l – 1, где k – число интервалов, l – число неизвестных параметров, замененных их точечными оценками, mi – частота i -го интервала. Если основная гипотеза верна, то величина npi будет близка к частоте ni, то есть сумма будет мала. В качестве статистики критерия выбирается случайная величина . Тогда при заданном уровне значимости a основная гипотеза отвергается, когда . Это равенство эквивалентно . А это означает, что – квантиль распределения хи-в-квадрате порядка 1– a со степенью свободы s = k– l – 1.

Таким образом, если выборочное значение статистики окажется меньше квантили , то основная гипотеза принимается.

Сформулируем кратко критерий проверки гипотезы о виде закона распределения г.с.

1) По данной реализации выборки построить интервальный статистический ряд, найти промежутки (8.2).

2) Вычислить по реализации выборки точечные оценки неизвестных параметров .

3) Вычислить величины npi (i = 1, …, k) по формулам (8.3). Проверить выполнение условий npi ³ 5. Если для некоторых интервалов это условие нарушается, то этот интервал объединяется с соседним (при этом складываются вероятности pi и частоты этих интервалов). Эта процедура продолжается до тех пор пока для всех интервалов не будет выполняться условие npi ³ 5.

4) По формуле (8.4) вычислить выборочное значениестатистики .

5) По таблице найти квантиль распределения хи-в-квадрате порядка 1– a со степенью свободы s = k– l – 1, где k – число интервалов после пересчета в пункте 3, l – число неизвестных параметров, замененных их точечными оценками в пункте 2.

6) Если <, то основная гипотеза принимается на уровне значимости a; если ³, то основная гипотеза отвергается.





Поделиться с друзьями:


Дата добавления: 2014-01-11; Просмотров: 1210; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.02 сек.