Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Проверка статистической гипотезы. Сравнение двух генеральных средних




 

Статистическая гипотеза – понятие более емкое, чем просто оценка значения неизвестного параметра. Пусть с помощью статистического эксперимента мы хотим проверить простую гипотезу о том, что неизвестное среднее равно некоторому значению . Эта гипотеза будет основой. Альтернативной ей является также простая гипотеза или сложная гипотеза, что или что . Например, известно, что в среднем за смену на станке производится 110 деталей. Станок сломался и его отремонтировали. Получив на отремонтированном станке показатели за n смен, мы хотим проверить гипотезы: производительность станка не изменилась, когда альтернативной гипотезой является то, что она изменилась, или что производительность станка увеличилась, или что производительность станка уменьшилась.

При решении таких задач применяется аппарат построения для соответствующей статистики области , вероятность попадания в которую достаточно близка к 1. При попадании статистики, построенной по выборке, в эту область принимается основная гипотеза (в нашем примере, что производительность станка не изменилась, если значение статистики попало в область, противоположную , принимается альтернативная гипотеза (производительность станка изменилась). В задачах о проверке гипотез принято область, противоположную , называть критической, а число - уровнем значимости. Уровень значимости обычно берут равным 0,05, иногда 0,01. При мы, проверяя на деле истинную гипотезу о том, что , будем ее отбрасывать с вероятностью 0,05, т.е. в среднем 5 из 100 истинных гипотез. Эту ошибку , когда отбрасывается основная гипотеза, хотя она истинна, называют ошибкой первого рода, в отличие от ошибки второго рода, которую совершают, приняв основную гипотезу, когда она ложна. В простых случаях областями оказываются уже знакомые нам доверительные интервалы. При проверке гипотезы мы строим с доверительной вероятностью , при альтернативной гипотезе двухсторонний, а при гипотезах и односторонние с нижней границей X доверительные интервалы. Если этот интервал накрывает гипотеза H принимается, если не накрывает – отвергается. Приведем некоторые примеры.

 

Пример 7.1. В задаче про ремонт станка проверяем гипотезу об изменении производительности станка, если за 31 смену получены данные о производительности, для которых , . Уровень значимости и . Значения , участвующие в построении доверительного интервала, отыскиваются в таблице, или в верхней строке:

Вывод – гипотеза о том, что производительность станка не изменилась, не проходит на уровне значимости 5%, так как старая производительность, равная 110, в 95-процентный доверительный интервал для новой средней производительности не попал. Более того, она не попала бы в доверительный интервал, даже если бы мы задались 98-процентным уровнем доверия, для которого . Т.е. наша выборка показала, что гипотеза о том, что производительность станка не изменилась, не подходит даже на уровне значимости 2%. Только при уровне доверия интервал становится таким большим , что мы уже не можем быть на 99% уверены, что изменения выборки не случайны. Увидев, что новые показатели хуже старых, берем в качестве альтернативной гипотезу о том, что новое среднее меньше старого (такая альтернатива естественна, если ), т.е. что производительность станка уменьшалась. Это предложение подтверждается даже на уровне значимости 0,01. Действительно, строим односторонний доверительный интервал для уровня доверия 0,99. Значения , участвующие в построении одностороннего доверительного интервала, отыскиваются в таблице 7.1, или в нижней строке:

Так как = 110 не входит в построенный односторонний интервал, можно принять гипотезу о том, что производительность уменьшилась, на уровне значимости 1%.

Подчеркнем, что вывод о приемлемости основной гипотезы, ее непротиворечивости имеющимся данным не означает того, что доказана ее истинность. Принимая ее, в некотором проценте случаев мы ошибемся.

Перечислим критерии, по которым, не привлекая понятия доверительного интервала, проверяется статистическая гипотеза о том, что среднее значение генеральной совокупности на уровне значимости (они выведены из формул для двустороннего и одностороннего доверительного интервала для уровня доверия ).

Вычисляем по выборке значение статистики .

1. Критическая область для односторонней проверки гипотезы, что среднее значение генеральной совокупности по сравнению с альтернативой на уровне значимости определяется неравенст­вом (отыскивается по таблице критических значений распределения Стьюдента, a в верхней строке).

2. Критическая область для односторонней проверки гипотезы, что среднее значение генеральной совокупности по сравнению с альтернативой на уровне значимости определяется неравенст­вом ( отыскивается по таблице критических значений распределения Стьюдента,  в нижней строке).

1. Критическая область для односторонней проверки гипотезы, что среднее значение генеральной совокупности по сравнению с альтернативой на уровне значимости определяется неравенст­вом ( отыскивается по таблице критических значений распределения Стьюдента, в нижней строке).

 

Если вычисленное значение статистики Т попадает в критическую область, то основная гипотеза отвергается. Вероятность попадания в эту область равна принятому уровню значимости . В этом случае принимается альтернативная гипотеза.

 

В нашем примере про станок , a . Так что основная гипотеза не проходит, а проходит альтернативная гипотеза <110 при уровне значимости 0,01.

Теперь рассмотрим две независимые выборки и извлеченные из нормальных генеральных совокупностей с одинаковыми дисперсиями , причем объемы выборок соответственно n и m, a средние , и дисперсия 2 неизвестны. Требуется проверить гипотезу о том, что . Альтернативной является гипотеза .

Как известно, выборочные средние – нормально (или приблизительно нормально) распределенные величины, следовательно, их разность – нормальная величина со средним и дисперсией, которая вычисляется по формуле:

.

Если бы дисперсия была известна, мы могли бы для проверки гипотезы воспользоваться свойствами и таблицами нормального распределения, как мы это делали при построении доверительного интервала для среднего при известной дисперсии. В силу того что 2 неизвестна, заменим в наших рассуждениях неизвестную дисперсию на ее эмпирический аналог.

Итак, для проверки гипотезы построим статистику:

,

где

 

Теперь к статистике t применим те же рассуждения, которые мы применяли к статистике Т.

Если гипотеза верна, статистика t имеет распределение Стьюдента с степенями свободы и в качестве области можно взять интервал, симметричный относительно 0, в который величина, распределенная по Стьюденту, попадает с вероятностью b, т.е. . Таким образом, если нам заданы две выборки и уровень значимости , мы вычисляем значение статистики t и ищем по , n и m в таблице 7.1 (в ней содержатся критические значения распределения Стьюдента) значение t . Если выполняется

,

мы принимаем гипотезу о том что и отвергаем гипотезу , если это неравенство не выполняется - произошло событие из дополнительной области, вероятность которой . Вероятность попасть в область равна

 

.

Если оказалось, что , можно проверять гипотезу о том, что , когда альтернативной гипотезой является . В этом случае область, попадание в которую дает основание принять основную гипотезу, строится односторонняя. А именно, в таблице 7.1 в нижней строке отыскивается , где  – заданный уровень доверия, в строке с нужным числом степеней свободы находим границу интервала t . Далее, если выполняется

,

то первая гипотеза неверна и принимается, что .

 

Можно проверять гипотезу о том, что , когда альтернативной гипотезой является . В этом случае область, попадание в которую дает основание принять первую гипотезу, также строится "односторонняя". А именно, гипотеза о том, что не принимается, а принимается гипотеза тогда, когда

.

С помощью нижней строки таблицы распределения Стьюдента мы решали уравнения:

и ,

где - уровень значимости.

Итак, перечислим критерии, по которым проверяется статистическая гипотеза о том, что средние значения двух генеральных совокупностей, имеющих одинаковые дисперсии, совпадают ( ) на уровне значимости . Они выведены из формул для двустороннего и одностороннего доверительного интервала для уровня доверия .

Вычисляем по выборке значение статистики t:

,

где

 

1. Критическая область для односторонней проверки гипотезы, что средние значения двух генеральных совокупностей совпадают ( ) по сравнению с альтернативой на уровне значимости определяется неравенст­вом ( отыскивается по таблице 7.1 критических значений распределения Стьюдента, a в верхней строке).

2. Критическая область для односторонней проверки гипотезы, что средние значения двух генеральных совокупностей совпадают ( ) по сравнению с альтернативой на уровне значимости определяется неравенст­вом ( отыскивается по таблице 7.1 критических значений распределения Стьюдента, a в верхней строке).

3. Критическая область для односторонней проверки гипотезы, что средние значения двух генеральных совокупностей совпадают ( ) по сравнению с альтернативой на уровне значимости определяется неравенст­вом ( отыскивается по таблице 7.1 критических значений распределения Стьюдента, a в верхней строке).

Если вычисленное значение статистики t попадает в критическую область, то основная гипотеза отвергается. Вероятность попадания в эту область равна принятому уровню значимости . В этом случае принимается альтернативная гипотеза.




Поделиться с друзьями:


Дата добавления: 2014-01-07; Просмотров: 927; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.009 сек.