КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Понятие статистической гипотезы
Интервальные оценки. Лекция 24. 3. Доверительный интервал для математического ожидания нормально распределенной генеральной совокупности при неизвестной дисперсии. Пусть требуется оценить математическое ожидание генеральной совокупности, имеющей нормальное распределение при неизвестной дисперсии . В этом случае для построения доверительного интервала применяют статистику , где – случайное значение выборочной дисперсии, то есть ; – случайное значение модифицированной (исправленной) выборочной дисперсия; – случайная выборка такая, что случайные величины , распределены по нормальному закону , в котором математическое ожидание и дисперсия неизвестны. Можно показать, что случайная величина имеет распределение Стьюдента с степенями свободы. Тогда , где , – квантили распределения Стьюдента. Отсюда находим доверительный интервал с уровнем значимости для математического ожидания при неизвестной дисперсии : . Если учесть, что , то доверительный интервал можно записать в виде , где – выборочное среднее; – модифицированная выборочная дисперсия; . 4. Доверительный интервал для дисперсии нормально распределенной генеральной совокупности при известном математическом ожидании. Найдем доверительный интервал для дисперсии генеральной совокупности, имеющей нормальное распределение при известном математическом ожидании . В этом случае для построения доверительного интервала применяют статистику , где – объем случайной выборки ; . Случайная величина имеет - распределение с степенями свободы, и поэтому доверительный интервал находится из условия , где , – квантили - распределения. Таким образом, для любой реализации случайной выборки доверительный интервал , где , накрывает с вероятностью теоретическое значение дисперсии случайной величины . Извлекая квадратный корень из обеих сторон последнего неравенства, определяющего доверительный интервал для , получаем доверительный интервал для среднего квадратического отклонения : . 5. Доверительный интервал для дисперсии нормально распределенной генеральной совокупности при неизвестном математическом ожидании. В этом случае для построения доверительного интервала применяют статистику , где – объем случайной выборки ; . Случайная величина имеет - распределение с степенями свободы. Тогда , где , – квантили - распределения. Отсюда для любой реализации случайной выборки находим доверительный интервал для дисперсии случайной величины и доверительный интервал для среднего квадратического отклонения , где – модифицированная выборочная дисперсия; . Статистическая гипотеза – это предположение относительно параметров или вида распределения случайной величины генеральной совокупности. Например, можно рассмотреть гипотезу о размерах изготовляемых деталей, об эффективности лекарства и т. д. Гипотеза называется простой, если она однозначно определяет распределение случайной величины, в противном случае гипотеза называется сложной. Например, если предполагается, что случайная величина распределена по нормальному закону , то гипотеза – простая, а если высказывается утверждение о нормальном распределении случайной величины с заданным параметром , но , то такая гипотеза – сложная. Правило, по которому принимается или отвергается гипотеза о значении параметра распределения случайной величины , называется критерием значимости. Если же распределение случайной величины неизвестно и может быть высказана гипотеза о виде распределения этой случайной величины, то правило, с помощью которого принимают или отрицают данную гипотезу, называется критерием согласия. Процедура проверки гипотез – это процесс, позволяющий для любого значения случайной выборки получить решение: принять или отклонить проверяемую гипотезу . Правило, согласно которому проверяется гипотеза , называется статистической проверкой гипотезы . Гипотеза, подлежащая проверке, называется нулевой или основной и обозначается . Вместе с гипотезой рассматривают одну из альтернативных (конкурирующих) гипотез , заключающуюся в том, что если нулевая гипотеза отвергается, то принимается альтернативная. Например, если проверяется гипотеза о равенстве параметра некоторому заданному значению , то есть , то в качестве альтернативной гипотезы можно рассмотреть одну из следующих гипотез: , , . Статистическая проверка гипотезы основывается на том принципе, что маловероятные события считаются невозможными, а события с большой вероятностью считаются достоверными. Этот принцип реализуется следующим образом. Перед анализом выборки фиксируется уровень значимости – вероятность ошибочного отклонения нулевой гипотезы. Обычно задаются значениями . Для выбора критерия значимости выбирают подходящую статистику , которая обычно совпадает с интервальной статистикой параметра . Пусть – множество значений статистики , а – такое подмножество множества , что , то есть вероятность попадания значений статистики в область , при условии справедливости гипотезы , равна уровню значимости . Если есть выборочное значение статистики , вычисленное по выборке наблюдений, то критерий значимости можно сформулировать следующим образом: если , то отклонить гипотезу , если же , то принять гипотезу . Множество всех значений статистики , при которых принимается решение, отклоняющее гипотезу и принимающее гипотезу , называется критической областью. Совокупность же значений статистики , при которых принимают гипотезу , называется областью принятия гипотезы. Точки, отделяющие критическую область от области принятия решений, называются критическими. Таким образом, для определения критической области статистики используют уровень значимости и учитывают вид альтернативной гипотезы . Уровень значимости определяет «размер» критической области , а расположение критической области на множестве значений статистики зависит от формулировки альтернативной гипотезы . Если проверяется гипотеза , то в случае альтернативной гипотезы () критическая область расположена на правом (левом) «хвосте» распределения статистики , то есть для заданного уровня значимости критическая область задается неравенством (), где , – квантили распределения статистики при условии, что верна гипотеза . Такие критерии называются односторонними (правосторонними и левосторонними). Если для гипотезы формулируется альтернативная гипотеза , то критическая область расположена на обоих «хвостах» распределения статистики , то есть критическая область определяется неравенствами и . В этом случае критерий значимости называется двусторонним. Принимая или отклоняя гипотезу , можно допустить ошибки двух родов: 1) ошибка первого рода имеет место тогда, когда отвергается гипотеза , в то время как в действительности она верна; 2) при ошибке второго рода принимается гипотеза , в то время как верна на самом деле одна из альтернативных гипотез . Пусть – вероятность ошибки первого рода, а – вероятность ошибки второго рода. Тогда можно сказать, что при большом количестве выборок доля ложных заключений равна , если верна гипотеза , и равна , если верна гипотеза . Например, в радиолокации принято, что гипотеза – отсутствие цели, а гипотеза – наличие цели. Тогда принятие гипотезы , когда на самом деле верна гипотеза , называют пропуском сигнала, а вероятность принятия такого решения называется вероятностью пропуска . Величина называется вероятностью правильного обнаружения. Принятие гипотезы , то есть решение о том, что цель присутствует, когда эта гипотеза несправедлива и цели в действительности нет, называется вероятностью ложной тревоги . Предположим, что рассматриваются основная и альтернативная гипотезы. Тогда ошибки первого и второго рода можно изобразить в виде следующей таблицы:
Статистическая проверка гипотезы состоит из следующих этапов: 1) формулировка нулевой и альтернативной гипотез; 2) выбор соответствующего уровня значимости ; 3) определение объема выборки ; 4) выбор статистики критерия значимости или согласия для проверки гипотезы ; 5) определение (по таблицам, по уровню значимости и по альтернативной гипотезе ) критической области и области принятия гипотезы; 6) формулировка правила проверки гипотезы; 7) принятие статистического решения: если значения статистики не входит в критическую область, то принимается гипотеза и отвергается гипотеза , а если входит в критическую область, то отвергается гипотеза и принимается . Результаты проверки статистической гипотезы нужно интерпретировать так: если приняли гипотезу , то можно считать ее доказанной, а если приняли гипотезу , то признали, что гипотеза не противоречит результатам наблюдений. Однако этим свойством наряду с могут обладать и другие гипотезы. Принимая гипотезу , следует проводить еще дополнительные исследования.
Дата добавления: 2014-01-07; Просмотров: 838; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |