Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Статистические гипотезы




Точечной оценкой неизвестного параметра называют число (точку на числовой оси), которое приблизительно равно оцениваемому параметру и может заменить его с достаточной степенью точности в статистических расчетах.

Точечные и интервальные оценки

Оценка надежности на основе статистической информации

 

 

Вопрос о выборе закона распределения является одним из ключевых на конечной стадии расчета надежности и носит характер принятия той или иной гипотезы. От принятой гипотезы будет зависеть достоверность полученных результатов, эффективность сделанных выводов и рекомендаций.

К сожалению, фактические наблюдения показывают, что изменчивость законов распределений встречается довольно часто, причем для одних и тех же объектов. Относительно небольшое изменение объема статистических данных, условий или режимов эксплуатации или даже качества изготовления деталей может повлиять на нулевую гипотезу, т.е. изменить либо параметры закона распределения, либо даже его вид.

При оценке надежности выделяют три основные области статистических методов обработки результатов наблюдений – описание данных, оценивание (характеристик и параметров распределений, регрессионных зависимостей) и проверка статистических гипотез.

Описание данных – предварительный этап статистической обработки. Используемые при описании данных величины (статистические данные) являются результатом наблюдений, (измерений, опытов, испытаний) и применяются в дальнейшем для оценивания и проверки гипотез. Функции этих результатов называют «статистиками». Статистики, являющиеся выборочными аналогами характеристик случайных величин (математического ожидания, медианы, дисперсии, моментов и др.) и используемые для оценивания этих характеристик, называют статистическими характеристиками.

Оценивание – это определение приближенного значения неизвестной характеристики или параметра распределения (генеральной совокупности), иной оцениваемой составляющей математической модели реального явления или процесса по результатам наблюдений. Иначе: необходимо по данным выборочного распределения оценить неизвестные параметры теоретического распределения.

Оценивание проводят с помощью оценок – статистик. Оценивание бывает двух видов – точечное и интервальное.

 

 

 

7.1.1 Точечное оценивание – способ оценивания, заключающийся в том, что значение оценки принимается как неизвестное значение параметра распределения.

 

Для того чтобы точечные статистические оценки обеспечивали «хорошие» приближения неизвестных параметров, они должны быть несмещенными, состоятельными и эффективными.

 

Несмещенной называют статистическую оценку Q*, математическое ожидание которой равно оцениваемому параметру Q, то есть

M(Q*) = Q. (7.1)

Оценки, для которых это соотношение неверно, называются смещенными. При этом разность между математическим ожиданием оценки Q* и оцениваемым параметром Q, т.е. M(Q*) – Q, называется смещением оценки.

Пусть Q* есть статистическая оценка неизвестного параметра Q теоретического распределения. Допустим, что по выборке объема n найдена оценка Q*1. Повторим опыт, т. е. извлечем из генеральной совокупности другую выборку того же объема и по ее данным найдем оценку Q*2 и т. д. Получим числа Q*1, Q*2, …, Q* k которые будут различаться. Таким образом, оценку Q* можно рассматривать как случайную величину, а числа Q*1, Q*2, …, Q* k как возможные ее значения.

Если оценка Q* дает приближенное значение Q с избытком, то найденное по данным выборок число Q (k = 1, 2, …, n) будет больше истинного значения Q. Следовательно, и математическое ожидание (среднее значение) случайной величины Q* будет превышать Q, то есть M(Q*) > Q. Если Q* дает приближенное значение Q с недостатком, то M(Q*) < Q.

Использование статистической оценки, математическое ожидание которой не равно оцениваемому параметру, приводит к систематическим ошибкам.

 

Поэтому нужно потребовать, чтобы математическое ожидание оценки Q было равно оцениваемому параметру.

Практически все оценки параметров, используемые в вероятностно-статистических методах, являются либо несмещенными, либо асимптотически несмещенными. Для несмещенных оценок показателем точности оценки служит дисперсия – чем дисперсия меньше, тем оценка лучше. Для смещенных оценок показателем точности служит математическое ожидание квадрата оценки М(Q*– Q)2.

Несмещенная оценка не всегда дает хорошее приближение оцениваемого параметра. Действительно, возможные значения Q* могут быть сильно рассеяны вокруг своего среднего значения, т. е. дисперсия величины Q* может быть значительной. В этом случае найденная по данным одной выборки оценка может оказаться удаленной от своего среднего значения, а значит, и от самого оцениваемого параметра, например, приняв Q*1 в качестве приближенного значения Q, мы допустили бы ошибку. Если потребовать, чтобы дисперсия величины Q* была малой, то возможность допустить ошибку будет исключена. Поэтому к статистической оценке предъявляются требования эффективности.

Эффективной называют статистическую оценку, которая (при заданном объеме выборки n) имеет наименьшую возможную дисперсию. При рассмотрении выборок большого объема к статистическим оценкам предъявляется требование состоятельности. Доказано, что среднеквадратическое М [ Х ]* и несмещенная оценка дисперсии S 2 являются эффективными оценками параметров М [ Х ] и D [ Х ] нормального распределения.

Состоятельной называют статистическую оценку, которая при n ® ¥ стремится по вероятности к оцениваемому параметру. Например, если дисперсия несмещенной оценки при n ® ¥ стремится к нулю, то такая оценка оказывается также состоятельной.

Оценка математического ожидания. Пусть имеется случайная величина Х с математическим ожиданием М [ Х ] и дисперсией D [ Х ], при этом оба параметра неизвестны. Над величиной Х произведено N независимых экспериментов, в результате которых была получена совокупность численных результатов х 1, х 2,…, хN.

В качестве оценки математического ожидания естественно предположить среднее арифметическое наблюдаемых значений:

. (7.2)

Оценка математического ожидания является несмещенной.

 

Например, одним прибором (без систематических ошибок) сняли показания случайной величины, т.е. х 1 = 13, х 2 = 15, х 3 = 17. Простая несмещенная оценка математического ожидания cоставит М [ Х ]* = (13 + 15 + 17)/3 = 15. (т.е. это среднее значение наблюдаемой величины).

 

Оценка дисперсии. Дисперсия характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

При больших объемах выборки для оценки дисперсии используют формулу выборочной дисперсии

. (7.3)

Для случая предыдущего примера:

D [ Х ]* = ((13 – 15)2 + (15 – 15) 2 + (17 – 15) 2)/3 = 8/3 = 2,67.

 

Это смещенная оценка генеральной дисперсии.

 

Для получения несмещенной оценки дисперсии генеральной совокупности, нужно умножить выборочную дисперсию на . Тогда получиться величина, называемая исправленной выборочной дисперсией

. (7.4)

Выражение для исправленной дисперсии является несмещенной оценкой генеральной дисперсии

А оценку среднего квадратического отклонения (стандарта) осуществляют по формуле:

S * = Ö S 2 . (7.5)

S 2 = 3 × 2,67/(3 – 1) = 4.

Точечные оценки параметров генеральной совокупности могут быть приняты в качестве ориентировочных, первоначальных результатов обработки выборочных данных.

 

7.1.2. Интервальные оценки. Интервальное оценивание особенно необходимо при малом количестве наблюдений, когда точечная оценка малонадежна.

Интервальной называют оценку, которая определяется двумя числами – концами отрезков. Оценивание с помощью доверительного интервала – это способ оценки, при котором с заданной доверительной вероятностью g устанавливают границы доверительного интервала.

 

Задачу интервального оценивания в самом общем виде можно сформулировать так: по данным выборки построить числовой интервал, относительно которого с заранее выбранной вероятностью можно сказать, что этот интервал покроет (накроет) оцениваемый параметр.

 

Выбор значения доверительной вероятности не является математической задачей, а определяется конкретной решаемой проблемой.

 

Доверительным интервалом для параметра Q называется такой интервал, относительно которого можно с заранее выбранной вероятностью

g = 1 – a (7.6)

(близкой к единице), утверждать, что он содержит неизвестное значение параметра Q; a – уровень значимости.

 

Пусть Q* – несмещенная оценка параметра Q. Требуется оценить возможную при этом ошибку. По определенным правилам находят такое число d > 0, чтобы выполнялось соотношение:

 

P (|Q*– Q| < d) = g или P (Q min < Q < Q max) = g. (7.7)

 

Равенство означает, что интервал [Q min; Q max ], где Q min = Q* – d, а Q max = Q* + d, заключает в себе оцениваемый параметр с доверительной вероятностью g.

Нижняя и верхняя граница доверительного интервала Q1 и Q2 определяются по результатам наблюдений, следовательно, сам доверительный интервал является случайной величиной. В связи с этим говорят, что доверительный интервал покрывает оцениваемый параметр с вероятностью g.

Надежность принято выбирать равной 0,95; 0,99; 0,999 – тогда событие, состоящее в том, что интервал [Q min; Q max ], покрывает параметр Q будет практически достоверным.

При этом число d характеризует точность интервальной оценки: чем меньше d, тем оценка точнее и наоборот.

7.1.2.1. Интервальная оценка математического ожидания при известной дисперсии. Пусть случайная величина Х Î N (М [ Х ]; D [ Х ] ) распределена по нормальному закону, причем математическое ожидание неизвестно, а дисперсия D [ Х ] = s2 известна. Требуется оценить неизвестное математическое ожидание. По наблюдениям найдем точечную оценку М [ Х ]* математического ожидания. Зададимся вероятностью g и найдем такое число d, чтобы выполнялось соотношение:

. (7.8)

Доказано, что построение доверительного интервала в этом случае осуществляется по формуле:

, (7.9)

где tу – значение стандартной нормальной величины, соответствующее надежности , а Ф(tу) – функция Лапласа; s – среднее квадратическое отклонение.

Очевидно, что увеличение надежности g приводит к увеличению функции Ф(tу) и соответственно увеличению параметра tу, что в свою очередь увеличивает величину d. То есть увеличение надежности оценки ведет к снижению ее точности (увеличению погрешности).

При этом точность оценки математического ожидания равна:

. (7.10)

Очевидно, что с увеличением объема выборки n величина погрешности d уменьшается, т.е. точность оценки повышается.

Формула (7.10) позволяет определить необходимый объем выборки для оценки математического ожидания с наперед заданной точностью и надежностью:

. (7.11)

Смысл формулы (7.8) состоит в следующем: с надежностью g доверительный интервал покрывает неизвестный параметр М [ Х ]*генеральной совокупности. Можно сказать иначе: точечная оценка М [ Х ]* определяет значение параметра Х генеральной совокупности с точностью и надежностью g.

 

Каждому доверительному интервалу соответствует свое критическое значение. Например, для g = 0,95 t у = ± 1,96, а для g = 0,99 и a = 0,01 t у = ± 2,58.

 

Рис. 7.1. Гауссова кривая для g = 0,95 и g = 0,99

Пример 7.1. Случайная величина имеет нормальное распределение. Найти доверительные интервалы для оценки с надежностью 0,96 неизвестного математического ожидания а, если объем выборки n = 49, генеральное среднее квадратическое отклонение s = 5; выборочная средняя М [ X ]* = 30.

Решение.

Поскольку g = 0,96, то Ф(t g) = g/2 = 0,48. По табл. функции Лапласа (Приложение 2) находим для Ф(t g) = 0,48 t g = 2,06.

Точность оценки математического ожидания:

,

.

28,53 < М [ X ]* < 31,47.

 

Пример 7.2. Имеется генеральная совокупность с некоторой характеристикой, распределенной по нормальному закону. Дисперсия равна 6,25. Выборка имеет объем n = 27. Получено средневыборочное значение характеристики ` х = 27. Найти доверительный интервал с надежностью g = 0,99, покрывающий неизвестное математическое ожидание исследуемой характеристики.

Решение. Для Ф(t g) = 0,99/2 = 0,495 t g = 2,58.

,

Отсюда, доверительный интервал (10,76; 13,24).

 

Пример 7.3. Найти минимальный объем выборки n, при котором с надежностью 0,95 можно утверждать, что точность оценки математического ожидания M [ X ], по выборочному среднему арифметическому равна d = 0,2, если известно, что среднее квадратическое отклонение s = 2,0. Предполагается, что выборка величины нормально распределена.

Решение: По таблице находим, что при Ф(t) = 0,95/2 = 0,475 t = 1,96.

Значит, объем выборки должен бать не менее 385.

 

7.1.2.2. Интервальная оценка математического ожидания при неизвестной дисперсии. На практике как математическое ожидание генеральной совокупности, так и его отклонение часто бывают неизвестными.

Ирландским статистиком Уильямом С. Госсетом было предложено t -распределение Стьюдента, позволившее разрешить проблему оценивания математического ожидания при неизвестной дисперсии.

Внешне график этого распределения очень напоминает стандартизованное нормальное распределение (представляет собой колокообразную форму и является симметричным).

 

Рис. 7.2. Стандартизованное нормальное распределение и t -распределение Стьюдента с различным числом степеней свободы

 

В результате по наблюдениям находятся точечные оценки математического ожидания и дисперсии.

В этом случае построение доверительного интервала осуществляется по формуле:

(7.12)

где t g t – значение функции распределения Стьюдента (t -распределения), соответствующее степеням свободы k = n – 1 и надежности g.

При этом точность оценки математического ожидания равна: .

Из уравнений видно, что распределение Стьюдента определяется числом степеней свободы и не зависит от неизвестных параметров математического ожидания и среднеквадратического отклонения.

 

Пример 7.4. Случайная величина Х имеет нормальное распределение. По выборке объема n = 61 найдена выборочная средняя M [ X ]* = 30 и исправленное среднее квадратичное значение S 2 = 1,5. Найти доверительный интервал для оценки с надежностью g = 0,95 неизвестного математического ожидания.

Решение:

Определим число степеней свободы k = n – 1 = 61 – 1 = 60.

Уровень значимости a = 1 – g = 1 – 0,95 = 0,05.

По таблице распределения Стьюдента (Приложение 3) находим значение t g t = 2,0.

Тогда

Доверительный интервал для неизвестного математического ожидания с надежностью g = 0,95 равен: 29, 613 < m < 30,387.

 

 

7.1.2.3. Доверительные интервалы для среднего квадратичного отклонения и дисперсии. При определении границ доверительных интервалов для дисперсии и среднего квадратического отклонения нормально распределенной случайной величины Х используется статистика , которая распределена по закону c2с n – 1 степенями свободы.

По заданной надежности g можно найти сколько угодно границ c21 и c22 интервалов, таких, что

Р (c21 < c2< c22) = g. (7.13)

 

При этом границы находятся из условий

Р (c2 £ c21) = (1 – g)/2. (7.14)

Р (c2 ³ c22) = (1 – g)/2. (7.15)

Для того, чтобы можно было воспользоваться таблицами распределения Пирсона (несимметричное распределение), преобразуем (7.14) в:

Р (c2 ³ c21) = (1 + g)/2. (7.16)

Т.о. для нахождения доверительного интервала для дисперсии, значения концов интервала равны

. (7.17)

 

Пример 7.5. По данным выборки объема n = 26 из генеральной совокупности определена несмещенная оценка дисперсии S 2 = 4. Предполагая, что исследуемый количественный признак распределен нормально, найти доверительный интервал, накрывающий дисперсию D [ X ] с надежностью g = 0,95.

Решение. Для (1 + g)/2 = 0,975 и (1 – g)/2 = 0,025 при n – 1 = 25 по таблицам (Приложение 4) находим величины c21 = 13,12 и c22 = 40,65.

Вычисляем границы доверительного интервала

,

Значит, с надежностью 0,95 можно утверждать, что неизвестное значение дисперсии находится в границах: 2,46 < D [ X ] < 7,62.

При нахождении доверительного интервала для среднего квадратического отклонения s, исходя из определения доверительного интервала

Р (S – d < s < S + d) = g, (7.18)

для нахождения границ интервала необходимо знать закон распределения статистики, которая для этого случая преобразуется в .

Тогда

. (7.19)

По заданным n и g по таблице находим величину q = d/ S.

Границы доверительного интервала

a = S (1 – q); b = S (1 + q). (7.20)

 

Пример 7.6. По данным выборки объема n = 26 из генеральной совокупности определена оценка средеквадратического отклонения Ö S 2 = 2. Предполагая, что исследуемый количественный признак распределен нормально, найти доверительный интервал, накрывающий sс надежностью g = 0,95.

Решение. По таблице (Приложение 5) для g = 0,95 и n – 1 = 25 находим q = 0,32. Тогда по (7.20)

a = 2(1 – 0,32) = 1,36; b = 2 (1 + 0,32) = 2,64.

Значит, с надежностью 0,95 можно утверждать, что неизвестное значение среднеквадратического отклонения находится в границах:

1,36 < s < 2,64.

 

 

 

Статистической гипотезой называется любое предположение о виде закона распределения и (или) его параметрах.

 

Статистические гипотезы делятся на непараметрические (о законе распределения) и параметрические (о его параметрах).

 

Например, статистической является гипотеза о том, что распределение производительности труда рабочих, выполняющих одинаковую работу в одинаковых условиях, имеет нормальный закон распределения. Статистической будет также гипотеза о том, что средние размеры деталей, производимые на однотипных, параллельно работающих станках, не различаются. Часто распределение величины X известно, и по выборке наблюдений необходимо проверить предположения о значении параметров этого распределения. Такие гипотезы называются параметрическими.

 

Статистическая гипотеза называется простой, если она однозначно определяет распределение случайной величины X, в противном случае гипотеза называется сложной.

 

Например, простой гипотезой является предположение о том, что случайная величина X распределена по нормальному закону с математическим ожиданием, равным нулю, и дисперсией, равной единице. Если высказывается предположение, что случайная величина X имеет нормальное распределение с дисперсией, равной единице, а математическое ожидание — число из отрезка [ a, b ], то это сложная гипотеза.

 

Одну из гипотез выделяют в качестве основной (или нулевой) и обозначается H 0. Наряду с гипотезой H 0. рассматривают одну из альтернативных (конкурирующих) гипотез H 1. Например, если проверяется гипотеза о равенстве параметра Q некоторому заданному значению Q0, то есть H 0: Q = Q0, то в качестве альтернативной гипотезы можно рассмотреть одну из следующих гипотез: H 0(1): Q > Q0; H 0(2): Q < Q0; H 0(3): Q ¹ Q0; H 0(4): Q = Q1; где Q1 — заданное значение, Q1 ¹ Q0. Выбор альтернативной гипотезы определяется конкретной формулировкой задачи.

Имея две гипотезы H 0 и H 1, на основе выборки прижимают либо основную, либо конкурирующую.

 

Правило, по которому принимается решение принять или отклонить гипотезу H 0, называется статистическим критерием (или просто критерием) проверки гипотезы H 0.

 

Статистический критерий – это правило, по которому принимается решение по нулевой гипотезе. Для построения критерия выбирают статистику К, т. е. некоторую функцию от результатов измерений или наблюдений, находят (или заранее знают) ее распределение и (при традиционном подходе к применению статистических критериев) задаются некоторым ее значением, kкр вероятность превышения (или вероятность принятия меньшего значения) которого считается пренебрежимо малой и равной a.

Критическими точками (значениями) называют точки, отделяющие область принятия гипотезы от критической области. Критической областью называют совокупность значений статистики, при которых нулевая гипотеза отвергается.

Областью принятия гипотезы называется совокупность значений статистики, при которых гипотезу не отвергают. Если наблюденное значение статистики принадлежит критической области – гипотезу отвергают. Если значение статистики «попало» в область допустимых значений, то гипотезу не отвергают.

 

Т.е. могут быть допущены ошибки двух родов.

 

Ошибка первого рода состоит в том, что отвергается нулевая гипотеза, когда она на самом деле верна.

 

Ошибка второго рода – отвергается альтернативная гипотеза, когда она на самом деле верна.

 

Вероятность ошибки первого рода (обозначается через a) называется уровнем значимости критерия. Уровень значимости a определяет размер критической области. Он задается обычно заранее. Чем меньше a, тем меньше вероятность отклонить верную гипотезу. Вероятность ошибки второго рода обозначают b. Вероятность b зависит от конкурирующей гипотезы и может быть вычислена только, если она является простой. Величина 1 – b называется мощностью критерия. Чем выше мощность критерия, тем он эффективнее. Чем меньше вероятность ошибки 1-го рода, тем больше вероятность ошибки 2-го рода.

 

Современный подход к применению статистических критериев состоит в том, что уровень значимости не задают заранее, а определяют по наблюденному значению статистики примененного критерия. Если этот уровень превышает 0,1, то принято считать, что нулевая гипотеза почти наверняка верна. Если этот уровень равен 0,01 или менее, то принято считать, что нулевая гипотеза почти наверняка неверна (в этом случае вероятность того, что она правильна всего лишь 1% или менее). Область значений a между 0,01 и 0,1 представляет собой область сомнений, когда желательно повторение опыта. Понятно, что оснований для сомнений тем больше, чем меньше a.

 

Значение a = 0,05 считается таким, когда шансы отвергнуть правильную гипотезу (отвергнуть Н 0, когда она верна) или принять неверную гипотезу (не отвергнуть Н 0, когда она неверна) приблизительно равны.

 

 

Вопросы для самоконтроля.

1. Что понимают под оцениванием параметра? Какие виды оценивания применяются?

2. Для чего применяют точечное оценивание? Какими свойствами должны обладать точечные статистические оценки?

3. Как определяется смещение оценки? Дайте характеристику этого свойства.

4. Дайте определение интервального оценивания. Сформулируйте задачу интервального оценивания.

5. Статистические гипотезы – определение, классификация. Определение ошибки первого и второго рода.

 

 





Поделиться с друзьями:


Дата добавления: 2015-04-30; Просмотров: 959; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.141 сек.