Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Доверительный интервал для математического ожидания




Пусть по выборке достаточно большого объема, n > 30, и при заданной доверительной вероятности 1– a необходимо определить доверительный интервал для математического ожидания mx, в качестве оценки которого используется среднее арифметическое

 

Закон распределения оценки математического ожидания близок к нормальному (распределение суммы независимых случайных величин с конечной дисперсией асимптотически нормально).

Если потребовать абсолютную надежность оценки математического ожидания, то границы доверительного интервала будут бесконечными [– ∞, +∞]. Выбор любых более узких границ связан с риском ошибки, вероятность которой определяется уровнем значимости a. Интерес представляет максимальная точность оценки, т.е. наименьшее значение интервала. Для симметричных функций минимальный интервал тоже будет симметричным относительно оценки mx. В этом случае выражение для доверительной вероятности имеет вид

P(| m*x – mx | < ε) = 1– a,

где ε – абсолютная погрешность оценивания.

Нормальный закон полностью определяется двумя параметрами – математическим ожиданием и дисперсией. Величина m*x является несмещенной, состоятельной и эффективной оценкой математического ожидания, поэтому ее значение принимаем за значение математического ожидания. Определим оценку дисперсии случайного параметра m*x, учитывая, что этот параметр равен среднему арифметическому одинаково распределенных случайных величин xi (следовательно, их дисперсии D(xi) одинаковы и равны S 2)

.

Итак, случайная величина m*x распределена по нормальному закону с параметрами m*x и S2/n. Для установления необходимых соотношений целесообразно перейти к центрированным и нормированным величинам. Выражение m*xmx можно трактовать как центрирование случайной величины m*x. Нормирование осуществляется делением на величину среднеквадратического отклонения оценки m*1

Для стандартизованной величины вероятность соблюдения неравенства определяется по функции нормального распределения

где Значение β равно квантили u1–a/2 стандартного нормального распределения уровня 1– a /2. В частности, уровням надежности 0,9, 0,95 и 0,99 соответствуют значения допустимого отклонения u1– a/2 величины z, равные 1,64, 1,96 и 2,58 соответственно. Окончательно можно записать

u 21– a/2 = nε2/m*x. (4.1)

Нетрудно заметить, что это выражение аналогично по своему содержанию формуле, полученной с использованием общего метода построения доверительного интервала.

При фиксированном объеме выборки из (4.1) следует, что чем больше доверительная вероятность 1– a, тем шире границы доверительного интервала (тем больше ошибка в оценке математического ожидания). Это равенство позволяет определить необходимый объем выборки для получения оценки математического ожидания с заданной надежностью и требуемой точностью (погрешностью):

n=S2u21– a/2 2.

Если перейти к относительной погрешности ε0 = ε/ m*x, то

n = S2 u21– a/2 /( ε0 2 m*x2). (4.2)

Таким образом, чтобы снизить относительную погрешность на порядок, необходимо увеличить объем выборки на два порядка. Приведенная формула часто используется в статистическом моделировании для определения необходимого количества испытаний модели.

Во многих случаях предположение о нормальном распределении случайной величины m*x становится приемлемым при n > 4 и вполне хорошо оправдывается при n >10. Оценка m*x вполне пригодна для применения вместо mх. Но не так обстоит дело с дисперсией, правомочность ее замены на S2 не обоснована даже в указанных случаях. При небольшом объеме выборки, n < 30, закон распределения оценки дисперсии S2 принимать за нормальный неоправданно. Ее распределение следует аппроксимировать распределением хи-квадрат как суммы квадратов центрированных величин (хи-квадрат распределение сходится к нормальному при количестве слагаемых, превышающем 30). Но это утверждение обосновано только для случая, когда случайная величина Х распределена нормально.

С учетом сделанных допущений величина z будет подчиняться закону распределения Стьюдента с n –1 степенями свободы (одна степень свободы использована для определения оценки дисперсии). Распределение Стьюдента симметричное, поэтому полученное соотношение между точностью, надежностью оценки и объемом выборки сохраняется, меняются только значения квантилей. Вместо квантили нормального распределения u1– a/2 следует взять квантиль t1– a/2(n–1) распределения Стьюдента с (n –1) степенями свободы. Значения критических точек распределения Стьюдента для некоторых вероятностей и различных степеней свободы, представлены в таблицах. Сравнение таблиц показывает, что квантили распределения Стьюдента больше квантилей нормального распределения того же уровня надежности при малом n. Иначе говоря, применение нормального распределения при небольшом объеме выборки ЭД приводит к неоправданному завышению точности оценки.

Пример 4.2. Определить с надежностью g = 0,9 доверительный интервал для математического ожидания случайной величины с точечными оценками m*х =27,51 и S2 =0,91, n = 44.

Решение. Интервал двусторонний, симметричный a = 0,1. Объем выборки можно считать большим, поэтому воспользуемся нормальным распределением, тогда u0,95 = 1,96. Допустимое отклонение

ε = u0,95(m*2 /n)0,5 =1,96 (0,91/44)0,5 = 0,28.

С вероятностью 0,9 НДГ интервала составит θ 0 =27,51– 0,28=27,23, ВДГ интервала θ 1 = 27,51 + 0,28 = 27,79.

Другими словами, с вероятностью 0,9 значение математического ожидания лежит в пределах от 27,23 до 27,79.

Пример 4.3. Определить с надежностью g = 0,9 (a = 0,1) доверительный интервал для математического ожидания случайной величины с точечными оценками m*х = 55 и S2 = 658,6. Объем выборки n =6

Решение. Объем выборки n=6 нельзя считать большим, поэтому воспользуемся распределением Стьюдента при числе степеней свободы, равном 5. Тогда для двусторонней критической области в соответствии с табл. Функции Стьюдента допустимое отклонение стандартизованной случайной величины составит

t0,9(4)=t(5; 0,1)= 2,015.

Допустимое отклонение исходной величины составит

ε= t0,9(5)(m*2 /n) 0,5 =2,015 (658,6/6)0,5 = 21,11.

Границы интервала: θ 0 =55–21,11=33,89 и θ 1 =55+21,11= 76,11.

В данном примере использование нормального распределения вместо распределения Стьюдента приведет к неоправданному сужению интервала в 2,015/1,64 = 1,3 раза.

 




Поделиться с друзьями:


Дата добавления: 2014-01-07; Просмотров: 645; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.006 сек.