Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Генеральной совокупности по выборке




Статистическое оценивание характеристик распределения

 

10.1. Точечные оценки и их свойства. Метод подстановки.

Так как основная задача математической статистики состо­ит в нахождении распределения наблюдаемой случайной величи­ны X по данным выборки и во многих случаях вид распределения X можно считать известным, то задача сводится к получению приближенных значений неизвестных параметров этого распреде­ления.

Пусть Fx (x, θ) — функция распределения случайной вели­чины X, содержащая один неизвестный параметр θ, а х1, х2,..., хn -выборка наблюдений этой случайной величины. Точечной оценкой неизвестного параметра θ называется приближенное значение этого параметра, полученное по выборке.

Заметим, что оценка есть значение некоторой функции элементов выборки, т.е. = (х1, х2,..., хn). Любую функцию эле­ментов выборки называют статистикой. Для уточнения свойств статистики (х1, х2,..., хn) таких, чтобы ее значения можно считать хорошей в некотором смысле оценкой параметра θ, ее надо рас­сматривать как функцию случайного вектора (Х1, Х2,..., Хn), од­ной из реализаций которого является данная выборка х1, х2,..., хn. Так как закон распределения каждой из случайных величин Xi, i = 1,2,..., n, есть Fx (x, θ), являющаяся функцией параметра θ, то и распределение статистики (х1, х2,..., хn) также зависит от неиз­вестного параметра θ.

Качество оценок характеризуется следующими основными свойствами:

а) Состоятельность. Оценка = (х1, х2,..., хn) называ­ется состоятельной оценкой параметра θ, если сходится по вероятности к θ при n →∞. Последнее означает, что при n →∞.

Состоятельность оценки вбольшинстве случаев уста­навливается с помощью следующей теоремы.

Теорема1. Если и при n →∞, то — состоятельная оценка параметра θ.

б) Несмещенность. Оценка θ называется несмещенной оценкой параметра θ, если ее математическое ожидание равно оцениваемому параметру, т.е. .

Разность называется смещением. Для несмещен­ных оценок систематическая ошибка оценивания равна нулю.

Простейший метод статистического оценивания - метод подстановки или аналогии — состоит в том, что в качестве оценки той или иной числовой характеристики (среднего, дисперсии и др.) генеральной совокупности берут соответствующую характе­ристику распределения выборки - выборочную характеристику.

Пример 38. Пусть х1, х2,..., хn - выборка из генеральной со­вокупности с конечными математическим ожиданием и дисперси­ей σ2. Используя метод подстановки, найти оценку т. Проверить свойства несмещенности и состоятельности полученной оценки.

Решение. По методу подстановки в качестве оценки т ма­тематического ожидания возьмем математическое ожидание рас­пределения выборки - выборочное среднее. Тогда, получим

.

Для проверки несмещенности и состоятельности выбо­рочного среднего как оценки т, рассмотрим эту статистику как функцию выборочного вектора (Х1, Х2,..., Хn). По определению вы­борочного вектора имеем: M[Xi]=т и D[Xi]=σ2, i = 1,2,..., п, причем Xi - независимые в совокупности случайные величины.

В данном случае будем иметь

,

.

Отсюда по определению получаем, что - несмещенная оценка т, и так как при n →∞, то в силу теоремы 1 является состоятельной оценкой математического ожидания т генеральной совокупности.

Пример 39. Доказать теорему о состоятельности оценки.

Доказательство: для оценки параметра θ может быть пред­ложено несколько несмещенных оценок. Мерой точности несме­щенной оценки считают ее дисперсию D[ ].

Пусть и - две различные несмещенные оценки пара­метра θ. Если D[ ]<D[ ], то говорят, что оценка более эф­фективна, чем оценка .

В предположении, что распределение случайной величины Х и статистика удовлетворяют некоторым условиям регулярно­сти *), для дисперсии несмещенной оценки параметра θ вы­полняется неравенство Крамера - Рао:

, где 1п (θ) - информация Фишера, содержащаяся в выборке объема п относительно неизвестного параметра θ. Для непрерывной случайной величины Х сплотностью распределения fx (x, θ) .

Если же Х- дискретная случайная величина, то , где р(Х, θ) = Р[Х = х].

Условия регулярности (А*)выполняются для обычно ис­пользуемых статистик нормального, биномиального и пуассонов-ского распределений.

Несмещенная оценка параметра θ, дисперсия которой достигает своего наименьшего возможного значения , называется эффективной: .

Несмещенная оценка называется асимптотически эффективной оценкой параметра θ, если .

Если условия регулярности (А*) не выполняются, то может существовать несмещенная оценка параметра θ, дисперсия кото­рой меньше, чем нижняя граница в неравенстве .

Такая оценка называется сверхэффективной.

 

10.2. Метод максимального правдоподобия

 

Метод максимального правдоподобия является одним из наиболее распространенных методов нахождения оценок неиз­вестных параметров распределения генеральной совокупности. Пусть Х- непрерывная случайная величина с плотностью распре­деления fx (x, θ), зависящей от неизвестного параметра θ, значе­ние которого требуется оценить по выборке объема п. Плотность распределения выборочного вектора (Х1, Х2,..., Хn)можно записать в виде .

Пусть х1, х2,..., хn - выборка наблюдений случайной величины X,по которой находится оценка неизвестного параметра.

Функцией правдоподобия L(θ) выборки объема п называет­ся плотность выборочного вектора, рассматриваемая при фикси­рованных значениях переменных х1,...,хп. Функция правдоподо­бия является, таким образом, функцией только неизвестного параметра θ, т.е. .

Аналогично определим функцию правдоподобия выборки дискретной случайной величины X. Пусть Х- дискретная случай­ная величина, причем вероятность Р[Х = х]= р(х, θ) есть функ­ция неизвестного параметра θ. Предполагая, что для оценки па­раметра θ получена конкретная выборка наблюдений случайной величины X объема п: х1,...,хп. Функция правдоподобия L(θ) вы­борки объема п равна вероятности того, что компоненты выбо­рочного вектора Х1,...,Хn примут фиксированные значения х1,...,хп, т.е. .

Метод максимального правдоподобия состоит в том, что в качестве оценки неизвестного параметра θ принимается значение , доставляющее максимум функции правдоподобия. Такую оценку называют МП - оценкой. В случае дискретного распреде­ления наблюдаемой случайной величины X МП - оценка неиз­вестного параметра θ есть такое значение , при котором веро­ятность появления данной конкретной выборки максимальна. Аналогичную интерпретацию МП - оценки дают и в случае оценки параметра распределения непрерывной случайной величины.

Для упрощения вычислений, связанных с получением МП -оценок, в некоторых случаях удобно использовать логарифмиче­скую функцию правдоподобия, т.е. ln L(θ).

При выполнении некоторых достаточно общих условий МП - оценки состоятельны, асимптотически эффективны и асимпто­тически нормально распределены. Последнее означает, что при увеличении объема выборки п для МП - оценки неизвестного параметра θ выполняется условие .

Если для параметра θ существует эффективная оценка, то метод максимального правдоподобия дает именно эту оценку и другой МП - оценки не существует.

 

Пример 40. Найти МП - оценки математического ожидания т и дисперсии σ2 нормально распределенной генеральной сово­купности.

Решение. Пусть х12,...,хп - выборка наблюдений случай­ной величины X с плотностью распределения

.

Найдем функцию правдоподобия L(m, σ2). Имеем

.

Логарифмическая функция правдоподобия отсюда равна

.

Используя необходимые условия максимума , по­лучим систему уравнений для нахождения искомых МП - оценок:

,

.

Из первого уравнения этой системы находим .

Подставляя полученное значение во второе уравнение, будем иметь .

Отметим, что выборочное среднее является несмещенной и состоятельной оценкой т (см. пример 38), а также эффективной оценкой в случае нормально распределенной генеральной сово­купности (убедитесь в этом самостоятельно). Выборочная диспер­сия является состоятельной и смещенной оценкой σ2.

Пример 41. Найти МП - оценку параметра X распределе­ния Пуассона.

Решение. Пусть х1,...,хп - выборка наблюдений случайной величины X, имеющей распределение Пуассона с неизвестным параметром X, т.е.

,

где х принимает неотрицательные целочисленные значения, х = 0,1,2. Функция правдоподобия L(λ) выборки объема п определяется так: .

Найдем логарифмическую функцию правдоподобия:

.

Используя необходимое условие экстремума, получим урав­нение для определения МП-оценки:

.

Отсюда следует, что .

Полученная МП - оценка является несмещенной и состоя­тельной оценкой λ (пример 38), а также эффективной оценкой этого параметра.

 

10.3. Метод моментов

 

Для получения оценок неизвестных параметров θ12,...,θs распределения генеральной совокупности X используется и метод моментов. Поясним его.

Пусть f х (х, θ12,...,θs) - плотность распределения случай­ной величины X. Определим с помощью этой плотности S каких-либо моментов случайной величины X, например, первые S на­чальных моментов, по формулам

, m =1,2,..., S.

По выборке наблюдений случайной величины найдем зна­чения соответствующих выборочных моментов:

, m =1,2,..., S.

Попарно приравнивая теоретические моменты αт случай­ной величины X их выборочным значениям , получаем систему s уравнений с неизвестными θ12,...,θs:

, m =1,2,..., S.

Решая полученную систему относительно неизвестных θ12,...,θs, находим оценки неизвестных параметров.

Аналогично находятся оценки неизвестных параметров по выборке наблюдений дискретной случайной величины.

Пример 42. Методом моментов найти оценки неизвестных параметров а и b для Г - распределения с плотностью

.

Решение. Для нахождения оценок параметров а и b по мето­ду моментов воспользуемся начальным моментом первого поряд­ка (математическим ожиданием) и центральным моментом второ­го порядка (дисперсией):

, .

По выборке х1,...,хn из генеральной совокупности, имеющей Г-распределение, находим значения соответствующих выборочных моментов:

, .

Приравнивая соответствующие равенства, получаем сле­дующую систему уравнений:

, . Решая ее, находим , .

 

10.4. Распределения χ2, Стьюдента и Фишера.

 

Распределения основных статистик, вычисляемых по выборке из нормально распределенной генеральной совокупности, связаны с распределениями χ2 (k), Стьюдента Т(к) и Фишера F(k1,k2).

Квантили этих распределений приведены в приложении (таблицы П5, П6, П7). Дадим определения и некоторые свойства этих рас­пределений.

а) Распределением χ2 с k степенями свободы называется распределение случайной величины χ2 (k), равной сумме квадра­тов k независимых нормально распределенных по закону N(0,1) случайных величин Ui, i = 1,2,..., k, т. е. распределение случайной величины .

Распределение χ2 с k степенями свободы там, где это не вызывает недоразумений, будет обозначаться также χ2 (k).

Плотность распределения определяется формулой

.

График функции приведен на рис. 12. Среднее и дис­персия распределения χ2 (k) равны соответственно: M[χ2 (k)] = k, D[χ2 (k)] = 2k.

 

 

Рис. 12.

Распределение χ2 часто используется в статистических рас­пределениях. Рассмотрим следующую теорему.

Теорема 2. Пусть х12,...,хп - выборка из нормально рас­пределенной генеральной совокупности N(m,σ), a и - соответственно выборочное среднее и выборочная дисперсия. Тогда статистики и S2 - независимые случайные величины, причем статистика имеет распределение χ2 (n -1).

Заметим, что если χ2 (k 1) и χ2 (k 2) - независимые случай­ные величины, имеющие распределение χ2 с k 1 и k 2степенями свободы соответственно, то сумма этих случайных величин имеет распределение χ2 с (k 1, k 2 ) степенями свободы: χ2 (k 1)+ χ2 (k 2)= χ2 (k 1+ k 2).

Распределение χ2 (k) при больших значениях k k>30 с достаточной для практических расчетов точностью аппроксими­руется нормальным распределением.

Это свойство используется для приближенного выражения квантилей распределения χ2 (k) через квантили ир нор­мального распределения N(0,1). Обычно используют следующие две формулы:

и .

 

Первая формула, применяемая при к≥30 и р≥ 0,5,дает относительную погрешность в пределах 1%, а вторая формула применяется для вычисления квантилей малого порядка.

 

Пример 43. Вычислить квантили , , .

Решение. По таблице приложений (П5) находим . Для вычисления квантили воспользуем­ся первой формулой. Так как и0,95 = 1,645 (см. таблицу приложе­ние П1), то .

По второй формуле, используя значение и0,01 = и0,99 = -2,326 получаем .

б) Распределением Стъюдента с k степенями свободы на­зывается распределение случайной величины Т(k), равной отно­шению двух независимых случайных величин U и , т. е.

,

где U имеет нормальное распределение N(0,1). Распределение Стьюдента с k степенями свободы будет также обозначаться Т(k). Распределение Стьюдента с k степенями свободы имеет плотность fT(x) (рис. 13):

 

 

Рис. 13.

, -∞< x <+∞,

среднее М[Т(к)] = 0 и дисперсию , к > 2.

Плотность распределения Стьюдента симметрична относи­тельно оси ординат, тогда для квантилей tp(k) имеет место соот­ношение tp(k) = - t1-p(k).

При больших k (k>30) для квантилей tp(k) распределения Стьюдента выполнено приближенное равенство tp(к)ир. Более точная формула имеет вид .

Пример 44. Найти квантили t0,05(8) и t0,90(40).

Решение. По таблице приложений (П6) находим t0,95(8) = l,86; t0,05(8) = -t0,95(8) = -l,86. Квантиль t0,90(40) опреде­лим, используя записанную выше формулу. Так как и0, 90 = 1,28 по таблице приложений (П1), то

Точное значение квантили t0,90(40) по таблице приложений (П6) равно 1,303.

 

в) Распределением Фишера с k1 и k2 степенями свободы называется распределение случайной величины F(k1,k2), равной отношению двух независимых случайных величин и , т.е .

Распределение Фишера с k1 и k2 степенями свободы обо­значается так: F(k1,k2). Распределение Фишера с k1 и k2 степенями свободы имеет плотность fF(x) (рис. 14):

 

 

 

 

Рис. 14.

.

среднее , .

Квантили распределения Фишера порядка р и 1 - р связаны между собой так: .

Между случайными величинами, имеющими нормальное распределение, распределения χ2 Стьюдента и Фишера, имеют место соотношения: Т2(k) = F( 1 ,k), и .

При k1 > 1 и k2 > 1 квантили распределения Фишера можно вычислить, используя приближенную формулу

.

Пример 45. Найти следующие квантили F0,01(3,5), F0,90(4,100) и F0,05(60,120).

Решение. Используя известное соотношение и таблицу при­ложений (П7), получаем .

Далее находим .

Далее находим, используя значение u 0,05 =- u 0,95 =-1,645, .

По таблице приложений (П7) значение квантили F 0,05(60,120) равно .

 




Поделиться с друзьями:


Дата добавления: 2014-11-20; Просмотров: 1283; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.009 сек.