КАТЕГОРИИ:

Главная
Случайная страница
Познавательное
Новые статьи
Контакты
Заказать работу

Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Генеральной совокупности по выборке

⇐ Предыдущая 10 11 12 131415 16 17 18 19 Следующая ⇒

Статистическое оценивание характеристик распределения

10.1. Точечные оценки и их свойства. Метод подстановки.

Так как основная задача математической статистики состоит в нахождении распределения наблюдаемой случайной величины X по данным выборки и во многих случаях вид распределения X можно считать известным, то задача сводится к получению приближенных значений неизвестных параметров этого распределения.

Пусть F_x (x, θ) — функция распределения случайной величины X, содержащая один неизвестный параметр θ, а х₁, х₂,..., х_n -выборка наблюдений этой случайной величины. Точечной оценкой неизвестного параметра θ называется приближенное значение этого параметра, полученное по выборке.

Заметим, что оценка есть значение некоторой функции элементов выборки, т.е. = (х₁, х₂,..., х_n). Любую функцию элементов выборки называют статистикой. Для уточнения свойств статистики (х₁, х₂,..., х_n) таких, чтобы ее значения можно считать хорошей в некотором смысле оценкой параметра θ, ее надо рассматривать как функцию случайного вектора (Х₁, Х₂,..., Х_n), одной из реализаций которого является данная выборка х₁, х₂,..., х_n. Так как закон распределения каждой из случайных величин X_i, i = 1,2,..., n, есть F_x (x, θ), являющаяся функцией параметра θ, то и распределение статистики (х₁, х₂,..., х_n) также зависит от неизвестного параметра θ.

Качество оценок характеризуется следующими основными свойствами:

а) Состоятельность. Оценка = (х₁, х₂,..., х_n) называется состоятельной оценкой параметра θ, если сходится по вероятности к θ при n →∞. Последнее означает, что при n →∞.

Состоятельность оценки вбольшинстве случаев устанавливается с помощью следующей теоремы.

Теорема1. Если и при n →∞, то — состоятельная оценка параметра θ.

б) Несмещенность. Оценка θ называется несмещенной оценкой параметра θ, если ее математическое ожидание равно оцениваемому параметру, т.е. .

Разность называется смещением. Для несмещенных оценок систематическая ошибка оценивания равна нулю.

Простейший метод статистического оценивания - метод подстановки или аналогии — состоит в том, что в качестве оценки той или иной числовой характеристики (среднего, дисперсии и др.) генеральной совокупности берут соответствующую характеристику распределения выборки - выборочную характеристику.

Пример 38. Пусть х₁, х₂,..., х_n - выборка из генеральной совокупности с конечными математическим ожиданием и дисперсией σ². Используя метод подстановки, найти оценку т. Проверить свойства несмещенности и состоятельности полученной оценки.

Решение. По методу подстановки в качестве оценки т математического ожидания возьмем математическое ожидание распределения выборки - выборочное среднее. Тогда, получим

Для проверки несмещенности и состоятельности выборочного среднего как оценки т, рассмотрим эту статистику как функцию выборочного вектора (Х₁, Х₂,..., Х_n). По определению выборочного вектора имеем: M[X_i]=т и D[X_i]=σ², i = 1,2,..., п, причем X_i - независимые в совокупности случайные величины.

В данном случае будем иметь

Отсюда по определению получаем, что - несмещенная оценка т, и так как при n →∞, то в силу теоремы 1 является состоятельной оценкой математического ожидания т генеральной совокупности.

Пример 39. Доказать теорему о состоятельности оценки.

Доказательство: для оценки параметра θ может быть предложено несколько несмещенных оценок. Мерой точности несмещенной оценки считают ее дисперсию D[ ].

Пусть и - две различные несмещенные оценки параметра θ. Если D[ ]<D[ ], то говорят, что оценка более эффективна, чем оценка .

В предположении, что распределение случайной величины Х и статистика удовлетворяют некоторым условиям регулярности (А^*), для дисперсии несмещенной оценки параметра θ выполняется неравенство Крамера - Рао:

, где 1_п (θ) - информация Фишера, содержащаяся в выборке объема п относительно неизвестного параметра θ. Для непрерывной случайной величины Х сплотностью распределения f_x (x, θ) .

Если же Х- дискретная случайная величина, то , где р(Х, θ) = Р[Х = х].

Условия регулярности (А^*)выполняются для обычно используемых статистик нормального, биномиального и пуассонов-ского распределений.

Несмещенная оценка параметра θ, дисперсия которой достигает своего наименьшего возможного значения , называется эффективной: .

Несмещенная оценка называется асимптотически эффективной оценкой параметра θ, если .

Если условия регулярности (А^*) не выполняются, то может существовать несмещенная оценка параметра θ, дисперсия которой меньше, чем нижняя граница в неравенстве .

Такая оценка называется сверхэффективной.

10.2. Метод максимального правдоподобия

Метод максимального правдоподобия является одним из наиболее распространенных методов нахождения оценок неизвестных параметров распределения генеральной совокупности. Пусть Х- непрерывная случайная величина с плотностью распределения f_x (x, θ), зависящей от неизвестного параметра θ, значение которого требуется оценить по выборке объема п. Плотность распределения выборочного вектора (Х₁, Х₂,..., Х_n)можно записать в виде .

Пусть х₁, х₂,..., х_n - выборка наблюдений случайной величины X,по которой находится оценка неизвестного параметра.

Функцией правдоподобия L(θ) выборки объема п называется плотность выборочного вектора, рассматриваемая при фиксированных значениях переменных х₁,...,х_п. Функция правдоподобия является, таким образом, функцией только неизвестного параметра θ, т.е. .

Аналогично определим функцию правдоподобия выборки дискретной случайной величины X. Пусть Х- дискретная случайная величина, причем вероятность Р[Х = х]= р(х, θ) есть функция неизвестного параметра θ. Предполагая, что для оценки параметра θ получена конкретная выборка наблюдений случайной величины X объема п: х₁,...,х_п. Функция правдоподобия L(θ) выборки объема п равна вероятности того, что компоненты выборочного вектора Х₁,...,Х_n примут фиксированные значения х₁,...,х_п, т.е. .

Метод максимального правдоподобия состоит в том, что в качестве оценки неизвестного параметра θ принимается значение , доставляющее максимум функции правдоподобия. Такую оценку называют МП - оценкой. В случае дискретного распределения наблюдаемой случайной величины X МП - оценка неизвестного параметра θ есть такое значение , при котором вероятность появления данной конкретной выборки максимальна. Аналогичную интерпретацию МП - оценки дают и в случае оценки параметра распределения непрерывной случайной величины.

Для упрощения вычислений, связанных с получением МП -оценок, в некоторых случаях удобно использовать логарифмическую функцию правдоподобия, т.е. ln L(θ).

При выполнении некоторых достаточно общих условий МП - оценки состоятельны, асимптотически эффективны и асимптотически нормально распределены. Последнее означает, что при увеличении объема выборки п для МП - оценки неизвестного параметра θ выполняется условие .

Если для параметра θ существует эффективная оценка, то метод максимального правдоподобия дает именно эту оценку и другой МП - оценки не существует.

Пример 40. Найти МП - оценки математического ожидания т и дисперсии σ² нормально распределенной генеральной совокупности.

Решение. Пусть х₁,х₂,...,х_п - выборка наблюдений случайной величины X с плотностью распределения

Найдем функцию правдоподобия L(m, σ²). Имеем

Логарифмическая функция правдоподобия отсюда равна

Используя необходимые условия максимума , получим систему уравнений для нахождения искомых МП - оценок:

Из первого уравнения этой системы находим .

Подставляя полученное значение во второе уравнение, будем иметь .

Отметим, что выборочное среднее является несмещенной и состоятельной оценкой т (см. пример 38), а также эффективной оценкой в случае нормально распределенной генеральной совокупности (убедитесь в этом самостоятельно). Выборочная дисперсия является состоятельной и смещенной оценкой σ².

Пример 41. Найти МП - оценку параметра X распределения Пуассона.

Решение. Пусть х₁,...,х_п - выборка наблюдений случайной величины X, имеющей распределение Пуассона с неизвестным параметром X, т.е.

где х принимает неотрицательные целочисленные значения, х = 0,1,2. Функция правдоподобия L(λ) выборки объема п определяется так: .

Найдем логарифмическую функцию правдоподобия:

Используя необходимое условие экстремума, получим уравнение для определения МП-оценки:

Отсюда следует, что .

Полученная МП - оценка является несмещенной и состоятельной оценкой λ (пример 38), а также эффективной оценкой этого параметра.

10.3. Метод моментов

Для получения оценок неизвестных параметров θ₁,θ₂,...,θ_s распределения генеральной совокупности X используется и метод моментов. Поясним его.

Пусть f _х (х, θ₁,θ₂,...,θ_s) - плотность распределения случайной величины X. Определим с помощью этой плотности S каких-либо моментов случайной величины X, например, первые S начальных моментов, по формулам

, m =1,2,..., S.

По выборке наблюдений случайной величины найдем значения соответствующих выборочных моментов:

, m =1,2,..., S.

Попарно приравнивая теоретические моменты α_т случайной величины X их выборочным значениям , получаем систему s уравнений с неизвестными θ₁,θ₂,...,θ_s:

, m =1,2,..., S.

Решая полученную систему относительно неизвестных θ₁,θ₂,...,θ_s, находим оценки неизвестных параметров.

Аналогично находятся оценки неизвестных параметров по выборке наблюдений дискретной случайной величины.

Пример 42. Методом моментов найти оценки неизвестных параметров а и b для Г - распределения с плотностью

Решение. Для нахождения оценок параметров а и b по методу моментов воспользуемся начальным моментом первого порядка (математическим ожиданием) и центральным моментом второго порядка (дисперсией):

, .

По выборке х₁,...,х_n из генеральной совокупности, имеющей Г-распределение, находим значения соответствующих выборочных моментов:

, .

Приравнивая соответствующие равенства, получаем следующую систему уравнений:

, . Решая ее, находим , .

10.4. Распределения χ², Стьюдента и Фишера.

Распределения основных статистик, вычисляемых по выборке из нормально распределенной генеральной совокупности, связаны с распределениями χ² (k), Стьюдента Т(к) и Фишера F(k₁,k₂).

Квантили этих распределений приведены в приложении (таблицы П5, П6, П7). Дадим определения и некоторые свойства этих распределений.

а) Распределением χ²с k степенями свободы называется распределение случайной величины χ² (k), равной сумме квадратов k независимых нормально распределенных по закону N(0,1) случайных величин U_i, i = 1,2,..., k, т. е. распределение случайной величины .

Распределение χ² с k степенями свободы там, где это не вызывает недоразумений, будет обозначаться также χ² (k).

Плотность распределения определяется формулой

График функции приведен на рис. 12. Среднее и дисперсия распределения χ² (k) равны соответственно: M[χ² (k)] = k, D[χ² (k)] = 2k.

Рис. 12.

Распределение χ² часто используется в статистических распределениях. Рассмотрим следующую теорему.

Теорема 2. Пусть х₁,х₂,...,х_п - выборка из нормально распределенной генеральной совокупности N(m,σ), a и - соответственно выборочное среднее и выборочная дисперсия. Тогда статистики и S² - независимые случайные величины, причем статистика имеет распределение χ² (n -1).

Заметим, что если χ² (k ₁) и χ² (k ₂) - независимые случайные величины, имеющие распределение χ² с k ₁ и k ₂степенями свободы соответственно, то сумма этих случайных величин имеет распределение χ² с (k ₁, k ₂ ) степенями свободы: χ² (k ₁)+ χ² (k ₂)= χ² (k ₁+ k ₂).

Распределение χ² (k) при больших значениях k k>30 с достаточной для практических расчетов точностью аппроксимируется нормальным распределением.

Это свойство используется для приближенного выражения квантилей распределения χ² (k) через квантили и_р нормального распределения N(0,1). Обычно используют следующие две формулы:

и .

Первая формула, применяемая при к≥30 и р≥ 0,5,дает относительную погрешность в пределах 1%, а вторая формула применяется для вычисления квантилей малого порядка.

Пример 43. Вычислить квантили , , .

Решение. По таблице приложений (П5) находим . Для вычисления квантили воспользуемся первой формулой. Так как и_0,95 = 1,645 (см. таблицу приложение П1), то .

По второй формуле, используя значение и_0,01 = и_0,99 = -2,326 получаем .

б) Распределением Стъюдента с k степенями свободы называется распределение случайной величины Т(k), равной отношению двух независимых случайных величин U и , т. е.

где U имеет нормальное распределение N(0,1). Распределение Стьюдента с k степенями свободы будет также обозначаться Т(k). Распределение Стьюдента с k степенями свободы имеет плотность f_T(x) (рис. 13):

Рис. 13.

, -∞< x <+∞,

среднее М[Т(к)] = 0 и дисперсию , к > 2.

Плотность распределения Стьюдента симметрична относительно оси ординат, тогда для квантилей t_p(k) имеет место соотношение t_p(k) = - t_1-_p(k).

При больших k (k>30) для квантилей t_p(k) распределения Стьюдента выполнено приближенное равенство t_p(к) ≈ и_р. Более точная формула имеет вид .

Пример 44. Найти квантили t_0,05(8) и t_0,90(40).

Решение. По таблице приложений (П6) находим t_0,95(8) = l,86; t_0,05(8) = -t_0,95(8) = -l,86. Квантиль t_0,90(40) определим, используя записанную выше формулу. Так как и_0, ₉₀ = 1,28 по таблице приложений (П1), то

Точное значение квантили t_0,90(40) по таблице приложений (П6) равно 1,303.

в) Распределением Фишера с k₁ и k₂ степенями свободы называется распределение случайной величины F(k₁,k₂), равной отношению двух независимых случайных величин и , т.е .

Распределение Фишера с k₁ и k₂ степенями свободы обозначается так: F(k₁,k₂). Распределение Фишера с k₁ и k₂ степенями свободы имеет плотность f_F(x) (рис. 14):

Рис. 14.

среднее , .

Квантили распределения Фишера порядка р и 1 - р связаны между собой так: .

Между случайными величинами, имеющими нормальное распределение, распределения χ² Стьюдента и Фишера, имеют место соотношения: Т²(k) = F( 1 ,k), и .

При k₁ > 1 и k₂ > 1 квантили распределения Фишера можно вычислить, используя приближенную формулу

Пример 45. Найти следующие квантили F_0,01(3,5), F_0,90(4,100) и F_0,05(60,120).

Решение. Используя известное соотношение и таблицу приложений (П7), получаем .

Далее находим .

Далее находим, используя значение u _0,05 =- u _0,95 =-1,645, .

По таблице приложений (П7) значение квантили F _0,05(60,120) равно .

⇐ Предыдущая 10 11 12 131415 16 17 18 19 Следующая ⇒

Поделиться с друзьями:

Дата добавления: 2014-11-20; Просмотров: 1283; Нарушение авторских прав?; Мы поможем в написании вашей работы!

Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет

studopedia.su - Студопедия (2013 - 2025) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление

Генерация страницы за: 0.012 сек.