КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Генеральной совокупности по выборке
Статистическое оценивание характеристик распределения
10.1. Точечные оценки и их свойства. Метод подстановки. Так как основная задача математической статистики состоит в нахождении распределения наблюдаемой случайной величины X по данным выборки и во многих случаях вид распределения X можно считать известным, то задача сводится к получению приближенных значений неизвестных параметров этого распределения. Пусть Fx (x, θ) — функция распределения случайной величины X, содержащая один неизвестный параметр θ, а х1, х2,..., хn -выборка наблюдений этой случайной величины. Точечной оценкой неизвестного параметра θ называется приближенное значение этого параметра, полученное по выборке. Заметим, что оценка есть значение некоторой функции элементов выборки, т.е. = (х1, х2,..., хn). Любую функцию элементов выборки называют статистикой. Для уточнения свойств статистики (х1, х2,..., хn) таких, чтобы ее значения можно считать хорошей в некотором смысле оценкой параметра θ, ее надо рассматривать как функцию случайного вектора (Х1, Х2,..., Хn), одной из реализаций которого является данная выборка х1, х2,..., хn. Так как закон распределения каждой из случайных величин Xi, i = 1,2,..., n, есть Fx (x, θ), являющаяся функцией параметра θ, то и распределение статистики (х1, х2,..., хn) также зависит от неизвестного параметра θ. Качество оценок характеризуется следующими основными свойствами: а) Состоятельность. Оценка = (х1, х2,..., хn) называется состоятельной оценкой параметра θ, если сходится по вероятности к θ при n →∞. Последнее означает, что при n →∞. Состоятельность оценки вбольшинстве случаев устанавливается с помощью следующей теоремы. Теорема1. Если и при n →∞, то — состоятельная оценка параметра θ. б) Несмещенность. Оценка θ называется несмещенной оценкой параметра θ, если ее математическое ожидание равно оцениваемому параметру, т.е. . Разность называется смещением. Для несмещенных оценок систематическая ошибка оценивания равна нулю. Простейший метод статистического оценивания - метод подстановки или аналогии — состоит в том, что в качестве оценки той или иной числовой характеристики (среднего, дисперсии и др.) генеральной совокупности берут соответствующую характеристику распределения выборки - выборочную характеристику. Пример 38. Пусть х1, х2,..., хn - выборка из генеральной совокупности с конечными математическим ожиданием и дисперсией σ2. Используя метод подстановки, найти оценку т. Проверить свойства несмещенности и состоятельности полученной оценки. Решение. По методу подстановки в качестве оценки т математического ожидания возьмем математическое ожидание распределения выборки - выборочное среднее. Тогда, получим . Для проверки несмещенности и состоятельности выборочного среднего как оценки т, рассмотрим эту статистику как функцию выборочного вектора (Х1, Х2,..., Хn). По определению выборочного вектора имеем: M[Xi]=т и D[Xi]=σ2, i = 1,2,..., п, причем Xi - независимые в совокупности случайные величины. В данном случае будем иметь , . Отсюда по определению получаем, что - несмещенная оценка т, и так как при n →∞, то в силу теоремы 1 является состоятельной оценкой математического ожидания т генеральной совокупности. Пример 39. Доказать теорему о состоятельности оценки. Доказательство: для оценки параметра θ может быть предложено несколько несмещенных оценок. Мерой точности несмещенной оценки считают ее дисперсию D[ ]. Пусть и - две различные несмещенные оценки параметра θ. Если D[ ]<D[ ], то говорят, что оценка более эффективна, чем оценка . В предположении, что распределение случайной величины Х и статистика удовлетворяют некоторым условиям регулярности (А*), для дисперсии несмещенной оценки параметра θ выполняется неравенство Крамера - Рао: , где 1п (θ) - информация Фишера, содержащаяся в выборке объема п относительно неизвестного параметра θ. Для непрерывной случайной величины Х сплотностью распределения fx (x, θ) . Если же Х- дискретная случайная величина, то , где р(Х, θ) = Р[Х = х]. Условия регулярности (А*)выполняются для обычно используемых статистик нормального, биномиального и пуассонов-ского распределений. Несмещенная оценка параметра θ, дисперсия которой достигает своего наименьшего возможного значения , называется эффективной: . Несмещенная оценка называется асимптотически эффективной оценкой параметра θ, если . Если условия регулярности (А*) не выполняются, то может существовать несмещенная оценка параметра θ, дисперсия которой меньше, чем нижняя граница в неравенстве . Такая оценка называется сверхэффективной.
10.2. Метод максимального правдоподобия
Метод максимального правдоподобия является одним из наиболее распространенных методов нахождения оценок неизвестных параметров распределения генеральной совокупности. Пусть Х- непрерывная случайная величина с плотностью распределения fx (x, θ), зависящей от неизвестного параметра θ, значение которого требуется оценить по выборке объема п. Плотность распределения выборочного вектора (Х1, Х2,..., Хn)можно записать в виде . Пусть х1, х2,..., хn - выборка наблюдений случайной величины X,по которой находится оценка неизвестного параметра. Функцией правдоподобия L(θ) выборки объема п называется плотность выборочного вектора, рассматриваемая при фиксированных значениях переменных х1,...,хп. Функция правдоподобия является, таким образом, функцией только неизвестного параметра θ, т.е. . Аналогично определим функцию правдоподобия выборки дискретной случайной величины X. Пусть Х- дискретная случайная величина, причем вероятность Р[Х = х]= р(х, θ) есть функция неизвестного параметра θ. Предполагая, что для оценки параметра θ получена конкретная выборка наблюдений случайной величины X объема п: х1,...,хп. Функция правдоподобия L(θ) выборки объема п равна вероятности того, что компоненты выборочного вектора Х1,...,Хn примут фиксированные значения х1,...,хп, т.е. . Метод максимального правдоподобия состоит в том, что в качестве оценки неизвестного параметра θ принимается значение , доставляющее максимум функции правдоподобия. Такую оценку называют МП - оценкой. В случае дискретного распределения наблюдаемой случайной величины X МП - оценка неизвестного параметра θ есть такое значение , при котором вероятность появления данной конкретной выборки максимальна. Аналогичную интерпретацию МП - оценки дают и в случае оценки параметра распределения непрерывной случайной величины. Для упрощения вычислений, связанных с получением МП -оценок, в некоторых случаях удобно использовать логарифмическую функцию правдоподобия, т.е. ln L(θ). При выполнении некоторых достаточно общих условий МП - оценки состоятельны, асимптотически эффективны и асимптотически нормально распределены. Последнее означает, что при увеличении объема выборки п для МП - оценки неизвестного параметра θ выполняется условие . Если для параметра θ существует эффективная оценка, то метод максимального правдоподобия дает именно эту оценку и другой МП - оценки не существует.
Пример 40. Найти МП - оценки математического ожидания т и дисперсии σ2 нормально распределенной генеральной совокупности. Решение. Пусть х1,х2,...,хп - выборка наблюдений случайной величины X с плотностью распределения . Найдем функцию правдоподобия L(m, σ2). Имеем . Логарифмическая функция правдоподобия отсюда равна . Используя необходимые условия максимума , получим систему уравнений для нахождения искомых МП - оценок: , . Из первого уравнения этой системы находим . Подставляя полученное значение во второе уравнение, будем иметь . Отметим, что выборочное среднее является несмещенной и состоятельной оценкой т (см. пример 38), а также эффективной оценкой в случае нормально распределенной генеральной совокупности (убедитесь в этом самостоятельно). Выборочная дисперсия является состоятельной и смещенной оценкой σ2. Пример 41. Найти МП - оценку параметра X распределения Пуассона. Решение. Пусть х1,...,хп - выборка наблюдений случайной величины X, имеющей распределение Пуассона с неизвестным параметром X, т.е. , где х принимает неотрицательные целочисленные значения, х = 0,1,2. Функция правдоподобия L(λ) выборки объема п определяется так: . Найдем логарифмическую функцию правдоподобия: . Используя необходимое условие экстремума, получим уравнение для определения МП-оценки: . Отсюда следует, что . Полученная МП - оценка является несмещенной и состоятельной оценкой λ (пример 38), а также эффективной оценкой этого параметра.
10.3. Метод моментов
Для получения оценок неизвестных параметров θ1,θ2,...,θs распределения генеральной совокупности X используется и метод моментов. Поясним его. Пусть f х (х, θ1,θ2,...,θs) - плотность распределения случайной величины X. Определим с помощью этой плотности S каких-либо моментов случайной величины X, например, первые S начальных моментов, по формулам , m =1,2,..., S. По выборке наблюдений случайной величины найдем значения соответствующих выборочных моментов: , m =1,2,..., S. Попарно приравнивая теоретические моменты αт случайной величины X их выборочным значениям , получаем систему s уравнений с неизвестными θ1,θ2,...,θs: , m =1,2,..., S. Решая полученную систему относительно неизвестных θ1,θ2,...,θs, находим оценки неизвестных параметров. Аналогично находятся оценки неизвестных параметров по выборке наблюдений дискретной случайной величины. Пример 42. Методом моментов найти оценки неизвестных параметров а и b для Г - распределения с плотностью . Решение. Для нахождения оценок параметров а и b по методу моментов воспользуемся начальным моментом первого порядка (математическим ожиданием) и центральным моментом второго порядка (дисперсией): , . По выборке х1,...,хn из генеральной совокупности, имеющей Г-распределение, находим значения соответствующих выборочных моментов: , . Приравнивая соответствующие равенства, получаем следующую систему уравнений: , . Решая ее, находим , .
10.4. Распределения χ2, Стьюдента и Фишера.
Распределения основных статистик, вычисляемых по выборке из нормально распределенной генеральной совокупности, связаны с распределениями χ2 (k), Стьюдента Т(к) и Фишера F(k1,k2). Квантили этих распределений приведены в приложении (таблицы П5, П6, П7). Дадим определения и некоторые свойства этих распределений. а) Распределением χ2 с k степенями свободы называется распределение случайной величины χ2 (k), равной сумме квадратов k независимых нормально распределенных по закону N(0,1) случайных величин Ui, i = 1,2,..., k, т. е. распределение случайной величины . Распределение χ2 с k степенями свободы там, где это не вызывает недоразумений, будет обозначаться также χ2 (k). Плотность распределения определяется формулой . График функции приведен на рис. 12. Среднее и дисперсия распределения χ2 (k) равны соответственно: M[χ2 (k)] = k, D[χ2 (k)] = 2k.
Рис. 12. Распределение χ2 часто используется в статистических распределениях. Рассмотрим следующую теорему. Теорема 2. Пусть х1,х2,...,хп - выборка из нормально распределенной генеральной совокупности N(m,σ), a и - соответственно выборочное среднее и выборочная дисперсия. Тогда статистики и S2 - независимые случайные величины, причем статистика имеет распределение χ2 (n -1). Заметим, что если χ2 (k 1) и χ2 (k 2) - независимые случайные величины, имеющие распределение χ2 с k 1 и k 2степенями свободы соответственно, то сумма этих случайных величин имеет распределение χ2 с (k 1, k 2 ) степенями свободы: χ2 (k 1)+ χ2 (k 2)= χ2 (k 1+ k 2). Распределение χ2 (k) при больших значениях k k>30 с достаточной для практических расчетов точностью аппроксимируется нормальным распределением. Это свойство используется для приближенного выражения квантилей распределения χ2 (k) через квантили ир нормального распределения N(0,1). Обычно используют следующие две формулы: и .
Первая формула, применяемая при к≥30 и р≥ 0,5,дает относительную погрешность в пределах 1%, а вторая формула применяется для вычисления квантилей малого порядка.
Пример 43. Вычислить квантили , , . Решение. По таблице приложений (П5) находим . Для вычисления квантили воспользуемся первой формулой. Так как и0,95 = 1,645 (см. таблицу приложение П1), то . По второй формуле, используя значение и0,01 = и0,99 = -2,326 получаем . б) Распределением Стъюдента с k степенями свободы называется распределение случайной величины Т(k), равной отношению двух независимых случайных величин U и , т. е. , где U имеет нормальное распределение N(0,1). Распределение Стьюдента с k степенями свободы будет также обозначаться Т(k). Распределение Стьюдента с k степенями свободы имеет плотность fT(x) (рис. 13):
Рис. 13. , -∞< x <+∞, среднее М[Т(к)] = 0 и дисперсию , к > 2. Плотность распределения Стьюдента симметрична относительно оси ординат, тогда для квантилей tp(k) имеет место соотношение tp(k) = - t1-p(k). При больших k (k>30) для квантилей tp(k) распределения Стьюдента выполнено приближенное равенство tp(к) ≈ ир. Более точная формула имеет вид . Пример 44. Найти квантили t0,05(8) и t0,90(40). Решение. По таблице приложений (П6) находим t0,95(8) = l,86; t0,05(8) = -t0,95(8) = -l,86. Квантиль t0,90(40) определим, используя записанную выше формулу. Так как и0, 90 = 1,28 по таблице приложений (П1), то Точное значение квантили t0,90(40) по таблице приложений (П6) равно 1,303.
в) Распределением Фишера с k1 и k2 степенями свободы называется распределение случайной величины F(k1,k2), равной отношению двух независимых случайных величин и , т.е . Распределение Фишера с k1 и k2 степенями свободы обозначается так: F(k1,k2). Распределение Фишера с k1 и k2 степенями свободы имеет плотность fF(x) (рис. 14):
Рис. 14. . среднее , . Квантили распределения Фишера порядка р и 1 - р связаны между собой так: . Между случайными величинами, имеющими нормальное распределение, распределения χ2 Стьюдента и Фишера, имеют место соотношения: Т2(k) = F( 1 ,k), и . При k1 > 1 и k2 > 1 квантили распределения Фишера можно вычислить, используя приближенную формулу . Пример 45. Найти следующие квантили F0,01(3,5), F0,90(4,100) и F0,05(60,120). Решение. Используя известное соотношение и таблицу приложений (П7), получаем . Далее находим . Далее находим, используя значение u 0,05 =- u 0,95 =-1,645, . По таблице приложений (П7) значение квантили F 0,05(60,120) равно .
Дата добавления: 2014-11-20; Просмотров: 1283; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |