Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Статистические оценки параметров распределения




 

Точечные оценки

 

Пусть требуется изучить количественный признак Х генеральной совокупности. Предположим, что из теоретических соображений удалось установить вид распределения признака. Возникает задача оценки параметров этого распределения. Например, если известно, что изучаемый признак распределен в генеральной совокупности по нормальному закону, то необходимо оценить (приближенно найти) математическое ожидание а и среднее квадратическое отклонение , так как эти два параметра определяют нормальное распределение.

Обычно в распоряжении исследователя имеются лишь данные выборки х 1, х 2, …, хп, полученные в результате п независимых наблюдений. Через эти данные и выражают оцениваемый параметр. В этом случае х 1, х 2, …, хп рассматривают как независимые случайные величины Х 1, Х 2, …, Хп.

Тогда статистической оценкой неизвестного параметра теоретического распределения называют функцию (Х 1, Х 2, …, Хп) от наблюдаемых случайных величин Х 1, Х 2, …, Хп.

Точечной называют статистическую оценку, которая определяется одним числом = (х 1, х 2, …, хп), где х 1, х 2, …, хп – результаты п наблюдений над количественным признаком Х (выборка).

Для того, чтобы статистические оценки давали “хорошие” приближения оцениваемых параметров, они должны удовлетворять определенным требованиям.

Пусть − статистическая оценка неизвестного параметра теоретического распределения. Допустим, что по выборке объема п найдена оценка . Повторим опыт, т.е. извлечем из генеральной совокупности выборку того же объема и по ее данным найдем оценку и т.д. В результате получим последовательность чисел , , …, . Таким образом, оценку можно рассматривать как случайную величину, а числа , , …, − как ее возможные значения.

Предположим, что оценка дает приближенное значение с избытком. Тогда > , i = 1, 2, …, k. Значит и М () > . Очевидно, что если дает оценку с недостатком, то М () < . Использование таких оценок приводит к систематическим (одного знака) ошибкам. Требование М () = гарантирует от получения таких ошибок.

Несмещенной называют статистическую оценку , математическое ожидание которой равно оцениваемому параметру при любом объеме выборки, т.е.

М () = .

 

Смещенной называют статистическую оценку, математическое ожидание которой не равно оцениваемому параметру.

Так как при выполнении условия М () = разброс оценок , , …, может быть велик, то необходимо потребовать, чтобы D () была мала.

Эффективной называют статистическую оценку, которая (при заданном объеме выборки п) имеет наименьшую возможную дисперсию.

При рассмотрении выборок большого объема к статистическим оценкам предъявляется требование состоятельности.

Состоятельной называют статистическую оценку, которая при п → ∞ стремится по вероятности к оцениваемому параметру, т.е.

| < ε) = 1

или

.

 

 

Генеральная средняя. Выборочная средняя. Дисперсия.

 

Пусть рассматривается генеральная совокупность относительно количественного признака Х.

Генеральной средней называют среднее арифметическое значений признака генеральной совокупности.

Если все значения х 1, х 2, …, хN признака генеральной совокупности объема N различны, то

= .

Если значения признака х 1, х 2, …, хk имеют соответствующие частоты N 1, N 2, …, Nk, причем N 1 + N 2 +…+ Nk = N, то

= .

Если рассматривать обследуемый признак Х генеральной совокупности как случайную величину, то

= М (Х).

Это справедливо и для непрерывного распределения.

Пусть для изучения генеральной совокупности относительно количественного признака Х извлечена выборка объема п.

Выборочной средней называют среднее арифметическое значений признака выборочной совокупности.

Если все значения х 1, х 2, …, хп признака выборки объема п различны, то

= .

Если значения признака х 1, х 2, …, хk имеют соответствующие частоты п 1, п 2, …, пk, причем п 1 + п 2 +…+ пk = п, то

= .

Выборочная средняя есть несмещенная оценка генеральной средней.

Так как = М (Х) признака Х, то за оценку математического ожидания генеральной совокупности можно взять :

= М (Х).

Замечание 1. Если первоначальные варианты хi – большие числа, то можно перейти к условным вариантам

иi = хiC,

где С = const.

Обычно С выбирают равным одному из средних значений вариант. Тогда

= = С ·+ = С + = С + .

Генеральной дисперсией DГ называют среднее арифметическое квадратов отклонений значений признака генеральной совокупности от их среднего значения .

Если все значения х 1, х 2, …, хN признака генеральной совокупности объема N различны, то

DГ = .

Если значения признака х 1, х 2, …, хk имеют соответствующие частоты N 1, N 2, …, Nk, причем N 1 + N 2 +…+ Nk = N, то

DГ = .

Генеральную дисперсию можно вычислить по формуле

DГ = ,

т.е. DГ равна среднему квадратов значений признака генеральной совокупности минус квадрат генеральной средней.

Генеральным средним квадратическим отклонением (генеральным стандартом) называют квадратный корень из генеральной дисперсии

= .

 

Выборочной дисперсией DВ называют среднее арифметическое квадратов отклонений значений наблюдаемых значений признака от их среднего значения .

Если все значения х 1, х 2, …, хп признака выборки объема п различны, то

DВ = .

Если значения признака х 1, х 2, …, хk имеют соответствующие частоты п 1, п 2, …, пk, причем п 1 + п 2 +…+ пk = п, то

DВ = .

Выборочную дисперсию можно вычислить по формуле

DВ =

 

или, если расписать и , то

 

DВ = .

Замечание 2. Если первоначальные варианты хi – большие числа, то можно перейти к условным вариантам (дисперсия при этом не изменяется)

иi = хiC,

где С = const.

Тогда

DВ (Х) = DВ (и) = = .

Замечание 3. Если первоначальные варианты хi являются десятичными дробями с k знаками после запятой, то можно перейти к условным вариантам (при этом дисперсия увеличится в С 2 раз)

иi = Схi,

где С = 10 k.

Тогда

DВ (Х) = .

Выборочным средним квадратическим отклонением (выборочным стандартом) называют квадратный корень из выборочной дисперсии

= .

 

Оценка генеральной дисперсии по исправленной выборочной дисперсии

Выборочная дисперсия DВ является смещенной оценкой генеральной дисперсии, при этом

М (DВ) = · DГ.

Выборочную дисперсию можно “исправить” так, чтобы ее математическое ожидание было равно генеральной дисперсии. Для этого надо умножить DВ на дробь . В результате получим исправленную выборочную дисперсию, которая будет несмещенной оценкой генеральной дисперсии DГ:

= DВ = ·= .

Теперь

М () = М ( DВ) = М (DВ) = ·· DГ = DГ,

т.е. М () = DГ и, значит, исправленная дисперсия является несмещенной оценкой DГ.

Более удобная для расчетов формула

= .

В условных вариантах она имеет вид

= ,

причем если иi = хiC, то = ; если иi = Схi, то = .

 

Для оценки среднего квадратического отклонения генеральной совокупности используют исправленное среднее квадратическое отклонение, которое равно квадратному корню из исправленной дисперсии

s = = .

 

Сравнивая формулы

DВ = и = ,

 

видно, что они отличаются только знаменателями. Очевидно, при достаточно больших значениях п объема выборки выборочная и исправленная дисперсии различаются мало. На практике пользуются исправленной дисперсией, если, примерно, п < 30.

Пример. Дано распределение выборки

хi 1 2 3

ni 2 1 4.

Найти несмещенные оценки генеральной средней, генеральной дисперсии, генерального среднего квадратического отклонения.

Несмещенной оценкой генеральной средней (и математического ожидания) является выборочная средняя .

Объем выборки: п = 2 + 1 + 4 = 7. Тогда

= = ·(2·1 + 1·2 + 4·3) = ≈ 2,29.

Несмещенной оценкой генеральной дисперсии является исправленная выборочная дисперсия .

Имеем

= = ·(2(1− 2,29)2 +1·(2 − 2,29)2 + 4·(3 − 2,29)2) =

 

= ·(3,33 + 0,08 + 2,02) = 0,905.

Несмещенной оценкой генерального среднего квадратического отклонения является исправленное выборочное среднее квадратическое отклонение s.

Имеем

s = = ≈ 0,951.

 

Интервальные оценки

 

Интервальной называют оценку, которая определяется двумя числами – концами интервала, покрывающего оцениваемый параметр.

Интервальная оценка позволяет установить точность и надежность оценки.

Пусть служит оценкой неизвестного параметра . Оценка тем точнее определяет параметр , чем меньше абсолютная величина разности ||. Другими словами, если некоторое число > 0 и || < , то, чем меньше , тем оценка точнее. Таким образом, положительное число характеризует точность оценки.

Однако статистические методы не позволяют категорически утверждать, что оценка удовлетворяет неравенству || < . Можно только говорить о вероятности , с которой это неравенство осуществляется.

Надежностью (доверительной вероятностью) оценки параметра по называют вероятность , с которой осуществляется неравенство || < .

Надежностью задаются заранее и ее значение близко к единице: 0,95; 0,99 и 0,999.

Пусть вероятность того, что || < равна :

Р (|| < ) = .

Тогда

Р (−< < ) =

или

Р (< < +) = .

Это соотношение следует понимать так: вероятность того, что интервал (, +) заключает в себе (покрывает) неизвестный параметр , равна .

Доверительным называют интервал (, +), который покрывает неизвестный параметр с заданной надежностью .

 

Интервальной оценкой (с надежностью ) математического ожидания а нормально распределенного количественного признака Х по выборочной средней при известном среднем квадратическом отклонении генеральной совокупности служит доверительный интервал

< a < + ,

где = − точность оценки, п – объем выборки, t – значение аргумента функции Лапласа Φ (t), при котором Φ (t) = ;

при неизвестном (и объеме выборки п < 30)

< a < +,

где s – исправленное выборочное среднее квадратическое отклонение, − определяют по таблице по заданным п и .

Интервальной оценкой (с надежностью ) среднего квадратического отклонения нормально распределенного количественного признака Х по исправленному выборочному среднему квадратическому отклонению s служит доверительный интервал

 

s (1 − q) < < s (1 + q) (при q < 1),

 

0 < < s (1 + q) (при q > 1),

 

где q = q (п, ) − определяют по таблице по заданным п и .

 

Замечание 1. Из формулы = следует:

1. при возрастании объема выборки п число убывает. Значит, точность оценки увеличивается;

2. увеличение надежности оценки = 2 Φ (t) приводит к увеличению t (Φ (t) – возрастающая функция). Значит, возрастает , т.е. точность уменьшается.

Замечание 2. Если требуется оценить математическое ожидание а с наперед заданной точностью и надежностью , то минимальный объем выборки, который обеспечит эту точность, находят по формуле

п = .

 

Пример. Найти доверительный интервал для оценки с надежностью = 0,95 неизвестного математического ожидания а нормально распределенного признака Х генеральной совокупности, если генеральное среднее квадратическое отклонение = 5, выборочная средняя = 14 и объем выборки п = 25.

Требуется найти доверительный интервал

< a < + .

Все величины, кроме t, известны. Найдем t из соотношения

Φ (t) = = = 0,475.

По таблице находим t = 1,96. Подставляем все значения в формулу доверительного интервала:

 

14 − < a < 14 +

или

12,04 < a < 15,96.

 

Отметим смысл заданной надежности = 0,95. Надежность = 0,95 указывает, что если произведено достаточно большое число выборок, то 95% из них определяет такие доверительные интервалы, в которых неизвестный параметр (в нашем случае а)действительно заключен; лишь в 5% случаев он может выйти за границы доверительного интервала.

 

Пример. По данным 9 независимых равноточных измерений некоторой физической величины найдены среднее арифметическое результатов измерений = 30,1 и исправленное среднее квадратическое отклонение s = 6. Оценить истинное значение измеряемой величины с помощью доверительного интервала с надежностью = 0,99. Предполагается, что результаты измерений распределены нормально.

Истинное значение измеряемой величины равно ее математическому ожиданию а. Поэтому задача сводится к оценке математического ожидания (при неизвестном ) при помощи доверительного интервала

< a < +.

По таблице находим

= = 3,36.

Тогда

30,1− < a < 30,1+

или

30,1− 6,72 < a < 30,1+ 6,72.

Следовательно,

23,38 < a < 36,82.

 

Пример. По данным выборки объема п = 16 из генеральной совокупности найдено исправленное среднее квадратическое отклонение s = 1 нормально распределенного количественного признака. Найти доверительный интервал, покрывающий генеральное среднее квадратическое отклонение с надежностью = 0,95.

Задача сводится к отысканию доверительного интервала

 

s (1 − q) < < s (1 + q) (при q < 1)

или

0 < < s (1 + q) (при q > 1).

 

По таблице находим

= = 0,44 < 1.

Следовательно, используем интервал

s (1 − q) < < s (1 + q).

Тогда

1·(1 − 0,44) < <1·(1 + 0,44)

или

0,56 < <1,44.

 

 




Поделиться с друзьями:


Дата добавления: 2014-10-15; Просмотров: 2136; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.008 сек.