КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Статистические оценки параметров распределения
Точечные оценки
Пусть требуется изучить количественный признак Х генеральной совокупности. Предположим, что из теоретических соображений удалось установить вид распределения признака. Возникает задача оценки параметров этого распределения. Например, если известно, что изучаемый признак распределен в генеральной совокупности по нормальному закону, то необходимо оценить (приближенно найти) математическое ожидание а и среднее квадратическое отклонение , так как эти два параметра определяют нормальное распределение. Обычно в распоряжении исследователя имеются лишь данные выборки х 1, х 2, …, хп, полученные в результате п независимых наблюдений. Через эти данные и выражают оцениваемый параметр. В этом случае х 1, х 2, …, хп рассматривают как независимые случайные величины Х 1, Х 2, …, Хп. Тогда статистической оценкой неизвестного параметра теоретического распределения называют функцию (Х 1, Х 2, …, Хп) от наблюдаемых случайных величин Х 1, Х 2, …, Хп. Точечной называют статистическую оценку, которая определяется одним числом = (х 1, х 2, …, хп), где х 1, х 2, …, хп – результаты п наблюдений над количественным признаком Х (выборка). Для того, чтобы статистические оценки давали “хорошие” приближения оцениваемых параметров, они должны удовлетворять определенным требованиям. Пусть − статистическая оценка неизвестного параметра теоретического распределения. Допустим, что по выборке объема п найдена оценка . Повторим опыт, т.е. извлечем из генеральной совокупности выборку того же объема и по ее данным найдем оценку и т.д. В результате получим последовательность чисел , , …, . Таким образом, оценку можно рассматривать как случайную величину, а числа , , …, − как ее возможные значения. Предположим, что оценка дает приближенное значение с избытком. Тогда > , i = 1, 2, …, k. Значит и М () > . Очевидно, что если дает оценку с недостатком, то М () < . Использование таких оценок приводит к систематическим (одного знака) ошибкам. Требование М () = гарантирует от получения таких ошибок. Несмещенной называют статистическую оценку , математическое ожидание которой равно оцениваемому параметру при любом объеме выборки, т.е. М () = .
Смещенной называют статистическую оценку, математическое ожидание которой не равно оцениваемому параметру. Так как при выполнении условия М () = разброс оценок , , …, может быть велик, то необходимо потребовать, чтобы D () была мала. Эффективной называют статистическую оценку, которая (при заданном объеме выборки п) имеет наименьшую возможную дисперсию. При рассмотрении выборок большого объема к статистическим оценкам предъявляется требование состоятельности. Состоятельной называют статистическую оценку, которая при п → ∞ стремится по вероятности к оцениваемому параметру, т.е. − | < ε) = 1 или .
Генеральная средняя. Выборочная средняя. Дисперсия.
Пусть рассматривается генеральная совокупность относительно количественного признака Х. Генеральной средней называют среднее арифметическое значений признака генеральной совокупности. Если все значения х 1, х 2, …, хN признака генеральной совокупности объема N различны, то = . Если значения признака х 1, х 2, …, хk имеют соответствующие частоты N 1, N 2, …, Nk, причем N 1 + N 2 +…+ Nk = N, то = . Если рассматривать обследуемый признак Х генеральной совокупности как случайную величину, то = М (Х). Это справедливо и для непрерывного распределения. Пусть для изучения генеральной совокупности относительно количественного признака Х извлечена выборка объема п. Выборочной средней называют среднее арифметическое значений признака выборочной совокупности. Если все значения х 1, х 2, …, хп признака выборки объема п различны, то = . Если значения признака х 1, х 2, …, хk имеют соответствующие частоты п 1, п 2, …, пk, причем п 1 + п 2 +…+ пk = п, то = . Выборочная средняя есть несмещенная оценка генеральной средней. Так как = М (Х) признака Х, то за оценку математического ожидания генеральной совокупности можно взять : ≈ = М (Х). Замечание 1. Если первоначальные варианты хi – большие числа, то можно перейти к условным вариантам иi = хi – C, где С = const. Обычно С выбирают равным одному из средних значений вариант. Тогда = = С ·+ = С + = С + . Генеральной дисперсией DГ называют среднее арифметическое квадратов отклонений значений признака генеральной совокупности от их среднего значения . Если все значения х 1, х 2, …, хN признака генеральной совокупности объема N различны, то DГ = . Если значения признака х 1, х 2, …, хk имеют соответствующие частоты N 1, N 2, …, Nk, причем N 1 + N 2 +…+ Nk = N, то DГ = . Генеральную дисперсию можно вычислить по формуле DГ = − , т.е. DГ равна среднему квадратов значений признака генеральной совокупности минус квадрат генеральной средней. Генеральным средним квадратическим отклонением (генеральным стандартом) называют квадратный корень из генеральной дисперсии = .
Выборочной дисперсией DВ называют среднее арифметическое квадратов отклонений значений наблюдаемых значений признака от их среднего значения . Если все значения х 1, х 2, …, хп признака выборки объема п различны, то DВ = . Если значения признака х 1, х 2, …, хk имеют соответствующие частоты п 1, п 2, …, пk, причем п 1 + п 2 +…+ пk = п, то DВ = . Выборочную дисперсию можно вычислить по формуле DВ = −
или, если расписать и , то
DВ = − . Замечание 2. Если первоначальные варианты хi – большие числа, то можно перейти к условным вариантам (дисперсия при этом не изменяется) иi = хi – C, где С = const. Тогда DВ (Х) = DВ (и) = − = − . Замечание 3. Если первоначальные варианты хi являются десятичными дробями с k знаками после запятой, то можно перейти к условным вариантам (при этом дисперсия увеличится в С 2 раз) иi = Схi, где С = 10 k. Тогда DВ (Х) = . Выборочным средним квадратическим отклонением (выборочным стандартом) называют квадратный корень из выборочной дисперсии = .
Оценка генеральной дисперсии по исправленной выборочной дисперсии Выборочная дисперсия DВ является смещенной оценкой генеральной дисперсии, при этом М (DВ) = · DГ. Выборочную дисперсию можно “исправить” так, чтобы ее математическое ожидание было равно генеральной дисперсии. Для этого надо умножить DВ на дробь . В результате получим исправленную выборочную дисперсию, которая будет несмещенной оценкой генеральной дисперсии DГ: = DВ = ·= . Теперь М () = М ( DВ) = М (DВ) = ·· DГ = DГ, т.е. М () = DГ и, значит, исправленная дисперсия является несмещенной оценкой DГ. Более удобная для расчетов формула = . В условных вариантах она имеет вид = , причем если иi = хi – C, то = ; если иi = Схi, то = .
Для оценки среднего квадратического отклонения генеральной совокупности используют исправленное среднее квадратическое отклонение, которое равно квадратному корню из исправленной дисперсии s = = .
Сравнивая формулы DВ = и = ,
видно, что они отличаются только знаменателями. Очевидно, при достаточно больших значениях п объема выборки выборочная и исправленная дисперсии различаются мало. На практике пользуются исправленной дисперсией, если, примерно, п < 30. Пример. Дано распределение выборки хi 1 2 3 ni 2 1 4. Найти несмещенные оценки генеральной средней, генеральной дисперсии, генерального среднего квадратического отклонения. □ Несмещенной оценкой генеральной средней (и математического ожидания) является выборочная средняя . Объем выборки: п = 2 + 1 + 4 = 7. Тогда = = ·(2·1 + 1·2 + 4·3) = ≈ 2,29. Несмещенной оценкой генеральной дисперсии является исправленная выборочная дисперсия . Имеем = = ·(2(1− 2,29)2 +1·(2 − 2,29)2 + 4·(3 − 2,29)2) =
= ·(3,33 + 0,08 + 2,02) = 0,905. Несмещенной оценкой генерального среднего квадратического отклонения является исправленное выборочное среднее квадратическое отклонение s. Имеем s = = ≈ 0,951. ■
Интервальные оценки
Интервальной называют оценку, которая определяется двумя числами – концами интервала, покрывающего оцениваемый параметр. Интервальная оценка позволяет установить точность и надежность оценки. Пусть служит оценкой неизвестного параметра . Оценка тем точнее определяет параметр , чем меньше абсолютная величина разности |− |. Другими словами, если некоторое число > 0 и |− | < , то, чем меньше , тем оценка точнее. Таким образом, положительное число характеризует точность оценки. Однако статистические методы не позволяют категорически утверждать, что оценка удовлетворяет неравенству |− | < . Можно только говорить о вероятности , с которой это неравенство осуществляется. Надежностью (доверительной вероятностью) оценки параметра по называют вероятность , с которой осуществляется неравенство |− | < . Надежностью задаются заранее и ее значение близко к единице: 0,95; 0,99 и 0,999. Пусть вероятность того, что |− | < равна : Р (|− | < ) = . Тогда Р (−< − < ) = или Р (−< < +) = . Это соотношение следует понимать так: вероятность того, что интервал (−, +) заключает в себе (покрывает) неизвестный параметр , равна . Доверительным называют интервал (−, +), который покрывает неизвестный параметр с заданной надежностью .
Интервальной оценкой (с надежностью ) математического ожидания а нормально распределенного количественного признака Х по выборочной средней при известном среднем квадратическом отклонении генеральной совокупности служит доверительный интервал − < a < + , где = − точность оценки, п – объем выборки, t – значение аргумента функции Лапласа Φ (t), при котором Φ (t) = ; при неизвестном (и объеме выборки п < 30) − < a < +, где s – исправленное выборочное среднее квадратическое отклонение, − определяют по таблице по заданным п и . Интервальной оценкой (с надежностью ) среднего квадратического отклонения нормально распределенного количественного признака Х по исправленному выборочному среднему квадратическому отклонению s служит доверительный интервал
s (1 − q) < < s (1 + q) (при q < 1),
0 < < s (1 + q) (при q > 1),
где q = q (п, ) − определяют по таблице по заданным п и .
Замечание 1. Из формулы = следует: 1. при возрастании объема выборки п число убывает. Значит, точность оценки увеличивается; 2. увеличение надежности оценки = 2 Φ (t) приводит к увеличению t (Φ (t) – возрастающая функция). Значит, возрастает , т.е. точность уменьшается. Замечание 2. Если требуется оценить математическое ожидание а с наперед заданной точностью и надежностью , то минимальный объем выборки, который обеспечит эту точность, находят по формуле п = .
Пример. Найти доверительный интервал для оценки с надежностью = 0,95 неизвестного математического ожидания а нормально распределенного признака Х генеральной совокупности, если генеральное среднее квадратическое отклонение = 5, выборочная средняя = 14 и объем выборки п = 25. □ Требуется найти доверительный интервал − < a < + . Все величины, кроме t, известны. Найдем t из соотношения Φ (t) = = = 0,475. По таблице находим t = 1,96. Подставляем все значения в формулу доверительного интервала:
14 − < a < 14 + или 12,04 < a < 15,96.
Отметим смысл заданной надежности = 0,95. Надежность = 0,95 указывает, что если произведено достаточно большое число выборок, то 95% из них определяет такие доверительные интервалы, в которых неизвестный параметр (в нашем случае а)действительно заключен; лишь в 5% случаев он может выйти за границы доверительного интервала. ■
Пример. По данным 9 независимых равноточных измерений некоторой физической величины найдены среднее арифметическое результатов измерений = 30,1 и исправленное среднее квадратическое отклонение s = 6. Оценить истинное значение измеряемой величины с помощью доверительного интервала с надежностью = 0,99. Предполагается, что результаты измерений распределены нормально. □ Истинное значение измеряемой величины равно ее математическому ожиданию а. Поэтому задача сводится к оценке математического ожидания (при неизвестном ) при помощи доверительного интервала − < a < +. По таблице находим = = 3,36. Тогда 30,1− < a < 30,1+ или 30,1− 6,72 < a < 30,1+ 6,72. Следовательно, 23,38 < a < 36,82. ■
Пример. По данным выборки объема п = 16 из генеральной совокупности найдено исправленное среднее квадратическое отклонение s = 1 нормально распределенного количественного признака. Найти доверительный интервал, покрывающий генеральное среднее квадратическое отклонение с надежностью = 0,95. □ Задача сводится к отысканию доверительного интервала
s (1 − q) < < s (1 + q) (при q < 1) или 0 < < s (1 + q) (при q > 1).
По таблице находим = = 0,44 < 1. Следовательно, используем интервал s (1 − q) < < s (1 + q). Тогда 1·(1 − 0,44) < <1·(1 + 0,44) или 0,56 < <1,44. ■
Дата добавления: 2014-10-15; Просмотров: 2136; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |