КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Выборочные оценки параметров распределения
1. При практическом применении статистических методов для анализа качества продукции, стабильности и точности технологических и измерительных процессов чаще всего приходится иметь дело со статистическим материалом ограниченного объема - 10÷100 измерений, либо сериями 5÷25 проб - малых выборок по 3÷7 измерений. Такого ограниченного материала недостаточно, чтобы найти заранее неизвестный закон распределения, хотя можно определить его важнейшие числовые характеристики: среднее и дисперсию либо параметры априорно известного закона распределения. Оценкой неизвестного параметра θ называется СВ, представляющая собой функцию выборочных значений : , вид которой определяется, исходя из «физического смысла» параметра θ и информации о законе распределения СВ X. В качестве оценки математического ожидания чаще всего используется выборочное среднее: .Числовые характеристики равны: , . Несмещенная выборочная оценка дисперсии, как известно, имеет вид . Однако выборочное СКО не является несмещенной оценкой параметра . В этом легко убедиться, рассмотрев дисперсию s: . Поскольку , приходим к очевидному выводу, что . Это отрицательное смещение оценки s при выборках небольшого объема может приводить к заниженной оценке средней ширины зоны рассеивания процесса, приводя тем самым к завышенной оценке числовых индексов (Ср, Срк и т.д.). 2. Для установления ПР величин и определения несмещенной оценки рассмотрим нормированную сумму квадратов отклонений: . Используя тождественное преобразование, представим в следующем виде: Внося и под знак квадрата, убеждаемся, что каждое из слагаемых представляет собой СВ - квадрат стандартной нормальной СВ. Перепишем (1.4.1) в виде . Поскольку аддитивна по степеням свободы (), приходим к выводу, что . (1.4.2) Величина была рассмотрена в п.1.2. Используя формулу линейного преобразования (), найдем ПР : (1.4.3) Среднее равно 1. Дисперсию найдем, используя соотношение и формулу для дисперсии нормированной СВ . Полагая , получаем . (1.4.4) Числовые характеристики выборочной дисперсии соответственно составят: , (1.4.5) Для нормированного выборочного СКО ПР найдем, используя преобразование : (1.4.6) Рассмотрим структуру последовательности . Для легко вычисляются и составляют: , . Рассмотрим случай n > 3:
Первое слагаемое равно 0. Второе слагаемое подстановкой , используя рекуррентное свойство , преобразуем к виду (1.4.7) Заменяя в рекуррентном соотношении (1.4.7) () и используя рекуррентное свойство Гамма-функции, по индукции получаем формулу общего члена последовательности : , . (1.4.8) Таким образом, несмещенную точечную выборочную оценку СКО получим, устранив отрицательное смещение М[S] тем же приемом, что и для s 2: (1.4.9) В табл. 1.4.1 приведена величина относительной ошибки в зависимости от объема выборки. Таблица 1.4.1
3. Эффективность полученной оценки будет определяться дисперсией СВ : , (1.4.10) и при больших n имеет место асимптотика
Можно указать еще один способ вычисления . Внося в (1.4.10) под знак квадрата и используя рекуррентное свойство , получаем рекуррентное соотношение: , , (1.4.11)
Точные значения приведены в табл. 1.4.2 в столбце . 4. Другой способ получения оценок параметров распределения основан на порядковых статистиках. Рассмотрим выборку непрерывной СВ объемом n, полученную при стандартных условиях из совокупности с ФР и ПР : . Выборка, упорядоченная по возрастанию , называется вариационным рядом. Член вариационного ряда с фиксированным номером называется элементарной порядковой статистикой. Каждому номеру соответствует случайная величина с законом распределения, зависящим от Основным исходным пунктом при установлении закона распределения служит биномиальное (точное полиномиальное) распределение дискретных случайных величин. Используем универсальное автопреобразование (п.1.2) и рассмотрим вариационный ряд , все члены которого будут сосредоточены на отрезке [0;1] (рис.1.4.1). Рис.1.4.1. Схема расположения вариационного ряда выборки из совокупности R(0,1)
Вариационный ряд , очевидно, разбивается на 3 группы: Ι содержит значение, меньшее ; ΙΙ – само значение ; ΙΙΙ – значений, больших . Пусть значение находится в точке . Тогда вероятность того, что значение окажется левее точки t составит , вероятность того, что значений окажется правее точки ,соответственно . Вероятность всей композиции будет равна произведению Количество комбинаций, реализующих точное расположение, согласно формуле полиномиального распределения (см. ссылку. на стр. 7), составит . Таким образом, функция распределения составит Дифференцируя последнее выражение по и вспоминая, что , , получаем плотность распределения : , (1.4.13) или, используя свойство биномиальных коэффициентов , получаем тождественную форму: . (1.4.14) В частности, для крайних членов вариационного ряда плотность распределения получаем, полагая - для минимального: (1.4.15) и - для максимального: . (1.4.16) В статистических приложениях большее распространение получили не сами элементарные порядковые статистики, а их композиции. Главным образом это размах и медиана выборки четного объема , представляющие собой соответственно разность и сумму двух членов вариационного ряда (медианой выборки нечетного объема служит статистика ). Для установления законов распределения размаха и медианы необходимо знать закон совместного распределения двух элементарных порядковых статистик. Пусть их номера и . Как и в предыдущем случае, применим универсальное автопреобразование и используем аналогичную схему рассуждений. В данном случае ряд окажется разбитым на 5 групп (рис. 1.4.2) численностью , , , 1, соответственно. Рис. 1.4.2. Схема расположения вариационного ряда выборки из совокупности с двумя фиксированными членами Рис. 1.4.3. Схема области интегрирования для определения закона совместного распределения двух порядковых статистик
Функцию совместного распределения двух порядковых статистик получаем в виде: . Дифференцируя по и и учитывая, что , окончательно получаем плотность распределения в виде (1.4.17) Эту схему рассуждений очевидно можно экстраполировать на любое количество членов вариационного ряда, и ПР совместного распределения всех членов вариационного ряда будет иметь вид , . (1.4.18) 5. Закон распределения выборочного размаха найдем как частный случай разности между двумя членами вариационного ряда: , . Плотность распределения разности двух случайных величин имеет вид , , (1.4.19) где –ПР совместного распределения (1.4.17). Рассмотрим два частных случая: межвариационный (последовательный) размах. Полагая в (1.4.19) , , получаем , , ; (1.4.20) полный размах выборки (в дальнейшем просто размах). Полагая в (1.4.17), (1.4.19) , , получаем . (1.4.21) Статистика выборки из нормальной совокупности является одной из наиболее популярных, поэтому рассмотрим ПР более детально. Как обычно в подобных случаях, рассмотрим совокупность , поскольку от не зависит, а при произвольном размах определяется умножением на размаха выборки из (другими словами рассматривается нормированный размах выборки из произвольной нормальной совокупности). При оговоренных условиях , Подставляя в (1.4.21), находим: , . (1.4.22) Для точные формулы ПР существуют только в квадратуре и для больших нужно исследовать их асимптотическое поведение. Вид ПР для , 10 представлен на рис. 1.4.4.
Рис. 1.4.4. Плотность выборочного размаха в зависимости от объема выборки
Асимптотика числовых характеристик нормированного размаха имеет вид , . (1.4.23) При этом нормированный размах , очевидно, есть несмещенная оценка генерального СКО, т.е. . В свою очередь, СКО полученной оценки будет совпадать с коэффициентом вариации нормированного размаха , предельное значение которого составит . (1.4.24) Сравнительная эффективность оценки приведена в табл. 1.4.2. Числовые характеристики и квантили нормированного размаха даны в приложении 3. 6. При установлении закона распределения выборочной медианы рассмотрим два случая: медиана выборки нечетного объема. В этом случае , и медианой служит серединная порядковая статистика с номером . Подставляя параметры статистики , , получаем общий вид плотности распределения медианы нечетной выборки: (1.4.25) Для совокупности N(0,1) получаем ; (1.4.26) при четном объеме выборки в качестве медианы, вообще говоря, может рассматриваться любая точка из интервала . Для определенности медианой принято считать середину указанного интервала. Плотность распределения случайной величины найдем путем последовательных преобразований. Сначала найдем плотность распределения суммы, используя формулу суммы и ПР (1.4.14) и учитывая, что : Искомую ПР медианы получим из ПР суммы: . (1.4.27) Для нормальной совокупности окончательно получаем . (1.4.28) При n =2 медиана совпадает с выборочным средним. Вид ПР медианы для n =3÷5 представлен на рис.1.4.5. Рис. 1.4.5. Плотность распределения выборочной медианы в зависимости от объема выборки n
При больших n для серединной порядковой статистики справедлива асимптотика , где . (1.4.29) Таким образом, серединная порядковая статистика является асимптотически нормальной оценкой генеральной квантили при любом законе распределения . В частности, для нормальной совокупности выборочная медиана распределена по нормальному закону , являясь несмещенной оценкой генерального среднего. При этом оценка по медиане при больших n в раз менее эффективна, чем по выборочному среднему, у которого . Сравнительная эффективность оценки генерального среднего нормальной совокупности по выборочной медиане в зависимости от n приведена в табл. 1.4.2.
Таблица 1.4.2. Сравнительная эффективность точечных оценок параметров нормального распределения
Окончание табл. 1.4.2.
*) Символы , означают несмещенные выборочные оценки генеральных параметров, индексы соответствуют используемой статистике. **) В последней строке приведен асимптотический вид СКО соответствующих статистик при больших . Приведенные в табл. 1.4.2 СКО используются, в частности, для определения контрольных границ при построении контрольных карт количественного признака (умножением на 3).
Глава 2. основы теории планирования эксперимента
Дата добавления: 2014-12-26; Просмотров: 1458; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |