КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Основные понятия, используемые при оценивании
Построение доверительного интервала для дисперсии. Построение доверительного интервала для математического ожидания при известном и неизвестном среднем квадратическом отклонении Доверительная вероятность Понятие доверительного интервала Распределение Хи-квадрат Пирсона. Распределение дисперсии в выборках из нормальной генеральной совокупности Распределение Стьюдента. Распределение средней арифметической для выборок из нормальной совокупности. Метод максимального правдоподобия. Оценка математического ожидания и дисперсии по выборке. Основные свойства оценок. Понятие об оценке параметров. Статистическое оценивание параметров распределения и построение доверительных интервалов (5 часов +4 часа ПЗ) Основные вопросы лекции: Оценивание — это определение приближенного значения неизвестной характеристики или параметра распределения (генеральной совокупности), иной оцениваемой составляющей математической модели реального (экономического, технического и др.) явления или процесса по результатам наблюдений. Иногда формулируют более коротко: оценивание — это определение приближенного значения неизвестного параметра генеральной совокупности по результатам наблюдений. При этом параметром генеральной совокупности может быть либо число, либо набор чисел (вектор), либо функция, либо множество или иной объект нечисловой природы. Например, по результатам наблюдений, распределенных согласно биномиальному закону, оценивают число — параметр p (вероятность успеха). По результатам наблюдений, имеющих гамма-распределение, оценивают набор из трех чисел — параметры формы a, масштаба b и сдвига c. Способ оценивания функции распределения дается теоремами В. И. Гливенко и А. Н. Колмогорова. Оценивают также плотности вероятности, функции, выражающие зависимости между переменными, включенными в вероятностные модели экономических, управленческих или технологических процессов, и так далее. Целью оценивания может быть нахождение упорядочения инвестиционных проектов по экономической эффективности или технических изделий (объектов) по качеству, формулировка правил технической или медицинской диагностики и так далее (Упорядочения в математической статистике называют также ранжировками. Это — один из видов объектов нечисловой природы.) Оценивание проводят с помощью оценок — статистик, являющихся основой для оценивания неизвестного параметра распределения. В ряде литературных источников термин «оценка» встречается в качестве синонима термина «оценивание». Употреблять одно и то же слово для обозначения двух разных понятий нецелесообразно: оценивание — это действие, а оценка — статистика (функция от результатов наблюдений), используемая в процессе указанного действия или являющаяся его результатом. Оценивание бывает двух видов — точечное оценивание и оценивание с помощью доверительной области. [править] Точечное оценивание Точечное оценивание — способ оценивания, заключающийся в том, что значение оценки принимается как неизвестное значение параметра распределения. Пример 2. Пусть результаты наблюдений x 1, x 2,..., xn рассматривают в вероятностной модели как случайную выборку из нормального распределения N (m,σ). Т. е. считают, что результаты наблюдений моделируются как реализации n независимых одинаково распределенных случайных величин, имеющих функцию нормального распределения N (m,σ) с некоторыми математическим ожиданием m и средним квадратическим отклонением , неизвестными статистику. Требуется оценить параметры m и σ (или σ2) по результатам наблюдений. Оценки обозначим m * и () * соответственно. Обычно в качестве оценки m * математического ожидания m используют выборочное среднее арифметическое , а в качестве оценки (σ2) * дисперсии σ2 используют выборочную дисперсию s2, то есть . Для оценивания математического ожидания m могут использоваться и другие статистики, например, выборочная медиана , полусумма минимального и максимального членов вариационного ряда и др. Для оценивания дисперсии σ2 также имеется ряд оценок, в частности, (см. выше) и оценка, основанная на размахе R, имеющая вид , где коэффициенты a (n) берут из специальных таблиц. Эти коэффициенты подобраны так, чтобы для выборок из нормального распределения . Наличие нескольких методов оценивания одних и тех же параметров приводит к необходимости выбора между этими методами. [править] Состоятельность, несмещенность и эффективность оценок. Как сравнивать методы оценивания между собой? Сравнение проводят на основе таких показателей качества методов оценивания, как состоятельность, несмещенность, эффективность и др. Рассмотрим оценку θ n числового параметра θ, определенную при n = 1,2,.... Оценка thetan называется состоятельной, если она сходится по вероятности к значению оцениваемого параметра θ при безграничном возрастании объема выборки. Выразим сказанное более подробно. Статистика θ n является состоятельной оценкой параметра θ тогда и только тогда, когда для любого положительного числа ε справедливо предельное соотношение . Пример 3. Из закона больших чисел следует, что является состоятельной оценкой θ = M (X) (в приведенной выше теореме Чебышёва предполагалось существование дисперсии D (X); однако, как доказал А. Я. Хинчин, достаточно выполнения более слабого условия — существования математического ожидания M (X)). Пример 4. Все указанные выше оценки параметров нормального распределения являются состоятельными. Вообще, все (за редчайшими исключениями) оценки параметров, используемые в вероятностно-статистических методах принятия решений, являются состоятельными. Пример 5. Так, согласно теореме В. И. Гливенко, эмпирическая функция распределения Fn (x) является состоятельной оценкой функции распределения результатов наблюдений F (x). При разработке новых методов оценивания следует в первую очередь проверять состоятельность предлагаемых методов. Второе важное свойство оценок — несмещенность. Несмещенная оценка θ n — это оценка параметра θ, математическое ожидание которой равно значению оцениваемого параметра: M (θ n) = θ. Пример 6. Из приведенных выше результатов следует, что и являются несмещенными оценками параметров m и s2 нормального распределения. Поскольку , то выборочная медиана и полусумма крайних членов вариационного ряда m * * — также несмещенные оценки математического ожидания m нормального распределения. Однако , поэтому оценки s2 и (σ2) * * не являются состоятельными оценками дисперсии σ2 нормального распределения.Оценки, для которых соотношение M (θ n) = θ неверно, называются смещенными. При этом разность между математическим ожиданием оценки θ n и оцениваемым параметром θ, то есть M (θ n) − θ, называется смещением оценки. Пример 7. Для оценки s2, как следует из сказанного выше, смещение равно . Смещение оценки s2 стремится к 0 при . Оценка, для которой смещение стремится к 0, когда объем выборки стремится к бесконечности, называется асимптотически несмещенной. В примере 7 показано, что оценка s2 является асимптотически несмещенной. Практически все оценки параметров, используемые в вероятностно-статистических методах принятия решений, являются либо несмещенными, либо асимптотически несмещенными. Для несмещенных оценок показателем точности оценки служит дисперсия — чем дисперсия меньше, тем оценка лучше. Для смещенных оценок показателем точности служит математическое ожидание квадрата оценки M (θ n − Θ)2. Как следует из основных свойств математического ожидания и дисперсии, , (3) то есть математическое ожидание квадрата ошибки складывается из дисперсии оценки и квадрата ее смещения. Для подавляющего большинства оценок параметров, используемых в вероятностно-статистических методах принятия решений, дисперсия имеет порядок 1 / n, а смещение — не более чем 1 / n, где n — объем выборки. Для таких оценок при больших n второе слагаемое в правой части (3) пренебрежимо мало по сравнению с первым, и для них справедливо приближенное равенство , (4) где c — число, определяемое методом вычисления оценок Θ n и истинным значением оцениваемого параметра θ. С дисперсией оценки связано третье важное свойство метода оценивания — эффективность. Эффективная оценка — это несмещенная оценка, имеющая наименьшую дисперсию из всех возможных несмещенных оценок данного параметра. Доказано, что и являются эффективными оценками параметров m и σ2 нормального распределения. В то же время для выборочной медианы справедливо предельное соотношение . Другими словами, эффективность выборочной медианы, то есть отношение дисперсии эффективной оценки параметра m к дисперсии несмещенной оценки этого параметра при больших n близка к 0,637. Именно из-за сравнительно низкой эффективности выборочной медианы в качестве оценки математического ожидания нормального распределения обычно используют выборочное среднее арифметическое. Понятие эффективности вводится для несмещенных оценок, для которых M (θ n) = θ для всех возможных значений параметра θ. Если не требовать несмещенности, то можно указать оценки, при некоторых θ имеющие меньшую дисперсию и средний квадрат ошибки, чем эффективные. Пример 8. Рассмотрим «оценку» математического ожидания . Тогда D (m 1) = 0, то есть всегда меньше дисперсии эффективной оценки . Математическое ожидание среднего квадрата ошибки dn (m 1) = m2, то есть при имеем . Ясно, однако, что статистику бессмысленно рассматривать в качестве оценки математического ожидания m. Пример 9. Более интересный пример рассмотрен американским математиком Дж. Ходжесом: Ясно, что Tn — состоятельная, асимптотически несмещенная оценка математического ожидания m, при этом, как нетрудно вычислить, Последняя формула показывает, что при оценка Tn не хуже (при сравнении по среднему квадрату ошибки dn), а при m = 0 — в четыре раза лучше. Подавляющее большинство оценок θ n, используемых в вероятностно-статистических методах, являются асимптотически нормальными, то есть для них справедливы предельные соотношения: для любого x, где Φ(x) — функция стандартного нормального распределения с математическим ожиданием 0 и дисперсией 1. Это означает, что для больших объемов выборок (практически — несколько десятков или сотен наблюдений) распределения оценок полностью описываются их математическими ожиданиями и дисперсиями, а качество оценок — значениями средних квадратов ошибок dn (θ n). [править] Наилучшие асимптотически нормальные оценки. Наилучшие асимптотически нормальные оценки, сокращенно НАН — оценки, — это оценки, для которых средний квадрат ошибки dn (θ n) принимает при больших объемах выборки наименьшее возможное значение, то есть величина c = c (θ n,θ) в формуле (4) минимальна. Ряд видов оценок — так называемые одношаговые оценки и оценки максимального правдоподобия — являются НАН — оценками, именно они обычно используются в вероятностно-статистических методах принятия решений. [править] Доверительное оценивание. Какова точность оценки параметра? В каких границах он может лежать? В научных публикациях и учебной литературе, в нормативно-технической и инструктивно-методической документации, в таблицах и программных продуктах наряду с алгоритмами расчетов точечных оценок даются правила нахождения доверительных границ. Они и указывают точность точечной оценки. При этом используются такие термины, как доверительная вероятность, доверительный интервал. Если речь идет об оценивании нескольких числовых параметров, или же функции, упорядочения и т. п., то говорят об оценивании с помощью доверительной области. Доверительная область — это область в пространстве параметров, в которую с заданной вероятностью входит неизвестное значение оцениваемого параметра распределения. «Заданная вероятность» называется доверительной вероятностью и обычно обозначается γ. Пусть Θ — пространство параметров. Рассмотрим статистику Θ1 = Θ1(x 1, x 2,..., xn) — функцию от результатов наблюдений x 1, x 2,..., xn, значениями которой являются подмножества пространства параметров Θ. Так как результаты наблюдений — случайные величины, то Θ1 — также случайная величина, значения которой — подмножества множества Θ, то есть Θ1 — случайное множество. Напомним, что множество — один из видов объектов нечисловой природы, случайные множества изучают в теории вероятностей и статистике объектов нечисловой природы. В ряде литературных источников, к настоящему времени во многом устаревших, под случайными величинами понимают только те из них, которые в качестве значений принимают действительные числа. Согласно справочнику академика РАН Ю. В. Прохорова и проф. Ю. А. Розанова случайные величины могут принимать значения из любого множества. Так, случайные вектора, случайные функции, случайные множества, случайные ранжировки (упорядочения) — это отдельные виды случайных величин. Используется и иная терминология: термин «случайная величина» сохраняется только за числовыми функциями, определенными на пространстве элементарных событий, а в случае иных областей значений используется термин «случайный элемент». (Замечание для математиков: все рассматриваемые функции, определенные на пространстве элементарных событий, предполагаются измеримыми.) Статистика Θ1 называется доверительной областью, соответствующей доверительной вероятности γ, если (5) Ясно, что этому условию удовлетворяет, как правило, не одна, а много доверительных областей. Из них выбирают для практического применения какую-либо одну, исходя из дополнительных соображений, например, из соображений симметрии или минимизируя объем доверительной области, то есть меру множества Θ1. При оценке одного числового параметра в качестве доверительных областей обычно применяют доверительные интервалы (в том числе лучи), а не иные типа подмножеств прямой. Более того, для многих двухпараметрических и трехпараметрических распределений (нормальных, логарифмически нормальных, Вейбулла-Гнеденко, гамма-распределений и др.) обычно используют точечные оценки и построенные на их основе доверительные границы для каждого из двух или трех параметров отдельно. Это делают для удобства пользования результатами расчетов: доверительные интервалы легче применять, чем фигуры на плоскости или тела в трехмерном пространстве. Как следует из сказанного выше, доверительный интервал — это интервал, который с заданной вероятностью накроет неизвестное значение оцениваемого параметра распределения. Границы доверительного интервала называют доверительными границами. Доверительная вероятность γ — вероятность того, что доверительный интервал накроет действительное значение параметра, оцениваемого по выборочным данным. Оцениванием с помощью доверительного интервала называют способ оценки, при котором с заданной доверительной вероятностью устанавливают границы доверительного интервала. Для числового параметра θ рассматривают верхнюю доверительную границу θ B, нижнюю доверительную границу θ H и двусторонние доверительные границы — верхнюю θ1 B и нижнюю θ1 H . Все четыре доверительные границы — функции от результатов наблюдений x 1, x 2,..., xn и доверительной вероятности γ. Верхняя доверительная граница θ B — случайная величина θ B = θ B (x 1, x 2,..., xn;γ), для которой , где θ — истинное значение оцениваемого параметра. Доверительный интервал в этом случае имеет вид . Нижняя доверительная граница θ H — случайная величина θ H = θ H (x 1, x 2,..., xn;γ), для которой , где \theta — истинное значение оцениваемого параметра. Доверительный интервал в этом случае имеет вид . Двусторонние доверительные границы — верхняя θ1 B и нижняя θ1 H — это случайные величины θ1 B = θ1 B (x 1, x 2,..., xn;γ) и θ1 H = θ1 H (x 1, x 2,..., xn;γ) такие, что , где θ — истинное значение оцениваемого параметра. Доверительный интервал в этом случае имеет вид [θ1 H ;θ1 B ]. Вероятности, связанные с доверительными границами, можно записать в виде частных случаев формулы (5): В нормативно-технической и инструктивно-методической документации, научной и учебной литературе используют два типа правил определения доверительных границ — построенных на основе точного распределения и построенных на основе асимптотического распределения некоторой точечной оценки θ n параметра θ. Рассмотрим примеры. Пример 10. Пусть x 1, x 2,..., xn — выборка из нормального закона N (m,σ), параметры m и σ неизвестны. Укажем доверительные границы для m. Известно, что случайная величина, имеет распределение Стьюдента с (t − 1) степенью свободы, где — выборочное среднее арифметическое и <amth>s_0</math> — выборочное среднее квадратическое отклонение. Пусть t γ(n − 1) и t 1 − γ(n − 1) — квантили указанного распределения порядка γ и 1 − γ соответственно. Тогда . Следовательно, , то есть в качестве нижней доверительной границы θ H, соответствующей доверительной вероятности \gamma, следует взять . (6) Аналогично получаем, что . Поскольку распределение Стьюдента симметрично относительно 0, то t 1 − γ(n − 1) = − t 1 − γ(n − 1) t γ(n − 1). Следовательно, в качестве верхней доверительной границы γ B для m, соответствующей доверительной вероятности γ, следует взять . (7) Как построить двусторонние доверительные границы? Положим , где θ1 H и θ1 B заданы формулами (6) и (7) соответственно. Поскольку неравенство выполнено тогда и только тогда, когда , то , (в предположении, что γ1 > 0,5;γ2 > 0,5). Следовательно, если γ = γ1 + γ2 − 1, то θ1 H и θ1 B — двусторонние доверительные границы для m, соответствующие доверительной вероятности γ. Обычно полагают γ1 = γ2, то есть в качестве двусторонних доверительных границ θ1 H и θ1 B , соответствующих доверительной вероятности γ, используют односторонние доверительные границы θ H и θ B, соответствующие доверительной вероятности (1 + γ) / 2. Другой вид правил построения доверительных границ для параметра θ основан на асимптотической нормальности некоторой точечной оценки θ n этого параметра. В вероятностно-статистических методах принятия решений используют, как уже отмечалось, несмещенные или асимптотически несмещенные оценки θ n, для которых смещение либо равно 0, либо при больших объемах выборки пренебрежимо мало по сравнению со средним квадратическим отклонением оценки θ n. Для таких оценок при всех x , где Φ(x) — функция нормального распределения N (0;1). Пусть u γ — квантиль порядка γ распределения N (0;1). Тогда . (8) Поскольку неравенство , равносильно неравенству , то в качестве θ H можно было бы взять левую часть последнего неравенства. Однако точное значение дисперсии D (θ n) обычно неизвестно. Зато часто удается доказать, что дисперсия оценки имеет вид (с точностью до пренебрежимо малых при росте n слагаемых), где h (θ) — некоторая функция от неизвестного параметра θ. Справедлива теорема о наследовании сходимости, согласно которой при подстановке в h (θ) оценки θ n вместо θ соотношение (8) остается справедливым, то есть . Следовательно, в качестве приближенной нижней доверительной границы следует взять , а в качестве приближенной верхней доверительной границы - . С ростом объема выборки качество приближенных доверительных границ улучшается, т. к. вероятности событий и стремятся к γ. Для построения двусторонних доверительных границ поступают аналогично правилу, указанному выше в примере 10 для интервального оценивания параметра m нормального распределения. А именно, используют односторонние доверительные границы, соответствующие доверительной вероятности (1 + γ) / 2. При обработке экономических, управленческих или технических статистических данных обычно используют значение доверительной вероятности γ = 0,95. Применяют также значения γ = 0,99 или γ = 0,90. Иногда встречаются значения γ = 0,80,γ = 0,975,γ = 0,98 и др. [править] Доверительное оценивание для дискретных распределений. Для дискретных распределений, таких, как биномиальное, гипергеометрическое или распределение Пуассона (а также распределения статистики Колмогорова и других непараметрических статистик), функции распределения имеют скачки. Поэтому для заданного заранее значения γ, например, γ = 0,95, нельзя указать доверительные границы, поскольку уравнения, с помощью которых вводятся доверительные границы, не имеют ни одного решения. Так, рассмотрим биномиальное распределение , где Y — число осуществлений события, n — объем выборки. Для него нельзя указать статистику K (Y, n) такую, что , поскольку K (Y, n) — функция от Y и может принимать не больше значений, чем принимает Y, то есть n + 1, а для γ имеется бесконечно много возможных значений — столько, сколько точек на отрезке. Сказанная означает, что верхней доверительной границы в случае биномиального распределения не существует. Для дискретных распределений приходится изменить определения доверительных границ. Покажем изменения на примере биномиального распределения. Так, в качестве верхней доверительной границы θ B используют наименьшее K (Y, n) такое, что . Аналогичным образом поступают для других доверительных границ и других распределений. Необходимо иметь в виду, что при небольших n и p истинная доверительная вероятность может существенно отличаться от номинальной γ, как это подробно продемонстрировано в работе. Поэтому наряду с величинами типа K (Y, n) (то есть доверительных границ) при разработке таблиц и компьютерных программ необходимо предусматривать возможность получения и величин типа (то есть достигаемых доверительных вероятностей). [править] Основные понятия, используемые при проверке гипотез. Статистическая гипотеза — любое предположение, касающееся неизвестного распределения случайных величин (элементов). Приведем формулировки нескольких статистических гипотез:
Различают нулевую и альтернативную гипотезы. Нулевая гипотеза — гипотеза, подлежащая проверке. Альтернативная гипотеза — каждая допустимая гипотеза, отличная от нулевой. Нулевую гипотезу обозначают H 0, альтернативную — H 1 (от Hypothesis — «гипотеза» (англ.)). Выбор тех или иных нулевых или альтернативных гипотез определяется стоящими перед менеджером, экономистом, инженером, исследователем прикладными задачами. Рассмотрим примеры. Пример 11. Пусть нулевая гипотеза — гипотеза 2 из приведенного выше списка, а альтернативная — гипотеза 1. Сказанное означает, то реальная ситуация описывается вероятностной моделью, согласно которой результаты наблюдений рассматриваются как реализации независимых одинаково распределенных случайных величин с функцией распределения N (0,σ), где параметр σ неизвестен статистику. В рамках этой модели нулевую гипотезу записывают так: , а альтернативную так: . Пример 12. Пусть нулевая гипотеза — по-прежнему гипотеза 2 из приведенного выше списка, а альтернативная — гипотеза 3 из того же списка. Тогда в вероятностной модели управленческой, экономической или производственной ситуации предполагается, что результаты наблюдений образуют выборку из нормального распределения N (m,σ) при некоторых значениях m и σ. Гипотезы записываются так: (оба параметра принимают фиксированные значения); и/или (то есть либо , либо , либо и , и ). Пример 13. Пусть H 0 — гипотеза 1 из приведенного выше списка, а H 1 — гипотеза 3 из того же списка. Тогда вероятностная модель — та же, что в примере 12, произвольно; Пример 14. Пусть H 0 — гипотеза 2 из приведенного выше списка, а согласно H 1результаты наблюдений имеют функцию распределения F (x), не совпадающую с функцией стандартного нормального распределения Φ(x). Тогда при всех x (записывается как ); Примечание. Здесь - знак тождественного совпадения функций (то есть совпадения при всех возможных значениях аргумента x). Пример 15. Пусть H 0 — гипотеза 3 из приведенного выше списка, а согласно H 1 результаты наблюдений имеют функцию распределения F (x), не являющуюся нормальной. Тогда при некоторых m,σ; H 1: для любых m,σ найдется x 0 = x 0(m,σ) такое, что . Пример 16. Пусть H 0 — гипотеза 4 из приведенного выше списка, согласно вероятностной модели две выборки извлечены из совокупностей с функциями распределения <maht>F(x)</math> и G (x), являющихся нормальными с параметрами m 1,σ1 и m 2,σ2 соответственно, а H 1 — отрицание H 0. Тогда , причем m 1 и σ1 произвольны; Пример 17. Пусть в условиях примера 16 дополнительно известно, что σ1 = σ2. Тогда , причем m 1 и σ произвольны; Пример 18. Пусть H 0 — гипотеза 5 из приведенного выше списка, согласно вероятностной модели две выборки извлечены из совокупностей с функциями распределения F (x) и G (x) соответственно, а H 1 — отрицание H 0. Тогда , где — произвольная функция распределения; Пример 19. Пусть в условиях примера 17 дополнительно предполагается, что функции распределения F (x) и G (x) отличаются только сдвигом, то есть G (x) = F (x − a) при некотором a. Тогда , где F (x) — произвольная функция распределения; , где F (x) — произвольная функция распределения. Пример 20. Пусть в условиях примера 14 дополнительно известно, что согласно вероятностной модели ситуации F (x) — функция нормального распределения с единичной дисперсией, то есть имеет вид N (m,1). Тогда (то есть F (x) = Φ(x) при всех x);(записывается как ); (то есть неверно, что ). Пример 21. При статистическом регулировании технологических, экономических, управленческих или иных процессов [2] рассматривают выборку, извлеченную из совокупности с нормальным распределением и известной дисперсией, и гипотезы , где значение параметра m = m 0 соответствует налаженному ходу процесса, а переход к m = m 1 свидетельствует о разладке. Пример 22. При статистическом приемочном контроле число дефектных единиц продукции в выборке подчиняется гипергеометрическому распределению, неизвестным параметром является p = D / N — уровень дефектности, где <maht>N</math> — объем партии продукции, D — общее число дефектных единиц продукции в партии. Используемые в нормативно-технической и коммерческой документации (стандартах, договорах на поставку и др.) планы контроля часто нацелены на проверку гипотезы против альтернативной гипотезы , где AQL — приемочный уровень дефектности, LQ — браковочный уровень дефектности (очевидно, что AQL < LQ). Пример 23. В качестве показателей стабильности технологического, экономического, управленческого или иного процесса используют ряд характеристик распределений контролируемых показателей, в частности, коэффициент вариации ν = σ / M (X). Требуется проверить нулевую гипотезу при альтернативной гипотезе , где ν0 — некоторое заранее заданное граничное значение. Пример 24. Пусть вероятностная модель двух выборок — та же, что в примере 18, математические ожидания результатов наблюдений в первой и второй выборках обозначим <maht>M(X)</math> и M (Y) соответственно. В ряде ситуаций проверяют нулевую гипотезу против альтернативной гипотезы . Пример 25. Выше отмечалось большое значение в математической статистике функций распределения, симметричных относительно 0, При проверке симметричности при всех x, в остальном F произвольна; В вероятностно-статистических методах принятия решений используются и многие другие постановки задач проверки статистических гипотез. Некоторые из них рассматриваются ниже. Конкретная задача проверки статистической гипотезы полностью описана, если заданы нулевая и альтернативная гипотезы. Выбор метода проверки статистической гипотезы, свойства и характеристики методов определяются как нулевой, так и альтернативной гипотезами. Для проверки одной и той же нулевой гипотезы при различных альтернативных гипотезах следует использовать, вообще говоря, различные методы. Так, в примерах 14 и 20 нулевая гипотеза одна и та же, а альтернативные — различны. Поэтому в условиях примера 14 следует применять непараметрические критерии однородности (статистики Смирнова или типа омега-квадрат), а в условиях примера 20 — методы на основе критерия Стьюдента или критерия Крамера-Уэлча. Если в условиях примера 14 использовать критерий Стьюдента, то он не будет решать поставленных задач. Если в условиях примера 20 использовать критерий согласия типа Колмогорова, то он, напротив, будет решать поставленные задачи, хотя, возможно, и хуже, чем специально приспособленный для этого случая критерий Стьюдента. При обработке реальных данных большое значение имеет правильный выбор гипотез H 0 и H 1. Принимаемые предположения, например, нормальность распределения, должны быть тщательно обоснованы, в частности, статистическими методами. Отметим, что в подавляющем большинстве конкретных прикладных постановок распределение результатов наблюдений отлично от нормального. Часто возникает ситуация, когда вид нулевой гипотезы вытекает из постановки прикладной задачи, а вид альтернативной гипотезы не ясен. В таких случаях следует рассматривать альтернативную гипотезу наиболее общего вида и использовать методы, решающие поставленную задачу при всех возможных H 1. В частности при проверке гипотезы 2 (из приведенного выше списка) как нулевой следует в качестве альтернативной гипотезы использовать H 1 из примера 14, а не из примера 20, если нет специальных обоснований нормальности распределения результатов наблюдений при альтернативной гипотезе. [править] Параметрические и непараметрические гипотезы. Статистические гипотезы бывают параметрические и непараметрические. Предположение, которое касается неизвестного значения параметра распределения, входящего в некоторое параметрическое семейство распределений, называется параметрической гипотезой (напомним, что параметр может быть и многомерным). Предположение, при котором вид распределения неизвестен (то есть не предполагается, что оно входит в некоторое параметрическое семейство распределений), называется непараметрической гипотезой. Таким образом, если распределение F (x) результатов наблюдений в выборке согласно принятой вероятностной модели входит в некоторое параметрическое семейство , то есть F (x) = F (x;θ0) при некотором θ0Θ, то рассматриваемая гипотеза — параметрическая, в противном случае — непараметрическая. Если и H 0 и H 1 — параметрические гипотезы, то задача проверки статистической гипотезы — параметрическая. Если хотя бы одна из гипотез H 0 и H 1 — непараметрическая, то задача проверки статистической гипотезы — непараметрическая. Другими словами, если вероятностная модель ситуации — параметрическая, то есть полностью описывается в терминах того или иного параметрического семейства распределений вероятностей, то и задача проверки статистической гипотезы — параметрическая. Если же вероятностная модель ситуации — непараметрическая, то есть ее нельзя полностью описать в терминах какого-либо параметрического семейства распределений вероятностей, то и задача проверки статистической гипотезы — непараметрическая. В примерах 11-13, 16, 17, 20-22 даны постановки параметрических задач проверки гипотез, а в примерах 14, 15, 18, 19, 23-25 — непараметрических. Непараметрические задачи делятся на два класса: в одном из них речь идет о проверке утверждений, касающихся функций распределения (примеры 14, 15, 18, 19, 25), во втором — о проверке утверждений, касающихся характеристик распределений (примеры 23, 24). Статистическая гипотеза называется простой, если она однозначно задает распределение результатов наблюдений, вошедших в выборку. В противном случае статистическая гипотеза называется сложной. Гипотеза 2 из приведенного выше списка, нулевые гипотезы в примерах 11, 12, 14, 20, нулевая и альтернативная гипотезы в примере 21 — простые, все остальные упомянутые выше гипотезы — сложные.
Дата добавления: 2014-12-23; Просмотров: 504; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |