Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Статистические критерии




Однозначно определенный способ проверки статистических гипотез называется статистическим критерием. Статистический критерий строится с помощью статистики U (x 1, x 2,..., xn) — функции от результатов наблюдений x 1, x 2,..., xn. В пространстве значений статистики U выделяют критическую область Ψ, то есть область со следующим свойством: если значения применяемой статистики принадлежат данной области, то отклоняют (иногда говорят -отвергают) нулевую гипотезу, в противном случае — не отвергают (то есть принимают).

Статистику U, используемую при построении определенного статистического критерия, называют статистикой этого критерия. Например, в задаче проверки статистической гипотезы, приведенной в примере 14, применяют критерий Колмогорова, основанный на статистике

.

При этом Dn называют статистикой критерия Колмогорова.

Частным случаем статистики U является векторзначная функция результатов наблюдений U 0(x 1, x 2,..., xn) = (x 1, x 2,..., xn), значения которой — набор результатов наблюдений. Если xi — числа, то U 0 — набор n чисел, то есть точка n -мерного пространства. Ясно, что статистика критерия U является функцией от U 0, то есть U = f (U 0). Поэтому можно считать, что Ψ — область в том же n -мерном пространстве, нулевая гипотеза отвергается, если , и принимается в противном случае.

В вероятностно-статистических методах обработки данных и принятия решений статистические критерии, как правило, основаны на статистиках U, принимающих числовые значения, и критические области имеют вид

, (9)

где C — некоторые числа.

Статистические критерии делятся на параметрические и непараметрические. Параметрические критерии используются в параметрических задачах проверки статистических гипотез, а непараметрические — в непараметрических задачах.

[править] Уровень значимости и мощность.

При проверке статистической гипотезы возможны ошибки. Есть два рода ошибок. Ошибка первого рода заключается в том, что отвергают нулевую гипотезу, в то время как в действительности эта гипотеза верна. Ошибка второго рода состоит в том, что принимают нулевую гипотезу, в то время как в действительности эта гипотеза неверна.

Вероятность ошибки первого рода называется уровнем значимости и обозначается α. Таким образом, , то есть уровень значимости α — это вероятность события , вычисленная в предположении, что верна нулевая гипотеза H 0.

Уровень значимости однозначно определен, если H 0 — простая гипотеза. Если же H 0 — сложная гипотеза, то уровень значимости, вообще говоря, зависит от функции распределения результатов наблюдений, удовлетворяющей H 0. Статистику критерия U обычно строят так, чтобы вероятность события не зависела от того, какое именно распределение (из удовлетворяющих нулевой гипотезе H 0) имеют результаты наблюдений. Для статистик критерия U общего вида под уровнем значимости понимают максимально возможную ошибку первого рода. Максимум (точнее, супремум) берется по всем возможным распределениям, удовлетворяющим нулевой гипотезе H 0, то есть .

Если критическая область имеет вид, указанный в формуле (9), то

. (10)

Если C задано, то из последнего соотношения определяют α. Часто поступают по иному — задавая α (обычно α = 0,05, иногда α = 0,01 или α = 0,1, другие значения α используются гораздо реже), определяют C из уравнения (10), обозначая его C α, и используют критическую область с заданным уровнем значимости α.

Вероятность ошибки второго рода есть . Обычно используют не эту вероятность, а ее дополнение до 1, то есть . Эта величина носит название мощности критерия. Итак, мощность критерия — это вероятность того, что нулевая гипотеза будет отвергнута, когда альтернативная гипотеза верна.

Понятия уровня значимости и мощности критерия объединяются в понятии функции мощности критерия — функции, определяющей вероятность того, что нулевая гипотеза будет отвергнута. Функция мощности зависит от критической области Ψ и действительного распределения результатов наблюдений. В параметрической задаче проверки гипотез распределение результатов наблюдений задается параметром θ. В этом случае функция мощности обозначается M (Ψ,θ) и зависит от критической области Ψ и действительного значения исследуемого параметра θ. Если

,
,

то

,
,

где α — вероятность ошибки первого рода, β — вероятность ошибки второго рода. В статистическом приемочном контроле α — риск изготовителя, β — риск потребителя. При статистическом регулировании технологического процесса α — риск излишней наладки, β — риск незамеченной разладки.

Функция мощности M (Ψ,θ) в случае одномерного параметра θ обычно достигает минимума, равного α, при θ = θ0, монотонно возрастает при удалении от θ0 и приближается к 1 при .

В ряде вероятностно-статистических методов принятия решений используется оперативная характеристика L (Ψ,θ) — вероятность принятия нулевой гипотезы в зависимости от критической области Ψ и действительного значения исследуемого параметра θ. Ясно, что

.

[править] Состоятельность и несмещенность критериев.

Основной характеристикой статистического критерия является функция мощности. Для многих задач проверки статистических гипотез разработан не один статистический критерий, а целый ряд. Чтобы выбрать из них определенный критерий для использования в конкретной практической ситуации, проводят сравнение критериев по различным показателям качества ([2], приложение 3), прежде всего с помощью их функций мощности. В качестве примера рассмотрим лишь два показателя качества критерия проверки статистической гипотезы — состоятельность и несмещенность.

Пусть объем выборки n растет, а Un и Ψ n — статистики критерия и критические области соответственно. Критерий называется состоятельным, если

,

то есть вероятность отвергнуть нулевую гипотезу стремится к 1, если верна альтернативная гипотеза.

Статистический критерий называется несмещенным, если для любого θ0, удовлетворяющего H 0, и любого θ1, удовлетворяющего H 1, справедливо неравенство

,

то есть при справедливости H 0 вероятность отвергнуть H 0 меньше, чем при справедливости H 1.

При наличии нескольких статистических критериев в одной и той же задаче проверки статистических гипотез следует использовать состоятельные и несмещенные критерии.

[править] Некоторые типовые задачи прикладной статистики

[править] Статистические данные и прикладная статистика

Под прикладной статистикой обычно понимают часть математической статистики, посвященную методам обработки реальных статистических данных, а также соответствующее математическое и программное обеспечение. Таким образом, чисто математические задачи не включают в прикладную статистику. В последние десятилетия термин «математическая статистика» все чаще применяют для обозначения чисто математической дисциплины, которая изучает свойства математических объектов и структур, введенных в классической статистике ранее середины ХХ века. При таком понимании прикладная статистика — самостоятельная научно-практическая дисциплина, не имеющая пересечения с математической статистикой. Прикладную статистику и статистические методы в целом можно отнести к кибернетике или к прикладной математике.

Под статистическими данными понимают числовые или нечисловые значения контролируемых параметров (признаков) исследуемых объектов, которые получены в результате наблюдений (измерений, анализов, испытаний, опытов и так далее) определенного числа признаков, у каждой единицы, вошедшей в исследование. Способы получения статистических данных и объемы выборок устанавливают, исходя из постановок конкретной прикладной задачи на основе методов математической теории планирования эксперимента.

Результат наблюдения xi исследуемого признака X (или совокупности исследуемых признаков X) у i -ой единицы выборки отражает количественные и/или качественные свойства обследованной единицы с номером i (здесь i = 1,2,..., n, где n — объем выборки). Деление прикладной статистики на направления соответственно виду обрабатываемых результатов наблюдений (то есть на статистику случайных величин, многомерный статистический анализ, статистику временных рядов и статистику объектов нечисловой природы) обсуждалось выше.

Результаты наблюдений x 1, x 2,..., xn, где xi — результат наблюдения i -ой единицы выборки, или результаты наблюдений для нескольких выборок, обрабатывают с помощью методов прикладной статистики, соответствующих поставленной задаче. Используют, как правило, аналитические методы, то есть методы, основанные на численных расчетах (объекты нечисловой природы при этом описывают с помощью чисел). В отдельных случаях допустимо применение графических методов (визуального анализа).

Количество разработанных к настоящему времени методов обработки данных весьма велико. Они описаны в сотнях тысяч книг и статей, а также в стандартах и других нормативно-технических и инструктивно-методических документах. Многие методы прикладной статистики требуют проведения трудоемких расчетов, поэтому для их реализации нужны компьютеры. Программы расчетов на ЭВМ должны соответствовать современному научному уровню. Однако для единичных расчетов при отсутствии соответствующего программного обеспечения успешно используют микрокалькуляторы.

[править] Статистический анализ точности и стабильности технологических процессов и качества продукции

Статистические методы используют, в частности, для анализа точности и стабильности технологических процессов и качества продукции. Цель — подготовка решений, обеспечивающих эффективное функционирование технологических единиц и повышение качества и конкурентоспособности выпускаемой продукции. Статистические методы следует применять во всех случаях, когда по результатам ограниченного числа наблюдений требуется установить причины улучшения или ухудшения точности и стабильности технологического оборудования. Под точностью технологического процесса понимают свойство технологического процесса, обусловливающее близость действительных и номинальных значений параметров производимой продукции. Под стабильностью технологического процесса понимают свойство технологического процесса, обусловливающее постоянство распределений вероятностей для его параметров в течение некоторого интервала времени без вмешательства извне.

Целями применения статистических методов анализа точности и стабильности технологических процессов и качества продукции на стадиях разработки, производства и эксплуатации (потребления) продукции являются, в частности:

  • определение фактических показателей точности и стабильности технологического процесса, оборудования или качества продукции;
  • установление соответствия качества продукции требованиям нормативно-технической документации;
  • проверка соблюдения технологической дисциплины;
  • изучение случайных и систематических факторов, способных привести к появлению дефектов;
  • выявление резервов производства и технологии;
  • обоснование технических норм и допусков на продукцию;
  • оценка результатов испытаний опытных образцов при обосновании требований к продукции и нормативов на нее;
  • обоснование выбора технологического оборудования и средств измерений и испытаний;
  • сравнение различных образцов продукции;
  • обоснование замены сплошного контроля статистическим;
  • выявление возможности внедрения статистических методов управления качеством продукции, и так далее.

Для достижения перечисленных выше целей применяют различные методы описания данных, оценивания и проверки гипотез. Приведем примеры постановок задач.

[править] Задачи одномерной статистики (статистики случайных величин)

Сравнение математических ожиданий проводят в тех случаях, когда требуется установить соответствие показателей качества изготовленной продукции и эталонного образца. Это — задача проверки гипотезы:

,

где m 0 — значение соответствующее эталонному образцу; X — случайная величина, моделирующая результаты наблюдений. В зависимости от формулировки вероятностной модели ситуации и альтернативной гипотезы сравнение математических ожиданий проводят либо параметрическими, либо непараметрическими методами.

Сравнение дисперсий проводят тогда, когда требуется установить отличие рассеивания показателя качества от номинального. Для этого проверяют гипотезу:

.

Ряд иных постановок задач одномерной статистики приведен ниже. Не меньшее значение, чем задачи проверки гипотез, имеют задачи оценивания параметров. Они, как и задачи проверки гипотез, в зависимости от используемой вероятностной модели ситуации делятся на параметрические и непараметрические.

В параметрических задачах оценивания принимают вероятностную модель, согласно которой результаты наблюдений x 1, x 2,..., xn рассматривают как реализации n независимых случайных величин с функцией распределения F (x;θ). Здесь θ — неизвестный параметр, лежащий в пространстве параметров Θ заданном используемой вероятностной моделью. Задача оценивания состоит в определении точечной оценок и доверительных границ (либо доверительной области) для параметра θ.

Параметр θ — либо число, либо вектор фиксированной конечной размерности. Так, для нормального распределения θ = (m2) — двумерный вектор, для биномиального θ = p — число, для гамма-распределения θ = (a, b, c) — трехмерный вектор, и так далее.

В современной математической статистике разработан ряд общих методов определения оценок и доверительных границ — метод моментов, метод максимального правдоподобия, метод одношаговых оценок, метод устойчивых (робастных) оценок, метод несмещенных оценок и др. Кратко рассмотрим первые три из них. Теоретические основы различных методов оценивания и полученные с их помощью конкретные правила определения оценок и доверительных границ для тех или иных параметрических семейств распределений рассмотрены в специальной литературе, включены в нормативно-техническую и инструктивно-методическую документацию.

Метод моментов основан на использовании выражений для моментов рассматриваемых случайных величин через параметры их функций распределения. Оценки метода моментов получают, подставляя выборочные моменты вместо теоретических в функции, выражающие параметры через моменты.

В методе максимального правдоподобия, разработанном в основном Р. А. Фишером, в качестве оценки параметра θ берут значение θ *, для которого максимальна так называемая функция правдоподобия

,

где x 1, x 2,..., xn — результаты наблюдений; f (x,θ) — их плотность распределения, зависящая от параметра θ, который нужно оценить.

Оценки максимального правдоподобия, как правило, эффективны (или асимптотически эффективны) и имеют меньшую дисперсию, чем оценки метода моментов. В отдельных случаях формулы для них выписываются явно (нормальное распределение, экспоненциальное распределение без сдвига). Однако чаще для их нахождения надо численно решать систему трансцендентных уравнений (распределения Вейбулла-Гнеденко, гамма). В подобных случаях целесообразно использовать не оценки максимального правдоподобия, а другие виды оценок, прежде всего одношаговые оценки. В литературе их иногда не вполне точно называют «приближенные оценки максимального правдоподобия». При достаточно больших объемах выборок они имеют столь же хорошие свойства, как и оценки максимального правдоподобия. Поэтому их следует рассматривать не как «приближенные», а как оценки, полученные по другому методу, не менее обоснованному и эффективному, чем метод максимального правдоподобия. Одношаговые оценки вычисляют по явным формулам ([17]).

В непараметрических задачах оценивания принимают вероятностную модель, в которой результаты наблюдений x 1, x 2,..., xn рассматривают как реализации n независимых случайных величин с функцией распределения F (x) общего вида. От F (x) требуют лишь выполнения некоторых условий типа непрерывности, существования математического ожидания и дисперсии и т. п. Подобные условия не являются столь жесткими, как условие принадлежности к определенному параметрическому семейству.

[править] Непараметрическое оценивание математического ожидания.

В непараметрической постановке оценивают либо характеристики случайной величины (математическое ожидание, дисперсию, коэффициент вариации), либо ее функцию распределения, плотность и т. п. Так, в силу закона больших чисел выборочное среднее арифметическое является состоятельной оценкой математического ожидания M (X) (при любой функции распределения F (x) результатов наблюдений, для которой математическое ожидание существует). С помощью центральной предельной теоремы определяют асимптотические доверительные границы

.

где γ — доверительная вероятность, — квантиль порядка стандартного нормального распределения N (0;1) с нулевым математическим ожиданием и единичной дисперсией, — выборочное среднее арифметическое, s — выборочное среднее квадратическое отклонение. Термин «асимптотические доверительные границы» означает, что вероятности

,

стремятся к , и γ соответственно при , но, вообще говоря, не равны этим значениям при конечных n. Практически асимптотические доверительные границы дают достаточную точность при n порядка 10.

[править] Непараметрическое оценивание функции распределения.

Второй пример непараметрического оценивания — оценивание функции распределения. По теореме Гливенко эмпирическая функция распределения Fn (x) является состоятельной оценкой функции распределения F (x). Если F (x) — непрерывная функция, то на основе теоремы Колмогорова доверительные границы для функции распределения F (x) задают в виде

,

где k (γ, n) — квантиль порядка γ распределения статистики Колмогорова при объеме выборки n (напомним, что распределение этой статистики не зависит от F (x)).

Правила определения оценок и доверительных границ в параметрическом случае строятся на основе параметрического семейства распределений F (x;θ). При обработке реальных данных возникает вопрос — соответствуют ли эти данные принятой вероятностной модели? Т. е. статистической гипотезе о том, что результаты наблюдений имеют функцию распределения из семейства при некотором θ = θ0 Такие гипотезы называют гипотезами согласия, а критерии их проверки — критериями согласия.

Если истинное значение параметра θ = θ0 известно, функция распределения F (x0) непрерывна, то для проверки гипотезы согласия часто применяют критерий Колмогорова, основанный на статистике

,

где Fn (x) — эмпирическая функция распределения.

Если истинное значение параметра θ0 неизвестно, например, при проверке гипотезы о нормальности распределения результатов наблюдения (то есть при проверке принадлежности этого распределения к семейству нормальных распределений), то иногда используют статистику

,

Она отличается от статистики Колмогорова Dn тем, что вместо истинного значения параметра θ0 подставлена его оценка θ *.

Распределение статистики Dn*) сильно отличается от распределения статистики Dn. В качестве примера рассмотрим проверку нормальности, когда , а . Для этого случая квантили распределений статистик Dn и Dn*) приведены в табл. 1 (см., например, [18]). Таким образом, квантили отличаются примерно в 1,5 раза.

[править] Таблица 1

Квантили статистик Dn и Dn*) при проверке нормальности
p 0,85 0,90 0,95 0,975 0,99
Квантили порядка p для Dn 1,138 1,224 1,358 1,480 1,626
Квантили порядка p для Dn*) 0,775 0,819 0,895 0,955 1,035

[править] Проблема исключения промахов.

При первичной обработке статистических данных важной задачей является исключение результатов наблюдений, полученных в результате грубых погрешностей и промахов. Например, при просмотре данных о весе (в килограммах) новорожденных детей наряду с числами 3,500, 2,750, 4,200 может встретиться число 35,00. Ясно, что это промах, и получено ошибочное число при ошибочной записи — запятая сдвинута на один знак, в результате результат наблюдения ошибочно увеличен в 10 раз.

Статистические методы исключения резко выделяющихся результатов наблюдений основаны на предположении, что подобные результаты наблюдений имеют распределения, резко отличающиеся от изучаемых, а потому их следует исключить из выборки. Простейшая вероятностная модель такова. При нулевой гипотезе результаты наблюдений рассматриваются как реализации независимых одинаково распределенных случайных величин X 1, X 2,..., Xn с функцией распределения F (x). При альтернативной гипотезе X 1, X 2,..., Xn − 1 — такие же, как и при нулевой гипотезе, а Xn соответствует грубой погрешности и имеет функцию распределения G (x) = F (xc), где c велико. Тогда с вероятностью, близкой к 1 (точнее, стремящейся к 1 при росте объема выборки),

,

то есть при описании данных в качестве возможной грубой ошибки следует рассматривать X max. Критическая область имеет вид

.

Критическое значение d = d (α, n) выбирают в зависимости от уровня значимости? и объема выборки n из условия

. (1)

Условие (1) эквивалентно при больших n и малых α следующему:

(2)

Если функция распределения результатов наблюдений F (x) известна, то критическое значение d находят из соотношения (2). Если F (x) известна с точностью до параметров, например, известно, что F (x) — нормальная функция распределения, то также разработаны правила проверки рассматриваемой гипотезы [7].

Однако часто вид функции распределения результатов наблюдений известен не абсолютно точно и не с точностью до параметров, а лишь с некоторой погрешностью. Тогда соотношение (2) становится практически бесполезным, поскольку малая погрешность в определении F (x), как можно показать, приводит к большой погрешности при определении критического значения d из условия (2), а при фиксированном d уровень значимости критерия может существенно отличаться от номинального [2].

Поэтому в ситуации, когда о F (x) нет полной информации, однако известны математическое ожидание M (X) и дисперсия σ2 = D (X) результатов наблюдений X 1, X 2,..., Xn, можно использовать непараметрические правила отбраковки, основанные на неравенстве Чебышёва. С помощью этого неравенства найдем критическое значение d = d (α, n) такое, что

.

Так как

,

то соотношение (3) будет выполнено, если

. (4)

По неравенству Чебышёва

, (5)

поэтому для того, чтобы (4) было выполнено, достаточно приравнять правые части формул (4) и (5), то есть определить d из условия

. (6)

Правило отбраковки, основанное на критическом значении d, вычисленном по формуле (6), использует минимальную информацию о функции распределения F (x) и поэтому исключает лишь результаты наблюдений, весьма далеко отстоящие от основной массы. Другими словами, значение d 1, заданное соотношением (1), обычно много меньше, чем значение d 2, заданное соотношением (6).

[править] Многомерный статистический анализ

Перейдем к многомерному статистическому анализу. Его применяют при решении следующих задач:

  • исследование зависимости между признаками;
  • классификация объектов или признаков, заданных векторами;
  • снижение размерности пространства признаков.

При этом результат наблюдений — вектор значений фиксированного числа количественных и иногда качественных признаков, измеренных у объекта. Напомним, что количественный признак — признак наблюдаемой единицы, который можно непосредственно выразить числом и единицей измерения. Количественный признак противопоставляется качественному — признаку наблюдаемой единицы, определяемому отнесением к одной из двух или более условных категорий (если имеется ровно две категории, то признак называется альтернативным). Статистический анализ качественных признаков — часть статистики объектов нечисловой природы. Количественные признаки делятся на признаки, измеренные в шкалах интервалов, отношений, разностей, абсолютной. А качественные — на признаки, измеренные в шкале наименований и порядковой шкале. Методы обработки данных должны быть согласованы со шкалами, в которых измерены рассматриваемые признаки.

[править] Корреляция и регрессия.

Целями исследования зависимости между признаками являются доказательство наличия связи между признаками и изучение этой связи. Для доказательства наличия связи между двумя случайными величинами X и Y применяют корреляционный анализ. Если совместное распределение X и Y является нормальным, то статистические выводы основывают на выборочном коэффициенте линейной корреляции, в остальных случаях используют коэффициенты ранговой корреляции Кендалла и Спирмена, а для качественных признаков — критерий хи-квадрат.

Регрессионный анализ применяют для изучения функциональной зависимости количественного признака Y от количественных признаков x (1), x (2),..., x (k). Эту зависимость называют регрессионной или, кратко, регрессией. Простейшая вероятностная модель регрессионного анализа (в случае k = 1) использует в качестве исходной информации набор пар результатов наблюдений (xi, yi), i = 1,2,..., n, и имеет вид

,

где ε i — ошибки наблюдений. Иногда предполагают, что ε i — независимые случайные величины с одним и тем же нормальным распределением N (0,σ2). Поскольку распределение ошибок наблюдения обычно отлично от нормального, то целесообразно рассматривать регрессионную модель в непараметрической постановке, то есть при произвольном распределении ε i.

Основная задача регрессионного анализа состоит в оценке неизвестных параметров a и b, задающих линейную зависимость y от x. Для решения этой задачи применяют разработанный еще К.Гауссом в 1794 г. метод наименьших квадратов, то есть находят оценки неизвестных параметров модели a и b из условия минимизации суммы квадратов

по переменным a и b.

Теория регрессионного анализа описана и расчетные формулы даны в специальной литературе [2], [11], [19]. В этой теории разработаны методы точечного и интервального оценивания параметров, задающих функциональную зависимость, а также непараметрические методы оценивания этой зависимости, методы проверки различных гипотез, связанных с регрессионными зависимостями. Выбор планов эксперимента, то есть точек xi, в которых будут проводиться эксперименты по наблюдению yi — предмет теории планирования эксперимента [20].

[править] Дисперсионный анализ.

Дисперсионный анализ применяют для изучения влияния качественных признаков на количественную переменную. Например, пусть имеются k выборок результатов измерений количественного показателя качества единиц продукции, выпущенных на k станках, то есть набор чисел (x 1(j), x 2(j),..., xn (j)), где j — номер станка, j = 1,2,..., k, а n — объем выборки. В распространенной постановке дисперсионного анализа предполагают, что результаты измерений независимы и в каждой выборке имеют нормальное распределение N (m (j),σ2) с одной и той же дисперсией. Хорошо разработаны и непараметрические постановки [21].

Проверка однородности качества продукции, то есть отсутствия влияния номера станка на качество продукции, сводится к проверке гипотезы

.

В дисперсионном анализе разработаны методы проверки подобных гипотез. Теория дисперсионного анализа и расчетные формулы рассмотрены в специальной литературе [22].

Гипотезу H 0 проверяют против альтернативной гипотезы H 1, согласно которой хотя бы одно из указанных равенств не выполнено. Проверка этой гипотезы основана на следующем «разложении дисперсий», указанном Р. А. Фишером:

, (7)

где s 2 — выборочная дисперсия в объединенной выборке, то есть

.

Далее, s 2(j) — выборочная дисперсия в j -ой группе,

.

Таким образом, первое слагаемое в правой части формулы (7) отражает внутригрупповую дисперсию. Наконец, — межгрупповая дисперсия,

.

Область прикладной статистики, связанную с разложениями дисперсии типа формулы (7), называют дисперсионным анализом. В качестве примера задачи дисперсионного анализа рассмотрим проверку приведенной выше гипотезы H 0 в предположении, что результаты измерений независимы и в каждой выборке имеют нормальное распределение N (m (j),σ2) с одной и той же дисперсией. При справедливости H 0 первое слагаемое в правой части формулы (7), деленное на σ2, имеет распределение хи-квадрат с k (n − 1) степенями свободы, а второе слагаемое, деленное на σ2, также имеет распределение хи-квадрат, но с (k − 1) степенями свободы, причем первое и второе слагаемые независимы как случайные величины. Поэтому случайная величина

имеет распределение Фишера с (k − 1) степенями свободы числителя и k (n − 1) степенями свободы знаменателя. Гипотеза H 0 принимается, если , и отвергается в противном случае, где F 1 − α — квантиль порядка 1 − α распределения Фишера с указанными числами степеней свободы. Такой выбор критической области определяется тем, что при H 1 величина F безгранично увеличивается при росте объема выборок n. Значения F 1 − α берут из соответствующих таблиц [8].

Разработаны непараметрические методы решения классических задач дисперсионного анализа [19], в частности, проверки гипотезы H 0.

 

[править] Методы классификации.

Следующий тип задач многомерного статистического анализа — задачи классификации. Они согласно [2, 20] делятся на три принципиально различных вида — дискриминантный анализ, кластер-анализ, задачи группировки.

[править] Дискриминантный анализ.

Задача дискриминантного анализа состоит в нахождении правила отнесения наблюдаемого объекта к одному из ранее описанных классов. При этом объекты описывают в математической модели с помощью векторов, координаты которых — результаты наблюдения ряда признаков у каждого объекта. Классы описывают либо непосредственно в математических терминах, либо с помощью обучающих выборок. Обучающая выборка — это выборка, для каждого элемента которой указано, к какому классу он относится.

Рассмотрим пример применения дискриминантного анализа для принятия решений в технической диагностике. Пусть по результатам измерения ряда параметров продукции требуется установить наличие или отсутствие дефектов. В этом случае для элементов обучающей выборки указаны дефекты, обнаруженные в ходе дополнительного исследования, например, проведенного после определенного периода эксплуатации. Дискриминантный анализ позволяет сократить объем контроля, а также предсказать будущее поведение продукции. Дискриминантный анализ сходен с регрессионным — первый позволяет предсказывать значение качественного признака, а второй — количественного. В статистике объектов нечисловой природы разработана математическая схема, частными случаями которой являются регрессионный и дискриминантный анализы [21].

[править] Кластер-анализ.

Кластерный анализ применяют, когда по статистическим данным нужно разделить элементы выборки на группы. Причем два элемента группы из одной и той же группы должны быть «близкими» по совокупности значений измеренных у них признаков, а два элемента из разных групп должны быть «далекими» в том же смысле. В отличие от дискриминантного анализа в кластер-анализе классы не заданы, а формируются в процессе обработки статистических данных. Например, кластер-анализ может быть применен для разбиения совокупности марок стали (или марок холодильников) на группы сходных между собой.

Другой вид кластер-анализа — разбиение признаков на группы близких между собой. Показателем близости признаков может служить выборочный коэффициент корреляции. Цель кластер-анализа признаков может состоять в уменьшении числа контролируемых параметров, что позволяет существенно сократить затраты на контроль. Для этого из группы тесно связанных между собой признаков (у которых коэффициент корреляции близок к 1 — своему максимальному значению) измеряют значение одного, а значения остальных рассчитывают с помощью регрессионного анализа.

[править] Задачи группировки.

Задачи группировки решают тогда, когда классы заранее не заданы и не обязаны быть «далекими» друг от друга. Примером является группировка студентов по учебным группам. В технике решением задачи группировки часто является параметрический ряд — возможные типоразмеры группируются согласно элементам параметрического ряда. В литературе, нормативно-технических и инструктивно-методических документах по прикладной статистике также иногда используется группировка результатов наблюдений (например, при построении гистограмм).

Задачи классификации решают не только в многомерном статистическом анализе, но и тогда, когда результатами наблюдений являются числа, функции или объекты нечисловой природы. Так, многие алгоритмы кластер-анализа используют только расстояния между объектами. Поэтому их можно применять и для классификации объектов нечисловой природы, лишь бы были заданы расстояния между ними. Простейшая задача классификации такова: даны две независимые выборки, требуется определить, представляют они два класса или один. В одномерной статистике эта задача сводится к проверке гипотезы однородности [2].

[править] Снижение размерности.

Третий раздел многомерного статистического анализа — задачи снижения размерности с целью сжатия информации. Цель их решения состоит в определении набора производных показателей, полученных преобразованием исходных признаков, такого, что число производных показателей значительно меньше числа исходных признаков, но они содержат возможно большую часть информации, имеющейся в исходных статистических данных. Задачи снижения размерности решают с помощью методов многомерного шкалирования, главных компонент, факторного анализа и др. Например, в простейшей модели многомерного шкалирования исходные данные — попарные расстояния между k объектами, а цель расчетов состоит в представлении объектов точками на плоскости. Это дает возможность в буквальном смысле слова увидеть, как объекты соотносятся между собой. Для достижения этой цели необходимо каждому объекту поставить в соответствие точку на плоскости так, чтобы попарные расстояния sij между точками, соответствующими объектам с номерами i и j, возможно точнее воспроизводили расстояния ρ ij между этими объектами. Согласно основной идее метода наименьших квадратов находят точки на плоскости так, чтобы величина

достигала своего наименьшего значения. Есть и многие другие постановки задач снижения размерности и визуализации данных.

[править] Статистика случайных процессов и временных рядов

Методы статистики случайных процессов и временных рядов применяют для постановки и решения, в частности, следующих задач:

  • предсказание будущего развития случайного процесса или временного ряда;
  • управление случайным процессом (временным рядом) с целью достижения поставленных целей, например, заданных значений контролируемых параметров;
  • построение вероятностной модели реального процесса, обычно длящегося во времени, и изучение свойств этой модели.

Пример 1. При внедрении статистического регулирования технологического процесса нужно проверить, что в налаженном состоянии математическое ожидание контролируемого параметра не меняется со временем. Если подобное изменение будет обнаружено, то следует установить подналадочное устройство.

Пример 2. Следящие системы, например, входящие в состав автоматизированной системы управления технологическим процессом, должны выделять полезный сигнал на фоне шумов. Это — задача оценивания (полезного сигнала), в то время как в примере 1 речь шла о задаче проверки гипотезы.

Методы статистики случайных процессов и временных рядов описаны в литературе [2,20].

[править] Статистика объектов нечисловой природы

Методы статистики объектов нечисловой природы (статистики нечисловых данных, или нечисловой статистики) применяют всегда, когда результаты наблюдений являются объектами нечисловой природы. Например, сообщениями о годности или дефектности единиц продукции. Информацией о сортности единиц продукции. Разбиениями единиц продукции на группы соответственно значения контролируемых параметров. Упорядочениями единиц продукции по качеству или инвестиционных проектов по предпочтительности. Фотографиями поверхности изделия, пораженной коррозией, и так далее. Итак, объекты нечисловой природы — это измерения по качественному признаку, множества, бинарные отношения (разбиения, упорядочения и др.) и многие другие математические объекты [2]. Они используются в различных вероятностно-статистических методах принятия решений. В частности, в задачах управления качеством продукции, а также, например, в медицине и социологии, как для описания результатов приборных измерений, так и для анализа экспертных оценок.

Для описания данных, являющихся объектами нечисловой природы, применяют, в частности, таблицы сопряженности, а в качестве средних величин — решения оптимизационных задач [2]. В качестве выборочных средних для измерений в порядковой шкале используют медиану и моду, а в шкале наименований — только моду. О методах классификации нечисловых данных говорилось выше.

Для решения параметрических задач оценивания используют оптимизационный подход, метод одношаговых оценок, метод максимального правдоподобия, метод устойчивых оценок. Для решения непараметрических задач оценивания наряду с оптимизационными подходами к оцениванию характеристик используют непараметрические оценки распределения случайного элемента, плотности распределения, функции, выражающей зависимость [2].

В качестве примера методов проверки статистических гипотез для объектов нечисловой природы рассмотрим критерий «хи-квадрат» (обозначают φ2), разработанный К.Пирсоном для проверки гипотезы однородности (другими словами, совпадения) распределений, соответствующих двум независимым выборкам.

Рассматриваются две выборки объемов n 1 и n 2, состоящие из результатов наблюдений качественного признака, имеющего k градаций. Пусть m 1 j и m 2 j — количества элементов первой и второй выборок соответственно, для которых наблюдается j -я градация, а p 1 j и p 2 j — вероятности того, что эта градация будет принята, для элементов первой и второй выборок, j = 1,2,..., k.

Для проверки гипотезы однородности распределений, соответствующих двум независимым выборкам,

,

применяют критерий φ2 (хи-квадрат) со статистикой

;.

Установлено [9, 11], что статистика X 2 при больших объемах выборок n 1 и n 2 имеет асимптотическое распределение хи-квадрат с (k − 1) степенью свободы.

Пример 3. В таблице приведены данные о содержании серы в углеродистой стали, выплавляемой двумя металлургическими заводами. Проверим, можно ли считать распределения примеси серы в плавках стали этих двух заводов одинаковыми.

Распределения плавок стали по процентному содержанию серы
Содержание серы, в % Число плавок
Завод А Завод Б
0,00—0,02    
0,02—0,04    
0,04—0,06    
0,06—0,08    

Расчет по данным дает X 2 = 3,39. Квантиль порядка 0,95 распределения χ-квадрат с k − 1 = 3 степенями свободы равен , поэтому гипотезу о совпадении функций распределения нельзя отклонить, а следует принять на уровне значимости α = 0,05.

Выше дано лишь краткое описание содержания прикладной статистики на современном этапе. Подробное изложение конкретных методов содержится в специальной литературе.




Поделиться с друзьями:


Дата добавления: 2014-12-24; Просмотров: 1403; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.009 сек.