КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Аппарат дисперсионного анализа
1. Рассмотрим структуру эффектов однофакторной схемы (2.1.3) (эффект
Для двух других отклонений справедливы аналогичные соотношения:
Рассмотрим сумму квадратов отклонений
Суммируя почленно, будем иметь
Суммируя оставшиеся слагаемые, получаем
откуда, на основании (2.2.1), (2.2.2), получаем тождественный ноль. Так, приходим к тождеству
Полученное соотношение (2.2.3) носит название основное уравнение дисперсионного анализа. Каждая из компонент суммы квадратов имеет число степеней свободы, как было показано в п.1.4, равное количеству независимых нормальных СВ (совокупности, из которых получены групповые выборки, априорно полагаются нормальными). Для определения числа степеней свободы существует простое мнемоническое правило: число степеней свободы = количество слагаемых в связывающей их сумме – количество уравнений. Для суммы квадратов эффекта
Таким образом, численной мерой изменчивости отклика служит сумма квадратов отклонений Q, которая, как гласит основное уравнение дисперсионного анализа, может быть представлена в виде суммы парциальных сумм квадратов Q A+ Q e – компонент, характеризующих вклад в полную изменчивость отклика каждого из источников изменчивости. Однако непосредственное сравнение величин Q A и Q e не позволяет сделать обоснованный вывод о том, какой из источников является более значимым (весомым). Поскольку у каждой компоненты свое число степеней свободы, то представляется естественным сравнивать между собой средние квадраты отклонений (на одну степень свободы):
При этом вполне очевидно, что методика сравнения (оценки значимости эффекта фактора) должна строиться исходя из вероятностного содержания основных исходных допущений (о нормальности и взаимной независимости всех индивидуальных значений). Единственно возможным в данной ситуации представляется использование аппарата дисперсионного анализа, конечно, если сами исходные данные не находятся в явном противоречии с теми самыми исходными допущениями. 2. В предыдущем пункте путем простых рассуждений было установлено, что численной мерой, характеризующей каждый из источников изменчивости, является средний квадрат отклонения и обоснована применимость дисперсионного анализа. Вероятностное содержание исходных допущений при более детальном рассмотрении заключается в наличии всего двух альтернативных гипотез: · · По существу, все проблемы дисперсионного анализа, так или иначе, вращаются вокруг этих двух альтернатив. При этом к формулировке гипотезы 1) очевидно, что она (вместе с 2) поскольку Для уяснения «механизма» использования дисперсионного анализа найдем МО средних квадратов (2.2.4) для каждой из гипотез. Для
Используя свойство МО (п.1.1), последнее соотношение преобразуем к виду
Далее, используя соотношение для дисперсии, получим
Данное тождество было получено применительно к условиям Теперь найдем МО
Применяя аналогичную последовательность преобразований и учитывая, что
Таким образом, можно считать доказанной теорему Фишера, которую в контексте предыдущего изложения можно сформулировать так: При справедливости гипотезы Отсюда следует, что отношение средних квадратов есть рассмотренное в п.1.2 дисперсионное отношение Фишера:
Здесь следует сделать следующее замечание. Закону Фишера будет (в рамках
Однако практический интерес представляет лишь ситуация Для МО
В последнем выражении общее генеральное среднее
В результате после элементарных преобразований окончательно получаем
где
Несмещенная оценка этой компоненты дисперсии согласно (2.2.8) будет иметь вид
Таким образом, доказана теорема Эрвина о выделении эффекта фактора, и алгоритм дисперсионного анализа в простейшем однофакторном случае заключается в следующем: 1) вычисляются средние квадраты 2) вычисляется их отношение
3) если 3. Изложенные в предыдущем пункте результаты и методика легко обобщаются на случай двух и большего числа факторов. Наибольшую сложность и, соответственно, интерес представляет переход от однофакторной к двухфакторной схеме. Пусть факторы
Точками условимся обозначать индексы, исчезающие при повышении порядка усреднения. Принимая за начало отсчета общий средний результат
соотношения для эффектов получим в виде:
где Соотношение (2.2.11), являющееся очевидным тождеством, содержит уже 4 источника изменчивости. Принципиальным отличием двухфакторной схемы является наличие третьего слагаемого в (2.2.11) – так называемого взаимодействия факторов. Первые два называются главными эффектами факторов. Последнее, как и в предыдущем случае, ошибка эксперимента. Для лучшего уяснения смысла вновь возникшего феномена – (А × В) - взаимодействия – следует сделать небольшое отступление. Факторы Наглядно это можно легко себе представить на простом модельном примере. Пусть Изобразим графически зависимость
а б в Рис. 2.2.1. Схема двухфакторного взаимодействия
На рис. 2.2.1 а,б При большем числе факторов геометрическую интерпретацию дать уже невозможно, но «механизм» взаимодействия будет тем же самым. Возвращаясь к схеме дисперсионного анализа, возведем обе части (2.2.11) в квадрат и просуммируем по всем
где частичные суммы соответственно равны:
Вывод (2.2.12) не содержит ничего принципиально отличающегося от (2.2.3): перекрестные произведения при суммировании обнуляются, а это, в свою очередь, напрямую вытекает из соотношений, аналогичных (2.2.1), (2.2.2). Число степеней свободы каждой частичной суммы определяется, как и в однофакторной схеме: количество слагаемых, входящих в сумму, – количество уравнений – связей. Для
Для остальных компонент соотношение очевидно, и получаем
Далее, как и в однофакторной схеме, находим средние квадраты отклонений:
Значимость каждого из трех источников контролируемой изменчивости оценивается по величине дисперсионного отно- шения 4. При увеличении количества факторов соотношения, аналогичные (2.2.11)
Частичные суммы квадратов и числа степеней свободы составят соответственно:
Значимость каждого из 7 источников контролируемой изменчивости оценивается точно так же по величине дисперсионного отношения 5. Одной из важнейших задач дисперсионного анализа является ранжирование значимых источников изменчивости. По завершении процедуры собственно дисперсионного анализа значимыми признаются только те эффекты и взаимодействия, у которых средние квадраты значительно превышают средний квадрат случайной ошибки (
где
Именно на основании полученного по (2.2.19), (2.2.20) числового ряда и делаются выводы об объекте исследования в знакомой всем формулировке примерно такого содержания: «… продолжительность жизни на 30% определяется чистотой воздушной среды, на 20% - качеством потребляемой питьевой воды и т.д. …».
Дата добавления: 2014-12-26; Просмотров: 964; Нарушение авторских прав?; Мы поможем в написании вашей работы! |