КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Дисперсионный анализ
Вопрос о проверке существенности расхождения двух выборочных характеристик может быть поставлен при сравнении не только двух выборочных средних, но и двух выборочных дисперсий. Для сравнения дисперсий применяется критерий, предложенный Рональдом Фишером, который называют дисперсионным отношением, или F-критерием. Критерий Фишера представляет собой отношение двух дисперсий: (8.35) где и рассматриваются в качестве оценок одной и той же генеральной дисперсии. При вычислении дисперсионного отношения в числителе берется большая из оценок и , поэтому величина дисперсионного отношения может быть равна или больше единицы. Если F-критерий равен 1, то это указывает на равенство дисперсий, и вопрос об оценке существенности их расхождения снимается. Если же величина дисперсионного отношения больше единицы, то возникает необходимость оценить, случайно ли расхождение между дисперсиями. При этом очевидно, что чем больше величина дисперсионного отношения, тем значительнее расхождение между дисперсиями. Для определения границ случайных колебаний отношения дисперсии Р.Фишером разработаны специальные таблицы F-pacпределения (см. Приложение VI). В этих таблицах указываются предельные значения F-критерия для различных комбинаций числа степеней свободы числителя , и знаменателя , которые могут быть превзойдены с вероятностью 0,05 или 0,01. Число степеней свободы k, соответствующее большей дисперсии, определяет столбец таблицы, а число степеней свободы k2,, соответствующее дисперсии , — строку таблицы. Рассчитанная по фактическим данным величина дисперсионного отношения сопоставляется стабличной величиной дисперсионного отношения, соответствующей данному сочетанию числа степеней свободы числителя и знаменателя и принятому уровню значимости. Гипотеза, которая проверяется с помощью этих таблиц, состоит в том, что сравниваемые дисперсии характеризуют вариацию признака в совокупностях, отобранных из одной и той же нормально распределенной генеральной совокупности или же отобранных из нормально распределенных генеральных совокупностей с одинаковой дисперсией. Если фактическое дисперсионное отношение будет больше табличного, то лишь с вероятностью 0,05 или 0,01 можно утверждать, что различие между дисперсиями определяется случайными факторами. Однако события, имеющие столь малую вероятность, считаются практически невозможными, а потому в этом случае с вероятностью 1 - α можно утверждать существенность различий в величине дисперсий. Если же фактическое значение дисперсионного отношения будет меньше соответствующего табличного значения, например, при 1 %-ном уровне значимости, то с вероятностью 99% можно утверждать, что расхождение между дисперсиями несущественно. Дисперсионный анализ приобретает самостоятельное значение при оценке существенности расхождения нескольких средних, что позволяет проверить гипотезу о наличии связи между признаком, положенным в основу группировки, и результативным признаком. В зависимости от количества факторов, определяющих вариацию результативного признака, дисперсионный анализ подразделяется на однофакторный и многофакторный. Методы дисперсионного анализа позволяют также проверить гипотезу относительно формы корреляционной зависимости и оценить целесообразность включения в модель дополнительных факторов. Рассмотрим применение дисперсионного анализа для случая однофакторного комплекса. Пусть все n наблюдений разбиты на k групп в соответствии с определенным признаком и число наблюдений в j -й группе равно nj Систему таких наблюдений в общем виде можно записать таким образом:
Номер группы Значения результативного признака Обозначим общую среднюю для всей совокупности , а среднюю — в соответствующей группе . Каждое индивидуальное отклонение от общей средней складывается из двух частей: отклонения от средней в соответствующей группе, т.е. величины , и отклонения в средней группе у от общей средней, т.е. , иначе Тогда сумма квадратов отклонений всех наблюдаемых значений от общей средней будет равна: (8.36) где первое слагаемое в правой части представляет собой сумму квадратов отклонений наблюдаемых значений от групповых средних и характеризует вариацию внутри групп, а второе слагаемое — сумма квадратов отклонений групповых средних от общей средней — характеризует вариацию между группами. Колебания изучаемого признака внутри группы вокруг средней возникают под влиянием прочих причин, исключая влияние фактора, положенного в основу группировки. Колеблемость групповых средних вокруг общей средней обусловлена влиянием признака-фактора. Если фактор, положенный в основу группировки, не оказывает влияния на вариацию изучаемого признака, то дисперсия групповых средних будет отражать только влияние тех же самых прочих факторов, которые определяют и вариацию внутри групп, а потому отношение дисперсий будет близко к единице или отличаться от нее в силу наличия случайных колебаний. Предельный размер этих колебаний можно установить по таблицам F-распределения (приложение 7). При применении дисперсионного анализа для расчета дисперсий учитывается число степеней свободы. В каждой группе при определении дисперсии мы располагаем степенями свободы, т.к. любое отклонение можем определить, зная отклонений и Поскольку мы использовали k средних, а сумма , число степеней свободы для расчета внутригрупповой дисперсии равно . При расчете межгрупповой дисперсии мы рассматриваем k отклонений групповых средних от общей средней. Зная общую среднюю и k-1 групповых средних, можно определить любое из недостающих отклонений. Тогда межгрупповая и внутригрупповая дисперсия с учетом числа степеней свободы будут соответственно равны: (8.37)
(8.38)
Если группировочный признак оказывает влияние на вариацию результативного признака, то вариацию групповых средних нельзя считать обусловленной только случайными воздействиями, и это найдет отражение в различии величины межгрупповой и внутригрупповой дисперсии, т.е. Fрасч. будет больше единицы. Если при этом F расч. > Fтабл., то с вероятностью 0,95 (0,99) можно утверждать, что между факторным и результативным признаками существует взаимосвязь. Рассмотрим дисперсионный анализ на следующем примере. За месяц известны данные о выработке рабочего за время работы в первую и во вторую смены (см. табл. 8.13). Таблица 8.13
Можно ли считать, что расхождение между уровнями выработки рабочего в первую и во вторую смены несущественно, т.е. можно ли считать, что генеральные средние в двух подгруппах одинаковы и, следовательно, выработка рабочего может быть охарактеризована общей средней. Для того чтобы ответить на поставленный вопрос, рассчитаем среднюю выработку рабочих в каждой смене (см. графу 2 табл. 8.14). Величина средней выработки в первую и вторую смены различна. Теперь возникает вопрос о том, насколько существенны эти расхождения, т.е. нужно проверить предположение о возможном влиянии сменности на выработку рабочих. Используя данные графы 4 и графы 5, рассчитаем и . Таблица 8. 14
Число степеней свободы для расчета внутригрупповой дисперсии равно 21(23-2), а для расчета межгрупповой дисперсии — 1(2-1). Следовательно,. В соответствии с числом степеней свободы числителя (1) и знаменателя (21) в таблице F-распределения для 5%-ного уровня значимости находим Fрасч.= 4,32, а для 1%-ного уровня значимости — Fтабл.=8,02. Так как Fрасч. значительно меньше табличных значений, гипотеза о несущественности различия выработки рабочего в первую и во вторую смены не опровергается, т.е. сменность не оказывает влияния на уровень выработки рабочего.
Дата добавления: 2014-12-10; Просмотров: 725; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |