КАТЕГОРИИ:

Главная
Случайная страница
Познавательное
Новые статьи
Контакты
Заказать работу

Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Необходимым условием для проведения дисперсионного анализа является то, чтобы независимая переменная была категориальной, а зависимая – метрической

Набор данных в ANOVA состоит из k – независимых одномерных выборок, элементы которых измерены в одинаковых единицах (долл., кг., баллы). Допустимы различные объемы (размеры) выборок.

1 этап. Подготовка данных для анализа выглядит следующим образом:

	Независимая переменная – фактор (напр., вид деятельности) (количество выборок k = 4)
	Выборка 1 – (экономисты)	Выборка 2 – (инженеры)	Выборка 3 – (филологи)	Выборка k – (химики)
Зависимая:	Х_1,1	Х_2,1	Х_3,1	Х_k_,1
Зависимая:	Х_1,2	Х_2,2	Х_3,2	Х_k_,2
Зависимая:	Х_1,3	Х_2,3	Х_3,3	Х_k_,3
Зависимая:	Х_1,4	Х_2,4	Х_3,4	Х_k_,4
Зависимая:	Х_1,5	Х_2,5		Х_2,5
Зависимая:		Х_2,6		Х_k_,6
Зависимая:		Х_2,7
Объем n=n1+n2+n3+…+nk	n₁= 5	n₂= 7	n₃= 4	n_k= 6
Среднее	Х₁	Х₂	Х₃	Х_k
Ст. отклонение	σ₁	σ₂	σ₃	σ_k

Нулевая гипотеза в однофакторном дисперсионном анализе утверждает, что все средние значения из различных генеральных совокупностей (которые представлены выборочными средними) равны между собой.

Н₀: μ₁= μ_k (все равны). (или Х₁ = Х₂= … = Х_k)

Альтернативная гипотеза утверждает, что хотя бы два любых средних не равны между собой.

Н₁: μ₁≠ μ_k (хотя бы две на равны). (или Х₁ ≠ Х_k)

F – тест состоит в расчете F – статистики и сравнении ее с табличным значением (аналогично с t - тестом).

Поскольку нулевая гипотеза утверждает, что средние всех генеральных совокупностей равны, необходимо оценить это среднее значение по всем выборкам, т.е. рассчитать общее среднее. Общее среднее представляет собой среднее всех значений из всех выборок.

Если размеры выборок не равны, то среднее рассчитывается как средневзвешенное с учетом размера выборок:

2 этап. Для изучения различий между зависимыми переменными проводится разложение полной дисперсии:

где SS_between - межгрупповая вариация и SS_within - внутригрупповая вариация.

Межгрупповая вариация (SS_between) показывает, насколько выборочные средние отличаются между собой. Она равна нулю, если средние равны и тем больше, чем сильнее различаются средние. Расчет межгрупповой дисперсии (вариации):

и средний квадрат:

Внутригрупповая вариация (SS_within) показывает, насколько отличаются между собой значения по каждой выборке.

и средний квадрат:

3 этап. Эффект влияния независимой переменной на зависимую переменную рассчитывается через корреляционное отношение (эта-квадрат), которое рассчитывается по формуле:

Значение корреляционного отношения находится в пределах от 0 до 1. Оно равно 0, когда все выборочные средние равны, т.е. независимая переменная не влияет на зависимую, и, наоборот, влияние увеличивается с ростом этого значения. Другими словами, величина представляет собой меру вариации зависимой переменной, вызванную влиянием на нее независимой переменной.

4 этап фактически сводится к процедуре статистической проверки гипотезы о равенстве средних (наличии различий) путем расчета F – статистики:

5 этап. Для того, чтобы сделать окончательный вывод, необходимо обратиться к F – таблице, содержащей критические значения F - статистики при истинной нулевой гипотезе. Чтобы найти критическое значение, необходимо учесть количество степеней свободы (df – degree freedom) и соответствующий уровень проверки (по умолчанию 5%).

Степень свободы для межгрупповой вариации составляет «k – 1», а для внутригрупповой вариации «n – k».

F – тест заключается в сравнении F – статистики, рассчитанной по имеющимся данным с критическим значением F – таблицы. Результат является значимым, если F_стат> F_критич, поскольку это говорит о наличии существенных различий между средними значениями по группам.

Результат вычислений с помощью Excel: однофакторная ANOVA – таблица.

Пример 1. Поставки продукции для вашей компании осуществляются тремя поставщиками («Мега+», «Коста» и «Трамп») в разное время: дневные часы, ночные смены и даже в пересменки. Естетственно, с вашей стороны, контроль за качеством продукции в дневное время выше, чем в другое время. Вами собраны данные с оценками качества (в баллах), и вы стремитесь узнать, есть ли отличие в качестве продукции, которая поставляется в разное время?

	Дневная смена	Ночная смена	Пересменка
«Мега+»	77,06	93,12	77,05
«Коста»	81,14	88,13	78,11
«Трамп»	82,02	81,18	79,91

Однофакторный дисперсионный анализ
ИТОГИ
Группы	Счет	Сумма	Среднее	Дисперсия
Столбец 1		240,2	80,0733333	7,00373333
Столбец 2		262,4	87,4766666	35,9610333
Столбец 3		235,0	78,3566666	2,09053333

Дисперсионный анализ
Источник вариации	SS	df	MS	F	P-Значение	F- критич.
Между группами	140,930688		70,4653444	4,69192377	0,05932788	5,143252
Внутри групп	90,1106		15,0184333

Итого	231,041288

Результаты расчета показывают, что F_стат< F_критич(4,691 < 5,14), следовательно, отличие в качестве поставляемой продукции в разное время отсутствует. Кроме того, P-значение (вероятность истинности нулевой гипотезы о равенстве средних) превышает 0,05, т.е. она не может быть отклонена.

Можно считать доказанным тот факт, что качество поставляемой продукции не зависит от времени поставки и является одинаковым в разное время.

Команды на выполнение в Excel: «Сервис» - «Анализ данных» - «Однофакторный дисперсионный анализ».

Пример 2. Требуется оценить влияние уровня рекламы внутри магазина на объемы продаж. Имеются следующие данные по 30 торговым точкам:

	Уровень рекламы
высокий	средний	низкий
Продажи, тыс. грн










Однофакторный дисперсионный анализ

ИТОГИ
Группы	Счет	Сумма	Среднее	Дисперсия
Столбец 1			8,3	1,788888889
Столбец 2			6,2	3,066666667
Столбец 3			3,7	4,011111111


Дисперсионный анализ
Источник вариации	SS	df	MS	F	P-Значение	F критическое
Между группами	106,0666667		53,03333	17,94360902	1,10362E-05	3,354130829
Внутри групп	79,8		2,955556

Итого	185,8666667

Результаты анализа показывают, что разница в объемах продаж в магазинах с разным уровнем рекламы, является значимой (существенной). Об этом свидетельствует значение F: 17,943 > 3,354, а также малая вероятность принятия нулевой гипотезы (р – значение = 1,10 Е-0,05).

Следовательно, нулевая гипотеза отклоняется и принимается альтернативная о том, что уровень рекламы влияет на объемы продаж, причем наблюдается прямая зависимость, т.е. более высокому уровню рекламы соответствуют более высокие объемы продаж.

В маркетинговых исследованиях часто приходится иметь дело с одновременным влиянием нескольких факторов на конечный результат:

1. Как уровень рекламы и уровень цен одновременно влияют на продажи данной торговой марки?

2. Влияет ли уровень образования и возраст на лояльность потребителей к покупке конкретного товара?

3. Влияние осведомленности и имиджа товара у покупателя на формирование предпочтений?

Процедура многофакторного анализа аналогична процедуре однофакторного дисперсионного анализа. Преимуществом многофакторного анализа является то, что появляется возможность изучить взаимодействие факторов между собой.

Если в качестве независимых переменных выступают два фактора (уровень рекламы и продажа по купонам), то разложение полной вариации составит:

Большее влияние фактора 1 будет отражаться в более высоком значении SS_between ₁, большее влияние фактора 2, соответственно, будет отражаться на более высоком значении SS_between₂.

Чем сильнее взаимодействие факторов 1 и 2, тем больше значение SS_1;₂. С другой стороны, если фактор 1 и фактор 2 не зависят друг от друга, то значение SS_1;₂ приближается к нулю.

Степень влияния двух факторов называется полным эффектом или множественной корреляцией:

Значимость полного эффекта рассчитывается с помощью F – статистики:

Если полный эффект статистически значимый, то на следующем этапе вычисляется значимость эффекта взаимодействия.

Если эффект взаимодействия оказывается статистически значимым, то имеет место влияние одного фактора от присутствия другого фактора на зависимую переменную.

Если же эффект взаимодействия не окажется статистически значимым, то необходимо проверить значимость каждого фактора в отдельности:

Вполне может оказаться так, что влияние каждого фактора в отдельности имеет значение, а их совместное взаимодействие на конечный результат не подтверждается.

Заключение — до 5 мин.

Содержание и методические рекомендации:

- обобщить наиболее важные, существенные вопросы лекции.

- сформулировать общие выводы.

- поставить задачи для самостоятельной работы.

- ответить на вопросы студентов.

<== предыдущая лекция	\|	следующая лекция ==>
Й учебный вопрос. Корреляционное отношение и трактовка его значений	\|	Инструкции перехода

Поделиться с друзьями:

Дата добавления: 2014-01-14; Просмотров: 535; Нарушение авторских прав?; Мы поможем в написании вашей работы!

Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет

studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление

Генерация страницы за: 0.031 сек.