Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Часть III. Сбор, подготовка и анализ данных 15 страница




До сих пор мы считали, что зависимую переменную измеряют интервальной или относи-

тельной шкалой. Однако если зависимая переменная неметрическая, то используется другой

метод проверки.

НЕМЕТРИЧЕСКИЙ ДИСПЕРСИОННЫЙ АНАЛИЗ

С помощью неметрического дисперсионного анализа (nonmetric analysis of variance) проверя-

ют различие средних значений более, чем двух групп, когда зависимая переменная измерена

порядковой шкалой.

Неметрический дисперсионный анализ (nonmetric analysis of variance)

Методом дисперсионного анализа проверяется различие центральных значений тенеденций

более, чем двух групп, когда зависимая переменная измерена порядковой шкалой.

Одной из таких процедур проверки является k-выборочный медианный тест (k-sample median

test). Как указывает его название, этот критерий является распространением медианного

теста для двух выборок, который рассматривался в главе 15.

628 Часть III. Сбор, подготовка и анализ данных

k-выборочный медианный тест (k-sample median test)

Непараметрический критерий, используемый для проверки различий, когда число выборок

больше двух и когда зависимая переменная измерена с помощью порядковой шкалы.

Нулевая гипотеза утверждает, что медианы k генеральных совокупностей равны, Проверка

нулевой гипотезы включает вычисление общей медианы k выборок. Затем создают 2 х Л-

таблицу, состоящую из ячеек со значениями счётов, исходя из количества наблюдений, кото-

рые лежат ниже или выше медианы. Вычисляют статистику хи-квадрат. Значимость статисти-

ки хи-квадрат означает, что нулевую гипотезу следует отклонить.

Более мощным критерием является однофакторный дисперсионный анализ Краскела—

Уоллиса (Kruskal—Wallis one-way analysis of variance).

Однофакторный дисперсионный анализ Краскела-Уоллиса (Kruskal-Wallis one-way

analysis of variance)

Неметрический ANOVA критерий, который использует значение ранга (порядковую стати-

стику) каждого случая, а не просто его положение относительно медианы.

Он является расширением критерия Манна—Уитни (глава 15), а также проверяет раз-

личие в значениях медиан. Нулевая гипотеза в этом случае та же, что и для медианного

теста /с-выборок, но процедура проверки отличается. Все наблюдения из k групп распола-

гают в одном ранжированном ряду. Если k совокупности одинаковые, то и группы долж-

ны быть аналогичными в смысле ранжирования в пределах каждой группы. Для каждой

группы вычисляют сумму рангов. Затем вычисляют //-статистику Краскела—Уоллиса с

распределением хи-квадрат.

Критерий Краскела—Уоллиса более веский, чем ^-выборочный медианный, поскольку ис-

пользует значение ранга каждого случая, а не просто его положение относительно медианы.

Однако если в данных имеется большое число совпадающих рангов, то лучше использовать

^-выборочный медианный тест.

Неметрический дисперсионный анализ непопулярен в коммерческих маркетинговых ис-

следованиях. Другая редко используемая процедура — многомерный дисперсионный анализ.

МНОГОМЕРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ

Многомерный дисперсионный анализ (multivariate analysis of variance — MANOVA) аналоги-

чен дисперсионному анализу (ANOVA), за исключением того, что вместо одной метрической

зависимой переменной имеется две или больше переменных.

Многомерный дисперсионный анализ (MANOVA)

(multivariate analysis of variance — MANOVA)

Метод ANOVA, использующий две или больше метрических зависимых переменных.

В этом случае цель остается той же, поскольку MANOVA проверяет различия между груп-

пами. В отличие от ANOVA, который проверяет групповые различия в отношении единствен-

ной зависимой переменной, MANOVA одновременно проверяет групповые различия в отно-

шении нескольких зависимых переменных. При ANOVA нулевую гипотезу формулируют сле-

дующим образом: средние зависимой переменной равны во всех группах. Многомерный

дисперсионный анализ лучше использовать, если имеется две или больше зависимых пере-

менных, которые коррелируют. Если же имеется много зависимых переменных, которые не

коррелируют или являются ортогональными, то лучше для каждой зависимой переменной вы-

полнить ANOVA, а не MANOVA [24].

Предположим, например, что четырем группам людей, каждая из которых состоит из 100

индивидуумов, отобранных случайным образом, показано четыре вида рекламы стирального

Глава 16. Дисперсионный и ковариационный анализ 629

порошка Tide. После просмотра рекламы каждый высказал свое отношение (рейтинг предпоч-

тения) к Tide, компании Procter & Gamble (компании, производящей Tide) и к самой рекламе.

Поскольку эти три переменных взаимосвязаны, многомерным дисперсионным анализом, сле-

дует определить наиболее эффективный вид рекламы (самый высокий рейтинг предпочтения

среди трех переменных). Врезка 16.1 "Практика маркетинговых исследований" демонстрирует

применение ANOVA и MANOVA в международном маркетинговом исследовании, а врезка 16.2

"Практика маркетинговых исследований" показывает применение этих методов при проверке

этики в маркетинговом исследовании.

Врезка 16.1. Практика маркетинговых исследований

Общие черты нарушения этика в ходе проведения марктеинговых исследований

Рассмотрим методику исследования, в ходе которого выяснялось отношение маркетоло-

гов к нарушению этики в различных странах. Выборка маркетологов объединила специали-

стов из Австралии, Канады, Великобритании и Соединенных Штатов Америки.

Оценки респондентов проанализированы компьютерными программами для MANOVA

и ANOVA. При анализе страна, где живет респондент, являлась независимой переменной, а

15 оценок— зависимыми переменными. Значения F-статистики при выполнении диспер-

сионного анализа указывали на то, что только две из 15 оценок были значимыми (р < 0,05

или лучше). Значение f-статистики при выполнении многомерного дисперсионного ана-

лиза оказалось статистически незначимым, что указывало на отсутствие различий в оценках

среди респондентов четырех стран. Поэтому был сделан вывод, что маркетологи из четырех

стран одинаково относятся к неэтичной исследовательской практике [25].

Врезка 16.2. Практика маркетинговых исследований

MANO VA демонстрирует, что мнение мужчины отличается от мнения женщины

Для исследования различия в оценках этики мужчинами и женщинами использовали

статистические методы MANOVA и ANOVA. Респондентов просили указать их степень

одобрения серии сценариев, включающих решения этического характера. Эти оценки слу-

жили зависимыми переменными при анализе, а пол респондентов — независимой пере-

менной, MANOVA использовали для выполнения многомерного анализа, в результате кото-

рого оказалось, что значение /'является значимым с уровнем значимости р < 0,001. Это оз-

начает, что отношение мужчин и женщин к этике исследования полностью отличаются.

Выполнен одномерный дисперсионный анализ, и f-значения указали, что три пункта вне-

сли наибольший вклад в различие оценок, даваемых мужчинами и женщинами этике ис-

следования: использование ультрафиолетовых чернил для предварительного кодирования

почтового вопросника; использование рекламы, которая способствовала неправильному ис-

пользованию потребителями товара, и нежелание исследователя предоставить данные, кото-

рые помогли бы городской группе консультантов [27].

ИСПОЛЬЗОВАНИЕ INTERNET И КОМПЬЮТЕРА

Все три компьютерных пакета (SPSS, SAS, BMDP) имеют возможности для проведения

дисперсионного и ковариационного анализа. Дополнительно к основному анализу, эти про-

граммы могут выполнять более сложный анализ. Minitab и Excel также предлагают некоторые

программы для этой цели. Приведем описание соответствующих программ. Для детального оз-

накомления обратитесь к соответствующим руководствам [26].

630 Часть III. Сбор, подготовка и анализ данных

Компьютерные программы для ANOVA и ANCOVA

SPSS

Можно эффективно выполнить однофакторный AN OVA, используя программу

ONEWAY. Эта программа также позволяет проверить априорные и апостериорные контра-

сты. Для выполнения многофакторного дисперсионного анализа используем ANOVA. Хотя

с помощью программы ANOVA можно определить ковариаты, она не позволяет выполнить

полный ковариационный анализ. Для полного дисперсионного или ковариационного ана-

лиза, включая повторные измерения или множественные зависимые измерения, рекомен-

дуется процедура MANOVA. Для неметрического дисперсионного анализа, включая меди-

анный тест ^-выборок и однофакторный дисперсионный анализ Краскела—Уоллеса

(Kruskal-Wallis), следует использовать программу NPAR TESTS.

SAS

Основная программа для выполнения дисперсионного анализа в случае сбалансированного

плана — ANOVA. Она обрабатывает данные из широкого диапазона экспериментальных пла-

нов, включая многомерный дисперсионный анализ и повторные измерения. Можно прове-

рить как априорные, так и апостериорные контрасты. Для несбалансированных планов ис-

пользуется более общая GLM-процедура. Эта программа выполняет следующий анализ: дис-

персионный, ковариационный, дисперсионный с повторными измерениями и множествен-

ный дисперсионный, а также проверяет априорные и апостериорные контрасты. Хотя про-

грамма GLM используется и для анализа сбалансированных планов, она не настолько эффек-

тивна для таких моделей, как программа ANOVA. Процедура VARCOMP вычисляет компо-

ненты дисперсии. Для неметрического дисперсионного анализа используем NPAR1WAY.

BMDP

Для однофакторного дисперсионного анатиза используем программу P1V. Она выполняет

ковариационный анализ, а также проверяют конкретные контрасты групповых средних. Одна-

ко более общей моделью является программа P2V, которая выполняет дисперсионный и кова-

риационный анализ для множества моделей эксперимента с фиксированными уровнями фак-

торов. Она также может обрабатывать повторные измерения, сбалансированные и несбаланси-

рованные планы. P4V, являясь более совершенной программой, может выполнять

многомерный дисперсионный и ковариационный анализы, в том числе и анализ комплекс-

ных экспериментальных планов. Другой специализированной программой является P3V, ко-

торая использует метод максимального правдоподобия для анализа моделей с фиксированны-

ми и случайными коэффициентами. Она подходит как для сбалансированных, так и несбалан-

сированных планов. P8V является общей моделью, которая выполняет дисперсионный анализ

для любого полного плана с ячейками одинакового размера. Непараметрическии дисперсион-

ный анализ можно выполнить с помощью программы P3S. И наконец, программа P7D, кроме

создания гистограмм, может выполнять однофакторный дисперсионный анализ.

Minitab

Дисперсионный и ковариационный анализ можно выполнить с помощью функции

Stats>ANOVA. Она выполняет однофакторный ANOVA, однофакторный невложенный

(unstacked) ANOVA, двухфакторный ANOVA, анализ средних, сбалансированный ANOVA,

ковариационный анализ, общую линейную модель, построение графика главных эффектов,

графика взаимодействия и графиков остатков. Для вычисления среднего и стандартного от-

клонений применима функция кросстабулирования. Для получения F и р значений ис-

пользуйте сбалансированный ANOVA.

Excel

С помощью функции Tools>Data Analysis можно выполнить как однофакторный, так и

двухфакторный ANOVA. Двухфакторный ANOVA имеет возможности двухфакторного ана-

Глава 16. Дисперсионный и ковариационный анализ 631

лиза с повторением и без повторения. Двухфакторный анализ с повторением содержит не-

сколько выборок для каждой группы данных.

Часто задачи, для которых можно использовать ANOVA, имеют независимые перемен-

ные (предикторы), которые являются взаимосвязанными. Такая ситуация требует особого

внимания. Проанализируем исследование, выполненное Burke, в котором коррелируют две

категориальные независимые переменные. Здесь приводится небольшой набор данных

(реальные данные являются собственностью компании).

Намерение купить товар (PI)

2,00

4,00

6,00

4,00

5,00

6,00

2,00

3,00

4,00

5,00

6,00

8,00

Рейтинг эффективности

1,00

2,00

3,00

4,00

5,00

6,00

1,00

2,00

3,00

4,00

5,00

6,00

Пол

0,00

1,00

1,1)0

0,00

0,00

1,00

0.00

0,00

0,00

1,00

1,00

1,00

Поскольку два предиктора в некоторой степени коррелируют (г1 = 0,24), важно опреде-

лить вклад каждого.

Первая таблица ANOVA показывает сумму квадратов рабочей модели при допущении,

что суммы квадратов для каждого предиктора скорректированы на наличие другого предик-

тора (т.е. как будто каждый предиктор был введен вторым).

Вторая таблица ANOVA показывает результирующее действие иерархического моделиро-

вания, когда предиктор '"Рейтинг" был "введен" первым.

Третья таблица ANOVA показывает результирующее действие иерархического моделиро-

вания, когда предиктор '"Пол" "введен" первым.

а.Ь ANOVA

PI Главные эффекты

Однозначный метод

Сумма

квадратов

(Совместный} 32,542

Рейтинг

Пол

Модель

Остаток

Итого

a) PI по рейтингу, полу;

в) Все эффекты введены одновременно.

13,792

3,125

32,542

2.375

34,917

Степени

свободы (df)

1 1

Средний квадрат F Значимость

5,424

2,758

3,125

3,424

0,475

3,174

11,418 0,009

5,807

6,579

0,038

0,050

11,418 0,009

632 Часть III. Сбор, подготовка и анализ данных

ANOVAa

Иерархический метод

PI Главные эффекты (Совместный)

Рейтинг

Пол

МОДЕЛЬ

Остаток

Итого

а) Р1 по рейтингу, полу

ANOVA8

И

Главные (Совместный)

эффекты Рейтинг

Пол

Модель

Остаток

Итог

a) PI по полу, рейтингу.

Обобщение результатов

Сумма

квадратов

32,542

29,417

3,125

32,542

2,375

34,917

Степени

свободы (df)

Средний

квадрат

5,424

5,883

3,125

5,424

0,475

3,174

F Значимость

11,418 0,009

12,386 0,008

6,579 0,050

11,418 0,009

Иерархический метод

Сумма

квадратов

32,542

18,750

13,792

32,542

2,375

34,917

Степени

свободы (df)

Средний

квадрат

5,424

18,750

2,758

5,424

0,475

3,174

F Значимость

11,418 0,009

39,474 0,002

5,807 0,038

11,418 0,009

Сумма квадратов

Рейтинг

;Пол

Общая для предикторов

Общая объяснимая

Регрессия Первый фактор ~ рейтинг

13,792 29,417

3,125 3,125

16,917 32,542

32,542 32,542

Первый фактор — пол

18,750

13,792

32,542

32,542

Теперь, когда вопрос ясен, необходимо определить, за какую долю в сумме квадратов от-

вечает каждая независимая переменная? Так как предикторы взаимосвязаны, иерархиче-

ский метод показывает сумму квадратов для предикторов, введенных в заданном порядке.

Однозначное решение показывает объяснимую сумму квадратов для каждого предиктора,

как будто он был введен вторым (вот почему ее не прибавляют к собственной сумме... оба

предиктора нельзя ввести вторыми). Три решения дают полную картину вклада каждого

предиктора, если бы он был единственной независимой переменной и его предельный

вклад был бы как у второго предиктора.

РЕЗЮМЕ

В дисперсионном (ANOVA) и ковариационном (ANCOVA) анализе зависимая переменная

метрическая, а все независимые переменные категориальные или представляют собой комби-

Глава 16. Дисперсионный и ковариационный анализ 633

нации категориальных и метрических переменных. Однофакторный дисперсионный анализ

включает единственную независимую категориальную переменную. Суть метода заключается в

проверке нулевой гипотезы о равенстве средних в совокупности. Полная вариация в зависимой

переменной раскладывается на два компонента: вариация, связанная с независимой перемен-

ной, и вариация, связанная с ошибкой. Вариацию выражают как сумму квадратов, скорректи-

рованную на среднее значение (SS). Средний квадрат получают делением суммы квадратов (SS)

на соответствующее число степеней свободы (df)- Нулевую гипотезу о равенстве средних прове-

ряют с помощью F-статистики, которая представляет собой отношение среднего квадрата неза-

висимой переменной к среднему квадрату ошибки.

Многофакторный дисперсионный анализ включает одновременное исследование двух или

больше категориальных независимых переменных. Главное преимущество этого анализа в том,

что он позволяет изучить взаимодействия между независимыми переменными. Значимость

общего эффекта, эффекты взаимодействия и главные эффекты отдельных факторов изучают с

помощью соответствующих У7-критериев. Имеет смысл проверять значимость главных эффек-

тов отдельных факторов, только если соответствующие эффекты взаимодействия незначимы.

Ковариационный анализ включает, по крайней мере, одну категориальную независимую

переменную и одну интервальную или метрическую независимую переменную. Метрическую

независимую переменную или ковариату обычно используют для удаления посторонних ва-

риаций из независимой переменной.

Если дисперсионный анализ выполняют для двух или больше факторов, то могут возник-

нуть проблемы их взаимодействия. Взаимодействие имеет место, если эффект независимой пе-

ременной на зависимую различен для разных уровней другой независимой переменной. Если

взаимодействие статистически значимо, оно может быть упорядоченным или неупорядочен-

ным. Неупорядоченное взаимодействие может быть пересекающегося или непересекающегося

типа. В сбалансированных планах относительную важность факторов при объяснении вариа-

ции в зависимой переменной измеряют с помощью со2. Для изучения рахтичий между кон-

кретными средними используются множественные сравнения либо в форме априорных, либо в

форме апостериорных контрастов.

В дисперсионном анализе с повторными измерениями наблюдения над каждым участни-

ком эксперимента выполняются для каждой комбинации условий эксперимента. Этот план

полезен для управления различиями среди участников, которые существуют априори и извест-

ны до проведения эксперимента. Неметрический дисперсионный анализ включает изучение

различий в средних значениях двух или больше групп, когда зависимая переменная измерена

порядковой шкалой. Многомерный дисперсионный анализ (MANOVA) включает две или

больше метрических зависимых переменных.

ОСНОВНЫЕ ТЕРМИНЫ И ПОНЯТИЯ

F-статистика (F-statstic)

^-выборочный медианный тест (^-sample

median test)

апостериорные контрасты (a posteriori contrasts)

априорные контрасты (a priori contrasts)

взаимодействие (interaction)

внутри групповая вариация SSeHympu (^ет,г)

дисперсионный анализ (analysis of variance-

AN OVA)

дисперсионный анализ с повторными из-

мерениями (repeated measures analysis of

variance)

значимость главного эффекта каждого

фактора (significance of the main effect of

each factor)

значимость полного эффекта (significance

of overall effect)

значимость эффекта взаимодействия

(significance of the interaction effect)

ковариата (covariate)

ковариационный анализ (analysis of covariance

- ANCOVA)




Поделиться с друзьями:


Дата добавления: 2015-05-09; Просмотров: 602; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.165 сек.