Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Коэффициентыканонической дискриминацией функции 1 страница




Функция 1

Доход 0,74301

Путешествие 0,09611

Отдых 0,23329

Размер семьи 0,46911

Возраст 0,20922

Структурная матрица:

Объединенная корреляционная матрица между дискриминирующими переменными и каноническими дискриминант-

ными функциями (переменные расположены в соответствии с размером корреляции внутри функции)

Функция 1

Доход 0,82202

Размер семьи 0,54096

Отдых 0,34607

Путешествие 0,21337

Возраст 0,20922

Ненормированные коэффициенты канонической дискриминацией функции

Функция 1

Доход 0,847671 ОЕ-01

Путешествие 0,4964455Е-01

Отдых 0,1202813

Размер семьи 0,4273893

Возраст 0,2454380Е-01

(Константа) -7,975476

Канонические дискрнминантные функции, оцененные по групповым средним (центроидам групп)

Группа Функция 1

Т~ 1,29118

2 -1,29118

Результаты классификации для случав, отобранных для анализа

Фактическая группа Число случаев Предсказанная группа - 1 Принадлежность к группе 2

Группа 1

Группа 2

IS

80%

D

0%

20%

100%

Процент правильно классифицированных по группам случаев; 90%

694 Часть III. Сбор, подготовка и анализ данных

Окончание табл. 18.4

Результаты -классификации для случав, не отобранных для анализа

Фактическая группа Число случаев Предсказанная

группа — 1

Группа 1 6 4

66,7%

Группа 2 6 0

0%

Процент правильно шссифицированных по группам случаев 83,33%

Принадлежность к

группе 2

33,3%

100%

Некоторые результаты можно получить, изучив групповые средние и стандартные отклоне-

ния. Маркетологи обнаружили, что в деление совокупности на две группы самый большой

вклад внесла переменная "доход". Кроме того, оказалось, что переменная "значение, прида-

ваемое семейному отдыху'1, важнее для различения групп, чем переменная "отношение к пу-

тешествию". По возрасту главы семьи две группы различаются мало, а стандартное отклонение

этой переменной большое.

Объединенная внутригрупповая корреляционная матрица указывает на низкие коэффи-

циенты корреляции между предикторами. Маловероятно, что возникнет проблема мульти-

кол л и неарности. Значимость одномерных /^-статистик (отношений внутри групповых сумм

квадратов к обшей сумме квадратов) указывает, что когда предикторы рассматриваются по

отдельности, то только доход; значение, придаваемое семейному отдыху; и размер семьи

значимо различаются между семьями, которые посетили курорт, и между теми, кто не отды-

хал на курорте.

Поскольку имеется две группы, то оценивается только одна дискриминантная функция,

Собственное значение, соответствующее этой функции, равно 1,7862. Каноническая корреля-

ция, соответствующая этой функции, равна 0,8007. Квадрат корреляции, равный (0,8007)2 =

0,64, показывает, что 64% дисперсии зависимой переменной (посещение курорта) объясняется

этой моделью. Следующая стадия дискриминантного анализа включает определение значимо-

сти д искри ми нантной функции.

Определение значимости дискриминантной функции

Бессмысленно интерпретировать результаты анализа, если определенные дискрими-

нантные функции не являются статистически значимыми. Поэтому следует выполнить

статистическую проверку нулевой гипотезы о равенстве средних всех дискриминантных

функций во всех группах генеральной совокупности. В программе SPSS эта проверка ба-

зируется на коэффициенте лямбда (X) Уилкса. Если одновременно проверяют несколько

функций, как в случае множественного дискриминантного анализа, то коэффициент X

является суммой одномерных X для каждой функции. Уровень значимости оценивают,

исходя из преобразования Х-статистики в статистику хи-квадрат (исходя из распределе-

ния хи-кеадрат, которому подчиняется Х-статистика). При проверке значимости в приме-

ре с посещением курорта (табл. 18.4) можно отметить, что Я, равная 0,3589, преобразуется

в хи-квадрат статитстику, равную 26,13 с пятью степенями свободы. Она значима при

уровне, превышающем 0,05. В программе SAS вычисляют приближенную F-статистику,

основанную на апроксимации к распределению отношения правдоподобия. В программе

BMDP проверка нулевой гипотезы базируется на преобразовании Х- статистики Уилкса в

F-статистику. В Minitab нельзя выполнить проверку значимости. Если нулевую гипотезу

отклоняют, что указывает на значимую дискриминацию, то можно продолжать интерпре-

тировать результаты [6].

Глава 18. Дискриминантный анализ 695

Интерпретация результатов

Интерпретация дискриминантных весов аналогична интерпретации во множественном

регрессионном анализе. Значение коэффициента для конкретного предиктора зависит от дру-

гих предикторов, включенных в дискриминантную функцию. Знаки коэффициентов условны,

но они указывают, какие значения переменной приводят к большим и маленьким значениям

.функции и связывают их с конкретными группами.

При наличии мультиколлинеарности между независимыми переменными не существует

однозначной меры относительной важности предикторов для дискриминации между группа-

ми [7]. Помня об этом предостережении, можно получить некоторое представление об относи-

тельной важности переменных, изучив абсолютные значения нормированных коэффициентов

дискриминантной функции. Как правило, предикторы с относительно большими нормиро-

ванными коэффициентами вносят больший вклад в дискриминирующую мощность функции

по сравнению с предикторами, имеющими меньшие коэффициенты.

Некоторое представление об относительной важности предикторов можно также получить,

изучив структурные коэффициенты корреляции, которые также называют каноническими или

дискриминантными нагрузками. Эти линейные коэффициенты корреляции между каждым из

предикторов и дискриминантной функцией представляют дисперсию, которую предиктор де-

лит вместе с функцией. Как и нормированные коэффициенты, эти коэффициенты корреля-

ции следует использовать осторожно.

Полезно исследовать нормированные коэффициенты дискриминантной функции в при-

мере с отпуском на курорте. С данными низкими коэффициентами корреляциями между пре-

дикторами можно использовать значения нормированных коэффициентов, чтобы предполо-

жить, что доход — наиболее важный предиктор при дискриминации между группами, а за ним

следуют размер семьи и значение, придаваемое семейному отдыху. Аналогичное наблюдение

получено из проверки структурных корреляций. Эти коэффициенты линейной корреляции

между предикторами и дискриминантной функцией перечислены в порядке их убывания.

Также даны и ненормированные коэффициенты дискриминантной функции. Для класси-

фикации данных их можно применить к необработанным значениям переменных в провероч-

ной выборке. Кроме того, показаны групповые центроиды, дающие значения дискриминант-

ной функции, оцененные по групповым средним. Центроид группы 1 (семьи, отдыхающие на

курорте) имеет положительное значение, а центроид группы 2 — равное ему, но отрицательное.

Знаки коэффициентов соответствующих предикторов положительны. Это означает, что чем

выше доход семьи; ее размер; значение, придаваемое семейному отдыху; отношение к путеше-

ствию и возраст, тем выше вероятность семейной поездки на курорт. Разумно создать профиль

двух групп с точки зрения трех предикторов, которые кажутся наиболее важными: доход, раз-

мер семьи и значение, придаваемое семейному отдыху. Значения этих трех переменных для

двух групп приведены в табл. 18.4.

Относительную важность предикторов иллюстрирует следующий пример.

ПРИМЕР. Удовлетворенные сотрудники остаются

Чтобы определить, какие факторы объясняют различия между торговыми работниками,

уволившимися из крупной компании по производству компьютеров, и теми, кто остался,

использовали дискриминантный анализ. Независимыми служили следующие переменные:

рейтинг компании, безопасные условия труда, удовлетворение работой по семибалльной

шкале, наличие конфликтных ситуаций по четырехбалльной шкале, наличие неопределен-

ности по четырехбалльной шкале и объем продаж по девятибалльной шкале. Зависимой пе-

ременной было разделение между теми торговыми работниками, кто остался работать в дан-

ной компании, и теми, кто уволился. Каноническая корреляция, измеряемая коэффициен-

том дискриминации R = 0,4572, оказалась значимой (Л Уилкса = 0,7909; F (26,173) = 1,7588;

р = 0,0180).

Результаты, полученные при одновременном введении всех переменных в дискрими-

нантный анализ, даны в следующей таблице.

696 Часть III. Сбор, подготовка и анализ данных

Результаты дискриминантного анализа

Переменная

Работа3

Продвижение по службе3

Безопасные условия труда

Вэаимотношения с покупателями13

Рейтинг компании

Работа с другими15

Интенсивность трудаь

Менеджмент (управление) временем-территорией11

Продажи0

Мастерство презентации"

Техническая информация6

Выплата пособий3

Достигнутая норма выработки11

Менеджмент3

Сбор информации11

Семьяс

Менеджер по продажам3

Сослуживец3

Покупателе

Семья11

Работа11

Работа0

Покупатель11

Менеджер по продажам'

Менеджер по продажам11

Покупатель3

Коэффициенты

0,0903

0,0288

0,1567

0,0086

0,4059

0,0018

-0,0148

0,0126

0,0059

0,0118

0,0003

0,0600

0,0035

0,0014

-0,0146

- 0,0684

-0,0121

0,0225

- 0,0625

0,0473

0,1378

0,0410

- 0,0060

- 0,0365

- 0,0606

- 0,0338

Нормированные

коэффициенты

0,3910

0,1515

0,1384

0,1751

0,3240

0,0365

- 0,3252

0,2899

0,1404

0,2526

0,0065

0,1843

0,2915

0,0138

- 0,3327

- 0,3408

-0,1102

0,0893

- 0,2797

0,1970

0,5312

0,5475

-0,0255

-0,2406

- 0,3333

-0,1488

Канонические

нагрузки

0,5446

0,5044

0,4958

0,4906

0,4824

0,4651

0,4518

0,4496

0,4484

0,4387

0,4173

0,3788

0,3780

0,3571

0,3326

- 0,3221

0,2909

0,2671

-0,2602

0,2180

0,2119

-0,1029

0,1004

- 0,0499

0,0467

0,0192

Замечание. Ранговый порядок важности переменной присвоен в соответствии с величиной канонической нагрузки.

'Примечание. Удовлетворение

ь Эффективность работы

с Неопределенность

a Конфликт

Ранговый порядок важности переменной в соответствии с относительной величи-

ной канонических нагрузок представлен в первой колонке. Удовлетворение работой и

возможность продвижения по службе самые важные дискриминаторы, за которыми

следовали условия безопасной работы. Продавцы, оставшиеся работать в компании, в

отличие от уволившихся, считали свою работу увлекательной, интересной и принося-

щей удовлетворение [8].

Обратите внимание, что в этом примере, исходя из канонических нагрузок, продвижение

по службе идентифицировали как вторую наиболее важную переменную. Однако продвижение

по службе не является второй наиболее важной переменной, если исходить из абсолютной ве-

личины нормированных коэффициентов дискриминантной функции. Эта аномалия — ре-

зультат мультиколлинеарности.

Глава 18. Дискриминантный анализ 697

При интерпретации результатов дискриминантного анализа также может помочь разработ-

ка характеристической структуры (characteristic profile) для каждой группы посредством описа-

ния каждой группы через групповые средние для предикторов.

Характеристическая структура (characteristic profile)

Средство интерпретации результатов дискриминантного анализа описанием каждой группы

через групповые средние для предикторов.

Если важные предикторы установлены, то сравнение групповых средних по этим перемен-

ным может помочь понять межгрупповые различия. Однако прежде чем интерпретировать ка-

кие-либо факты, необходимо убедиться в достоверности результатов.

Оценка достоверности дискриминантного анализа

Как уже говорилось, данные разбивают случайным образом на две подвыборки. Анализи-

руемую часть выборки используют для вычисления д искри ми нантной функции, а провероч-

ную— для построения классификационной матрицы. Д искри ми нантные веса, определенные

анализируемой выборкой, умножают на значения независимых переменных в проверочной

выборке, чтобы получить дискриминантные показатели для случаев в этой выборке. Затем слу-

иаи распределяют по группам, исходя из д искрим и нантных показателей и соответствующего

правила принятия решения. Например, при дискриминантном анализе двух групп случай мо-

жет быть отнесен к группе с самым близким по значению центроидом. Затем, сложив элемен-

ты, лежащие на диагонали матрицы, и разделив полученную сумму на общее количество случа-

ев, можно определить коэффициент результативности (hit ratio) или процент верно классифи-

цированных случаев [9].

Коэффициент результативности (hit ratio)

Процент случаев, верно классифицированных с помощью дискриминантного анализа.

Полезно сравнить процент случаев, верно классифицированных с помощью дискрими-

нантного анализа, с процентом случаев, который можно получить случайным образом. Для

равных по размеру групп процент случайной классификации равен частному от деления еди-

ницы на количество групп. Превысит ли и насколько количество верно классифицированных

случаев их случайное количество? Здесь нет общепринятого подхода, хотя некоторые авторы

считают, что точность классификации, достигнутая с помощью дискриминантного анализа,

должна быть, по крайней мере, на 25% выше, чем точность, которую можно достичь случай-

ным образом [10].

Большинство программ для выполнения дискриминантного анализа также определяют

классификационную матрицу, исходя из анализируемой выборки. Поскольку программы учи-

тывают даже случайные вариации в данных, то полученные результаты всегда точнее, чем клас-

сификация данных на основе проверочной выборки [11].

В табл. 18.4 (пример семейного отдыха на курорте) также показаны результаты классифика-

ции, полученные на основе анализируемой выборки. Коэффициент результативности или

процент верно классифицированных случаев равен (12 + 15)/30 = 0,90 или 90%. Могут воз-

никнуть сомнения, что этот коэффициент результативности искусственно завышен, поскольку

данные, использованные для вычисления, использовались и для проверки. Выполнение клас-

сификационного анализа по независимому набору данных приводит к классификационной

матрице с немного меньшим коэффициентом результативности (4 + 6)/12 = 0,833 или 83,3%

(табл. 18.4). Задав случайным образом две группы равного размера, можно ожидать, что коэф-

фициент результативности равен 1/2 = 0,50 или 50%. Однако превышение точности классифи-

кации над случайной классификацией составляет свыше 25%, и поэтому достоверность дис-

криминантного анализа оценивают как удовлетворительную.

Следующий пример иллюстрирует иное применение дискриминантного анализа двух групп.

698 Часть III. Сбор, подготовка и анализ данных

ПРИМЕР. Домоседы

Маркетологи использовали д искрим и нантный анализ для двух групп, чтобы оценить

силу каждого из пяти факторов, использованных при делении людей на тех, кто смотрит те-

левизор, и тех, кто не смотрит. Данный метод хорошо подходил для этой цели вследствие

природы предопределенных категориальных групп (телезрители и нетелезрители) и интер-

вальных шкал, использованных для получения отдельных значений факторов.

Отобраны две группы по 185 взрослых зрителей (телезрителей и нетелезрителей) с общим

размером выборки «= 370. Дискриминантное уравнение для анализа вычислено с помощью

подвыборки, состоящей из 142 респондентов, взятых из выборки в 370 человек. Оставшиеся

198 респондентов служили как проверочная подвыборка в перекрестной проверке уравнения.

30 респондентов исключили из анализа из-за отсутствия дискриминантных значений.

Каноническая корреляция для дискриминантной функции, равная 0,4291, являлась

значимой при/» < 0,0001 уровне. Собственное значение равнялось 0,2257. В таблице приве-

дены нормированные канонические дискриминантные коэффициенты. Значительная часть

дисперсии объясняется дискриминантной функцией. Кроме того, как показано в таблице,

фактор "ориентация на дом" внес наибольшой вклад в классификацию индивидуумов на

телезрителей и нетелезрителей. Также свой вклад внесли мораль, безопасность и здоровье,

уважение. Как оказалось, социальный фактор играл небольшую роль.

Результаты дискриминактного анализа

Стандартные коэффициенты канонической дискриминантной функции

Мораль 0,27798

Безопасность и здоровье 0,39850

Ориентация на дом 0,77496

! Уважение 0,32069

Социальный фактор - 0,01996

Классификация результатов для случаев, отобранных для использования в анализе

Фактическая группа Число случаев Предсказанная групповая принадлежность

Телезрители Нетелезрители

Телезрители 77 56 21

72,7% 27,3%

Нетелезрители 65 24 41

36,9% 63,1%

Процент верно классифицированных случаев 68,31%

Классификация результатов для случаев, использованных для перекрестной проверки

Фактическая группа Количество случаев Предсказанная групповая принадлежность

Активные телезрители Пассивные телезрители

Телезрители 108 85 23

78,7% 21,3%

Нетелезрители 90 25 65

27,8% 72,2%

Процент верно классифицированных случаев 75,76%

Метод перекрестной проверки, использующий д искрим и нантную функцию из анали-

зируемой выборки, подтвердил точку зрения, что выбранный фактор помог исследователям

разделить людей на телезрителей и нетелезрителей. Как показано в таблице, применение

Глава 18. Дискриминантный анализ 699

дискриминантноЙ функции удачно при зачислении к определенной группе 75,76% случаев.

Это означает, что рассмотрение существенных факторов поможет специалистам по марке-

тингу понять потребности пожилых людей [12],

МНОЖЕСТВЕННЫЙ ДИСКРИМИНАНТНЫЙ АНАЛИЗ

Формулирование проблемы

Данные табл. 18.2 и 18.3 можно использовать для иллюстрации дискриминантного анализа

для трех групп. В последней колонке этих таблиц домашние хозяйства классифицируют по

трем категориям, исходя из суммы, потраченной на семейный отдых (Б — большая, С — сред-

няя и М — маленькая). Десять домашних хозяйств попали в каждую из категорий. Интересно

выяснить, действительно ли семьи, которые потратили большую, среднюю или маленькую

сумму на отдых (сумма), различаются с точки зрения семейного дохода (доход), отношения к

путешествию (путешествие), значения, придаваемого семейному отдыху (отдых), размера се-

мьи (размер семьи) и возраста главы семьи (возраст) [13].

Определение коэффициентов дискриминантноЙ функции

В табл. 18.5 представлены результаты, полученные с помощью дискриминантного анализа

трех групп. Изучение групповых средних показало, что переменная "доход" разделяет группы

более широко, чем любая другая переменная. Существует некоторое разделение по переменным

"путешествие" и "отдых". А вот с точки зрения размера семьи и возраста главы семьи группы 1

и 2 почти не различаются.

Таблица 18.5. Результаты дискриминантного анализа трех груш

Групповые средине

Группы Доход Путешествие Отдых Размер семьи Возраст

В целом

38,57000

50,11000

64,97000

51,21667

4,50000

4,00000

6,10000

4,86667

4,70000

4,20000

5,90000

4,93333

3,10000

3,40000

4,20000

3,56667

50,30000

49,50000

56,00000

51,93333

Групповые стандартные отклонения

В целом

5,2971В

6,00231

3,61434

12,79523

1,71594

2,35702

1,19722

1,97804

1,88856

2,48551

1,66333

2,09981

1,19722

1,50555

1,13529

1,33089

9,09732

9,25263

7,601 17

8,57395

Объединенная межгрупповая корреляционная матрица

Доход

Путешествие

Отдых

Размер семьи

Возраст

Доход

1,00000

0,05120

0,30681

0,38050

- 0,20939

Коэффициент Я Уилксэ (£Астагистика)

Путешествие

1,00000

0,03588

0,00474

- 0,34022

Отдых

1,00000

0,22080

-0,01326

Размер семьи

1,00000

-0,02512

Возраст

1,00000

— одномерный f-фитерий с двумя и 27 степенями свободы

700 Часть III. Сбор, подготовка и анализ данных

Продолжение табл. 18.5

Переменная

Доход

Путешествие

Отдых

Размер семьи

Возраст

Коэффициент Я Унлкса

0,26215

0,78790

0,88060

0,87411

0,88214

Значение F

38,00

3,634

1,830

1,944

1,804

Значимость

0,0000

0,0400

0,1797

0,1626

0,1840

Канонические дискриминангные функции

Функция Собствен- Процент Кумулч-

ное эна- варка- тивный

чение ции процент

Каноничес- После

паякорре- удаления

Я Уилкса Хи-квадрат Степени Значи-

свободы мостъ

ляция функции

I*

2'

3,8190

0,2469

93,93

6,07

93,93

100,00

: 0

0,8902: 1

0,4450:

0,1664 44,831 10 0,0001

0,8020 44,831 4 0,24

обозначает две канонические дискриминантные функции, оставшиеся в анализе.

Нормированные коэффициенты канонической дискриминангной функции

Доход

Путешествие

Отдых

Размер семьи

Возраст

Функция 1

1,04740

0,33991

-0,14198

-0,16317

0,49474

Функция 2

- 0,42026

0,76861

0,53354

0,12932

0.52447

Структурная матрица

Объединенные внутригрупповые корреляции между различающими переменными и каноническими дискриминант-

ными функциями (переменные ранжированы в соответствии с размером корреляции внутри функции}

Функция 1 функция 2

Доход

Размер семьи

Отдых

Путешествие

Возраст

0,65556*

0,19319*

0,21935

0,148999

0,16576

- 0,27833

0,7749

0,58829*

0,45362*

0,34079*

Ненормированные коэффициенты канонической дискриминантной функции

Функция 1 Функция 2

Доход

Путешествие

Отдых

Размер семьи

Возраст

(Константа)

0,1542658

0,1867977

- 0,6952264Е-01

-0,1202813

0,5928055Е-01

-11,09442

-0,619714ВЕ-01

0,4223430

0,2612652

0,1002796

0,6284206Е-01

-3,791600

Глава 18. Дискриминантный анализ 701

Окончание табл. J8.5

Канонические дискриминангные функции, оцененные по групповым средним (центроидам групп)

Группа

I

Результаты классификации

Функция 1

-0,04100

- 0,40479

2,44578

Фактическая группа Число случаев

Функция 2

0,41847

- 0,65В67

0,24020

Предсказанная групповая принадлежность

1 2 3

Группа 1

Группа 2

Группа,'i

90,0%

I

10,0%

0,0%

10,0%

90,0%

20,0%

0,0%

0,0%

80,0%

Процент правильно классифицированных по группам случаев 86,67%

Результаты классификации для случав, не отобранных для анализа

Предсказанная групповая принадлежность

Фактическая группа Число случаев 1 2 3

Группа

Группа

Группа

4 3

75,0%

4 0

0,0%

4 1

25,0%

25,0%

75,0%

0,0%

0,0%

25,0%

75,0%

Процент верно классифицированных по группам случаев 75,00%

Самое большое стандартное отклонение внутри группы для всех трех групп имеет перемен-

ная "возраст". Объединенная межгрупповая корреляционная матрица указывает на некоторую

корреляцию переменных '"отдых" и "размер семьи" с "доходом". Переменная "возраст" имеет

отрицательную корреляцию с "путешествием" (т.е. зависимость между путешествием и возрас-

том обратная). К тому же эти корреляции находятся в нижнем ряду, указывая, что хотя муль-

ти колли неарность и может иметь место, но она, вероятно, не вызовет серьезной проблемы.

Значимость соответствующих одномерных /^статистик (отношений межгрупповой суммы

квадратов к внутри групповой) указывает, что когда предикторы рассматриваются по отдельно-

сти, то при дифференциации двух групп только доход и путешествие значимы.

Если при проведении множественного дискриминантного анализа имеется G групп, то

можно определить (С— 1) дискриминантную функцию, если число предикторов больше этого

количества. Вообще, с G группами и k предикторами можно вычислить и меньше, чем (G — 1)

или k дискриминантных функций. Первая функция имеет самое высокое значение отношения

межгрупповой суммы квадратов к внутригруппововой сумме квадратов. Вторая функция, не-

коррелирующая с первой, имеет второе по величине собственное значение и т.д. Однако не все

функции могут быть статистически значимыми.

Поскольку имеется три группы, можно определить значения двух функций. Собственное зна-

чение первой функции равно 3,8190, и эта функция объясняет 93, 93% объяснимой дисперсии.

702 Часть III. Сбор, подготовка и анализ данных

Поскольку собственное значение большое, то первая функция, вероятно, старше. Вторая

функция имеет небольшое собственное значение, равное 0,2469, и объясняет только 6,07% объ-

яснимой дисперсии.

Определение значимости дискриминантной функции

Чтобы проверить нулевую гипотезу о равенстве центроидов групп, рассмотрим обе функции од-

новременно. Можно успешно проверить средние функций, выполнив первую проверку всех средних

одновременно. Затем, на следующих этапах, каждый раз исключают одну из функций и проверяют

средние оставшихся функций. Если в табл. 18.5 в колонке ''После удаления функции" стоит 0, то

значит не была удалена ни одна функция. Значение коэффициента Я, Уилкса равно 0,1644. Коэффи-

циент Я Уилкса преобразуется в статистику хи-квадрат, равную 44,831 с 10-тью степенями свободы,

которая является значимой выше 0,05 уровня. Таким образом, две функции вместе значимо дискри-

минируют (различают) три группы. Однако после исключения первой функции коэффициент А,

Уилкса, соответствующий второй функции, равен 0,8020, и является не значимой при уровне 0,05.

Поэтому вторая функция не вносит значимый вклад в групповые различия.

Интерпретация результатов

Интерпретировать результаты анализа помогает проверка нормированных коэффициентов

дискриминантной функции, структурных корреляций и построение диаграмм. Нормированные

коэффициенты показывают высокое значение коэффициента для дохода по функции 1; в то вре-

мя как функция 2 имеет относительно большие значения коэффициентов для переменных

4,0

0.0

-4,0

По горизонтали: функция 1

По вертикали: функция 2

1 1

-I 23 3 3 3

1 1 12 3* 3

1 1 *2 2 3

1 2 2

-6,0 40 -2,0

"Отмечает групповой центр

3,0 4,0 6,0




Поделиться с друзьями:


Дата добавления: 2015-05-09; Просмотров: 448; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.009 сек.