Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Часть III. Сбор, подготовка и анализ данных 6 страница




Kuh, Roy E. Walsh, Regression Diagnostics (New York, NY: John Wiley, 1980).

20. Критерий Дурбина—Уотсона обсуждается практически в каждом учебнике по регрессии.

См., например, работы: Hiroyuki Hisamatsu, Koichi Maekawa, "The Distribution of the Durbin—

Watson Statistic in Integrated and Near-Integrated Models", Journal of Econometrics, April 1994,

p. 367—382; N.R. Draper, H. Smith, Applied Regression Analysis, 3rd ed. (New York, NY: John

Wiley, 1998).

21. Helen Berman, "Selling the Advertising Дгж1е Show Partnership", Folio: The Magazine for

Magazine Management (Special Sourcebook Issue for 1997 Supplement), p. 214-215; Lawrence

Sotey, R. Krishnan, "Does Advertising Subsidize Consumer Magazine Prices?", Journal of

Advertising, Spring 1987, p. 4-9.

22. John Fox, Applied Regression Analysis, Linear Models and Related Methods (Thousand Oaks, CA: Sage

Publications, 1997); Shelby H, Mclntyre, David B. Montgomery, V. Srinivasan, Barton A. Weitz,

"Evaluating the Statistical Significance of Models Developed by Stepwise Regression", Journal of

Marketing Research, February 1983, p. 1-11,

23. Относительно современного применения ступенчатой регрессии см. работы Christopher D.

Ittner, David F. Larcker, "Product Development Cycle Time and Organisational Performance",

Journal of Marketing Research, February 1997, p. 13-23; Michael Laroche, Robert Sadokierski,

"Role of Confidence in a Multi-Brand Model of Intentions for a High-Involvement Service", Journal

of Business Research, January 1994, p. 1-12.

24. Diane Crispell, "Hispanics at the Mall", American Demographics, October 1997, p, 35-36; Glen R.

Jarboe, Carl D. McDaniel, "A Profile of Browsers in Regional Shopping Malls", Journal of the

Academy of Marketing Science, Spring 1987, p. 46—53.

25. Edward Greenberg, Robert Parks, "A Predictive Approach to Model Selection and Multicollinearity",

Journal of Applied Econometrics, January-February 1997, p. 67—75; Chezy Ofir, Andre Khuri,

"Multicollinearity in Marketing Models: Diagnostics and Remedial Measures", International Journal

of Research in Marketing, March 1986, p. 181-205.

26. Возможные процедуры приведены в работах George C.S. Wang, "How to Handle MuHicollinearity

in Regression Modelling", Journal of Business Forecasting Methods & Systems, Spring 1996,

p. 23—27; Charlotte H. Mason, William D. Perreault, Jr., "Collinearity, Power, and Interpretation of

Multiple Regression Analysis", Journal of Marketing Research, August 1991, p. 268-280; R.R.

Глава 17, Корреляция и регрессия 683

Hocking, ''Developments in Linear Regression Methodology: 1959-1982", Technometrics, August

1983, p. 219-230; Ronald D. Snee, "Discussion", Technometrics, August 1983, p. 230-237.

27. R. James Holzworth, "Policy Capturing with Ridge Regression", Organizational Behavior and Human

Decision Processes, November 1996, p. 171—179; Albert R. Wildt, "Equity Estimation and Assessing

Market Response", Journal of Marketing Research, February 1994, p. 437—451; Subhash Sharma,

William L. James, "Latent Root Regression: An Alternative Procedure for Estimating Parameters in

the Presence of М\\\\\со\\теш\у'\ Journal of Marketing Research, May 1981, p. 154—161.

28. Можно определить только относительную важность, поскольку важность независимой пе-

ременной зависит от всех независимых переменных в регрессионной модели.

29. Robert Rugimbana, "Predicting Automated Teller Machine Usage: The Relative Importance of Perceptual

and Demographic Factors", International Journal of Bank Marketing, April 1995, p. 26—32;

Paul E. Green, J. Douglas Carroll, Wayne S, DeSarbo, ''A New Measure of Predictor Variable Importance

in Multiple Regression", Journal of Marketing Research, August 1978, p. 356—360; Barbara

Bund Jackson, "Comment on 'A New Measure of Predictor Variable Importance in Multiple Regression'",

Journal of Marketing Research, February 1980, p. 116—118.

30. При маловероятном событии, когда все предикторы не связаны, простые линейные корре-

ляции равны частным корреляциям, частичным корреляциям и коэффициенту "бета". По-

этому квадраты этих величин будут иметь тот же ранговый порядок относительной важно-

сти переменных.

31. Чтобы узнать больше о перекрестной проверке, см. работы Mark S. Litwin, How to Measure

Survey Reliability and Validity (Thousand Oaks, CA: Sage Publications 1997); X. Michael Song, Mark

E. Perry, "The Determinants of Japanese New Product Success", Journal of Marketing Research,

February 1997, p. 64—76; Bruce Cooil, Russell S. Winner, David L. Rados, "Cross-Validation for

Prediction", Journal of 'Marketing Research, August 1987, p. 271—279.

32. Относительно современного применения регрессии с фиктивными переменными см, рабо-

ты U. Yavas, "Demand Forecasting in a Service Setting", Journal of International Marketing and

Marketing Research, February 1996, p. 3—11; Jacob Cohen, Patricia Cohen, Applied Multiple

Regression Correlation Analysis for the Behavioural Sciences, 2nd ed. (Hikksdale, NJ: Lawrence Erlbaum

Associates, 1983), p, 181-222.

33. John Fox, Applied Regression Analysis, Linear Models, and Related Methods (Thousand Oaks, CA:

Sage Publication 1997). О применении регрессионного анализа для ковариационного анализа

см. статью Peter A. Dancin, Daniel С. Smith, "The Effect of Brand Portfolio Characteristics on

Consumer Evaluations of Brand Extensions", Journal of Marketing Research, May 1994, p. 229—241.

34. Jeoffrey I. Crouch, "Demand Elasticities in International Marketing: A Meta-Analytical Application

to Tourism", Journal of Business Research, June 1996, p. 117—136; Andrew Geddes, "Asian Airlines

Try Loyalty Offers", Advertising Age, December 14,1992, p. 10.

35. Lynne M. Andersson, Thomas S. Bateman, "Cynicism in the Workplace: Some Causes and Effects",

Journal of Organizational Behavior, September 1997, p. 449—469; I. Akaah, E.A. Riordan, "The Incidence

of Unethical Practices in Marketing Research: An Empirical Investigation", Journal of the

Academy of Marketing Science IS (1990), p. 143—152.

36. Eric L. Einspruch, An Introductory Guide to SPSS for Windows (Thousand Oaks, CA: Sage Publications,

1998); Paul E. Specto, SAS Programming for Researchers and Social Scientists (Thousand

Oaks, CA: Sage Publications, 1993); Mohamed Afzal Norat, "Software Reviews", Economic Journal:

The Journal of the Royal Economic Society, May 1997, p. 857-882; Seiter Charles, "The Statistical

Difference", Macworld, October 1993, p. 116-121.

€84 Часть III. Сбор, подготовка и анализ данных

 

Глава 18. Дискриминантный анализ

После изучения материала этой главы вы должны уметь...

1. Излагать концепцию дискриминантного анализа, его цели и применение в маркетинговых

исследованиях.

2. Обрисовывать процедуру выполнения дискриминантного анализа, включая формулирова-

ние проблемы, определение коэффициентов дискриминантной функции и значимости,

интерпретацию и проверку достоверности.

3. Обсуждать множественный дискриминантный анализ и различие между дискриминант-

ным анализом для двух групп и множественным дискриминантным анализом.

4. Объяснять пошаговый дискриминантый анализ и описывать метод Махаланобиса.

КРАТКИЙ ОБЗОР

Эта глава посвящена дискриминантному анализу. В начале главы мы установим его связь с

регрессионным (глава 17) и дисперсионным (глава 18) анализом. Опишем модель и общую про-

цедуру выполнения дискриминантного анализа, отметив такие стадии: формулировка проблемы,

вычисление коэффициентов дискриминантной функции, определение значимости, интерпрета-

ция и проверка результатов. Данная процедура проиллюстрирована на примере дискриминанто-

ного анализа для двух групп. Рассмотрен пример множественного дискриминантного анализа

(для трех групп). Кроме того, мы изучим пошаговый дискриминантный анализ.

Начнем с примеров, иллюстрирующих применение дискриминантного анализа для двух

групп и множественного дискриминантного анализа.

ПРИМЕР. Покупка товаров со скидкой

Для того чтобы определить корреляцию характеристик покупателей с их предрасполо-

женностью к покупке товаров со скидками, был проведен опрос 294 потребителей, которые

благосклонно относятся к рекламе таких товаров. Предикторами являлись четыре фактора,

связанные с отношением покупателей к процессу покупки товаров и их поведением, а также

избранные демографические характеристики (пол, возраст и доход).

Зависимой переменной выбрали степень предрасположенности респондентов к скидкам.

При этом определены три ее уровня. Респонденты, заявившие, что в течение последних 12

месяцев ни разу не купили товар со скидками, были отнесены к категории "не потребите-

ли"; респонденты, заявившие, что они сделали за этот период одну-две таких покупки, бы-

ли отнесены к редким покупателям; респонденты, сделавшие больше двух покупок, были

классифицированы как частые покупатели товаров со скидками. Для изучения данных мар-

кетологи применили множественный дискриминантный анализ.

Установлено два главных факта. Во-первых, восприятие потребителями соотношения

"усилия, необходимые для получения скидки/ размер скидки", было наиболее эффективной пе-

ременной для выведения различия (дискриминации) между частыми, редкими покупателями и

лицами, не являющимися потребителями предлагаемого товара со скидкой. Маркетологи выяс-

нилим, что чувствительные к скидкам покупатели согласны на относительно меньший размер

скидки по сравнению с другими покупателями. Во-вторых, потребители, которые были хорошо

осведомлены о постоянных ценах на товары и поэтому легко узнавали товары со скидками, веро-

ятно, чаще других, откликаются на предложение товаров по сниженным ценам [1].

Глава 18. Дискриминантный анализ 685

ИНОЙ ПРИМЕР. ВЫБОР УНИВЕРМАГА

Дискриминантный анализ для двух групп

В маркетинговом исследовании "Выбор универмага", маркетологи использовали дискри- 1

минантный анализ для двух групп, чтобы выяснить, отличаются ли значения, которые при- I

сваивают восьми факторам выбора универмага респонденты, которым известны универмаги I

от тех значений, которые выставляют респонденты, которым универмаги не известны.

Зависимой переменной были две группы респондентов — владеющие и не владеющие ин-!

формацией об универмагах, а независимыми переменными — важность (значение) восьми

факторов критерия выбора. Общая дискриминантная функция была значимой, что указы- |

вало на существенное различие между двумя группами. Результаты показали, что по срав- I

нению с респондентами, ничего не знающими о данных универмагах, респонденты, хорошо!

осведомленные о них, придавали большее относительное значение качеству товаров, уело- I

виям возврата товаров, услугам продавцов, а также условиям кредитования и расчета с по-

купателями.

—- „тчннн--..„„„,--—... -, TT-T.IIIJ ".•••"•"U-J.

В указанном примере с универмагом задействованы две группы респондентов (знакомые и

не знакомые с универмагом), в то время как в примере с предрасположенностью к покупкам

товаров со скидками проверяли три группы (лица, не являющиеся покупателями товаров со

скидкой; редкие покупатели и частые). В данных исследованиях обнаружены существенные

межгрупповые различия при использовании многих предикторов (независимых переменных),

Исследование различий между группами — основа концепции дискриминантного анализа.

ОСНОВЫ ДИСКРИМИНАНТНОГО АНАЛИЗА

Дискриминантный анализ (discriminant analysis) используется для анализа данных в том слу-

чае, когда зависимая переменная категориальная, а предикторы (независимые переменные)

интервальные [2].

Дискриминантный анализ (discriminant analysis)

Метод для анализа данных маркетинговых исследований в том случае, когда зависимая пе-

ременная категориальная, а предикторы (независимые переменные) интервальные.

Например, зависимая переменная может быть выбором торговой марки персонального

компьютера (торговые марки А, В или С), а независимыми переменными могут быть рейтинги

свойств персональных компьютеров, измеренные по семибалльной шкале Лайкерта. Дискри-

минантный анализ преследует такие цели.

1. Определение дискриминантных функций (discriminant functions) или линейных комбинаций

независимых переменных, которые наилучшим образом различают (дискриминируют) ка-

тегории (группы) зависимой переменной.

2. Проверка существования между группами значимых различий с точки зрения независимых

переменных.

3. Определение предикторов, вносящих наибольший вклад в межгрупповые различия.

4. Отнесение случаев к одной из групп (классификация), исходя из значений предикторов.

5. Оценка точности классификации данных на группы.

Дискриминантная функция (discriminant functions)

Выведенная посредством дискриминантного анализа линейная комбинация независимых

переменных, с помощью которой можно наилучшим образом различить (дискриминиро-

вать) категории зависимой переменной.

686 Часть III. Сбор, подготовка и анализ данных

Метод дискриминантного анализа описывается числом категорий, имеющихся у зависи-

мой переменной. Если она имеет две категории, то метод называют дискрииинантным анализом

для двух групп (two-group discriminant analsysis).

Дискриминантный анализ для двух групп (two-group discriminant analsysis)

Метод дискриминантного анализа, когда зависимая переменная имеет две категории.

Если анализируют три или больше категорий, то метод называют множественным дискри

минантным анализом (multiple descriminant analysis).

J Множественный Дискриминантный анализ (multiple descriminant analysis)

Метод дискриминантного анализа, когда у зависимой переменной имеется три или больше

категорий.

Главное отличие между ними заключается в том, что при наличии двух групп возможно

вывести только одну дискриминантную функцию. Используя множественный Дискрими-

нантный анализ, можно вычислить несколько функций [3].

В маркетинговых исследованиях можно привести массу примеров применения дискри-

минантного анализа. Так, с помощью этого метода можно получить ответы на следующие

вопросы [4].

• Чем, с точки зрения демографических характеристик, отличаются приверженцы данно-

го магазина от тех, у кого эта приверженность отсутствует?

• Отличаются ли в потреблении замороженных продуктов покупатели, которые пьют без-

алкогольные напитки мало, умеренно и много?

• Какие психографические характеристики помогают провести различия между воспри-

имчивыми и не восприимчивыми к цене покупателями бакалейных товаров?

• Различаются ли между собой различные сегменты рынка по своим предпочтениям к

средствам массовой информации?

• Какие существуют различия между постоянными покупателями местных универсаль-

ных магазинов и постоянными покупателями общенациональных сетей универмагов с

точки зрения стиля жизни?

• Какими отличительными характеристиками обладают потребители, реагирующие на

прямую почтовую рекламу?

СВЯЗЬ С РЕГРЕССИОННЫМ И ДИСПЕРСИОННЫМ

АНАЛИЗОМ

Связь между дискриминантным, дисперсионным и регрессионным анализом показана в

табл. 18.1.

Мы обьясним эту связь на примере, в котором исследователь пытается установить зависи-

мость величины суммы, на которую заключается договор страхования жизни, от возраста и до-

хода. Все три метода включают единственную зависимую переменную и несколько предикто-

ров или независимых переменных. Однако природа этих переменных различна. В случае дис-

персионного и регрессионного анализа зависимая переменная метрическая или интервальная

(страховая премия выражена в долларах), в то время как в дискриминантном анализе зависи-

мая переменная категориальная (страховая премия классифицируется как высокая, средняя

или низкая). Независимые переменные являются категориальными в дисперсионном анализе

(возраст и доход классифицируют как старый (высокий), средний и молодой (низкий)), но вы-

Глава 18. Дискриминантный анализ 687

ступают метрическими в регрессионном и дискриминантном анализе (возраст в годах и доход в

долларах, т.е. оба измерены с помощью относительной шкалы).

Таблица 18.1. Сходства и отличия между дисперсионным, регрессионным и дискрими-

1 нантным анализом

Дисперсионный анализ Регрессионный анализ Дискритнантный анализ

Сходства

Число зависимых переменных

Число независимых переменных

Отличия

Природа зависимой переменной

Природа независимой переменной

Одна

Несколько

Метрическая

Категориальная

Одна

Несколько

Метрическая

Метрическая

Одна

Несколько

Категориальная

Метрическая

Д искри минантный анализ для двух групп, когда зависимая переменная имеет только две ка-

тегории, тесно связан со множественным регрессионным анализом. В этом случае множествен-

ный регрессионный анализ, в котором зависимую переменную кодируют как фиктивную пере-

менную, имеющую значение 0 или 1, приводит к частным коэффициентам регрессии, которые

пропорциональны коэффициентам д искри минантной функции (см. следующий раздел).

МОДЕЛЬ ДИСКРИМИНАНТНОГО АНАЛИЗА

Модель дискриминантного анализа (discriminant analysis model) имеет следующий вид:

}

где/) — д искрим инантны и показатель (дискриминант), Ь — дискри минантный коэффици-

ент или вес, Х~ предиктор или независимая переменная.

Модель дискриминантного анализа (discriminant analysis model)

Статистическая модель, лежащая в основе дискриминантного анализа.

Коэффициенты или веса (Ь) определяют таким образом, чтобы группы максимально воз-

можно отличались значениями дискриминантной функции. Это происходит тогда, когда от-

ношение межгрупповой суммы квадратов к внутри групповой сумме квадратов для дискрими-

нантных показателей максимально. Любая другая линейная комбинация предикторов приво-

дит к меньшему значению этого отношения. Технические детали вычисления описаны в

приложении 18А. С дискриминантным анализом связан ряд статистик.

СТАТИСТИКИ, СВЯЗАННЫЕ

С ДИСКРИМИНАНТНЫМ АНАЛИЗОМ

Ниже приведены основные статистики, связанные с дискриминантным анализом.

Каноническая корреляция (canonical correlation). Измеряет степень связи между дискрими-

наитными показателями и группами. Это мера связи между единственной дискриминирую-

щей функцией и набором фиктивных переменных, которые определяют принадлежность к

данной группе.

Центроид (средняя точка) (centroid). Центроид — это средние значения для дискриминант-

ных показателей конкретной группы. Центроидов столько, сколько групп, т.е. один центроид

для каждой группы. Средние группы для всех функций — это групповые центроиды.

688 Часть III. Сбор, подготовка и анализ данных

Классификационная матрица (classification matrix). Иногда ее называют смешанной матрицей,

или матрицей предсказания. Классификационная матрица содержит ряд правильно классифи-

цированных и ошибочно классифицированных случаев. Верно классифицированные случаи

лежат на диагонали матрицы, поскольку предсказанные и фактические группы одни и те же.

Элементы, не лежащие по диагонали матрицы, представляют случаи, классифицированные

ошибочно. Сумма элементов, лежащих на диагонали, деленная на общее количество случаев,

дает коэффициент результативности.

Коэффициенты дискриминантной функции (discriminant function coefficients). Коэффициен-

ты д искри ми нантной функции (ненормированные) — это коэффициенты переменных, когда

они измерены в первоначальных единицах.

Дискриминантные показатели (discriminant scores). Сумма произведений ненормированных

коэффициентов дискриминантной функции на значения переменных, добавленная к посто-

янному члену.

Собственное (характеристическое) значение (eigenvalue). Для каждой дискриминантной

функции собственное значение — это отношение межгрупповой суммы квадратов к внутри-

групповой сумме квадратов. Большие собственные значения указывают на функции более вы-

сокого порядка.

f-статистика и ее значимость (F values and their significance). Значения /"-статистики вычис-

ляют однофакторный дисперсионный анализ, разбивая на группы независимую переменную.

Каждый предиктор, в свою очередь, служит в ANOVA метрической зависимой переменной.

Средние группы и групповые стандартные отклонения (group means and group standard deviations).

Эти показатели вычисляют для каждого предиктора каждой группы.

Объединенная межгрупповая корреляционная матрица (pooled within-group correlation matrix).

Объединенную межгрупповую корреляционную матрицу вычисляют усреднением отдельных

ковариационных матриц для всех групп.

Нормированные коэффициенты дискриминантных функций (standardized discriminant function

coefficients). Коэффициенты дискриминантных функций используют как множители для нор-

мированных переменных, т.е. переменных с нулевым средним и дисперсией, равной 1.

Структурные коэффициенты корреляции (structure correlations). Также известны как дискри-

минантные нагрузки, представляют собой линейные коэффициенты корреляции между предик-

торами и дискриминантной функцией.

Общая корреляционная матрица (total correlation matrix). Если при вычислении корреляций

наблюдения обрабатывают так, как будто они взяты из одной выборки, то в результате получа-

ют общую корреляционную матрицу.

Коэффициент л Уилкса (Wilks's А). Иногда называемый f-статисшкой, коэффициент X

Уилкса для каждого предиктора — это отношение внутригрупповой суммы квадратов к общей

сумме квадратов. Его значение варьирует от 0 до 1. Большое значение X (около 1) указывает на

то, что средние групп не должны различаться. Малые значения Я (около 0) указывают на то, что

средние групп различаются.

В дискриминантном анализе существуют такие допущения: каждая группа является вы-

боркой из многомерной нормально распределенной совокупности; все совокупности имеют

одну и ту же ковариационную матрицу. Чтобы лучше понять роль допущений и описанных

выше статистик, следует изучить методы выполнения д искри минантного анализа.

ВЫПОЛНЕНИЕ ДИСКРИМИНАНТНОГО АНАЛИЗА

Выполнение дискриминантного анализа включает следующие стадии: формулирование

проблемы, вычисление коэффициентов дискриминантной функции, определение значимо-

сти, интерпретация и проверка достоверности (рис 18.1).

Эти стадии обсуждаются и иллюстрируются для дискриминантного анализа двух групп.

Множественный дискриминантный анализ рассматривается в этой главе ниже.

Глава 18. Дискриминантный анализ 689

Определение зкачи

дискриминантной фунщии

Сленга достоверности

дискриминантного анализа

Рис. 18.1. Выполнение дискриминантного анализа

Формулирование проблемы

Первый шаг дискриминантного анализа — формулирование проблемы путем определе-

ния целей, зависимой переменой и независимых переменных. Зависимая переменная долж-

на состоять из двух или больше взаимоисключающих и взаимно исчерпывающих категорий.

Если зависимая переменная измерена с помощью интервальной или относительной шкалы,

то ее следует, в первую очередь, перевести в статус категориальной. Например, отношение к

торговой марке, измеренное по семибалльной шкале, можно категоризировать как неблаго-

приятное (1, 2, 3), нейтральное (4) и благоприятное (5, 6, 7). Можно поступить иначе. Для

этого следует построить график распределения значений зависимой переменной и сформи-

ровать группы равного размера с помощью точек отсечения. Предикторы следует выбирать,

исходя из теоретической модели или ранее проведенного исследования, или, в случае поис-

кового исследования, из интуиции и опыта исследователя.

Следующий шаг — разделение выборки на две части. Одна из них — анализируемая выбор-

ка (analysis sample) — используется для вычисления дискриминантной функции.

Анализируемая выборка (analysis sample)

Часть общей выборки, которую используют для вычисления дискриминантной функции.

Другая часть — проверочная выборка (validation sample) — предназначена для проверки дис-

криминантной функции.

Когда выборка достаточно большая, ее можно разбить на две равные части. Одна служит

анализируемой выборкой, а другую используют для проверки. Затем роль этих половинок вза-

690 Часть III. Сбор, подготовка и анализ данных

имно меняют и повторяют анализ. Это называется двойной перекрестной проверкой, и она

аналогична методу, рассмотренному в регрессионном анализе (глава 17).

i

Проверочная выборка (validation sample)

Часть общей выборки, которую используют для проверки результатов расчета на основании

анализируемой выборки.

Часто распределение количества случаев в анализируемой и проверочной выборки явствует из

распределения в обшей выборке. Например, если общая выборка содержит 50% лояльно и 50% нело-

яльно настроенных покупателей, то анализируемая и проверочная выборки должны каждая содер-

жать 50% лояльных и 50% нелояльных покупателей. В другом случае, если выборка содержит 25%

лояльных и 75% нелояльных покупателей, следует выбрать анализируемую и проверочную выборки

таким образом, чтобы их распределения отражали аналогичную картину (25% против 75%).

И наконец, проверку достоверности дискриминантной функции предлагают выполнять не-

однократно. Каждый раз выборку следует разбивать на две части: для анализа и проверки. Вычис-

ляют дискриминантную функцию и выполняют анализ достверности модели. Таким образом,

оценка достоверности основана на ряде испытаний. Предлагаются также более точные методы [5].

Чтобы лучше проиллюстрировать дискриминантный анализ для двух групп, обратимся к

примеру. Предположим, что мы хотим определить главные характеристики семей, которые от-

дыхали на курорте в последние два года, Данные получены на основании выборки, включаю-

щей 42 семьи. Из них 30 включены (как показано в табл. 18.2) в анализируемую выборку, а ос-

тавшиеся 12 (как показано в табл. 18.3) стали частью проверочной выборки.

Таблица 18.2. Информация об отдыхе на курорте: анализируемая выборка

Номер

•'-

В

И

1G

Посещение

курорта

i

i

i

i

Ежегодный

доход семьи

fa тысячах

долларов)

50,2

70,3

Б2.9

46,5

52,7

75.;)

46,2

57,0

64,1

68,1

73,4

71,9

56,2

49,3

62,0

32,1

36,2

43,2

!)U t-

44,1

Отношение

к путешествию

'.;

i

/

i

•1

Значение,

придаваемое

семейному

отдыху

Размер

семьи

Л

'I

Возраст

главы семьи




Поделиться с друзьями:


Дата добавления: 2015-05-09; Просмотров: 325; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.249 сек.