Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Часть III. Сбор, подготовка и анализ данных 7 страница




Principle's of Statistical Data Handling (Thousand Oaks, CA: Sage Publications, 1996).

3. Colin McDonald, "Linguistic Coding — A New Solution to an Old Problem", Journal of the Market

Research Society, October 1996, p. 505-524, Philip S. Sidel, "Coding", in Robert Ferber (ed.),

Handbook of Marketing Research (New York: McGraw-Hill, 1974), p. 2.178-2.199.

4. Arlene Fink, How to Analyze Survey Data (Thousand Oaks, CA: Sage Publications, 1995); Pamela L.

Alreck, Robert B. Settle, The Survey Research Handbook, 2nd ed. (Homewood, IL: Irwin Professional

Publishing, 1994).

5. Serge Luyens, "Coding Verbatims by Computer", Marketing Research A Magazine of Management &

Applications, Spring 1995, p. 20-25.

6. Norman Frendberg, "Scanning Questionnaires Efficiently", Marketing Research A Magazine of

Management & Applications, Spring 1993, p. 38—42.

7. Eric L. Einspruch, An Introductory Guide to SPSS for Windows (Thousand Oaks, CA: Sage Publications,

1998); Paul E. Spector, SAS Programming for Researchers and Social Scientists (Thousand Oaks,

CA: Sage Publications, 1993); Mohamed Atzal Norat, "Software Reviews", Economic Journal: The

Journal of the Royal Economic Society, May 1997, p. 857—882.

8. Vicki. A. Freedman, Douglas A. Wolf, "A Case Study on the Use of Multiple Imputation",

Demography, August 1995; p. 459—470; Naresh K. Malhotra, "Analyzing Marketing Research Data

with Incomplete Information on the Dependent Variable", Journal of Marketing Research, February

1987, p. 74-84.

9. Необходимо ввести такое значение, которое имеет смысл.

10. All Kara, Chistine Nielsen, Sundeep Sahay, Nagaraj Sivasubramaniam, "Latent Information in the

Pattern of Missing Observations in Global Mail Surveys", Journal of Global Marketing, April 1994,

p. 103—126; Naresh K, Malhotra, "Analyzing Marketing Research Data with Incomplete Information

on the Dependent Variable", Journal of Marketing Research, February 1987, p. 74—84.

11. Некоторые процедуры взвешивания требуют определенной доработки. См. статьи Llan Yaniv,

"Weighting and Trimming Heuristics for Aggregating Judgments under Uncertainty",

Organizational Behavior & Human Decision Processes, March 1997, p. 237—239; Humphrey Taylor,

"The Very Different Methods Used to Conduct Telephone Surveys of the Public", Journal of the

Market Research Society, July 1997, p. 421-432.

12. Rajiv M. Rao, "Nielsen's Internet Survey: Does It Carry Any Weight" Fortune, March 18, 1996,

p. 24.

13. Arch G, Woodside, Robert L. Nielsen, Fred Walters, Gale D. Muller, "Preference Segmentation of

Health Care Services. The Old-Fashioneds, Value Conscious, Affluents, and Professional Want It-

Alls", Journal of Health Care Marketing, June 1988, p. 14—24, См. также статью Rama Jayanti,

"Affective Responses toward Service Providers Implications for Service Encounters", Health

Marketing Quarterly, January 1996, p, 49—65.

14. В Swift, "Preparing Numerical Data", in Roger Sapsford, Victor Jupp (eds.), Data Collection and

Analysis (Thousand Oaks, CA: Sage Publications, 1996), Ronald E, Frank, "Use of Transformations",

Journal of Marketing Research, August 1966, p, 247—253.

15. Jacques Tacq, Multivanate Analysis Techniques in Social Science Research Analysis (Thousand Oaks,

CA: Sage Publications, 1996).

550 Часть III. Сбор, подготовка и анализ данных

16. Fred Davidson, Principles of Statistical Data Handling (Thousand Oaks, CA: Sage Publications,

1996). См. также статью Naresh К. Malhotra, "Modeling Store Choice Based on Censored Preference

Data", Journal of Retailing, Summer 1986, p. 128—144,

17. J. Douglass Carrol, Paul E. Green, "Psychometric Methods in Marketing Research Part II Multidimensional

Scaling", Journal of Marketing Research, May 1997, p. 193—204.

18. David Kilbum, "Haagen-Dazs Is Flavor of Month", Marketing Week, September 4, 1997, p. 30,

Mark Maremont, "They're All Screaming for Haagen Dazs", Business Week, October 14, 1991.

19. Pertti Alasuutan, Researching Culture (Thousand Oaks, CA: Sage Publications, 1995); C.T. Tan,

J. McCulIough, J. Teoh, "An Individual Analysis Approach to Cross-Cultural Research", in Melanie

Wallendorf, Paul Anderson (eds,), Advance's in Consumer Research 14 (Provo, UT: Association for

Consumer Research, 1987): 394-7.

20. Association for Consumer Research, 1987, p. 394—597 См. например, статьи Lisa D. Spiller, Alexander

J. Campbell, "The Use of International Direct Marketing by Small Businesses in Canada,

Mexico, and the United States A Comparative Analysis", Journal of Direct Marketing, Winter 1994,

p. 7—16; Mee-Kau Nyaw, Ignace Ng, "A Comparative Analysis of Ethical Beliefs A Four Country

Study", Journal of Business Ethics, July 1994, p. 543-556.

21. Dianna L. Newman, Robert D. Brown, Applied Ethics for Program Evaluation Analysis (Thousand

Oaks, CA: Sage Publications, 1996); G.M. Zmkhan, M. Bisesi, M.J. Saxton, "MBA's Changing

Attitudes toward Marketing Dilemmas 1981-1987", Journal of Business Ethics, August 1989,

p. 963-974.

Глава 14. Подготовка данных к анализу 551

 

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез

После изучения материала этой главы вы должны уметь...

1. Описывать значимость предварительного анализа данных, понимать, что можно получить

из такого анализа.

2. Обсуждать анализ данных, опирающийся на распределение частот значений переменной,

включающий анализ центра распределения, изменчивости и формы кривой.

3. Объяснять анализ данных, связанный с кросс-табуляцией и имеющими к нему отношение

статистиками: хи-квадратом, фи-коэффициентом, коэффициентом сопряженности,

V-коэффициентом Крамера и коэффициентом "лямбда".

4. Описывать анализ данных, связанный с параметрической проверкой гипотез для одной

выборки, двух независимых выборок и парных выборок.

5. Объяснять анализ данных, связанный с непараметрической проверкой гипотез для одной

выборки, двух независимых выборок и парных выборок.

КРАТКИЙ ОБЗОР

Эта глава посвящена базовому анализу данных, включающему изучение распределения час-

тот значений переменной (вариационных рядов), кросс-табуляцию (построение таблиц сопря-

женности) и проверку гипотез. Сначала мы рассмотрим распределение частот и объясним, как

с его помощью определить количество выбросов, пропущенных и экстремальных значений

данных, а также выявим центральную тенденцию в значениях изучаемых данных, их вариа-

цию и форму кривой распределения. Затем введем понятие проверки гипотез и опишем общую

процедуру проверки. Процедуры проверки гипотез делятся на проверку связей и проверку раз-

личий. Мы также рассмотрим использование кросс-табуляции для установления связи между

двумя или тремя переменными. Хотя природу связи можно увидеть из таблиц, статистики по-

зволяют определить значимость и силу связи. И наконец, мы познакомим вас с методами ста-

тистической проверки гипотез, связанных с различиями в одной или двух выборках.

Многие маркетинговые исследовательские проекты не выходят за рамки базового анализа

данных. Полученные по итогам исследования результаты часто отображают с помощью таблиц

и графиков, как будет показано в главе 22.

; СКВОЗНОЙ ПРИМЕР. ВЫБОР УНИВЕРМАГА

I Анализ исходных данных

В проекте "Выбор универмага" маркетологи сначала провели базовый анализ полученных

!ими данных, а затем на его основе —многомерный статистический анализ. Анализ данных

начался с построения вариационного ряда и вычисления описательных статистик для каж-;

дои переменной. В дополнение к выявлению возможных проблем при обработке данных 1

(см. главу 14) полученная информация позволила хорошо "прощупать" данные, чтобы оп-

552 Часть til. Сбор, подготовка и анализ данных

ределить, каким образом они в дальнейшем будут анализированться. Например, следует ли

для целей анализа рассматривать переменные как имеющие категориальный характер, и ес-

ли да, то сколько категорий представлено в каждой переменной? Чтобы установить связи

между переменными, необходимо выполнить несколько операций кросс-табуляции для

двух и трех переменных. Для изучения влияния независимых переменных с двумя катего-

риями на метрические зависимые переменные маркетологи задействовали /-критерий и

другие процедуры проверки гипотез.

Результаты базового анализа данных ценны сами по себе и, кроме того, показывают на-

правление для последующего многомерного анализа. Чтобы читатель понял особенности ста-

тистических методов, мы приведем ряд примеров применения кросс-табуляции, критерия хи-

квадрат и проверки гипотез.

ПРИМЕР. Рекламная битва полов

При сравнении телевизионных роликов в Австралии, Мексике и Соединенных Штатах

Америки анализировалась роль пола в рекламе. Маркетологи выявили, что рекламные ро-

лики разных стран отличаются степенью участия в них мужчин и женщин. Для анализа

данных маркетологи применили кросс-табуляцию и статистическую проверку с использо-

ванием критерия хи-квадрат. В результате они получили следующие характеристики мекси-

канской рекламы.

Участники рекламы, %

Рекламируемый товар, который используют Женщины Мужчины

Женщины 25,0 4,0

Мужчины 6,8 11,8

Оба пола 68,2 84,2

Х2= 19,73, /><0,001

Отсюда следует, что в мексиканской рекламе женщины появляются для рекламы това-

ров, используемых женщинами или лицами обеих полов, но редко рекламируют товары для

мужчины. Мужчины рекламируют изделия, которыми пользуются и мужчины, и женщи-

ны. Эти различия в рекламе характерны также и для рекламных роликов США, хотя и в

меньшей степени, а вот в австралийской рекламе таких различий нет [1].

ПРИМЕР. Анализ воспринимаемого риска для различных видов продаж

Маркетологи сравнили продажи 12 видов товаров по каталогу и через розничную торго-

вую сеть. Результаты анализа показали, что следует отклонить выдвинутую гипотезу о том,

что нет сушественной разницы степени воспринимаемого потребителями риска для этих

двух видов продаж. Для проверки гипотезы были вычислены 12 (по одному для каждого то-

вара) /-критериев парных наблюдений. Средние значения степени риска (в баллах) для не-

которых из товаров в обоих видах продаж даны в приведенной ниже таблице, причем наи-

высший балл отвечает наибольшему риску.

Средние значения степени воспринимаемого риска (в баллах) для двух видов продаж

Общий воспринимаемый риск, в баллах

Продажа через магазины

ТоваР Про&ха по каталогу ^зничной торговли

Музыкальная высококачественная аппаратура 48,89 41,98"

Музыкальные альбомы 32,65 28,74'

Парадные туфли 58,60 50,80*

Телевизор с экраном 13 дюймов 48,53 40,91*

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 553

Спортивные носки 35,22

Карманный калькулятор 49,62

Фотоаппарат 35 мм 48,13

Духи 34,85

30,22*

42,00*

39,52*

29,79* 1

'Уровень значимости 0,01.

Из данных таблицы видно, что степень воспринимаемого риска при продаже товаров по

каталогу (при уровне статистической значимости р < 0,01) выше по сравнению с риском при

продаже товаров через магазины розничной торговли [2].

Пример, касающийся универсального магазина, показывает роль базового анализа данных

при использовании его в сочетании с методами многомерного анализа, в то время как два дру-

гих примера показывают, что этот анализ полезен и сам по себе. Использование кросс-

табуляции и критерия хи-квадрат в примере, связанном с телевизионной рекламой, и парного

(-критерия в примере с продажей товаров по каталогу позволяют маркетологам сделать вполне

конкретные выводы.

Статистические понятия, обсуждаемые в этой главе, проиллюстрированы на примере, по-

казывающим использование респондентами Internet для личных (не связанных с профессио-

нальной деятельностью) целей. Табл. 15.1 содержит данные о 30 респондентах, включающие

пол (1 — мужчина, 2 — женщина), степень знакомства с Internet (1 — почти незнаком, 7 — хо-

рошо знаком), использование Internet (в часах в неделю), отношение к Internet и Internet-

технологиям (измеренные по семибалльной шкале: 1 — неблагосклонное, 7 — благосклонное),

использование Internet для приобретения товаров или банковских операций (1 — да, 2 — нет).

На первом этапе анализа следует изучить распределение частот значений или вариационный

ряд соответствующих переменных.

Таблица 15.1. Данные об использовании Internet

На Рес-

пондента

\

Лол

1,00

2,00

2,00

2,00

1,00

2,00

2,00

2,00

2,00

1.00

2,00

2,00

1,00

1,00

1,00

2,00

1,00

Знакомство

с Internet

7,00

2,00

3,00

3,00

7,00

4,00

2,00

3,00

3,00

9,00

4,00

5,00

6,00

6,00

0,00

4,00

6,00

Использование

Internet

14,00

2,00

3,00

3,00

13,00

6,00

2,00

6,00

6,00

15,00

3,00

4,00

9,00

8,00

5,00

3 ОС

9,00

Отношение

к internet

7,00

3,00

4,00

7,00

7,00

5,00

4,00

5,00

6,00

7,00

4 ОС

6,00

6,00

3,00

5,00

4 00

5,00

Отношение

к Internet-

технологиям

6,00

3,00

3,00

5,00

7,00

4,00

5,00

4,00

4,00

6,00

3,00

4 СО

5,00

2,00

4,00

;>, оо

3,00

Использование

для покупок

1,00

2,00

1,00

1,00

1,00

1,00

2,00

2,00

1,00

1,00

2,00

2,00

2,00

2,00

юо

2,00

1,00

Использование

для банковских

операций

1,00

2,00

2,00

; со

.,00

2,00

2,00

2,00

2,00

2,00

Г 00

,00

'' ОН

2,00

? 00

1,00

554 Часть III. Сбор, подготовка и анализ данных

Окончание табл. 15.1

№ Рес-

пондента

? 1

Пол

1,00

!,00

2.00

1,00

2,00

1,00

2,00

2,00

1,00

1,00

Знакомство

с Internet

4,00

7,00

6,00

6,00

5,00

3,00

7,00

6. СО

6 ОС

5.00

4,00

4,00

3,00

Использование

Internet

4,00

14,00

6,00

9,00

5,00

2.00

15,00

6.00

13,00

4.00

2,00

4,00

3,00

Отношение

к Internet

5,00

6,00

6,00

4,00

5,00

6,00

5,00

6.00

5,00

3,00

5,00

7,00

Отношение

к Internet-

технологиям

4,00

6,00

4,00

2,00

4.00

2,00

6,00

3,00

6,00

5,00

2,00

3,00

5,00

Использование

для покупок

1,00

1,00

2,00

2,00

2,00

2,00

1,00

!,00

1,00

1,00

2.00

1,00

1,00

Использование

для банковских

операций

2,00

1,00

2,00

2,00

I.OO

2.30

1,00

2,00

1,00

2.00

2,00

2,00

ВАРИАЦИОННЫЙ РЯД

При проведении маркетинговых исследований часто необходимо получить информацию об

одной переменной. Например;

• Какое количество потребителей определенной марки товара можно считать лояльными ей?

• Каково соотношение между разными группами потребителей товара: много исполь-

зующими, средне, слабо и не пользователями?

• Какое количество потребителей хорошо осведомлены о предлагаемом новом товаре?

Сколько потребителей поверхностно знакомы, сколько— что-то слышали, а сколько во-

обше ничего не знают о данной торговой марке? Какова средняя степень осведомленности

о товаре? Сильно ли различается степень осведомленность потребителей о новом товаре?

• Что представляет собой кривая распределения дохода для приверженцев данной мар-

ки товара? Смещено ли данное распределение в сторону группы потребителей с низ-

кими доходами?

Ответы на подобные вопросы можно получить, изучив распределение частот значений пере-

менной, или вариационный ряд (frequency distribution). При таком анализе рассматривается одна

переменная.

Вариационный ряд, распределение частот значений переменной

(frequency distribution).

Математическое распределение, цель которого - подсчет ответов, связанных с различными

значениями одной переменной (частот), и дальнейшее выражение их в процентном виде

(частости).

Целью построения вариационного ряда является подсчет ответов респондентов, в которых

приводятся различные значения переменной. Относительную частоту различных значений пе-

ременной выражают в процентах и называют частостямк. Подсчет распределения частот зна-

чений переменной дает возможность построить таблицу, с указанием частоты, частости и на-

копленных частостей для всех значений этой переменной.

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 555

В табл. 15.2 представлено распределение частот осведомленности об Internet. Первая колон-

ка содержит отметки, присвоенные различным категориям переменной, а вторая — коды, при-

своенные каждому значению переменной.

Таблица 15.2. Распределение частот осведомленности об Internet

Отметка значения Значение Частоты {N) Частости Достоверные частости Накопленные частости

Плохо осведомлены

Хорошо осведомлены

"

Итого

а

б

е

0,0

6,7

20,0

20,0

10,0

26,7

13,3

3,3

100,0

0,0

6,9

20,7

20,7

10,3

27,6

13,8

Пропуск

100,0

0,0

6,9

27,6

48,3

58,6

86,2

100,0

Обратите внимание, что код 9 присвоен пропущенным значениям. В третьей колонке при-

ведено количество ответивших респондентов. Например, три респондента отметили в анкете

галочкой значение 5, указав, что они что-то слышали об Internet. В четвертой колонке приведен

процент респондентов, отметивших в анкете галочкой данное значение. В следуюшей колонке

показаны проценты, подсчитанные с учетом пропущенных значений. Если пропущенных зна-

чений нет, то колонки 4 и 5 идентичны. В последней колонке представлены накопленные час-

тости после корректировки пропущенных случаев (ответов респондентов). Как видно, из 30

респондентов, участвующих в опросе, 10% отметили значение 5. Если исключить одного рес-

пондента с пропущенным значением, то частость увеличится до 10,3%. Накопленная частость,

относящаяся к значению 5, равна 58,6. Другими словами, 58,6% респондентов с достоверными

ответами показали значение осведомленности 5 или меньше.

3 4 5 t

Знакомство с Internet

Рис. 15.1. Гистограмма распределения частот

556 Часть III. Сбор, подготовка и анализ данных

Вариационный ряд помогает определить долю неответивших респондентов (в табл. 15.2

один респондент из 30 не ответил на вопрос), а также указывает долю ошибочных ответов. Зна-

чения, равные 0 или 8, соответствуют ошибочным ответам. Следует определить количество слу-

чаев с такими значениями и соответственно откорректировать результат. Кроме того, можно ус-

тановить наличие выбросов, т.е. случаев с экстремальными значениями. При анализе распре-

деления частот относительно размера домохозяйства (семьи) выбросами следует считать

несколько семей, состоящих не меньше чем девяти человек. Распределение частот также опре-

деляет форму эмпирического распределения значений переменной. Частотные данные можно

использовать для построения гистограмм или вертикальных столбчатых диаграмм, на которых

по оси ЛГоткладывают значения переменной, а по оси Y— абсолютные (частоты) или относи-

тельные (частости) значения. На рис. 15.1 представлена гистограмма для данных табл. 15.2. По

гистограмме можно проверить, соответствует ли наблюдаемое распределение предполагаемому

маркетологом распределению.

Для иллюстрации наших рассуждений рассмотрим следующий пример.

ПРИМЕР. Этические проблемы в рекламе

В опросе, касающемся этических проблем, руководителей рекламных агентств просили

описать наиболее трудные этические проблемы, с которыми они сталкиваются в повседнев-

ной работе. Распределение частот показало, что чаше всего они испытывали следующие про-

блемы: честное отношение к своим клиентам; создание объективной, не вводящей в заблуж-

дение, социально значимой рекламы; принятие решения о целесообразности оказания услуг

клиентам, чьи продукты или услуги вредят здоровью, ненужны, бесполезны и неэтичны;

честное отношение к поставщикам, партнерам и посредникам; справедливое отношение к

сотрудникам и менеджерам; объективное и честное отношение к другим рекламным

агентствам [3].

Этические проблемы руководителей рекламных агентств

Ответы

Проблема

1. Честное отношение к своим клиентам

2. Создание честной, не вводящей в заблуждение, социально значимой рекламы

3. Принятие решения о целесообразности предоставления услуг клиентам, чьи продукты

или услуги вредят здоровью, ненужны, бесполезны и неэтичны

4. Честное отношение к поставщикам, партнерам и посредникам

5. Честное отношение к сотрудникам и менеджерам

6. Объективное и честное отношение к другим рекламным агентствам

7. Другие

8. Ответов нет

Итого

Количество

Процент

100%

Данные в этом примере указывают на распространенность различных этических проблем.

Поскольку при этом используют числовые значения, для вычисления описательных статистик

можно применить распределение частот. Вычисление некоторых статистик, связанных с рас-

пределением частот, обсуждается в следующем разделе.

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 557

СТАТИСТИКИ. СВЯЗАННЫЕ С РАСПРЕДЕЛЕНИЕМ

ЧАСТОТ

Как следует из предыдущего раздела, распределение частот — удобный способ представ-

ления различных значений переменной. Таблица вариационного ряда легко читается и со-

держит основную информацию, но иногда такая информация слишком детализированна, и

исследователь вынужден обобщать ее с помощью описательных статистик [4]. Чаще всего

используют следующие статистики, связанные с распределением частот: показатели центра

распределения (среднее, мода и медиана), показатели вариации (размах, меж квартальный

размах, стандартное отклонение и коэффициент вариации) и показатели формы распределе-

ния (асимметрия и эксцесс) [5].

Показатели центра распределения

Показатели центра распределения (measures of location) характеризуют положение центра

распределения, вокруг которого концентрируются данные. Если всю выборку изменить, доба-

вив фиксированную величину к каждому наблюдению, то среднее, мода и медиана изменятся

на аналогичную величину.

Показатели центра распределения (measures of location)

Статистики, которые характеризуют значение признака, вокруг которого концентрируются

наблюдения, или, как говорят, показывают центральную тенденцию распределения.

Среднее арифметическое или выборочное среднее (mean) — это наиболее часто используе-

мый показатель, характеризующий положение центра распределения. Он используется для

оценки среднего значения в случае, если данные собраны с помощью интервальной или отно-

сительной шкалы. Его величина должна отражать некоторое среднее значение, вокруг которого

распределена большая часть ответов.

Среднее арифметическое, выборочное среднее (mean)

Эта величина получается делением суммы всех имеющихся значений переменной на число

значении,

Среднее арифметическое X задается формулой

где Xt— полученные значения переменной X, п — число наблюдений (размер выборки).

Обычно среднее значение — устойчивый показатель и заметно не изменяется при добавле-

нии или вычитании значений данных. Для частот, представленных в табл. 15.2, среднее ариф-

метическое вычисляют следующим образом:

— _ (2x2 + 6x3 + 6x4 + 3x5 + 8x6 + 4x7) _ (4 + 18 + 24 + 15 + 48 + 28) _,,„,.,„_, „„,

А — — — \jli2.f—'+il2A

29 29

Мода (mode) — значение переменной, встречающееся чаще других. Представляет наивыс-

шую точку (пик) распределения. Мода хороший показатель центра распределения, если пере-

менная имеет категорийный характер, или, иначе говоря, ее можно разбить на категории.

Мода (mode)

Значение переменной, которое чаще всего встречается в выборочном распределении.

Медиана (median) выборки — это значение переменной в середине ряда данных, располо-

женных в порядке возрастания или убывания, Положение медианы определяется ее номером.

558 Часть III. Сбор, подготовка и анализ данных

Если число данных четное, то медиана равна полусумме двух серединных значений. Медиа-

на— это 50-й процентиль. Она характеризует положение центра распределения порядковых

данных. В табл. 15.2 медиана равна 5,000.

Медиана (median)

Значение переменной, которое приходится на середину распределения частот, т.е. одна по-

ловина всех значений больше медианы, а другая половина - меньше.

Как видно из табл. 15.2, три показателя, характеризующих положение центра распределе-

ния для рассматриваемого нами примера, различны (среднее значение — 4,724; мода — 6,000;

медиана — 5,000). И это неудивительно, поскольку каждый показатель определяет центр рас-

пределения по-разному. Какой же показатель использовать? Если переменную измеряют по

номинальной шкале, то лучше использовать моду. Если переменную измеряют по порядковой

шкале, то больше подходит медиана. Если же переменную измеряют по интервальной или от-

носительной шкале, то мода плохо отражает положение центра распределения. Это можно уви-

деть из табл. 15.2. Хотя значение моды, равное 6,000, отражает наивысшую частоту, оно пред-

ставляет только 27,6% выборки. Медиана лучше подходит в качестве показателя, характери-

зующего положение центра распределения, для интервальной или относительной шкалы, хотя

и она не учитывает имеющуюся информацию о переменной. Текущие значения переменной до

и после медианы игнорируются. Самый лучший показатель для интервальной или относи-

тельной шкалы — среднее арифметическое. Он учитывает всю доступную информацию, по-

скольку для его вычисления используются все значения. Однако среднее арифметическое чув-

ствительно к выбросам значений (экстремально малым или экстремально большим значени-




Поделиться с друзьями:


Дата добавления: 2015-05-09; Просмотров: 339; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.301 сек.