Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Часть III. Сбор, подготовка и анализ данных 8 страница




ям). Если данные содержат выбросы, то среднее не будет хорошим показателем центра

распределения и лучше использовать два показателя — среднее и медиану.

Показатели вариации

Показатели вариации (изменчивости) (measures of variability), вычисляемые на основании

данных, измеряемых с помощью интервальных или относительных шкал, включают размах

вариации, межквартильный размах, дисперсию, стандартное отклонение и коэффициент

вариации.

Показатели вариации (изменчивости) (measures of variability)

Статистики, показывающие меру разброса (вариабельность) значений переменной.

Размах вариации (range) отражает разброс данных. Он равен разности между наибольшим и

наименьшим значениями в выборке. Поэтому на него непосредственно влияют выбросы.

Размах вариации (range)

Разность между наибольшим и наименьшим значениями переменной в вариационном ряду.

Размах = Xuacfumihligf - Хна!ме„ьа1С1

Если все значения данных умножить на константу, то значение размаха вариации умножа-

ется на ту же константу. Размах вариации в табл. 15.2 равен: 7 — 2 = 5,000.

Межквартильный размах (interquartile range) — это разность между 75- и 25-м процентиля-

ми. Для набора точек данных, расположенных в ранжированном ряду, />-м процентилем будет

такое значение переменной в ранжированном ряду распределения, что/>% единиц совокупно-

сти будут меньше и (100 — р)% — больше него. Если все значения данных умножить на кон-

станту, то межквартильный размах умножается на эту же константу. Межквартильный размах в

табл. 15.2 равен 6 - 3 = 3,000.

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 559

Межквартильный размах (interquartile range)

Размах вариации распределения, охватывающий центральные 50% всех наблюдений.

Разность между средним значением переменной и ее наблюдаемым значением называют

отклонением от среднего. Дисперсия (variance) — среднее из квадратов отклонений переменной

от ее средней величины. Она никогда не может быть отрицательной. Если значения данных

сгруппированы вокруг среднего, то дисперсия невелика. И наоборот, если данные разбросаны,

то мы имеем дело с большей дисперсией. Если все значения данных умножить на константу, то

дисперсия умножится на квадрат константы. Среднеквадратическое (стандартное) отклонение

(standard deviation) равно квадратному корню из дисперсии. Таким образом стандартное откло-

нение выражается в тех же единицах, что и сами данные.

Дисперсия (variance)

Среднее из квадратов отклонений переменной от ее средней величины.

Среднеквадратическое (стандартное) отклонение (standard deviation)

Корень квадратный из значения дисперсии.

Стандартное отклонение выборки sx вычисляют следующим образом;

я-1

Мы делим на п —1 вместо л, поскольку генеральное среднее неизвестно, и вместо него ис-

пользуют выборочное среднее, что делает выборку менее изменчивой, чем фактически. Деля на

п —1 вместо п, мы корректируем более слабую изменчивость значений переменой, наблюдае-

мую в выборке. Для данных, приведенных в табл. 15.2, дисперсию вычисляют так;

V ={2х(2-4,724)2 + 6х(3-4,724): + бх(4-4Л24)2 + Зх(5-4,724)2 +

+8х(б-4,724)2 +4х(7-4,724):}/

/28:

{14,840+17,833 + 3,145 + 0,229 + 13,025 + 20,721} 69,793

= 1 1= —: = 2,493

28 28

Следовательно, стандартное отклонение находим по формуле;

s,.=V2,493 =1,579

Коэффициент вариации (coefficient of variation) — это отношение стандартного отклонения к

среднему арифметическому, выраженное в процентах. Коэффициент вариации — показатель

относительной изменчивости переменной. Коэффициент вариации CV вычисляют так:

CV=s. /X"

Коэффициент вариации (coefficient of variation)

Величина относительной изменчивости переменной, представляющая собой отношение ее

стандартного отклонения к ее среднему значению.

Коэффициент вариации имеет смысл, только если переменную измеряют по относитель-

ной шкале. Поскольку степень знакомства с Internet измерена не по этой шкале, то бессмыс-

ленно вычислять коэффициент вариации для данных табл. 15.2.

560 Часть III. Сбор, подготовка и анализ данных

Показатели формы распределения

Показатели формы распределения, как и показатели вариации, также полезны для пони-

мания природы распределения переменной. Форму распределения оценивают с помощью

асимметрии и эксцесса.

Асимметрия. Распределение переменной может быть симметричным или асимметричным

(скошенным). При симметричном распределении частоты любых двух значений переменной,

которые расположены на одном и том же расстоянии от центра распределения, одинаковы.

Равны между собой также и значения среднего арифметического, моды и медианы. Распреде-

ление асимметрично (skewness), если значения переменной, равноудаленные от среднего, име-

ют разную частоту, т.е. одна ветвь распределения вытянута больше другой (рис. 15.2). Значение

асимметрии для распределения данных табл. 15.2 равно —0,094; что указывает на незначитель-

ную отрицательную асимметрию.

Симметричное распределение

Среднее

Медиана

Мода

Асимметричное распределение

Среднее Медиана Мода

Рис. 15.2. Асимметрия распределения

Асимметрия (skewness)

Характеристика распределения, которая оценивает симметрию расположения значений дан-

ных относительно средней.

Эксцесс (kurtosis) — это показатель относительной крутости (островершинности или плос-

ко верш и нности) кривой вариационного ряда по сравнению с нормальным распределением.

Эксцесс нормально распределенной случайной величины равен нулю. Если эксцесс положите-

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 561

лен, то распределение более островершинно по сравнению с нормальным распределением. При

отрицательном значении распределение более плосковершинно по сравнению с нормальным,

Значение этой статистики для табл. 15.2 равно —1,261; это указывает на то, что распределение

более плосковершинное по сравнению с нормальным.

Эксцесс (kurtosis)

Мера относительной крутости кривой распределения частот.

ВВЕДЕНИЕ В ТЕОРИЮ ПРОВЕРКИ ГИПОТЕЗ

Этот раздел посвящен введению в теорию проверки гипотез. Базовый анализ данных неиз-

менно включает в себя статистическую проверку гипотез. Приведем примеры гипотез в марке-

тинговых исследованиях.

• Число постоянных покупателей универмага превышает 10% семей.

• Потребители определенной марки товара, которые отличаются между собой уровнем

его потребления (много и мало), различаются также и психографическими характери-

стиками.

• Рассматриваемый отель имеет более высокий имидж, чем его ближайший конкурент,

• Чем лучше респондент знаком с рестораном, тем чаще он его посещает.

В главе 12 мы рассмотрели понятия выборочного распределения, стандартную ошибку

среднего и доли и доверительный интервал [6]. Все они относятся к проверке гипотезы и по-

этому необходимо вспомнить их. Ниже мы опишем общую схему проверки гипотезы, которая

применима к проверке гипотез с большим диапазоном параметров.

ОБЩАЯ СХЕМА ПРОВЕРКИ ГИПОТЕЗЫ

Для проверки гипотезы необходимо выполнить следующие этапы (рис.15.3).

1. Сформулировать нулевую гипотезу Н0 и альтернативную гипотезу Н,.

2. Выбрать подходящий метод статистической проверки гипотезы (статистический критерий)

и соответствующую статистику критерия (выборочную статистику, тест-статистику).

3. Выбрать уровень значимости а.

4. Определить размер выборки и собрать данные. Вычислить значение выборочной ста-

тистики.

5. Определить вероятность, которую примет статистика критерия (выбранная на этапе 2) при

выполнении нулевой гипотезы, используя соответствующее выборочное распределение.

Альтернативный вариант данного этапа: определить критическое значение статистики, ко-

торое делит интервал на область принятия и непринятия нулевой гипотезы.

6. Сравнить полученную вероятность для тест-статистики (статистики, построенной по ре-

зультатам выборочного наблюдения) с заданным уровнем значимости. Альтернативный ва-

риант данного этапа: определить, попадает ли выборочное значение тест-статистики в об-

ласть принятия или отклонения нулевой гипотезы.

7. Принять статистическое решение, касающееся того, принять или отвергнуть нулевую

гипотезу.

8. Выразить статистическое решение с точки зрения проблемы маркетингового исследования.

562 Часть III. Сбор, подготовка и анализ данных

Определить критическое

значение

выборочной статистики

критерия

i

чонить или не отклонять нулевую гипотеза

Определить, попадает ли

значение в область

принятия или непринятия

нулевой гипотезы

Рис. 15.3. Общая схема проверки гипотезы

Этап 1. Формулировка гипотез

На первом этапе маркетолог формулирует нулевую и альтернативную гипотезы. Нулевая

гипотеза (null hypothesis) утверждает, что между определенными статистическими параметрами

генеральной совокупности (средними или долями) не существует связи или различия. Ее под-

тверждение не требует от компании каких-либо действий.

Нулевая гипотеза (null hypothesis)

Предположение о том, что между определенными статистическими параметрами генераль-

ной совокупности {средними или долями) не существует связи или различия. Ее подтвер-

ждение не требует от компании каких-либо действий.

Альтернативная гипотеза (alternative hypothesis) — это гипотеза, предполагающая, что между

определенными статистическими параметрами генеральной совокупности (средними или до-

лями) есть связь или различия. Ее подтверждение означает, что руководству компании следует

предпринимать какие-либо действия или менять свои взгляды на положение дел. Таким об-

разом, альтернативная гипотеза противоположна нулевой.

Маркетолог всегда проверяет именно нулевую гипотезу. Она имеет отношение к конкрет-

ному значению параметра совокупности (например, ц, ст, л), а не к выборочным статисти-

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 563

кам (например, X). Проверка гипотез имеет два исхода: нулевая гипотеза отвергается, а аль-

тернативная — принимается, или нулевая гипотеза не отклоняется, исходя из представленных

доказательств. Следовательно, по результатам статистической проверки нулевую гипотезу не

следует принимать, т.е. некорректно заключить, что, поскольку нулевую гипотезу не отклоня-

ют, ее можно принять как истинную. В классической теории проверки гипотез сложно опреде-

лить, достоверность нулевой гипотезы.

Альтернативная гипотеза (alternative hypothesis)

Утверждение о том, что между определенными статистическими параметрами (средними

или долями) генеральной совокупности есть связь или различия. Ее подтверждение означа-

ет, что руководству компании следует предпринимать какие-либо действия или менять свои

взгляды на положение дел.

В маркетинговых исследованиях нулевую гипотезу формулируют так, что ее непринятие

ведет к желаемому заключению. Альтернативная гипотеза представляет заключение, для кото-

рого маркетологи ищут доказательство его справедливости. Например, руководство универмага

хотело бы начать торговлю своими товарами через Internet. Новую услугу введут в действие, ес-

ли свыше 40% пользователей Internet используют сеть для совершения покупок. Маркетолог

записывает гипотезы следующим образом:

Я0:тг<0,40

Я,: п > 0,40

Если нулевую гипотезу Н0 отклоняют, то принимают альтернативную гипотезу Н„ значит,

стоит ввести новую услугу — приобретение товаров через Internet. С другой стороны, если нуле-

вую гипотезу На не отклоняют, то новую услугу не стоит внедрять до тех пор, пока не будет по-

лучено дополнительных доказательств для того, чтобы заняться Internet-торге влей.

В рассматриваемом случае для проверки гипотезы используют односторонний критерий

(one-tailed test), так как альтернативная гипотеза имеет четко выраженное направление: доля

пользователей Internet, которые используют его для приобретения товаров, больше 0,40.

Односторонний критерий (one-tailed test)

Критерий проверки нулевой гипотезы, когда альтернативная гипотеза имеет четкую направ-

ленность.

С другой стороны, предположим, что исследователь хочет определить, действительно ли

доля пользователей Internet, которая осуществляет покупки через сеть, отличается от 40%.

Для этого использует двусторонний критерий (two-tailed test), а гипотезы запишем в следую-

щем виде:

Я0: п =0,400

Я,: я* 0,400

Двусторонний критерий (two-tailed test)

Критерий проверки нулевой гипотезы, когда альтернативная гипотеза не имеет четкой на-

правленности.

В практике маркетинговых исследований односторонний критерий используют чаще,

чем двусторонний. Обычно существует какое-либо предпочтительное направление изме-

ненения характеристик, подлежащее доказательству. Например, чем выше прибыль, объ-

ем продаж и качество продукта, тем это лучше для фирмы. Односторонний критерий

сильнее двустороннего. Мощность статистического критерия обсуждается ниже, при рас-

смотрении этапа 3.

564 Часть III. Сбор, подготовка и анализ данных

Этап 2. Выбор подходящего метода проверки

Для проверки нулевой гипотезы необходимо выбрать подходящий статистический метод

(статистический критерий). Исследователь должен принимать во внимание саму процедуру

вычисления выборочной статистики и характерное для нее выборочное распределение. Выбо-

рочная статистика критерия (test statistic) служит для того, чтобы можно было сделать вывод о

том, насколько близко выборка соответствует нулевой гипотезе.

Выборочная статистика критерия (test statistic)

Мера соответствий выборки нулевой гипотезе. Она часто подчиняется таким распространен-

ным распределениям, как нормальное, Стьюдента (t-распределение) или хи-квадрат рас-

пределение.

Выборочная статистика часто имеет такие широко распространенные распределения, как

нормальное, Стьюдента (^-распределение) или хи-квадрат распределение. Правила выбора под-

ходящего метода проверки обсуждаются ниже. В нашем примере наиболее приемлема z-

статистика, которая имеет нормальное распределение. Она вычисляется по формуле

г~^.

°е

где

Этап 3. Выбор уровня значимости

Какой бы вывод мы ни сделали в отношении изучаемой совокупности, всегда существует

риск неверного заключения. При этом встречаются два типа ошибок.

Ошибку I рода (Type I error) совершают, когда, исходя из результатов выборочного распреде-

ления, отклоняют нулевую гипотезу, в то время как она фактически верна.

Ошибка I рода (Type I error)

Также известная под названием альфа-ошибка, имеет место тогда, когда по результатам

выборочного распределения отклоняют нулевую гипотезу, которая на самом деле верна.

В нашем примере ошибка I рода имела бы место, если мы, исходя из данных выборки, ус-

тановили бы, что доля потребителей, предпочитающих новый вид услуг, больше 0,40 (40%), в

то время как фактически она была бы меньше либо равна 0,40. Вероятность ошибки I рода (а)

также называют уровнем значимости (level of significance).

Уровень значимости (level of significance)

Вероятность ошибки первого рода.

Вероятность ошибки первого рода устанавливается, исходя из допустимого уровняя риска

отклонения истинной нулевой гипотезы. Выбор уровня риска зависит от того, во сколько оце-

нивается ошибка первого рода.

Ошибку II рода (Туре II error) совершают, когда, исходя из результатов выборки, не откло-

няют нулевую гипотезу, которая в действительности является ошибочной. В нашем примере

ошибка II рода имела бы место, если мы, исходя из данных выборки, установили бы, что доля

потребителей, предпочитающих новый вид услуг, меньше или равна 0,40, в то время как фак-

тически она была бы больше 0,40. Вероятность ошибки II рода обозначается р*. В отличие от а,

значение которой устанавливает сам исследователь, величина Р зависит от фактического значе-

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 565

ния параметра генеральной совокупности (например, доли). Вероятность совершения ошибки

I рода (а) и вероятность ошибки II рода (|3) показаны на рис. 15.4. Вероятность (1 - р) соверше-

ния ошибки II рода также называют мощностью статистического критерия.

Критическое значение

статистики z

., = 0,45

zp =-2,330 -|

Рис. 15.4. Ошибка Iрода (а) и ошибка IIрода (&)

Ошибка II рода (Type I error)

Также известна под названием бета-ошибка, имеет место тогда, когда результаты выборки

ведут < принятию нулевой гипотезы, которая фактически ошибочна.

Мощность критерия (power of a test) представляет собой вероятность (1 — |3) отклонения ну-

левой гипотезы, когда она неверна и должна быть отвергнута. Хотя величина (3 неизвестна, она

связана с а. Чрезвычайно низкое значение ее (например, 0,001) приведет к недопустимо высо-

кому значению р. Поэтому необходимо сбалансировать два типа ошибок. В качестве компро-

мисса ее часто устанавливают равной 0,05; иногда ей присваивают значение 0,01; другие значе-

ния а встречаются редко. Уровень а, наряду с размером выборки, определяет уровень Р для

конкретного исследовательского проекта. Риском а и р можно управлять, увеличив размер вы-

борки. Для данного уровня значимости а увеличение размера выборки уменьшит значение Р,

повысив тем самым мощность статистического критерия.

Мощность статистического критерия (power of a test)

Вероятность отклонений нулевой гипотезы, когда она фактически неверна и должна быть

отвергнута.

Этап 4. Сбор данных

Размер выборки определяют, приняв во внимание желаемые значения вероятностей совер-

шения ошибок I и II рода и других количественных факторов, например финансовых ограни-

566 Часть III. Сбор, подготовка и анализ данных

чений. Затем собирают необходимые данные и вычисляют значение выборочной статистики.

В нашем примере из 30 опрошенных пользователей Internet 17 отметили, что они приобретают

товары через Internet. Таким образом, выборочная доля этих пользователей Internet составляет

£ = 17/30 = 0,567.

Значение о> можно определить по следующей формуле:

= 0,089

п \ 30

Выборочную статистику z можно вычислить по формуле:

р-я- 0,567-0.40 _

; =

0,089

Этап 5. Определение критического значения z-статистики

Используя таблицы нормального распределения (табл. 2 Приложения), можно вычислить

вероятность получения значения z, равного 1,88 (рис. 15.5).

Закрашенная область

= 0,9699 Незакрашенная область

= 0,0301

Рис. 15.5. Вероятность получения значения г при использо-

вании одностороннего критерия

Площадь закрашенной области между -°° и 1,88 равна 0,9699. Следовательно, площадь

незакрашенной области справа от 2=1,88 равна 1,0000— 0,9699 = 0,0301. Альтернативно, кри-

тическое значение г, которое отсекает область, имеющую площадь а = 0,05 и расположенную

справа от критического значения, находится между 1,64 и 1,65 и равно 1,645. Обратите внима-

ние, что при определении критического значения выборочной статистики область вправо от

критического значения критерия равна либо а либо а/2. Это значение равно а для односто-

роннего критерия и а/2 — для двустороннего.

Этапы 6 и 7. Сравнение выборочного

значения z-статистики с критическим значением

и принятие решения

Итак, маркетологи выяснили, что вероятность того, что вычисленная ими выборочная ста-

тистика больше 1,88, равна 0,0301. Это вероятность получения значения р, равного 0,567 при

р -0,40. Это число меньше выбранного уровня значимости, равного 0,05. Следовательно, ну-

левая гипотеза отклоняется. Альтернативно исследователи могут поступить следующим обра-

зом. Они видят, что полученное значение z-статистики = 1,88 лежит в области отклонения ну-

левой гипотезы (в критической области), справа от значения 1,645. Поэтому снова можно сде-

лать такой же вывод, т.е. отклонить нулевую гипотезу. Обратите внимание, что два способа

проверки нулевой гипотезы эквивалентны по выводу, но математически отличаются направле-

нием сравнения. Если вероятность получения вычисленного значения выборочной статистики

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 567

(TSC-AL), меньше, чем уровень значимости (а), то нулевую гипотезу отклоняют. Справедливо и

следующее утверждение: если вычисленное значение выборочной статистики больше, чем ее

критическое значение (TSCK), то нулевую гипотезу также отклоняют. Причина этой перемены

знаков в том, что чем больше значение TSCAL, тем меньше вероятность получения высокого

значения выборочной статистики при условии выполнения нулевой гипотезы. Запишем этот в

следующем виде:

если вероятность TSCAI < уровня значимости (а), то нулевую гипотезу Нй отклоняют,

или

если Т5СЛ1> Г5СЛ, то нулевую гипотезу отклоняют.

Этап 8. Вывод с точки зрения маркетингового

исследования

На основании результатов проверки статистической гипотезы следует сделать заключение с

точки зрения стоящей перед нами проблемы маркетингового исследования. В нашем примере

мы заключаем, что существует статистически значимое доказательство того, что доля пользова-

телей Internet, которые приобретают товары через Internet, выше, чем 0,40. Следовательно, уни-

вермагу можно порекомендовать вводить новую услугу — приобретение товаров через Internet.

Как видно из рис. 15.6, маркетологи используют проверку статистической гипотезы как для

проверки наличия связей между переменными, так и для проверки различий между парамет-

рами генеральной совокупности.

Типы

проверки

гипотезы

Г

Проверка

связи

дщСж; ^^^ |^L

Распределения Средние Доли

ПроЕ

раап^

ерка

ичий.

Медианы/Ранги:

Рис. 15.6, Общая классификация типов проверки гипотезы

Проверка различий может относиться к распределениям, средним, долям, медианам или

рангам. Сначала мы обсудим гипотезы, относящиеся к проверке связей с точки зрения

кросс-табуляции.

ПОСТРОЕНИЕ ТАБЛИЦ СОПРЯЖЕННОСТИ

ПРИЗНАКОВ

Помимо ответов на вопросы, относящихся к анализу одной переменной, маркетологов час-

то интересуют дополнительные вопросы о связи этой переменной с другими переменными.

• Как много мужчин среди приверженцев данной торговой марки?

568 Часть III. Сбор, подготовка и анализ данных

• Связано ли использование товара (потребление его в больших, средних, малых коли-

чествах и не потребление) с отдыхом на открытом воздухе (высокая, средняя и низкая

активность)?

• Связана ли осведомленность о новом товаре с возрастом и уровнем образования?

• Связана ли покупка товара с доходом человека (высокий, средний или низкий доход)?

На эти и подобные вопросы можно ответить с помощью таблицы сопряженности призна-

ков. В то время как вариационный ряд характеризует одну переменную, построение таблиц со-

пряженности признаков (кросс-табуляция) (cross-tabulation) помогает увидеть одновременно

значения двух или больше переменных.

Построение таблиц сопряженности признаков, кросс-табуляция (cross-tabulation)

Статистический метод, который одновременно характеризует две или больше переменных и

заключается в создании таблиц сопряженности признаков, отражающих совместное распре-

деление двух или больше переменных с ограниченным числом категорий или определен-

ными значениями.

Кросс-табуляция представляет собой процесс объединения распределений частот значений

двух или больше переменных в одну таблицу. Она объясняет, как одна переменная, например

лояльность торговой марке, связана с другой переменной, такой как пол. В таблицах сопря-

женности признаков показывается совместное распределение значений двух или больше пере-

менных, обладающих ограниченным числом категорий или принимающих определенные зна-

чения. Категории одной переменной помешают в таблицу так, чтобы они размещались в ней

(сопрягались) в соответствии с категориями другой или другими несколькими переменными.

Таким образом, распределение частот одной переменной подразделяется на группы в зависи-

мости от категорий других переменных.

Предположим, нас интересует, действительно ли использование Internet связано с полом.

Чтобы построить таблицу сопряженности признаков, респондентов разделили в зависимости

от того, сколько времени они пользуются сетью. Пользующихся Internet пять часов и меньше

отнесли к мало пользующимся, а остальных — ко много, Итог процедуры кросс-табуляции

приведен в табл. 15.3.

1 Таблица 15.3, Пол и использование Internet

Использование Internet

Мало(1)

Много (2)

Итого

Мужчины

Пол

Женщины

Итого

Кросс-табуляция предусматривает создание ячейки для каждой комбинации категорий

двух переменных. Число в каждой ячейке показывает количество респондентов, давших эту

комбинацию ответов. В табл. 15.3 видим, что 10 респондентов, ответивших, что они мало ис-

пользуют Internet — женщины. Итоговые значения таблицы показывают, что из 30 респонден-

тов с достоверными ответами по обеим переменным 15 человек ответили, что они мало ис-

пользуют Internet, a 15 — много. Что касается пола, то 15 респондентов оказались женщинами,

а 15 — мужчинами. Обратите внимание, что эту информацию можно было бы получить из от-

дельного распределения частот для каждой переменной. Таблицы кросс-табуляции также на-

зывают таблицами сопряженности признаков (contingency tables).

Таблицы сопряженности признаков (contingency tables)

Таблица кросс-табуляции состоит из ячеек, в которых приведены комбинации категорий

двух переменных.

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 569

Рассматриваемые данные должны быть качественными или категориальными, по-

скольку предполагается, что каждая переменная должна измеряться только по номиналь-

ной шкале [7].

Таблицами сопряженности широко пользуются при проведении прикладных маркетинго-

вых исследований, поскольку

• менеджеры, которые недостаточно владеют статистическими методами, легко интерпре-

тируют и понимают процедуру кросс-табуляции и ее результаты;

• очевидность трактовки результатов анализа ясно свидетельствует о возможных управ-

ленческих действиях;

• ряд операций кросс-табуляции позволяет лучше понять сложное явление, чем это сде-

лал бы один многовариантный анализ;

• кросс-табуляция облегчает проблему разбросанных ячеек, которая затрудняет дискрет-

ный много вариантный анализ;

• анализ методом кросс-табуляции прост для выполнения и поэтому обращен к исследо-

вателям, менее искушенным в вопросах статистики [8].

Мы рассмотрим построение таблиц сопряженности для двух и трех переменных.

Две переменные

Кросс-табуляцию с двумя переменными можно рассматривать как двумерную. Сначала

рассмотрим кросс-табуляцию данных, касающихся пола и использования Internet, представ-

ленную в табл. 15.3. Связано ли использование Internet с полом? Это можно выяснить из

табл. 15.3. Мы видим, что непропорционально большое количество респондентов, проводя-

ших много времени в Internet, — мужчины. Лучше понять этот вопрос поможет процентное

вычисление.

Исходя из того, что обе переменные подвергаются процедуре кросс-табуляции, мы можем

посчитать проценты применительно к колонке (табл. 15.4) либо к строке (табл, 15.5).




Поделиться с друзьями:


Дата добавления: 2015-05-09; Просмотров: 375; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.008 сек.