Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Часть III. Сбор, подготовка и анализ данных 11 страница




наблюдаемым числом случаев в каждой категории и ожидаемым. Другие непараметричсские

методы проверки включают критерий серий и биномиальный тест.

Критерий серий (runs test)

Критерий случайности для дихотомической переменной.

Критерий серий (runs test) представляет собой критерий случайности для дихотомических

(двузначных) переменных. Эту проверку выполняют, определяя, действительно ли порядок

или последовательность, в которой получены наблюдения, случайны. Биномиальный критерий

(binomial test) также является критерием согласия для дихотомических переменных. Он прове-

ряет степень соответствия (согласия) числа наблюдений в каждой категории с числом наблю-

дений, ожидаемым в условиях конкретного биномиального распределения.

590 Часть III. Сбор, подготовка и анализ данных

Биномиальный критерий (binomial test)

Статистический критерий согласия для дихотомических переменных. Он проверяет степень

согласия наблюдаемого числа наблюдений в каждой категории с числом наблюдений, ожи-

даемым G условиях конкретного биномиального распределения.

Подробную информацию об этих критериях смотрите в литературе по статистике [21].

Две независимые выборки

Если необходимо сравнить различие в показателях центратьной тенденции двух генераль-

ных совокупностей, исходя из наблюдений из двух независимых выборок, а переменная изме-

рена на основании порядковой шкалы, то можно использовать {/-критерий Манна—Уитни

(Mann-Whitney £/-test) [22]. Этот критерий соответствует /-критерию двух независимых выбо-

рок, переменные которых выражены в интервальной шкале, когда предполагают, что диспер-

сии двух совокупностей равны.

При использовании {/-критерия Манна—Уитни две выборки объединяют и наблюдения

ранжируют в порядке возрастания. Тест-статистику U вычисляют как число повторений рангов

из одной выборки или группы 1, которое стоит впереди рангов из группы 2. Если выборки взя-

ты из одной совокупности, распределение рангов из двух групп в ранжированном перечне

должно быть случайным. Экстремальное значение (/-статистики свидетельствует о неслучай-

ном характере, указывая на неравенство двух групп. Для выборок размером меньше 30 вычис-

ляют точное значение уровня значимости для ^/-статистики, Для выборок большого размера U-

статистику преобразуют в нормально распределенную ^-статистику, которую можно скорректи-

ровать с учетом совпадений внутри рангов.

^/-критерий Манна-Уитни (Mann-Whitney (Atest)

Статистический критерий для переменной, измеренной с помощью порядковой шкалы, ко-

торый сравнивает различие в показателях положения двух совокупностей, исходя из на-

блюдений, взятых из двух независимых выборок.

Мы снова рассмотрим различие использования Internet мужчинами и женщинами, обра-

тившись к {/-критерию Манна—Уитни. Результаты приведены в табл. 15.17.

Таблица 15.17. {/-критерий Манна-Уитни

(/-критерий Манна-Уитни и W-критерий парных сравнений Уилкоксона

Зависимость степени использования Internet от пола

Пол Средний ранг Количество случаев

Мужчины 20,93 15

Женщины 10,07 15

Итого 30

U W z Откорректированная

вероятность р

31,000 151,00 - 3,406 0001

Примечание. U ~ тест-статистика Манна-Уитни,

W— W-статистика Уилкоксона,

i — U-статистика, преобразованная в нормально распределенную z-статистику.

Из данных таблицы обнаруживается значительное различие между двумя группами,

подкрепляющее изложенные результаты проверки двух независимых выборок с помощью

Г-критерия. Поскольку ранги присвоены в порядке возрастания наблюдений, то более высо-

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 591

кое среднее значение ранга для мужчин (20,93) свидетельствует, что они интенсивнее ис-

пользуют Internet по сравнению с женщинами (среднее значение ранга 10,7).

Исследователи часто хотят проверить различия в долях, полученных из анализа двух неза-

висимых выборок. В качестве альтернативы параметрической г-статистики можно использо-

вать процедуру кросс-табуляции, чтобы выполнить проверку с помощью критерия хи-

квадрат [23]. В этом случае имеем таблицу 2 x 2. Одну переменную используем для обозначе-

ния выборки, допустим, значение 1 — для выборки 1, а значение 2— для выборки 2. Другая

переменная будет интересующей нас двоичной переменной.

Два других непараметрических метода проверки независимых выборок— это медианный

критерий и критерий Колмогорова—Смирнова. Двухвыборочный медианный критерий (twosample

median test) определяет, действительно ли две группы взяты из совокупностей с одной и

той же медианой. Медианный критерий не такой мощный, как ^/-критерий Манна—Уитни,

поскольку он попросту использует показатель положения каждого наблюдения относительно

медианы, а не ранг каждого наблюдения.

Двухвыборочный медианный критерий (two-sample median test)

Непараметрический метод проверки, который определяет, действительно ли две группы

взяты из совокупностей с одной и той же медианой. Медианный критерий не такой мощ-

ный, как U-критерий Манна-Уитни.

Двухвыборочный критерий Колмогорова—Смирнова (Kolmogorov-Smirnov two-sample test)

проверяет, действительно ли две совокупности подчиняются одному и тому же закону распре-

деления. Он учитывает любые различия между двумя распределениями, включая медиану, ва-

риацию и асимметрию, о чем свидетельствует приведенный ниже пример.

Двухвыборочный критерий Колмогорова-Смирнова

(Kolmogorov-Smirnov two-sample test)

Непараметрический метод проверки, действительно ли две совокупности подчиняются од-

ному и тому же закону распределения. Этот критерий учитывает любые различия между

двумя распределениями, включая медиану, вариацию и асимметрию.

ПРИМЕР. Большой бизнес: так ли просто поменять стартегию?

Как руководители маркетинговых компаний и их клиенты — компании из списка Fortune

500— представляют себе роль маркетинговых исследований в изменении маркетинговой страте-

гии? Обнаружено, что руководители маркетинговых компаний, в отличие от своих клиентов, по-

ложительно смотрят на изменение стратегии и не склонны откладывать начало изменений. Вы-

раженные в процентах ответы на один из пунктов опроса "Должны ли вноситься изменения в

маркетинговую стратегию фирмы при первой возможности" приведен ниже. С помощью крите-

рия Колмогорова—Смирнова показано (в таблице), что различия в определении роли маркетин-

I говых исследований статистически значимы при уровне значимости 0,05 [24].

; Роль маркетингового исследования в выработке стратегии

Ответы (%)

Выборка п Должны Предпочтитель И могут, и не Предпочтитель Абсолютно не

обязательно но должны могут но не должны должны

D 77 7 26 43 19 5

U 68 2 15 32 35 16

Уровень значимости К - С = 0,05

'D — руководители маркетинговых компаний; U — клиенты маркетинговых компаний.

592 Часть III. Сбор, подготовка и анализ данных

В этом примере руководители маркетинговых компаний и их клиенты представляют две

независимые выборки. Однако выборки не всегда независимые. В случае парных выборок сле-

дует использовать другой набор критериев.

Парные выборки

Важным непараметрическим критерием для изучения различий в показателях центральной

тенденции двух генеральных совокупностей на основе парных наблюдений является критерий по-

парных сравнений Уилкоксона (Wilcoxon matched-pairs signed-ranks test). С его помощью анализи-

руется величина разностей между парными наблюдениями. В этом методе вычисляют разности

между парами переменных и ранжируют абсолютные значения разностей. На следующем этапе

суммируют положительные и отрицательные ранги. Далее на основании положительных и отри-

цательных сумм рангов рассчитывают г-статистику. В соответствии с нулевой гипотезой, утвер-

ждающей об отсутствие различий, z представляет собой случайную величину, распределенную по

нормальному закону, со значением медианы, равным 0, и дисперсией 1 для больших выборок.

Критерий Уилкоксона соответствует рассмотренному ранее парному f-критерию [25].

Критерий попарных сравнений Уилкоксона (Wilcoxon matched-pairs signed-ranks test).

Непараметрический метод проверки, посредством которого анализируют разности между

парными наблюдениями, учитывая их величину.

Рассмотрим еще раз пример, приведенный для парного /-критерия и касающийся наличия

различий в отношении респондентов к Internet и Internet-технологиям. Допустим, что обе эти

переменные измерены с помощью порядковой шкалы, а не интервальной. В соответствии с

этим используем критерий Уилкоксона. Результаты приведены в табл. 15.18.

ннм^^^^^^^н^^мн^^^^^^^^^^^^^^ВМН^^^^^^^^^Н^Н Таблица 15.18. Критерий попарных сравнений Уилкоксона

internet с Internet-технологиями

(Internet-технологии - internet} Число случаев Средний ранг

- Ранги

+- Ранги

Совпадающие ранги

Итого

г = -4,207

12,72

7,50

Вероятность для двусторонней проверки р= 0,0000

Здесь снова выявлено различие в переменных, и результаты согласуются с выводами, сде-

ланными на основании парного /-критерия. В данном случае мы имеем 23 отрицательные раз-

ности (респонденты лучше относятся к Internet, чем к Internet-технологиям). Средний ранг их

равен 12,72. С другой стороны, есть только одна положительная разность (один респондент

лучше относится к Internet-технологиям, чем к Internet). Средний ранг этой разности равен

7,50. Кроме того, есть 6 совпадающих рангов, т.е. 6 одинаковых значений обеих переменных.

Эти числа показывают, что респонденты лучше относятся к Internet, чем к Internet-

технологиям. Кроме того, вероятность соответствующей ^-статистики меньше, чем 0,05, свиде-

тельствует о том что различие в отношениях действительно значимое.

Критерий знаков (sign test)

Непараметрический критерий для изучения разностей в показателях центральной тенденции

двух генеральных совокупностей на основе парных наблюдений, который только сравнивает

знаки разностей между парами переменных, но не учитывает величину разностей.

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 593

Другой непараметрический метод парной проверки — критерий знаков (sign test) [26]. Он не

такой мощный, как критерий Уилкоксона, поскольку только сравнивает знаки разностей меж-

ду парами переменных, не учитывая величину разностей.

В особом случае двоичной переменной, когда исследователь желает проверить разности в

долях, можно использовать критерий Мак-Немара. В противном случае можно использовать

критерий хи-квадрат. Различные параметрические и непараметрические критерии для разли-

чий обобщены в табл. 15.19.

Таблица 15.19. Проверка гипотез о различиях: итог

Выборка Применение Шкала измерения Критерий/Комментарии

Одна выборка

Одна выборка Распределения Неметрическая Критерии согласия Колмогорова-Смирнова и хи-

квадрат

Критерий серий

Биномиальный тест согласия для дихотомиче-

ских переменных

Одна выборка Средние

Одна выборка Доли

Две независимые выборки

Две независимые выборки Распределения

Две независимые выборки Средние

Две независимые выборки Доли

Две независимые выборки Ранги/Медианы

Парные выборки

Парные выборки Средние

Парные выборки Доли

Парные выборки Ранги/Медианы

Метрическая

Метрическая

Неметрическая

Метрическая

Метрическая

Неметрическая

Неметрическая

Метрическая

Неметрическая

Неметрическая

(-критерий, если дисперсия неизвестна

z-критерий, если дисперсия известна

z -критерий

Двухвыборочный критерий Колмогорова-

Смирнова для проверки эквивалентности двух

распределений

Двугрупповой (-критерий

F-критерий для равенства дисперсий

z-критерий

критерий хи-квадрат

f-критерий Манна-Уитни более мощный, чем

медианный критерий

Парный (-критерий

Критерий Мак-Немара для двоичных перемен-

ных. Критерий хи-квадрат

Критерий попарных сравнений Уилкоксона более

мощный, чем критерий знаков

Критерии в табл. 15.19 легко соотнести с представленными на рис. 15.9. Табл. 15.19 делит

критерии для распределений и для рангов/медиан. Врезка 15.1 "Практика маркетинговых ис-

следований" показывает использование проверки гипотез в стратегии международного брэн-

динга, в то время как врезка 15.2 "Практика маркетинговых исследований" излагает использо-

вание описательных статистик в исследованиях по этике.

Врезка 15.1. Практика маркетинговых исследований

Стратегия международного брэндинга

С 1990-х годов наблюдается тенденция к глобальному маркетингу. Как можно продавать

фирменный товар за границей, учитывая многообразие исторических и культурных тради-

ций? По словам Боба Кролла (Bob Kroll), бывшего президента компании Del Monte

594 Часть III. Сбор, подготовка и анализ данных

International ', преимуществом может стать унифицированная упаковка, также важно удовле-

творение кулинарных вкусовых предпочтений в каждой стране. Эту мысль проясняет одно

из последних международных маркетинговых исследований. В настоящее время руководи-

тели маркетинговых компаний считают, что лучше мыслить глобально, а действовать — ло-

кально. В число респондентов вошли 100 менеджеров по управлению продуктом и сотруд-

ники маркетинговых служб из некоторых наиболее крупных пищевых, фармацевтических и

других компаний США. 39% ответили, что использование унифицированной упаковки на

зарубежных рынках — неудачная идея, а 38% поддержали ее. Однако те, кто были за то, что-

бы упаковка разрабатывалась для каждой страны, пожелали, чтобы упаковка все-таки была

как можно ближе к своему оригиналу, независимо от страны, где продается данный товар.

Но они также считали необходимым, чтобы упаковка товара соответствовала языковым осо-

бенностям и требованиям различных рынков. Исходя из этих положений, подходящим по-

исковым вопросом такого исследования мог стать следующий: "Предпочитают ли потреби-

тели в разных странах покупать товары фирм с известной всему миру товарной маркой в раз-

личной упаковке, соответствующей местным требованиям?" На основании такого

поискового вопроса выдвинем гипотезу о том (при всех других равных условиях), что пред-

ложение фирменного товара в специально разработанной упаковке может увеличить его до-

лю рынка. Гипотезу можно сформулировать так:

Я0: Для хорошо известного фирменного товара доработанная для местных рынков упа-

ковка не увеличит долю на международном рынке.

//,: При равных прочих условиях для хорошо известного фирменного товара доработан-

ная для местных рынков упаковка увеличит долю на международном рынке.

Для проверки нулевой гипотезы в качестве хорошо известного фирменного товара можно

выбрать зубную пасту фирмы Colgate, которая придерживалась смешанной стратегии. Долю

рынка в странах со стандартной упаковкой можно сравнить с долей рынка в странах с дора-

ботанной для местных рынков упаковкой при контроле влияния других факторов. Можно

использовать /-критерий для двух независимых выборок [28].

Врезка 15.2. Практика маркетинговых исследований

Недоверие, подтвержденное статистически

Описательные статистики указывают на то, что общественное восприятие этики в бизне-

се и, таким образом, этики в маркетинге, слабое. В опросе, проведенном Business Week, 46%

респондентов ответили, что только этические принципы руководителей компаний справед-

ливы. Опрос журнала Time показал, что 76% американцев считают, что менеджерам компа-

ний (и, таким образом, исследователям) не хватает этики поведения, и это отсутствие мора-

ли снижает нравственные стандарты в Соединенных Штатах Америки. Результаты исследо-

вания бизнесменов, проведенные Туше Росс (louche Ross), показали, что мораль является

серьезным вопросом и предположение масс-медиа об отсутствии морали в бизнес-кругах не

преувеличено [29].

ИСПОЛЬЗОВАНИЕ INTERNET И КОМПЬЮТЕРА

Все три стандартных статистических пакета (SPSS, SAS, BMDP) имеют схожие функ-

ции для вычисления распределения частот, построения таблиц сопряженности признаков

и проверки гипотезы. Основные программы для вычисления распределения частот сле-

дующие: FREQUENCIES (SPSS), UNIVARIATE (SAS) и 2D (BMDP). Другие программы

определяют только распределение частот (FREQ в SAS, 4D в BMDP) или только некото-

рые статистики [27].

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 595

Компьютерные программы для анализа распределения частот

SPSS

Основная программа в SPSS — FREQUENCIES. С ее помощью строится таблица значе-

ний частот, частостей и накопленных частостей для значений каждой переменной. Она про-

водит расчет всех необходимых статистик, за исключением коэффициента вариации. Если

данные интервальные и требуется определить только итоговые статистики, то можно ис-

пользовать процедуру DESCRIPTIVES. Все статистики, которые вычисляют с помощью

DESCRIPTIVES, доступны и в FREQUENCIES. Однако DESCRIPTIVES эффективнее, по-

скольку она не сортирует значения в таблице частот. Дополнительная программа MEANS

вычисляет среднее значение и стандартное отклонение для зависимой переменной в под-

группах случаев, определяемых независимыми переменными.

SAS

Основная программа в SAS — UNIVARIATE. В дополнение к определению таблицы час-

тот, эта программа позволяет вычислить все необходимые статистики. Другая доступная

процедура — FREQ, Для одномерного распределения частот FREQ не дает ни одной необ-

ходимой статистики. Для определения итоговых статистик используются такие процедуры,

как MEANS, SUMMARY и TABULATE. Следует отметить, что FREQ недоступна в качестве

независимой программы в микрокомпьютерной версии,

BMDP

Главная процедура в BMDP — 2D, она позволяет определять распределение частот и все

ассоциированные статистики, за исключением коэффициента вариации. С помощью ID

можно вычислить итоговые статистики для интервальных данных, но нельзя вычислить

распределение частот. 4D вычисляет распределение частот для метрических и неметрических

данных, но не позволяет вычислить итоговые статистики.

Minitab

Главная функция — Stats1^Descriptive Statistics. Выходные величины включают среднее,

медиану, стандартное отклонение, минимум, максимум и квартили. Гистограмму можно

получить при выборе опции Graph^Histogram.

Excel

С помощью функции ToolsOData Analysis (Инструменты"=> Анализ данных) вычисля-

ют дескриптивные статистики. Можно определить среднее, стандартную ошибку, медиа-

ну, моду, стандартное отклонение, дисперсию, эксцесс, асимметрию, размах, минимум,

максимум, сумму и доверительный интервал. Частоты можно отобразитьть с помошью

гистограммы.

Основные программы для построения таблиц сопряженности признаков— CROSSTABS

(SPSS), FREQ (SAS) и 4F (BMDP). Все они могут строить таблицы сопряженности и вычис-

лять данные для ячеек, проценты для категорий в рядах и колонках, высчитывать критерий хи-

квадрат для определения уровня значимости и все рассмотренные показатели силы связи. Про-

грамму TABULATE (SAS) также можно использовать для получения данных для ячеек, про-

центов рядов и колонок, хотя она не вычисляет ни одной ассоциированной статистики. В про-

грамме Minitab таблицы сопряженности и критерий хи-квадрат вычисляют с помощью функ-

ции Stats'*Tables. Каждую из этих характеристик можно выбрать с помощью функции Tables.

Функция Data1^Pivot Table выполняет построение таблиц сопряженности в программе Excel.

Для дополнительного анализа необходимы такие функции: максимум, минимум, среднее или

стандартное отклонение. Расчеты можно провести также на основе других ячеек. Для ChiTest

можно воспользоваться функцией Insert^Function^Statistical^ChiTest.

596 Часть III. Сбор, подготовка и анализ данных

Основная программа для выполнения проверки с помошью (-критерия в SPSS — T-TEST.

Она_с помощью /-критерия проверяет как независимые, так и парные выборки. Все рассмот-

ренные выше непараметрические методы проверки выполняются с помощью программы

NPAR. В SAS используется T-TEST. Непараметрические методы проверки выполняются

программой NPAR1WAY, которая проверяет гипотезу для двух независимых выборок (с по-

мощью критерия Манна—Уитни, медианого критерия и критерия Колмогорова—Смирнова),

а также вычисляет критерий Уилкоксона для парных выборок. Параметрический метод про-

верки с помощью /-критерия можно выполнить в BMDP, используя программы 3D, а непа-

раметрическую проверку с помощью того же критерия — с использованием программы 3S.

Параметрические критерии, доступные в Minitab с помощью функции descriptive stat, сле-

дующие: ^-критерий для средних, /-критерий для средних и двухвыборочный /-критерий.

Непараметрические критерии доступны с помощью функции Stat^Time Series. Они вклю-

чают следующие категории: од но выборочный знаков, Уилкоксона, Манна—Уитни, Круска-

ла-Уэллиса, медианный, Фридмана, серий и попарных разностей. Доступные параметриче-

ские критерии в Excel и других электронных таблицах включают /-критерий: парных выбо-

рок для средних; г-критерий: две независимые выборки, предполагающие равные

дисперсии; /-критерий: две независимые выборки при допущении неравенства дисперсий;

^-критерий: две выборки для средних и F-критерий для дисперсий двух выборок. Непара-

метрических критериев здесь нет.

! В центре внимания Burke

Основной инструмент, используемый большинством исследователей для анализа дан-

| ных, — построение таблиц сопряженности признаков (кросс-табуляция). Она позволяет

окинуть быстрым взглядом распределение ответов и выявить проблемы с данными. Однако

она может ввести в заблуждение, если не предпринять определенных мер.

Рассмотрим такой пример. Корпорация Burke завершила исследование, представляющее

большой интерес для клиента. Результаты таблиц Burke отличались от недавних результатов

другой маркетинговой компании. Для разбора этого примера используем иллюстративные

данные (фактические данные — частная собственность компании).

Это исследование проводилось среди небольших компаний (с количеством работающих

меньше 20 человек) относительно использования ими кадровых агентств как источника

приема временных рабочих. Взята выборка в 100 фирм с одним работником, а также в 100

фирм с количеством работающих от 2 до 19 человек, Создана следующая таблица,

Это тип таблицы привычен для обычного клиента. Получается, что 52% фирм исполь-

зуют помощь кадровых агентств для привлечения временных рабочих Информационный

центр корпорации Burke имел данные переписи населения, показывающие, что в генераль-

ной совокупности имелось 9,2 миллиона фирм с одним работником и только 2,5 миллиона

фирм с количеством работающих от 2 до 20 человек. Взвешенная общая колонка должна вы-

глядеть следующим образом.

Количество постоянных работников, t

Использовали агентство? База

Да

Нет

= 1

40%

60%

От 2 до 19

65%

35%

Итого

52%

48%

Репрезентативная выборка должна включать 157 фирм с одним работником и 43 фирмы

от 2 до 20 человек.

Тогда веса для формирования общей колонки равны 1,57 и 0,43 соответственно.

Правильная таблица должна имеет следующий вид:

Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 597

Количество постоянных работников, t

= 1 От 2 до 19 Взвешенный итог

Использовали агентство? База 100 100 200

Да 40 65 91

40% 65% 45%

Нет 60 35 109

60% 35%

% выборочной совокупности (выборки) —1 работник = 0,79

% выборочной совокупности (выборки) — от 2 до 20 работников = 0,21

Теперь клиенту сказали, что 45% (а не 52%) компаний с количеством работников мень-

ше 20 человек используют кадровые агентства для приема временных работников. Может

показаться, что это незначительное изменение, но когда клиент увидел последнюю таблицу,

он принял решение о перестройке своего бизнеса. Никогда не формируйте итоговую колон-

ку в таблицах, не рассмотрев истинное распределение в генеральной совокупности.

РЕЗЮМЕ

Базовый анализ данных позволяет глубже проникнуть в суть явления и является основой как для

выполнения последующего анализа, так и для интерпретации данных. Для каждой переменной не-

обходимо получить распределение частот признаков (вариационный ряд). Результаты анализа отра-

жены в таблицах частот, частостей и накопленных частот для всех значений переменной. Они по-

казывают наличие выбросов, пропущенных или экстремальных значений. Показатели центра рас-

пределения— среднее арифметическое, медиана и мода. Вариация распределения признаков

описывается размахом, дисперсией, стандартным отклонением, коэффициентом вариации и меж-

квартильным размахом. Форму кривой распределения определяют асимметрия и эксцесс.

Кросс-табуляция представляет собой процедуру создания таблиц сопряженности призна-

ков, которые отражают совместное распределение значений двух или больше переменных.

В кросс-табуляции проценты вычисляем по колонкам (к итоговой колонке) или по рядам

(к итоговому ряду). Общее правило — вычисление процентов в направлении независимой пе-

ременной через зависимую переменную.

Часто, чтобы лучше уяснить суть связи переменных, вводят третью переменную. Статистика

хи-квадрат позволяет проверить статистическую значимость наблюдаемой связи в таблице со-

пряженности. С помощью фи-коэффициента, коэффициента сопряженности, V -коэффициент

Крамера и коэффициента "лямбда" определяют силу связи между переменными.

Для проверки гипотез о различиях используют параметрические и непараметрические ме-

тоды. Из параметрических методов для проверки гипотезы относительно среднего совокупно-

сти используют /-критерий. Его различные типы подходят для проверки гипотезы, в основе ко-

торой лежит одна выборка, две независимые выборки или парные выборки. Из непараметри-

ческих методов популярны одновыборочные критерии, включающие критерий согласия

Колмогорова—Смирнова, критерий хи-квадрат, критерий серий и биномиальный критерий.

Для двух независимых непараметрических выборок можно использовать ^/-критерий Манна-

Уитни, медианный критерий и критерий Колмогорова—Смирнова. В случае парных выборок

для проверки гипотезы о показателе центра распределения полезны критерий попарных срав-

нений Уилкоксона и критерий знаков.

ОСНОВНЫЕ ТЕРМИНЫ И ПОНЯТИЯ

• /-критерий, критерий Фишера (/-test) • /-критерий (/-test)

• /"-распределение (/'-distribution) • /-распределение (/ -distribution)

• /"-статистика (/"-statistic)

598 Часть III. Сбор, подготовка и анализ данных

• {/-критерий Манна-Уитни (Mann-

Whitney U-test)

• К-коэффициент Крамера (Cramer's V)

• г-статистики (г -test)

• альтернативная гипотеза (alternative

hypothesis)

• асимметричная "лямбда" (asymmetric

lambda)

• асимметрия (skewness)

• биномиальный критерий (binomial test)

• вариационный ряд, распределение частот

(frequency distribution)

• выборочная (наблюдаемая) статистика,

статистика критерия (test statistic)

• гамма (gamma)

• двусторонний критерий (two-tailed test)

• двухвыборочный критерий согласия

Колмогорова—Смирнова (Kolmogorov—

Smirnov two-sample test)

• двухвыборочный медианный критерий

(two-sample median test)

• дисперсия (variance)

• коэффициент вариации (coefficient of




Поделиться с друзьями:


Дата добавления: 2015-05-09; Просмотров: 434; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.198 сек.