Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Понятие статистической гипотезы




Показатели формы распределения

Показатели формы распределения полезны для понимания природы распределения переменной. Форму распределения оценивают с помощью асимметрии и эксцесса.

Асимметрия. Распределение переменной может быть симметричным или асимметричным (скошенным). При симметричном распределении частоты любых двух значений переменной, которые расположены на одном и том же расстоянии от центра распределения, одинаковы. Равны между собой также и значения среднего арифметического, моды и медианы.

Распределение асимметрично (skewness), если значения переменной, равноудаленные от среднего, имеют разную частоту, т.е. одна ветвь распределения вытянута больше другой (рис.2).

Асимметрией, или коэффициентом асимметрии, называется числовая характеристика, определяемая выражением:

S =

 

где числитель — центральный момент третьего порядка.

 

— куб среднего квадратичного отклонения.

Для всех без исключения симметричных распределений нечётные центральные моменты равны 0, поэтому и коэффициент асимметрии для симметричных распределений равен нулю. Значение асимметрии для распределения данных табл.2 равно —0,094; что указывает на незначительную отрицательную асимметрию.

Эксцесс (kurtosis) — это показатель относительной крутости (островершинности или плосковершинности) кривой вариационного ряда по сравнению с нормальным распределением.

Эксцесс нормально распределенной случайной величины равен нулю. Если эксцесс положителен, то распределение более островершинно по сравнению с нормальным распределением. При отрицательном значении распределение более плосковершинно по сравнению с нормальным,

Значение этой статистики для табл. 2 равно —1,261; это указывает на то, что распределение более плосковершинное по сравнению с нормальным.

Эксцесс есть степень крутости эмпирического распределения по отношению к нормальному. Он определяется по формуле:

 

где числитель — центральный момент четвертого порядка

Для нормального закона. Отсюда следует, что для нормального закона. Смысл термина «эксцесс» состоит в том, что он показывает, как быстро уменьшается плотность распределения вблизи её максимального значения.

 

Базовый анализ данных включает в себя статистическую проверку гипотез. Примеры гипотез в маркетинговых исследованиях:

• Число постоянных покупателей универмага превышает 10% семей.

• Потребители определенной марки товара, которые отличаются между собой уровнем его потребления (много и мало), различаются также и психографическими характеристиками.

• Рассматриваемый отель имеет более высокий имидж, чем его ближайший конкурент,

• Чем лучше респондент знаком с рестораном, тем чаще он его посещает.

ОБЩАЯ СХЕМА ПРОВЕРКИ ГИПОТЕЗЫ

Для проверки гипотезы необходимо выполнить следующие этапы:

1. Сформулировать нулевую гипотезу Н0 и альтернативную гипотезу Н1

2. Выбрать подходящий метод статистической проверки гипотезы (статистический критерий) и соответствующую статистику критерия (выборочную статистику, тест-статистику).

3. Выбрать уровень значимости а.

4. Определить размер выборки и собрать данные. Вычислить значение выборочной статистики.

5. Определить вероятность, которую примет статистика критерия (выбранная на этапе 2) при выполнении нулевой гипотезы, используя соответствующее выборочное распределение. Альтернативный вариант данного этапа: определить критическое значение статистики, которое делит интервал на область принятия и непринятия нулевой гипотезы.

6. Сравнить полученную вероятность для тест-статистики (статистики, построенной по результатам выборочного наблюдения) с заданным уровнем значимости. Альтернативный вариант данного этапа: определить, попадает ли выборочное значение тест-статистики в область принятия или отклонения нулевой гипотезы.

7. Принять статистическое решение, касающееся того, принять или отвергнуть нулевую гипотезу.

8. Выразить статистическое решение с точки зрения проблемы маркетингового исследования.

На первом этапе маркетолог формулирует нулевую и альтернативную гипотезы. Нулевая гипотеза (null hypothesis) утверждает, что между определенными статистическими параметрами генеральной совокупности (средними или долями) не существует связи или различия. Ее подтверждение не требует от компании каких-либо действий.

Нулевая гипотеза (null hypothesis) - Предположение о том, что между определенными статистическими параметрами генеральной совокупности (средними или долями) не существует связи или различия. Ее подтверждение не требует от компании каких-либо действий.

Альтернативная гипотеза (alternative hypothesis) — это гипотеза, предполагающая, что между определенными статистическими параметрами генеральной совокупности (средними или долями) есть связь или различия. Ее подтверждение означает, что руководству компании следует предпринимать какие-либо действия или менять свои взгляды на положение дел. Таким образом, альтернативная гипотеза противоположна нулевой.

Маркетолог всегда проверяет именно нулевую гипотезу. Она имеет отношение к конкретному значению параметра совокупности, а не к выборочным статистикам (например, X). Проверка гипотез имеет два исхода: нулевая гипотеза отвергается, а альтернативная — принимается, или нулевая гипотеза не отклоняется, исходя из представленных доказательств. Следовательно, по результатам статистической проверки нулевую гипотезу не следует принимать, т.е. некорректно заключить, что, поскольку нулевую гипотезу не отклоняют, ее можно принять как истинную. В классической теории проверки гипотез сложно определить достоверность нулевой гипотезы.

В маркетинговых исследованиях нулевую гипотезу формулируют так, что ее непринятие ведет к желаемому заключению. Альтернативная гипотеза представляет заключение, для которого маркетологи ищут доказательство его справедливости. Например, руководство универмага хотело бы начать торговлю своими товарами через Internet. Новую услугу введут в действие, если свыше 40% пользователей Internet используют сеть для совершения покупок. Маркетолог записывает гипотезы следующим образом:

H0 :π>=0,40

H1: π > 0,40

Если нулевую гипотезу Н0 отклоняют, то принимают альтернативную гипотезу Н1, значит, стоит ввести новую услугу — приобретение товаров через Internet. С другой стороны, если нулевую гипотезу Н0 не отклоняют, то новую услугу не стоит внедрять до тех пор, пока не будет получено дополнительных доказательств для того, чтобы заняться Internet-торговлей.

В рассматриваемом случае для проверки гипотезы используют односторонний критерий (one-tailed test), так как альтернативная гипотеза имеет четко выраженное направление: доля пользователей Internet, которые используют его для приобретения товаров, больше 0,40.

С другой стороны, предположим, что исследователь хочет определить, действительно ли доля пользователей Internet, которая осуществляет покупки через сеть, отличается от 40%. Для этого использует двусторонний критерий (two-tailed test), а гипотезы запишем в следующем виде:

H0 :π = 0,40

H1: π = 0,40

Двусторонний критерий (two-tailed test) - критерий проверки нулевой гипотезы, когда альтернативная гипотеза не имеет четкой направленности.

В практике маркетинговых исследований односторонний критерий используют чаще, чем двусторонний. Обычно существует какое-либо предпочтительное направление изменения характеристик, подлежащее доказательству. Например, чем выше прибыль, объем продаж и качество продукта, тем это лучше для фирмы. Односторонний критерий сильнее двустороннего. Мощность статистического критерия обсуждается ниже, при рассмотрении этапа 3.

Этап 2. Выбор подходящего метода проверки

Для проверки нулевой гипотезы необходимо выбрать подходящий статистический метод (статистический критерий). Исследователь должен принимать во внимание саму процедуру вычисления выборочной статистики и характерное для нее выборочное распределение. Выборочная статистика критерия (test statistic) служит для того, чтобы можно было сделать вывод о том, насколько близко выборка соответствует нулевой гипотезе. Она часто подчиняется таким распространенным распределениям, как нормальное, Стьюдента (t-распределение) или хи-квадрат распределение.

В нашем примере наиболее приемлема z-статистика, которая имеет нормальное распределение. Она вычисляется по формуле:

 

Z=

 

Где =

Этап 3. Выбор уровня значимости

Какой бы вывод мы ни сделали в отношении изучаемой совокупности, всегда существует риск неверного заключения. При этом встречаются два типа ошибок. Ошибку I рода (Type I error) совершают, когда, исходя из результатов выборочного распределения, отклоняют нулевую гипотезу, в то время как она фактически верна. Также известная под названием альфа-ошибка. В нашем примере ошибка I рода имела бы место, если мы, исходя из данных выборки, установили бы, что доля потребителей, предпочитающих новый вид услуг, больше 0,40 (40%), в то время как фактически она была бы меньше либо равна 0,40. Вероятность ошибки I рода (а) также называют уровнем значимости (level of significance).

Вероятность ошибки первого рода устанавливается, исходя из допустимого уровня риска отклонения истинной нулевой гипотезы. Выбор уровня риска зависит от того, во сколько оценивается ошибка первого рода.

Ошибку II рода (Туре II error) совершают, когда, исходя из результатов выборки, не отклоняют нулевую гипотезу, которая в действительности является ошибочной. В нашем примере ошибка II рода имела бы место, если мы, исходя из данных выборки, установили бы, что доля потребителей, предпочитающих новый вид услуг, меньше или равна 0,40, в то время как фактически она была бы больше 0,40. Вероятность ошибки II рода обозначается β. В отличие от α, значение которой устанавливает сам исследователь, величина β зависит от фактического значения параметра генеральной совокупности (например, доли). Вероятность совершения ошибки I рода (α) и вероятность ошибки II рода (β) показаны на рис. 15.4. Вероятность (1 - р) совершения ошибки II рода также называют мощностью статистического критерия.

 

 

 

 

Ошибка II рода (Type I error) - Также известна под названием бета-ошибка, имеет место тогда, когда результаты выборки ведут к принятию нулевой гипотезы, которая фактически ошибочна. Мощность критерия (power of a test) представляет собой вероятность (1 — β) отклонения нулевой гипотезы, когда она неверна и должна быть отвергнута. Хотя величина β неизвестна, она связана с α. Чрезвычайно низкое значение ее (например, 0,001) приведет к недопустимо высокому значению р. Поэтому необходимо сбалансировать два типа ошибок. В качестве компромисса ее часто устанавливают равной 0,05; иногда ей присваивают значение 0,01; другие значения α встречаются редко. Уровень α, наряду с размером выборки, определяет уровень Р для конкретного исследовательского проекта. Риском а и р можно управлять, увеличив размер выборки. Для данного уровня значимости а увеличение размера выборки уменьшит значение Р, повысив тем самым мощность статистического критерия.

Этап 4. Сбор данных

Размер выборки определяют, приняв во внимание желаемые значения вероятностей совершения ошибок I и II рода и других количественных факторов, например финансовых ограничений. Затем собирают необходимые данные и вычисляют значение выборочной статистики. В нашем примере из 30 опрошенных пользователей Internet 17 отметили, что они приобретают товары через Internet. Таким образом, выборочная доля этих пользователей Internet составляет p = 17/30 = 0,567.

Значение можно определить по следующей формуле:

= = =0, 089

 

Выборочную статистику z можно вычислить по формуле:

z= =

Этап 5. Определение критического значения z-статистики

Используя таблицы нормального распределения (табл. 2 Приложения), можно вычислить вероятность получения значения z, равного 1,88 (рис. 15.5).

 

 

 

 

Площадь закрашенной области между ∞ и 1,88 равна 0,9699. Следовательно, площадь незакрашенной области справа от z=1,88 равна 1,0000— 0,9699 = 0,0301. Альтернативно, критическое значение z, которое отсекает область, имеющую площадь а = 0,05 и расположенную справа от критического значения, находится между 1,64 и 1,65 и равно 1,645. Обратите внимание, что при определении критического значения выборочной статистики область вправо от критического значения критерия равна либо а либо а/2. Это значение равно а для одностороннего критерия и а/2 — для двустороннего.

Этапы 6 и 7. Сравнение выборочного значения z-статистики с критическим значением и принятие решения.

Итак, маркетологи выяснили, что вероятность того, что вычисленная ими выборочная статистика больше 1,88, равна 0,0301. Это вероятность получения значения р, равного 0,567 при π=0,40. Это число меньше выбранного уровня значимости, равного 0,05. Следовательно, нулевая гипотеза отклоняется. Альтернативно исследователи могут поступить следующим образом. Они видят, что полученное значение z-статистики = 1,88 лежит в области отклонения нулевой гипотезы (в критической области), справа от значения 1,645. Поэтому снова можно сделать такой же вывод, т.е. отклонить нулевую гипотезу. Обратите внимание, что два способа проверки нулевой гипотезы эквивалентны по выводу, но математически отличаются направлением сравнения. Если вероятность получения вычисленного значения выборочной статистики (TSCM), меньше, чем уровень значимости (а), то нулевую гипотезу отклоняют. Справедливо и следующее утверждение: если вычисленное значение выборочной статистики больше, чем ее критическое значение (TSCR), то нулевую гипотезу также отклоняют. Причина этой перемены знаков в том, что чем больше значение TSCM, тем меньше вероятность получения высокого значения выборочной статистики при условии выполнения нулевой гипотезы. Запишем этот в следующем виде:

если вероятность TSCM < уровня значимости (α), то нулевую гипотезу отклоняют,

или

если TSCM > ТSCR, то нулевую гипотезу отклоняют.

Этап 8. Вывод с точки зрения маркетингового исследования

На основании результатов проверки статистической гипотезы следует сделать заключение с точки зрения стоящей перед нами проблемы маркетингового исследования. В нашем примеремы заключаем, что существует статистически значимое доказательство того, что доля пользователей Internet, которые приобретают товары через Internet, выше, чем 0,40. Следовательно, универмагу можно порекомендовать вводить новую услугу — приобретение товаров через Internet. Mаркетологи используют проверку статистической гипотезы как для проверки наличия связей между переменными, так и для проверки различий между параметрами генеральной совокупности.

 

 




Поделиться с друзьями:


Дата добавления: 2014-01-20; Просмотров: 564; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.042 сек.