Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Сравнение эмпирического и равномерного распределений

Тема 8 Сравнение распределений

Использование критерия c2 позволяет ответить на вопрос: с одинаковой ли частотой встречаются разные значения признака в эмпирическом и теоретическом распределениях или в нескольких эмпирических распределениях. Этот критерий можно применять, если были зафиксированы частоты встречаемости признака. Алгоритм расчета c2 можно пояснить на приведенных ниже примерах.

Исследовался вопрос о предпочтении в группе студентов одного из 4 видов напитков (было предложено назвать только один предпочитаемый из четырех). Данные опроса были сведены в следующую таблицу.

 

Pepsi cola Coca cola Sprite Seven up
       

 

Можно ли сказать, что все эти напитки одинаково предпочитаемы, или один из них является более популярным? В принципе, из таблицы видно, что кока-кола имеет самый высокий рейтинг, а спрайт – самый низкий. Но насколько достоверно это различие? Для ответа на вопрос необходимо сравнить полученное эмпирическое распределение с теоретическим равномерным.

Решение задачи строится по следующему алгоритму.

1. Статистические гипотезы предлагается сформулировать следующим образом:

Н0: Распределение предпочтений различных напитков значимо не отличается от равномерного распределения.

Н1: Распределение предпочтений различных напитков значимо отличается от равномерного.

2. Для решения задачи необходимо подсчитать общее количество выборов.

 

Pepsi cola Coca cola Sprite Seven up Σ
         

 

3. Следующий этап – составление таблицы для вычисления эмпирического значения c2

Первый столбец (fэ) содержит значения полученных при опросе эмпирических частот. Во втором столбце (f т) представлены значения, которые получились бы, если бы предпочтения были распределены поровну. То есть во все ячейки заносятся значения полученные делением общего количества выборов на количество выбираемых напитков (38 / 4 = 9,5). Следующий столбец содержит разницу эмпирической и теоретической частот. Затем полученные разницы возводятся в квадрат, делятся на значения теоретических частот и суммируются.

 

f э f т f э- f т (f э- f т )2 (f э- f т ) 2/ f т
  9,5 0,5 0,25 0,03
  9,5 2,5 6,25 0,66
  9,5 -3,5 12,25 1,29
  9,5 -1,5 2,25 0,24
        c2 эмп =1,22

Таким образом, эмпирический показатель рассчитывается по формуле:

4. Определяется степень свободы. Для таблиц такого типа формула имеет вид:

df = c – 1, где c – это количество разрядов

В нашем случае df = 4 - 1 = 3.

5. При помощи таблицы критических значений сравниваем полученное эмпирическое значение с критическими.

 

df р = 0,1 р = 0,05 р = 0,01 р = 0,001
  4,605 5,992 9,211 13,817
  6,251 7,815 11,346 16,269
  7,779 9,488 13,278 18,470

 

Эмпирический показатель (c2 эмп = 1,22) в строке df = 3 находится левее значения 6,251. Это значит, что р-уровень результата находится левее уровня тенденции (р = 0,1). Таким образом, эмпирическое значение ниже критического при p ≤ 0,1:
c2эмп < c2кр (p ≤ 0,1) Þ Н0!. Таким образом, нам необходимо принять нулевую гипотезу, мы доказали отсутствие значимых различий между распределением предпочтений различных напитков и равномерным распределением.

<== предыдущая лекция | следующая лекция ==>
Вычисление ранговой корреляции по Кендаллу | Сравнение эмпирических распределений
Поделиться с друзьями:


Дата добавления: 2014-01-04; Просмотров: 466; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.014 сек.