КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Коэффициент взаимной сопряженности Чупрова
Пример 2. Пример 1. Раздел II Анализ силы связи порядковых и категориальных переменных
Количественные (или номинальные) переменные – переменные, выражающиеся в числах в определенных единицах измерения. Категориальные переменные – это переменные, принимающие конечное число значений, состоящих из категорий, которые неупорядочены относительно друг друга. Чаще всего выражаются не в числах. Например: цвет, уровень образования, страна, фамилия. Порядковые переменные – это категориальные переменные, для которых определено отношение порядка, т.е. они ранжированы относительно друг друга. Например: оценка успеваемости, номер места на соревнованиях или группы людей по возрастам. В исследовании социально-экономических явлений часто возникает необходимость оценить силу связи между категориальными и порядковыми переменными. Коэффициент корреляции Пирсона, который считали ранее, не подходит, он не показывает реального состояния. Необходимо использовать другие коэффициенты связи. Пример: Пусть у нас имеется лекарство и мы хотим проверить есть ли связь между приемом этого лекарства и состояния больного.
Всех больных случайным образом делят на 2 группы. 1-ю группу лечат новым препаратом, а 2-ю группу лечат традиционными методами. Таким образом мы получаем 2 показателя: 1-ый показатель: проходил ли больной курс лечения новым препаратом. Х1: А – давали лекарство Ā – не давали Х2 – результат лечения. Х2: В – состояние улучшилось В – состояние ухудшилось Результаты этого опыта можно представить в таблице. n11 – число людей, которым давали лекарство и чье состояние улучшилось. n12 - число людей, которым давали лекарство и чье состояние ухудшилось. n01=n11+n21 n02=n12+n22 n10=n11+n12 N20=n21+n12 N=n11+n12+n21+n22 Задача состоит в том, чтобы по этим 4-м числам определить, связан ли результат лечения с приемом лекарства и как именно связан. Рассмотрим разные варианты. 1.Если между Х1 и Х2 нет никакой связи, лекарство бессмысленно. Тогда доля принимавших лекарство среди больных, чье состояние улучшилось должна быть равна доле принимавших лекарство среди тех, кому стало хуже и равна доле принимавших лекарство среди всех больных. Доля принимающих лекарство, чье состояние улучшилось=n11/n01 Доля принимающих лекарство, чье состояние ухудшилось=n12/n02 Доля принимавших лекарство среди всех участвующих в эксперименте=n11/n01+n12/n02=n10/N N11=(n11+n12)(n22+n21)/N – то связи нет! На равенстве долей и построена мера связи. За меру связи можно принять величину n11=…, но у этой величины значения могут быть и больше 1 и меньше 1 по модулюÞ ее необходимо модифицировать, чтобы сделать похожей на коэффициент корреляции. А именно ввести коэффициент Юла, равный D=(n11n22 - n12n21)/(n11n22+n12n21) Если D=0, то связи нет. Если связь сильная отрицательная, то коэффициент Юла D=-1 Если связь сильная положительная, то D=1 Замечание: Коэффициент Юла подходит, если рассматривается таблица 2*2. Т.е. определяется сила связи между 2-мя параметрами, каждый из которых принимает только 2 значения. Связь считается подтвержденной, если ׀D׀>0,5.
D=(n11n22-0)/(n11n22+0)=1, т.е. из нелечения Þухудшение состояния.
D=(0-n12n21)/(0+n12n21)=-1, т.е. из лечения Þухудшение самочувствия или если не лечили, то обязательно стало лучше. Однако часто в маркетинговых исследованиях приходится сталкиваться с ситуацией, когда 1 или оба признака принимают несколько значений. В этом случае рассчитать коэффициент Юла не получится и следует использовать другие коэффициенты. Примером таблиц n*m может служить анализ результатов выборок кандидатов в разных регионах страны. Тогда каждому региону сопоставляют столбец, а каждому кандидату – строку. В таблице стоят значения рейтинга кандидата в соответствующем регионе. Требуется установить связь между регионом и рейтингом в нем кандидатов. Рассмотрим различия статистики тесноты связи: 1. Фи – коэффициент. Его используют для таблиц 2*2. Фи=, где
- итоговое число в столбце - итоговое число в строке - полный размер выборки - соответствующее число в таблице Ф – коэффициент принимающий значение, равное 0, если связь присутствует, и 1, если связь сильная. Пример. Найти связь между использованием Интернета и полом.
==7,5 =7,5 =7,5
=7,5 Тогда Таким образом связь положительная, не очень сильная. Ф применяется только для таблиц 2*2, а коэффициент сопряженности С используется в таблице любого размера. С Î [0;1] Также используется V – коэффициент Крамера, который является модификацией. Для таблиц с r рядами , т.е. V – коэффициент подтверждает наличие слабой связи.
- коэффициент взаимной сопряженности. Чем ближе Кп к 1, тем теснее связь.
Дата добавления: 2013-12-13; Просмотров: 1899; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |