В настоящее время существует большое число различных числовых показателей, созданных для измерения степени и характера взаимосвязи двух переменных - коэффициентов связи. Пожалуй, наиболее известный из них - КОЭФФИЦИЕНТ ХИ-КВАДРАТ. Рассмотрим те идеи, которые лежат в основе вычисления коэффициента хи-квадрат.

Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Коэффициенты связи для номинальных переменных

Двумерные таблицы

Наиболее часто используемым инструментом проверки гипотез о взаимосвязи двух переменных являются таблицы сопряженности. Таблица является весьма простым и наглядным и вместе с тем эффективным инструментом анализа одновременно двух переменных. Таблица 2.1 представляет двумерную таблицу сопряженности для переменных Q12 и Q2 из исследования "Мониторинг социальных и экономических перемен в России". Данные по этим переменным получены из ответов на вопросы:

Q10 "Как бы Вы оценили в настоящее время материальное положение Вашей семьи?"

1. Хорошее, очень хорошее

2. Среднее

3. Плохое, очень плохое

4. Затрудняюсь ответить

Q12 "Как бы Вы оценили в целом политическую обстановку в России?"

1. Благополучная, спокойная

2. Напряженная

3. Критическая, взрывоопасная

4. Затрудняюсь ответить

Таблица 2.1

Таблица сопряженности для двух переменных

Q10 и Q12 (по данным исследования "Мониторинг")

 

 

 

 

 

 

 

 

    КАК БЫ ВЫ ОЦЕНИЛИ ЭКОНОМИЧЕСКОЕ ПОЛОЖЕНИЕ РОССИИ? Всего
1. Благополучная, спокойная
2. Напряженная 3. Критическая, взрывоопасная 4.Затрудн. ответить
КАК БЫ ВЫ ОЦЕНИЛИ В НАСТОЯЩЕЕ ВРЕМЯ МАТЕРИАЛЬНОЕ ПОЛОЖЕНИЕ ВАШЕЙ СЕМЬИ?
1.Хорошее, очень хорошее          
2.Среднее
         
3.Плохое, очень плохое
         
4.Затрудняюсь ответить
         
Всего
         

В клетках таблицы на пересечении соответствующих строк и столбцов находятся числа, показывающие, какое количество единиц анализа (в данном случае - респондентов) отметили одновременно данные градации по переменным Q10 и Q12. Так, на пересечении первой строки и второго столбца таблицы 2.1 стоит число 48. Это значит, что градацию 1 переменной Q10 (т.е. считают материальное положение своей семьи хорошим или очень хорошим) и градацию 2 переменной Q12 (т.е. считают политическую обстановку в России напряженной) одновременно отметили 48 человек.

Внизу таблицы сопряженности располагаются суммарные данные по всем колонкам, а с правого края таблицы - аналогичные суммы по всем строкам. Иными словами, сбоку справа и снизу находятся одномерные частотные распределения для переменных, использованных в таблице.

Можем ли мы, глядя на таблицу 2.1 сразу дать ответ на вопрос о наличии зависимости между переменными Q10 и Q12? По всей очевидности нет - стоящие в клетках таблицы числа ничего особенного не демонстрируют.

Если бы количество респондентов, имеющих различные значения переменной Q10, было бы одинаково, то в таблице 2.1 можно было бы сравнивать между собой строки и оценивать, насколько одинаковы значения в клетках, располагающихся в одной колонке. Однако количество респондентов по строкам сильно разнится, поэтому для возможности такого сравнения построим таблицу, в клетках которой находятся не абсолютные количества единиц анализа, а процент от сумм по строкам. Т.е. число респондентов в каждой строке берется за 100% и от этого числа считается процент в каждой клетке таблицы. Таким образом, мы как бы нормируем каждую строку таблицы и получаем возможность сравнения распределений по строкам (Таблица 2.2).

Таблица 2.2 показывает, что оценка политической ситуации в России значительно отличается у групп респондентов, по разному оценивающих материальное положение своей семьи, и, следовательно, имеется определенная зависимость между переменными Q10 и Q12.

Таблица 2.2

Таблица сопряженности переменных

Q10 и Q12, содержащая проценты по строкам

(по данным исследования "Мониторинг")

  КАК БЫ ВЫ ОЦЕНИЛИ ЭКОНОМИЧЕСКОЕ ПОЛОЖЕНИЕ РОССИИ? Всего
1.Благополучная, спокойная 2 Напряженная 3 Критическая, взрывоопасная 4 Затрудн. ответить
КАК БЫ ВЫ ОЦЕНИЛИ В НАСТОЯЩЕЕ ВРЕМЯ МАТЕРИАЛЬНОЕ ПОЛОЖЕНИЕ ВАШЕЙ СЕМЬИ? 1.Хорошее, очень хорошее 9,7% 38,7% 37,9% 13,7% 100,0%
2.Среднее 1,5% 36,7% 51,2% 10,6% 100,0%
3.Плохое, очень плохое 1,2% 16,8% 73,6% 8,5% 100,0%
4.Затрудняюсь ответить   21,4% 53,6% 25,0% 100,0%
Всего 1,8% 28,7% 59,4% 10,1% 100,0%

 

Важнейшим вопросом при анализе зависимостей между двумя переменными является вопрос о том, какую из переменных считать зависимой, т.е. подверженной влиянию, а какую - независимой, т.е. влияющей. В таблице 2.1 и в последующих рассуждениях по сути дела предполагалось, что оценка материального положения семьи является независимой переменной, иными словами она влияет на оценку политической ситуации, которая, следовательно, является зависимой переменной. Если же мы поменяем местами переменные в модели, и будем считать, что оценка политической ситуации оказывает влияние на оценку материального положения семьи, то целесообразно изменить таблицу и проводить нормирование не от сумм по строкам, а от сумм по колонкам. Таблица 2.3 построена именно таким образом, т.е. это опять данные таблицы 2.1, но нормированные по колонкам.

Таблица 2.3

Таблица сопряженности переменных

Q10 и Q12, содержащая проценты по колонкам

 

 

 

 

 

 

 

    КАК БЫ ВЫ ОЦЕНИЛИ ЭКОНОМИЧЕСКОЕ ПОЛОЖЕНИЕ РОССИИ? Всего
 
  1. Благополучная, спокойная 2. Напряженная 3. Критическая, взрывоопасная 4. Затрудн. ответить
КАК БЫ ВЫ ОЦЕНИЛИ В НАСТОЯЩЕЕ ВРЕМЯ МАТЕРИАЛЬНОЕ ПОЛОЖЕНИЕ ВАШЕЙ СЕМЬИ?
1.Хорошее, очень хорошее 27,9% 6,9% 3,3% 7,0% 5,2%
2. Среднее
46,5% 69,1% 46,6% 56,8% 54,1%
3.Плохое, очень плохое
25,6% 23,1% 49,1% 33,3% 39,6%
4.Затрудняюсь ответить
  ,9% 1,0% 2,9% 1,2%
Всего
100,0% 100,0% 100,0% 100,0% 100,0%

При анализе таблиц сопряженности крайне важно отдавать себе отчет, что мы, по сути дела, ищем наличие (или отсутствие) определенных статистических, но никак не причинно-следственных зависимостей. Вопрос о том, какая из переменных является причиной, т.е. оказывает влияние, а какая меняется вследствие этой причины, не может быть решен ни анализом таблиц, ни вообще каким-либо формально-статистическим методом.

Иллюстрацию этой мысли можно найти у О.Генри. В рассказе "Вождь краснокожих" главный герой предложил изящную модель для ответа на вопрос о том, почему дует ветер - потому, что деревья качаются. Если собрать данные о ветре и поведении деревьев во время ветра, то любой статистический метод покажет, что данные ни в коем случае не противоречат этой модели, что, видимо, и послужило Джиму основанием для столь глубокомысленного вывода.

 

Обработка данных на компьютере. Построение таблиц сопряженности в пакете программ SPSS осуществляется с помощью команды CROSSTABS

На рисунке 2.3 показано меню этой команды. В списке всех переменных необходимо выбрать те из них, значения которых будут идти по строкам таблиц (окно ROW(s)), и те, которые пойдут по колонкам (окно COLUMN(s)).

Выбранные в меню рисунка 2.3 переменные (q10 и q12) определяют те переменные, которые будут представлены в получаемой таблице, но не определяют того, каков же именно будет вид таблицы. То, какие характеристики будут присутствовать в задаваемой таблице, определяется в меню, которое вызывается нажатием клавиши Cells... Это меню представлено на рисунке 2.4.

Как видно из рисунка 2.4 меню CELLS содержит 8 окон, каждое из которых определяет параметр, который будет присутствовать в получаемой таблице сопряженности. Таким образом, если выбрать все предлагаемые параметры, то можно получить таблицу, в каждой из клеток которой будет 8 разных чисел.

В меню рисунка 2.4 видно, что все предлагаемые параметры разбиты на 3 группы.

1. Counts (значения);

2. Percentages (проценты);

3. Residuals (остатки).

Если в блоке «Counts» поставить галочку в окне «Observed», то мы получим таблицу, в клетках которой содержатся количества единиц анализа (то есть таблицу 2.1). Если в блоке «Percentage» выбрать окно «Row» (строка), то получим таблицу с процентами, нормированными по строкам (таблица 2.2). Если, наконец, выбрать окно «Column» (колонка), то получится таблица 2.3. Подчеркнем еще раз, что выбор окон в меню Cells команды CROSSTABS происходит исключительно исходя из решаемых задач. Можно выбрать любое количество окон.

 

<== предыдущая лекция | следующая лекция ==>
Диаграммы рассеяния | Коэффициент хи-квадрат
Поделиться с друзьями:


Дата добавления: 2014-01-07; Просмотров: 1137; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.026 сек.