Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Общий вид линейных регрессионных уравнений с номинальными переменными. Их интерпретация




 

Итак, предположим, что у нас имеется некоторые номинальные признаки Y (зависимый; пока, до обсуждения некоторых вопросов, связанных с интерпретацией результатов регрессионного анализа, будем считать этот признак номинальным) и Х1, Х2,..., Хn (независимые). Пусть Y принимает k значений, а каждый признак Хi - li значений. Предположим также, что осуществлена дихотомизация исходных данных, в результате чего независимый признак “превращен” в дихотомические признаки Y1, Y2,..., Yk, а каждый признак Хi - в дихотомические , ,..., . Будем полагать, что в качестве “отбрасываемого признака фигурирует последний признак из каждого только что приведенного набора. Применение техники номинального регрессионного анализа к такого рода данным означат расчет k уравнений вида:

Y1 = f11, Х2,..., Хn) =

= f1(, ,..., , , ,..., ,..., , ,..., )

Y2 = f21, Х2,..., Хn) = f2(, ,..., , , ,..., ,..., , ,..., )

Yk = f k1, Х2,...,Хn) = fk (, ,..., , , ,..., ,..., , ,..., )

отвечают Х1 отвечают Х2 отвечают Хn

 

Не хотим далее “мучить” читателя индексами и поэтому все дальнейшие рассуждения будем вести в предположении, что рассматривается только одна градация зависимого признака с отвечающей ей дихотомической переменной Y и один принимающий три значения независимый признак Х с отвечающими ему дихотомическими переменными Х1, Х2, Х3. Надеемся, что необходимые обобщения читатель сделает самостоятельно.

Таким образом, будем полагать, что искомая зависимость имеет вид:

Y = f(Х1, Х2 ) = а 0 + а1 ´ Х 1+ а 2 ´ Х2 (11)

Например, предположим, что Y, Х 1, Х2 – это дихотомические переменные, отвечающие, соответственно, свойствам “быть торговцем”, “быть русским” и “быть грузином” (напомним, что дихотомическую переменную, отвечающую свойству “быть чукчей”, мы при построении уравнения отбрасываем). Процесс поиска подобной зависимости состоит в реализации техники линейного регрессионного анализа.

Коэффициенты уравнения регрессии, найденные по всем правилам классического регрессионного анализа, выражаются довольно сложными формулами, включающими в себя такие (вроде бы "запретные" для номинальных данных) статистики, как среднее арифметическое, дисперсия, частные коэффициенты корреляции и т.д., Однако, как мы уже упоминали, их оказывается возможным проинтерпретировать вполне разумным, понятным любому социологу, способом – как некоторые условные частоты. Опишем эту интерпретацию.

Сначала проинтерпретируем коэффициент а0 (свободный член уравнения (5)). В силу самой сути уравнения регрессии, подставив в него произвольные значения независимых переменных Х 1, Х2, слева от знака равенства мы получим среднее значение Y, которое отвечает совокупности респондентов с рассматриваемыми значениями предикторов. Рассмотрим только тех людей, которым соответствует отброшенная нами национальность, – чукчей. Ясно, что для них Х1 = Х2 = 0. Подставив эти значения в уравнение регрессии, получим соотношение

Y = а0

Таким образом, интерпретируемый коэффициент а 0 равен среднему арифметическому значению зависимой переменной для отброшенной категории респондентов, в данном случае – для чукчей. Если бы Y был интервальной переменной, то тем самым интерпретация свободного члена уравнения регрессии была бы окончена. Но наш Y – дихотомическая переменная, отвечающая свойству “быть торговцем”. В соответствии с описанной выше интерпретацией среднего арифметического значения дихотомического признака, смысл а 0 сводится к тому. Что это - доля чукчей, работающих торговцами (говоря формально – доля отброшенной категории респондентов, обладающих единичным значением зависимого признака).

Перейдем к интерпретации коэффициента а1 из уравнения (11). Рассмотрим только русских. Нетрудно видеть, что для них Х 1 = 1 и Х2 = 0. Подставим эти значения в уравнение. Получим соотношение:

Y = а0 + а1.

Учитывая осуществленную выше интерпретацию свободного члена уравнения, применительно к нашему примеру, можно сказать, что а1 – это тот “довесок”, который надо прибавить к доле чукчей, являющихся торговцами, чтобы получить долю русских, занимающихся этим делом. Аналогична интерпретация а2: это та величина, которую надо прибавить к доле торговцев среди чукчей, чтобы получить аналогичную долю среди грузин. Приведем пример.

Пусть уравнение, найденное с помощью линейного регрессионного анализа имеет вид:

Y = 0,3 – 0,1 Х1 + 0,6 Х2 (12)

Его коэффициенты можно интерпретировать как условные частоты: доля торговцев среди чукчей равна 0,3, среди русских – (0,3 + (- 0,1)) = 0,2, а среди грузин – (0.3 + 0,6) = 0,9.

Чтобы еще более стал ясен смысл коэффициентов уравнения регрессии, рассмотрим, во что это уравнение превращается в случае изучения двух дихотомических признаков. Приведем пример из [Типология и классификация..., 1982. С. 260 - 266]. Пусть Х - семейное положение (два значения: X1 – женат, X2 – неженат), Y – посещение кинотеатра (Y1 – посещает, Y2 – не посещает; здесь мы отвлекаемся от точного смысла этих слов: означает ли выражение “не посещает” то, что респондент никогда не ходил в кино, или же что он не был там в течение последних 5-ти лет и т.д.).

Пусть таблица сопряженности, отвечающая нашим признакам, имеет вид:

Таблица 29.

Общий вид четырехклеточной таблицы сопряженности

Y X Итого
X1 X2
Y1 a b a+b
Y2 c d c+d
Итого a+c b+d a+b+c+d

 

Найдем коэффициенты уравнения регрессии вида

Y = a + bХ.

В соответствии с нашими правилами, они равны:

(доля посещающих кинотеатр среди неженатых);

(тот “довесок”, который надо прибавить к доле посещающих кинотеатр среди неженатых, чтобы получить аналогичную долю среди женатых (последняя равна ).

Приведем соответствующий цифровой пример. Пусть конкретная матрица имеет вид:

Таблица 30.

Пример четырехклеточной таблицы сопряженности

Y X Итого
X1 X2
Y1      
Y2      
Итого      

 

Тогда верны соотношения:

Y = 0,76 + 0,2Х.

Нетрудно увидеть связь между номинальным регрессионным и детерминационным анализом. Действительно, в соответствии с последним, I(X2®Y1) = P(Y1/X2) = = a. В то же время I(X1®Y1) = P(Y1/X1) = и поэтому b = I(X1®Y1) – I(X2®Y1).

Итак, все коэффициенты рассматриваемого уравнения регрессии интерпретируются через некоторые условные частоты. Встает вопрос: надо ли использовать сложную технику регрессионного анализа для того, чтобы получить результаты, получаемые обычно социологом более простым путем (путем прямого расчета многомерных частотных таблиц)? Покажем, что такая постановка вопроса неправомерна: регрессионный анализ нельзя свести только к получению условных частот. Уравнение регрессии представляет собой систему, свойства которой не сводятся к свойствам отдельных составляющих ее элементов (коэффициентов найденного уравнения). Рассмотрим это обстоятельство подробнее.

 

33. Типы задач, решаемых с помощью Нра. Краткие сведения о логит- и пробит-моделях регрессионного анализа.

 




Поделиться с друзьями:


Дата добавления: 2015-04-23; Просмотров: 436; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.015 сек.