Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Фиктивные переменные

Линейные уравнения регрессии с переменной структурой

 

При наличии качественных переменных имеем неоднородную структуру данных.

а) Построение разных (отдельных) моделей для каждого уровня качественной переменной.

б) Введение в уравнение регрессии качественных переменных. Они называются также фиктивными, номинальными, нечисловыми, структурными, “манекенами” (dummy variabls) и присвоение градациям этих переменных “цифровых меток”.

 

Возможные подходы при кодировке:

1. Введение булевых (бинарных, дихотомических переменных)

 

Например: “признак 1” – есть высшее образование;

“признак 2” – нет высшего образования.

 

Случай нескольких градаций качественного признака. Если качественный признак имеет несколько уровней.

 

Возможны два подхода:

 

1.Ввести дискретную переменную, имеющую столько же уровней, сколько признаков.

2.Ввести несколько бинарных переменных.

В примере с образованием (начальное, среднее, высшее): Х j = (1; 2; 3;)

Однако такие данные трудно содержательно интерпретировать.

Действительно, приписываемые цифровые метки (1; 2; 3;) никак не связаны ни с экспертными оценками, ни с закономерностями исследуемого объекта. Такое кодирование вносит в уравнение регрессии искусственные связи. В частности, качественный признак “образование” может оказаться на порядок более значимым (или менее значимым) по сравнению с другими факторами в зависимости от цифр кода.

Поэтому предпочтительнее способ 2, т.е. введение нескольких бинарных переменных.

Правило: Число бинарных переменных должно быть на 1 меньше, чем число градаций качественного признака.

 

Поясним это на примере с качественным признаком “образование”. Число градаций 3, значит достаточно ввести две бинарные переменные.

 

 

Если образование среднее, то автоматически оно не начальное.

Если начальное, то это отражено парой {Z1=0; Z2=0}.

Если ввести третью бинарную переменную

 

– возникает “логическая ловушка”.

 

Если сумма значений фиктивный переменных, включенных в регрессию, равна постоянному числу (например: 1) в любой i–ой строке, то качественный признак будет неразличим в уравнение регрессии, т.е. его оценка будет смешана со свободным членом.

 

Поясним это утверждение.

Пусть качественный признак отражен тремя градациями и, соответственно закодирован тремя бинарными (двоичными) переменными Z1, Z2, Z3.

Тогда их сумма равна:

Zi = Z1+ Z2+ Z3 Z3=1

в любой i – ой строке матрицы планирования Х. Возникает функциональная мультиколлинеарность, т.е. мультиколлинеарность состоит в линейной зависимости первого столбца для с вектор – столбцами для , а именно: первый столбец равен сумме столбцов для качественных переменных.

 

 

и метод наименьших квадратов неприменим.

 

Сложные модели с влиянием качественных переменных на параметры :

Замечание 3: Возможны смешанные уравнения регрессии с фиктивными переменными.

 

()

 

Пример:

- потребление продукта.

Х – доход

Z1 – сезонность (влияние на свободный член)

Z2 – уровень доходности домашнего хозяйства влияют на b 1 при Х (склонность к потреблению).

 

<== предыдущая лекция | следующая лекция ==>
Случай нелинейных координатных функций | Способ устранения коррелированности регрессоров с остатками с помощью инструментальных переменных
Поделиться с друзьями:


Дата добавления: 2014-01-05; Просмотров: 308; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.01 сек.