Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Проблема мультиколлинеарности факторов в регрессионных моделях




Явление мультиколлинеарности в случае линейной модели регрессии – это нарушение одной из ее предпосылок, т.е. наличие линейной зависимости между факторами.

_______________________________________________________________________

Мультиколлинеарность – это высокая взаимная коррелированность объясняющих переменных.

_______________________________________________________________________

 

Мультиколлинеарность может проявляться в двух формах:

1) при функциональной / явной форме мультиколлинеарности по крайней мере одна из парных связей между объясняющими переменными являются линейной функциональной зависимостью.

2) стохастическая / скрытая форма в экономических исследованиях проявляется чаще, когда между двумя объясняющими переменными существует тесная корреляционная связь.

Для того, чтобы регрессионный анализ, основанный на МНК, давал наилучшие результаты, предполагается, что значения х не являются случайными величинами и что не коррелированы, т.е. каждая переменная содержит уникальную информацию о у, которая не содержит в других . Когда такая идеальная ситуация существует, то мультиколлинеарность отсутствует. Полная коллинеарность появляется в случае, если одна из может быть точно выражена в терминах другой переменной для всех элементов набора данных.

Причины мультиколлинеарности:

1) способ сбора данных и отбора переменных в модель без учета их смысла и природы (учета возможных взаимосвязей между ними). Например, при оценке влияния на размер жилья доходов семьи и размера семьи если мы соберем данные только среди семей большого размера и с высокими доходами и не включим в модель семьи малого размера и с небольшими доходами, то в результате получится модель с эффектом мультиколлинеарности. Решение проблемы – улучшение схемы выборки. В случае, если переменные взаимодополняют друг друга, подгонка выборки не поможет. Решением будет исключение одной из переменных;

2) высокая мощность переменной. Например, для изменения вида модели может быть введен дополнительный термин в модель, уже содержащую $

3) регрессоры, измеряющие примерно одно и то же: валютный курс на начало и на конец дня;

4) естественные соотношения между регрессорами: возраст, стаж и количество лет обучения.

Последствия мультиколлинеарности:

1) при проверке нулевой гипотезы о незначимости коэффициентов регрессии с помощью t-критерия в большинстве случаев она принимается, однако само уравнение регрессии по проверке с помощью F-критерия оказывается значимым, что говорит о завышенной оценке коэффициента регрессии; доверительные интервалы имеют слишком широкие границы;

2) полученные оценки параметров уравнения в основном неоправданно завышены или имеют неправильные знаки;

3) добавление или исключение из исходных данных 1-2 наблюдений оказывает сильное влияние на оценки коэффициентов;

4) наличие мультиколлинеарности в модели может сделать ее непригодной для дальнейшего применения.

Основная проблема мультиколлинеарности – обесценение дисперсии оценок коэффициентов регрессии. Для измерения эффекта мультиколлинеарности используется показатель VIF (variation inflation factor) – коэффициент вздутия дисперсии по сравнению с той дисперсией, которая была бы, если бы не имел коллинеарности с другими независимыми переменными в регрессии:

,

где – значение коэффициента множественной детерминации для регрессора на все остальные.

Например, значение VIF=6 означает, что дисперсия коэффициентов в 6 раз больше той, что должна была бы быть при полном отсутствии коллинеарности. Считается, что критическое значение составляет VIF=10 – слишком большая корреляция между факторами.

 

Пример.

для регрессии на остальные регрессоры

для регрессии

для регрессии

Есть ли мультиколлинеарность?

довольно плохо объясняется остальными переменными, переменная линейно независима.

Переменные линейно зависимы, высокий.

 




Поделиться с друзьями:


Дата добавления: 2015-05-26; Просмотров: 2913; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.013 сек.