Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Нелинейная регрессия

Применение фиктивных переменных в регрессионном анализе

В модели

Способы уменьшения (устранения) мультиколлинеарности

ЛЕКЦИЯ №5. НЕКОТОРЫЕ АСПЕКТЫ ПОСТРОЕНИЯ МОДЕЛЕЙ

МНОЖЕСТВЕННОЙ РЕГРЕССИИ

 

 

ПЛАН

 

5.1. Явление мультиколлинеарности. Признаки присутствия
мультиколлинеарности в модели

5.1. Явление мультиколлинеарности. Признаки присутствия
мультиколлинеарности в модели

 

Мультиколлинеарность – это коррелированность двух или нескольких объясняющих переменных в уравнении регрессии. Мультиколлинеарность означает наличие линейной зависимости между факторными признаками в модели. Линейная взаимосвязь между признаками может проявляться как в функциональной, так и в статистической формах.

Если между объясняющими переменными существует линейная функциональная связь, то ранг матрицы становится меньше числа оцениваемых по МНК параметров модели, т.е. , что нарушает условие 6 теоремы Гаусса-Маркова. В этом случае матрица будет иметь линейно зависимые столбцы, а ее определитель станет равным нулю. Следовательно, вычисление наилучшего вектора оценок по формуле (3.5) будет невозможным. Для устранения мультиколлинеарности такого вида следует исключить из модели ту объясняющую переменную, которая связана линейной зависимостью с другими объясняющими переменными.

Однако чаще всего линейная связь между объясняющими переменными носит статистический характер, что проявляется в значительной коррелированности факторных признаков. В этом случае вектор МНК-оценок формально может быть вычислен по формуле: , но определитель матрицы становится близок к нулю. Поскольку дисперсии оценок пропорциональны диагональным элементам обратной матрицы (см. формулы 4.6), то близость к нулю определителя матрицы может привести к резкому увеличению дисперсий . В результате появляются следующие признаки присутствия явления мультиколлинеарности в модели: оценки могут иметь большие стандартные ошибки, малую значимость, в то время как модель в целом остается значимой. Как следствие, МНК-оценки параметров модели становятся статистически неустойчивыми: небольшие изменения в исходных данных (например, урезание или добавление небольшой порции исходных данных) могут привести к значительному изменению значений оценок . При этом возможно как появление неверного знака у оценок , так и появление неожиданно больших (с точки зрения экономической теории) значений . В результате модель становится непригодной для анализа и прогнозирования.

 

5.2. Способы уменьшения (устранения)
мультиколлинеарности в модели

Одним из распространенных способов уменьшения (устранения) мультиколлинеарности в модели является отбор факторов в модель на основе анализа матрицы парных коэффициентов корреляции. Для этого используют матрицу парных коэффициентов корреляции:

Заметим, что эта матрица является симметричной, т.к. и , а на главной диагонали ее стоят единицы, т.к. .

Отбор факторов в модель на основе анализа матрицы парных коэффициентов корреляции осуществляется по следующему алгоритму: в модель включают только те факторы из , которые наиболее сильно связаны с зависимой переменной , но при этом слабо связаны с другими объясняющими переменными. При этом связь между объясняющими переменными считается сильной, если парный коэффициент корреляции между ними больше числа 0,8 по абсолютной величине.

Другим способом устранения (уменьшения) мультиколлинеарности является пошаговый отбор в модель наиболее информативных переменных. Суть его состоит в следующем. Пусть имеются признаки мультиколлинеарности в модели, содержащей набор объясняющих переменных . На первом шаге в модель вводят ту объясняющую переменную из , которая имеет с зависимой переменной максимальный коэффициент детерминации.

На втором шаге в модель включается новая объясняющая переменная, которая вместе с выбранной на первом шаге переменной составляет пару, имеющую с переменной наиболее высокий коэффициент детерминации. Таким образом, на втором шаге в модель отбирают двойку наиболее информативных объясняющих переменных.

На третьем шаге в модель отбирают тройку наиболее информативных переменных, включающую в себя результаты выбора на предыдущих шагах, и т.д.

Такие действия по включению новых переменных в модель следует повторять до тех пор, пока для отобранных переменных будет увеличиваться скорректированный коэффициент детерминации. Результирующая модель будет содержать набор наиболее информативных объясняющих переменных и иметь максимальный скорректированный коэффициент детерминации.

Рассмотренные выше способы устранения мультиколлинеарности могут дать разные наборы объясняющих переменных, которые следует включить в модель. Это объясняется тем, что такие пошаговые процедуры присоединения-удаления переменных гарантируют лишь получение близкого к оптимальному набора переменных, следовательно, получаемые с помощью разных пошаговых процедур наборы переменных не обязательно совпадают.

<== предыдущая лекция | следующая лекция ==>
Особливості харчування спортсменів в період відповідальних змагань | Применение фиктивных переменных в регрессионном анализе
Поделиться с друзьями:


Дата добавления: 2014-01-11; Просмотров: 436; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.009 сек.