Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Мультиколлинеарность

Под мультиколлинеарностью понимается высокая коррелированность между объясняющими переменными х. Она может проявляться в функциональной (явной) и стохастической (скрытой) формах. При функциональной форме мультиколлинеарности хотя бы одна из парных связей между переменными х называется линейной функциональной зависимостью. При скрытой форме между двумя объясняющими переменными существует сильная корреляционная связь.

При наличии мультиколлинеарности уравнения регрессии не имеют реального смысла. В этом случае параметры b0, b1,…, bp не значимы по t-критерию, хотя в целом модель может оказаться значимой по F-критерию.

Точных количественных критериев для определения наличия или отсутствия мультиколлинеарности не существует. Тем не менее, используются некоторые эвристические подходы по ее выявлению:

1. Анализ корреляционной зависимости между объясняющими переменными х1, х2, …, хp и выявление пар переменных, имеющих высокие коэффициенты корреляции (>0,8). Если такие переменные выявлены, то говорят о мультиколлинеарности между ними.

2. Определение множественных коэффициентов детерминации между одной из объясняющих переменных и некоторой их группой. Если множественные коэффициенты детерминации >0,6, то это свидетельствует о наличии мультиколлинеарности.

3. Исследования матрицы Х'X. Если определитель матрицы близок к 0, то это признак мультиколлинеарности.

Для устранения или уменьшения мультиколлинеарности используют ряд методов. Самый простой из них заключается в том, что из двух переменных х, между которыми имеется высокий коэффициент корреляции, одна переменная исключается из рассмотрения.

Какую из переменных убрать, а какую оставить, решают из экономических соображений.

Другой метод устранения мультиколлинеарности основан на переходе к смещенным оценкам, но такой метод более трудоемок.

Одним из возможных методов устранения или уменьшения мультиколлинеарности является пошаговая процедура отбора наиболее информативных переменных. На первом шаге рассматривается лишь одна переменная х, имеющая с у наибольший коэффициент детерминации. На втором шаге в регрессию включается новая объясняющая переменная и рассчитывается скорректированный коэффициент детерминации для у, х1, х2. На третьем шаге вводится еще одна переменная х и рассчитывается коэффициент детерминации уже для этого количества переменных. Процедура ввода новых переменных продолжается до тех пор, пока увеличивается коэффициент детерминации R2.

Пример. По данным 5 сельскохозяйственных районов исследуем зависимость урожайности зерновых культур у от ряда переменных: х1 – число тракторов, х2 – число комбайнов, х3 – число орудий для обработки почвы, х4 – количество удобрений, х5 – количество средств защиты растений. Все показатели рассчитаны на 1 гектар.

Таблица 6

Исходные данные

 

Проведем процедуру пошагового отбора переменных в модель множественной регрессии. Для этого необходимо составить таблицу парных коэффициентов корреляции между у и 5 переменными х и между самими переменных х. Коэффициенты корреляции будем рассчитывать по формуле:

 

 

Составим расчетную таблицу.

Таблица 7

 

Составим еще одну таблицу.

 

 


Таблица 8

 


Рассчитаем Sy:

1,67;

=0,59; =0,01; =0,794; =0,217; =0,183.

Рассчитаем r и сведем их в таблицу 9.

Таблица 9

 

= -0,5;

= -0,88;

= -0,45;

=0,008;

= -0,65;

-0,15;

0,31;

-0,146;

-0,31;

0,575;

-0,23;

0,03;

-0,87;

0,018;

0,313.

На первом шаге в модель включаются у и переменная х2, так как между ними самый высокий коэффициент корреляции.

Рассчитаем для этих переменных коэффициент:

= -0,88.

Коэффициент детерминации R2=0,774.

Среди возможных пар переменных выбираем ту пару, которая имеет с переменной у также наибольший коэффициент корреляции. Выбираем переменную х5 и рассчитываем множественный. Для нахождения определим коэффициенты b.

 

 

Рассчитав предварительно,, …, на основе данной системы построим матрицу:

 

Рассчитаем определитель данной матрицы:

Δ=6,915*10-5;

Δ1=0,00103;

Δ2= -0,00012;

Δ3=0,000321;

Δ4= -6,9*10-5;

Δ5= -0,000133;

Δ6= -0,00049.

Определим b:

b0=14,927;

b1= -1,754;

b2=4,636;

b3= -0,997;

b4= -1,919;

b5= -7,1.

= (-0,88)*4,636+(-0,65)*(-7,1) = 0,535.

Значит, уже на втором шаге значение R2 начало снижаться, значит, дальнейшее добавление переменных не имеет смысла и модель должна состоять из у и х1.

 

<== предыдущая лекция | следующая лекция ==>
Множественный регрессионный анализ | Временные ряды в эконометрических исследованиях
Поделиться с друзьями:


Дата добавления: 2014-01-07; Просмотров: 1015; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.022 сек.