Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Отбор факторов, включаемых в модель множественной регрессии




Методы отбора факторов. При построении моделей множественной регрессии одним из важнейших этапов является отбор факторов, воздействующих на результирующий признак. Обычно он происходит в два этапа:

I. Содержательный анализ факторов. Выделяют те факторы, которые существенно влияют на результат.

II. Расчет количественных оценок, позволяющих оценить влияние факторов на результат и друг на друга. На их сновании проводится окончательный отбор факторов. Здесь могут использоваться различные методы отбора факторов, например:

а) использование парных коэффициентов корреляции;

б) использование парных частных коэффициентов корреляции;

в) расчет вкладов факторов в объясненную дисперсию;

г) и т.п.

 

Рассмотрим более подробно использование парных коэффициентов корреляции.

 

Матрица парных коэффициентов линейной корреляции. Пусть в модели множественной регрессии предполагается использовать n признаков-факторов x1, x2, …, xn, а y – результативный признак. Тогда для этих переменных может быть построена матрица парных коэффициентов линейной корреляции, или корреляционная матрицу, которая по своей сути представляет совокупность коэффициентов корреляции между всеми возможными парами признаков:

(1.6)

Эта матрица всегда симметрична относительно главной диагонали, а члены матрицы, стоящие на этой диагонали, равны 1, поскольку представляют собой корреляцию признака с самим собой.

 

Анализ корреляционной матрицы позволяет выявить факторы, тесно связанные между собой, т.е. коллинеарные.

Коллинеарностьфакторов – это тесная линейная связь между двумя переменными. Считается, что переменные явно коллинеарны, если коэффициент корреляции между ними по модулю превышает 0,7.

При наличии коллинеарных признаков один из них нужно исключить из модели, чтобы между оставшимися факторами не было тесных связей. Разумеется, здесь речь идет именно о связи между признаками факторами x1, x2, …, xn. Коэффициенты корреляции между результатом y и факторами x1, x2, …, xn должны быть как можно ближе к единице по модулю, т.е. связь между ними должна быть тесной.

 

Мультиколлинеарностьфакторов – это тесная линейная связь между несколькими переменными, коллинеарность многих факторов.

По парным коэффициентам корреляции можно заметить лишь явную коллинеарность факторов. Чтобы оценить мультиколлинеарность всех факторов, имеет смысл построить матрицу парных коэффициентов корреляции между факторами (матрицу межфакторной корреляции) и рассчитать ее определитель. Эта матрица может быть легко получена из корреляционной матрицы вычеркиванием первых строки и столбца (соответствующих признаку-результату).

Очевидно, что новая матрица в случае полного отсутствия корреляции между факторами будет еди­ничной матрицей (все недиагональные элементы равнялись бы нулю), и ее определитель равнялся бы единице. В противоположном случае, т.е. если бы между факторами была полная линей­ная зависимость, все элементы новой матрицы равнялись бы 1, и ее определитель был бы равен 0. Таким образом, чем ближе определитель такой матрицы к нулю, тем сильнее мультиколлинеарность факторов.

Мультиколлинеарность факторов отрицательно сказывается на качестве модели, поскольку:

1) из-за связи между факторами затрудняется оценка влияния отдельных факторов на результат, что затрудняет интерпретацию параметров регрессии,

2) может привести к включению в модель лишних параметров;

3) уменьшается точность оценок коэффициентов регрессии, растет дисперсия оценок и стандартные ошибки;

4) завышается коэффициент множественной корреляции (см. далее).

 

Требованиям к факторам, включаемым в модель множественной регрессии. Таким образом, основными требованиями к факторам, включаемым в модель множественной регрессии, являются следующие:

1) их существенное влияние на результативный признак;

2) отсутствие мультиколлинеарности;

3) количественная измеримость факторов. Если в модель включается качественный фактор, для него необходимо разработать количественную шкалу измерения, например, балльную, либо использовать фиктивные переменные (см. далее).

 

Коэффициент множественной корреляции. Тесноту линейной связи между результатом и всеми признаками-факторами можно измерить с помощью множественного коэффициента корреляции, который для линейной модели можно рассчитать по формуле:

(1.7)

где Δм.п.к.к. – определитель матрицы парных коэффициентов корреляции;

Δм.м-ф.к. – определитель матрицы межфакторной корреляции.

Этот показатель будет более подробно рассмотрен в дальнейшем при изучении оценки качества модели.




Поделиться с друзьями:


Дата добавления: 2014-01-07; Просмотров: 2578; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.013 сек.