Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Способы отбора факторных переменных

Введение.

Лекция №11. Построение уравнений парной нелинейной и множественной регрессии

 

При построении уравнений парной нелинейной регрессии и уравнений множественной регрессии нередко возникают дополнительные трудности. Эти трудности связаны с тем, что, во-первых, метод наименьших квадратов (МНК) изначально разработан для расчета параметров линейных функций и в его основу заложены некоторые предпосылки, которые всегда выполняются для линейных уравнений регрессии, но могут быть нарушены, если МНК применяется для расчета параметров линеаризованных (но изначально не линейных) уравнений регрессии.

Во-вторых, при построении уравнений множественной регрессии одной из важнейших проблем становится проблема отбора тех факторов, которые целесообразно включать в уравнение. В 30-е г. XX в. увлечение множественной регрессией сменилось разочарованием. Стремясь включить как можно больше факторов в модель, исследователи часто сталкивались с бессмысленными результатами. В настоящее время считается, что в уравнение множественной регрессии не имеет смысла включать более трех-четырех факторных признаков.

 

Для проведения правильного анализа необходимо знать всю совокупность связей между переменными.

В 1934 году Роберт Фриш предложил одновременно исследовать все возможные виды уравнений регрессии между различными сочетаниями переменных. Анализируя разные варианты уравнений регрессии, Р. Фриш обнаружил эффект деградации регрессии. Он заключался в том, что если в регрессию включить много переменных, имеющих линейные связи друг с другом, то коэффициенты регрессии возвращаются к тем же значениям, которые они имели в уравнении с наименьшим числом переменных.

Он предложил считать, что существует три вида переменных:

- Полезные;

- Лишние;

- Вредные.

Если переменную включают в модель, и при этом она существенно повышает индекс детерминации (квадрат корреляционного отношения), причем коэффициент регрессии при других переменных при этом изменится, то переменная называется полезной переменной.

Если переменную включают в модель, и при этом ни индекс детерминации, ни коэффициенты регрессии при других переменных существенно не меняются, то переменная называется лишней.

Если переменную включают в модель и при этом индекс детерминации существенно не меняется, но значительно изменяются коэффициенты регрессии при других переменных, то переменная называется вредной.

Такой анализ регрессионных моделей Р. Фриш назвал конфлюэнтным анализом и предложил его использовать для отбора факторных переменных, которые следует включать в модель.

Явление линейной зависимости между двумя переменными называется коллинеарностью. Одновременная зависимость между несколькими переменными называется мультиколлинеарностью.

Считается, что нельзя одновременно включать в модель линейно зависимые (коллинеарные) переменные. Для оценки линейной зависимости между двумя переменными измеряют парные коэффициенты корреляции. Для проверки наличия мультиколлинеарности рассчитывают определитель матрицы коэффициентов парной корреляции.

Пусть x1, x2 - разные факторные переменные, которые приобретают n различных значений.

Если r(х1, х2) > 0.8, то факторы х1 и х2 считаются коллинеарными, и их нельзя одновременно включать в модель.

При построении уравнений множественной регрессии необходимо проводить предварительный анализ мультиколлинеарности и на его основе отбирать те переменные, которые целесообразно включать в модель.

<== предыдущая лекция | следующая лекция ==>
Шкала Чеддока | Исходные данные для построения уравнений регрессии
Поделиться с друзьями:


Дата добавления: 2014-01-20; Просмотров: 358; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.01 сек.