Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Спецификация модели




ТЕМА 3. МНОЖЕСТВЕННАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ.

Построение уравнения множественной регрессии начинается с решения вопроса о спецификации модели. Она включает в себя два круга вопросов: отбор фак­торов и выбор вида уравнения регрессии.

Факторы, включаемые во множественную регрессию, должны отвечать следующим требова­ниям.

1. Они должны быть количественно измеримы. Если необхо­димо включить в модель качественный фактор, не имеющий ко­личественного измерения, то ему нужно придать количествен­ную определенность (например, в модели урожайности качество почвы задается в виде баллов; в модели стоимости объектов не­движимости учитывается место нахождения недвижимости: рай­оны могут быть проранжированы).

2. Факторы не должны быть интеркоррелированы и тем более находиться в точной функциональной связи.

3. Включаемые факторы не должны коррелировать друг с другом. Наибольшие труд­ности в использовании аппарата множественной регрессии воз­никают при наличии мультиколлинеарности факторов, когда более чем два фактора связаны между собой линейной зависимос­тью, т. е. имеет место совокупное воздействие факторов друг на друга. Одним из индикаторов определения наличия мультиколлинеарности между признаками является превышение парным коэффициентом корреляции величины 0,8 (rxi xj) и др.

При отборе факторов рекомендуется пользоваться следующим правилом: число включаемых факторов обычно в 6—7 раз меньше объема совокупности, по которой строится регрессия.

Практика построения многофакторных моделей взаимосвязи показывает, что все реально существующие зависимости между социально экономическими явлениями можно описать используя пять типов моделей:

1) Линейная:

2) Степенная

3) Показательная

4) Параболическая

5) Гиперболическая

Наиболее приемлемым способом определения вида исходного уравнения регрессии является метод перебора различных уравнений.

Основное значение имеют линейные модели в силу простоты и логичности их экономической интерпретации. Нелинейные формы зависимости приводятся к линейным путем линеаризации. В линейной мно­жественной регрессии парамет­ры при xназываются коэффициентами «чистой» регрессии. Они характеризуют среднее изменение результата с изменением соот­ветствующего фактора на единицу при неизмененном значении других факторов, закрепленных на среднем уровне.

Параметры уравнения множественной регрессии оценивают­ся, как и в парной регрессии, методом наименьших квадратов (МНК). При его применении строится система нормальных уравнений, решение которой и позволяет получить оценки пара­метров регрессии.

Уравнение множественной регрессии можно построить в естественном и стандартизированном виде.

А) Построение уравнения в естественном виде. Так, для уравнения у = а + b 1 · х1 + b2 · х2 + ··· + bр · хр + ε сис­тема нормальных уравнений составит:

Ее решение может быть осуществлено методом определителей:

где Δ — определитель системы;

Δ а, Δ b1,..., Δ bp частные определители.

Б) Возможен и иной подход к определению параметров множе­ственной регрессии, когда на основе матрицы парных коэффи­циентов корреляции строится уравнение регрессии в стандарти­зованном масштабе:

где — стандартизованные переменные:

для которых среднее значение равно нулю:

а среднее квадратическое отклонение равно единице:

β -стандартизованные коэффициенты регрессии.

Применяя МНК к уравнению множественной регрессии в стандартизованном масштабе, после соответствующих преобра­зований получим систему нормальных уравнений вида

Решая ее методом определителей, найдем параметры — стан­дартизованные коэффициенты регрессии (β -коэффициенты).

Стандартизованные коэффициенты регрессии показывают, на сколько сигм изменится в среднем результат, если соответст­вующий фактор x j, изменится на одну сигму при неизменном среднем уровне других факторов. Сравнивая их друг с другом, можно ранжировать факторы по си­ле их воздействия на результат.

От уравнения в стандартизированном виде можно перейти к уравнению в естественной форме. Так, переход для двухфакторного уравнения множественной регрессии можно записать следующим образом:

 

Практическая значимость уравнения множественной регрес­сии оценивается с помощью показателя множественной корре­ляции и его квадрата - коэффициента детерминации.

Показатель множественной корреляции характеризует тесно­ту связи рассматриваемого набора факторов с исследуемым при­знаком, или, иначе, оценивает тесноту совместного влияния факторов на результат. Независимо от формы связи показатель множественной кор­реляции может быть найден как индекс множественной корре­ляции:

где σ2 у — общая дисперсия результативного признака;

σ2 ост - остаточная дисперсия для уравнения y =f(x1, x 2,..., x p).

Расчет индекса множественной корреляции предполагает оп­ределение уравнения множественной регрессии и на его основе остаточной дисперсии:

При линейной зависимости признаков формула индекса кор­реляции может быть представлена следующим выражением:

где βxi - стандартизованные коэффициенты регрессии;

r уxi -парные коэффициенты корреляции результата с каждым фактором.

Скорректированный индекс множественной корреляции со­держит поправку на число степеней свободы:

где т - число параметров при переменных х;

n - число наблюдений.

Поскольку, то величину скорректированного индекса детерминации можно представить в виде

Чем больше величина m, тем сильнее различияи R2.

Парные коэффициенты корреляции. Для измерения тесноты связи между двумя из рассматриваемых переменных(без учета их взаимодействия с другими переменными) применяются парные коэффициенты корреляции. Методика расчета таких коэффициентов и их интерпретации аналогичны линейному коэффициенту корреляции в случае однофакторной связи.

Частные коэффициенты корреляции. Однако в реальных условиях все переменные, как правило, взаимосвязаны. Теснота этой связи определяется частными коэффициентами корреляции, которые характеризуют степень влияния одного из аргументов на функцию при условии, что остальные независимые переменные закреплены на постоянном уровне. В зависимости от количества переменных, влияние которых исключается (элиминируется), частные коэффициенты корреляции могут быть различного порядка. При исключении влияния одной переменной получаем частный коэффициент корреляции первого порядка; при исключении влияния двух переменных – второго порядка и т.д. Парный коэффициент корреляции между функцией и аргументом обычно не равен соответствующему частному коэффициенту.

Частный коэффициент корреляции первого порядка между признаками у и х1 при исключенном влиянии признака х2 вычисляется по формуле

где r – парные коэффициенты корреляции между соответствующими признаками.

 

Для уравнения регрессии с тремя факторами частные коэффициенты корреляции второго порядка определяются на основе частных коэффициентов корреляции первого порядка. Так по уравнению

возможно исчисление трех частных коэффициентов корреляции второго порядка:

каждый из которых определяется по рекуррентной формуле. Например, при i = 1 имеем формулу для расчета r yx1*x2x3, а именно

В эконометрике частные коэффициенты корреляции обычно не имеют самостоятельного значения. В основном их используют на стадии формирования модели, в частности в процедуре отсева факторов.

Значимость уравнения множественной регрессии в целом, так же как и в парной регрессии, оценивается с помощью F-кри­терия Фишера:

где D факт - факторная сумма квадратов на одну степень свободы;

D ост - остаточная сумма квадратов на одну степень свободы;

R2- коэффициент (индекс) множественной детерминации;

т - число параметров при переменных x (в линейной регрессии совпадает с числом включенных в модель факторов);

n- число наблюдений.

Оценивается значимость не только уравнения в целом, но и фактора, дополнительно включенного в регрессионную модель. Необходимость такой оценки связана с тем, что не каждый фак­тор, вошедший в модель, может существенно увеличивать долю объясненной вариации результативного признака. Кроме того, при наличии в модели нескольких факторов они могут вводиться в модель в разной последовательности. Ввиду корреляции между факторами значимость одного и того же фактора может быть раз­ной в зависимости от последовательности его введения в модель. Мерой для оценки включения фактора в модель служит частный F-критерий, т. е. Fxj.

Частный F-критерий построен на сравнении прироста фак­торной дисперсии, обусловленного влиянием дополнительно включенного фактора, с остаточной дисперсией на одну степень свободы по регрессионной модели в целом. Предположим, что оцениваем значимость влияния x1 как дополнительно включен­ного в модель фактора. Используем следующую формулу:

где R2 yx1x2...xp - коэффициент множественной детерминации для модели с полным набором факторов;

R2yx2....xp ~ тот же показатель, но без включения в модель фактора x1;

n- число наблюдений;

т - число параметров в модели (без свободного члена).

Фактическое значение частного F-критерия сравнивается с табличным при 5%-ном или 1%-ном уровне значимости и числе степеней свободы: 1 и n— т — 1. Если фактическое значение Fxj. превышает, то дополнительное включение фактора xj в модель статистически оправданно и коэффициент чис­той регрессии b i при факторе xi - статистически значим. Если же фактическое значение Fxj меньше табличного, то дополнитель­ное включение в модель фактора х, не увеличивает существенно долю объясненной вариации признака у, следовательно, нецеле­сообразно его включение в модель; коэффициент регрессии при данном факторе в этом случае статистически незначим.

С помощью частного F-критерия можно проверить значи­мость всех коэффициентов регрессии в предположении, что каж­дый соответствующий фактор xi - вводился в уравнение множест­венной регрессии последним.

 




Поделиться с друзьями:


Дата добавления: 2014-01-20; Просмотров: 740; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.011 сек.