Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Множественный регрессионный анализ

Экономические явления определяются большим числом одновременно и совокупно влияющих факторов. Поэтому возникает задача исследования зависимости одной переменной у от нескольких объясняющих переменных х1, х2,…, хn. Эта задача решается с помощью множественного регрессионного анализа. Модель множественной линейной регрессии можно представить в виде:

yi= β0+ β1xi1+ β2xi2+…+ βpxipi, (1)

где i=1,…, n;

εi отражает возмущение и случайные ошибки.

Модель (1) называется классической нормальной моделью множественной регрессии. Множество объясняющих переменных, присутствующих в модели, значительно усложняет вычисления, поэтому прибегают к применению матричного описания регрессии, для чего вводят следующие обозначения: у представляется в виде матрицы-столбца или вектора:

 

А значения х тоже представляют в виде матрицы размера n, где n – количество переменных х:

 

В матрицу дополнительно введем столбец, все элементы которого равны 1. Это сделано для того, чтобы учесть влияние β. Предполагается, что β0 был умножен на фиктивную переменную х0, принимающую значение 1 при любых условиях.

– матрица-столбец параметров уравнения.

– матрица-столбец случайных ошибок.

Тогда в матричной форме модель (1) примет вид: Y=XB+ε.

Оценкой этого уравнения является модель: Y=Xb+e,

где b=(b0, b1, …,bp)', e=(e1, e2, …,ep)'.

Для оценки вектора неизвестных параметров β применяется метод наименьших квадратов. Для этого определяют произведение транспонированной матрицы e' на саму матрицу e:

(e1, e2, …,ep)*=e12+ e22+…+ ep2=Σ ei2, i=1,…, p.

В методе наименьших квадратов (МНК) должно соблюдаться условие минимизации квадрата отклонения теоретических данных от фактических:

S= = e'e=(Y-Xb)'*(Y-Xb) →min. (2)

При транспонировании произведения матриц получается произведение транспонированных матриц, взятых в обратном порядке, т.е. соблюдается правило:

(Xb)'=b'X'.

Т.о., после раскрытия скобок в формуле (2), получится следующее выражение:

S= (Y-Xb)'*(Y-Xb) = (Y'-b'X')'*(Y-Xb) →min,

S=Y'Y-Y'Xb-b'X'Y+b'X'Xb →min.

Y'Xb можно представить в виде b'X'Y. Тогда S примет вид:

S=Y'Y-2b'X'Y+ b'X'Xb →min.

Для нахождения минимума (экстремумов) функции необходимо первую производную этой функции приравнять к 0. Но т.к. у нас выражение представлено в матричной форме, то получится матрица-вектор частных производных:

 

Для вектора частных производных существуют следующие формулы:

 

где b, c – векторы-столбцы;

А – симметрическая матрица, т.е. элементы которой расположены симметрично от главной диагонали. Поэтому полагая, что c=X’Y, A=X’X примет вид:

= - 2X’Y+2X’Xb=0,

X’Xb=X’Y. (3)

В матричной форме Х'X получается умножением матрицы Х на транспонированную матрицу X’:

X’X=

Определим произведение X’Y:

X’Y=

Тогда в матричной форме уравнение (3) примет вид:

. (4)

Решением уравнения будет являться выражение:

b==X’Y (X’X)-1.

Выражение (4) может быть решено через систему линейных уравнений:

(5)

Пример. Имеются следующие данные о производительности труда рабочего, мощности оборудования и уровне механизации работ. Информация дана по 10 предприятиям. Составить уравнение множественной регрессии на основе имеющихся данных.

Таблица 5

 

1 способ. Матрица Х'X в нашем примере примет вид:

Х'X=

Запишем матрицу Х’Y:

X’Y=

Определим параметры b, исходя из условия: b=(X’X)-1X’Y, где (X’X)-1=, где – присоединенная матрица, все элементы которой являются алгебраическими дополнениями матрицы (X’X)’.

Найдем определитель матрицы X’X:

 

(X’X)-1=.

b=

Т.о. b0=-3,5393, b1=0,8539, b2=0,3670.

Теперь уравнение множественной регрессии примет вид:

=- 3,5393+0,8539x1+0,3670x2.

Т.о. значения b1 и b2 показывают, что при увеличении мощности оборудования на единицу производительность труда увеличивается на 0,8539 единиц, а при увеличении уровня механизации на единицу производительность труда увеличивается на 0,3670 единиц.

2 способ. Данную задачу можно решить через систему линейных уравнений, общий вид которой представлен в виде модели (5).

Если в модели присутствуют у, х1 и х2, то общий вид системы принимает следующую форму:

 

 

 

Решим матричным способом.

 

Δ=3738.

-13230,

3192,

1372.

 

 

 

 

После определения параметров b рассчитывают коэффициенты эластичности, показывающие уровень влияния b на изучаемое явление у. Коэффициент эластичности показывает, на сколько процентов (от средней) изменится у при увеличении х на один процент. Коэффициент эластичности рассчитывается по формуле:

 

E1=0,854*9,4/6,8=1,18.

E2=0,367*6,3/6,8=0,34.

Т.е. при изменении только х1 на один процент у увеличится на 1,18% от среднего значения. При увеличении х2 на один процент у увеличится на 0,34% от среднего значения. Т.о. фактор «мощность оборудования» оказывает большее влияние на у (производительность труда), чем фактор «уровень механизации работ».

После расчета коэффициента эластичности определяют линейные коэффициенты частной корреляции между у и х1, затем между у и х2. Также определяется коэффициент корреляции между самими переменными х1 и х2.

 

 

 

1) Определим.

 

 

 

2) Рассчитаем.

.

 

3) Рассчитаем.

 

 

Мы определили линейные коэффициенты корреляции (парные). На их основе определим частные коэффициенты корреляции:

 

 

Полученные значения необходимо сравнить с парными коэффициентами. Существуют отличия между коэффициентами, особенно оно значимо по переменной х2. Парный коэффициент показывает наличие слабой связи, а частный коэффициент её отсутствие.

Далее рассчитывается линейный коэффициент множественной корреляции:

, где

 

 

 

Т.о. наблюдается наличие слабой связи между у, х1, х2.

– коэффициент детерминации – показывает, что изменение у только на 24% обусловлено влиянием х1 и х2, а на 76% влиянием прочих факторов.

Оценим статистическую значимость уравнения множественной регрессии, рассчитав F – критерий Фишера. Для множественной регрессии он определяется по формуле:

 

Сравним полученное F с табличным при уровне значимости α=0,05 и числе степеней свободы k1=m-1, k2=n-m.

k1=2, k2=7, Fтабл=4,74.

Т.к. Fрасч<Fтабл, то уравнение считается не значимым.

Помимо этого рассчитываются частные F – критерии – Fx1 и Fx2, которые оценивают значимость присутствия факторов х1 и х2 в уравнении множественной регрессии, а также целесообразность включения в модель одного фактора после другого, т.е. Fx1 оценивает целесообразность включения в уравнение фактора x1 после того, как в модель был включен х2, а Fx2 показывает, нужно ли было включать в модель фактор х2. Эти критерии рассчитываются по следующим формулам:

 

 

 

 

Fтабл=5,32.

Низкое значение Fx1 и Fx2 свидетельствует о статистической не значимости и не целесообразности включения их в модели, но Fx1 > Fx2, т.е. фактор х1 более целесообразно включить в модель, чем х2.

Для коэффициентов и функций регрессии определяются доверительные интервалы, т.к. в расчетах всегда присутствует ошибка. Кроме того, регрессионные модели часто используются для прогнозирования, где также необходимо представление прогнозных оценок в виде интервалов. Доверительными эти интервалы называются потому, что при их определении используется t – критерий Стьюдента, который называется критерием доверия. Доверительные интервалы определяются для коэффициентов регрессии зависимой переменной у.

Интервальные значения для коэффициентов регрессии имеют вид:

 

 

 

 

 

 

 

tтабл=2,36.

0,8539-2,36*0,82 ≤ β1 ≤ 0,8539+2,36*0,82,

-1,08≤ β1 ≤ 2,79,

0,3670-2,36*0,87 ≤ β2 ≤ 0,3670+2,36*0,87,

-1,69 ≤ β2 ≤ 2,42.

tтабл, что еще раз подтверждает гипотезу о не значимости коэффициентов регрессии.

Полученные интервалы показывают, что: сила влияния переменной х1 на у будет не меньше, чем -1,08 и не больше, чем 2,79, а сила влияния переменной х2 на у будет не меньше, чем -1,69 и не больше, чем 2,42.

Интервал для индивидуальных значений зависимой переменной у имеет вид:

 

 

Se= 0,951.

6,8-2,36*0,951 6,8+2,36*0,951,

4,56 9,04.

Т.е. при уровне значимости α=0,05 значение будет находиться в пределах от 4,56 до 9,04.

 

<== предыдущая лекция | следующая лекция ==>
Линейная и нелинейная регрессия | Мультиколлинеарность
Поделиться с друзьями:


Дата добавления: 2014-01-07; Просмотров: 877; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.046 сек.