КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Множественный регрессионный анализ
Экономические явления определяются большим числом одновременно и совокупно влияющих факторов. Поэтому возникает задача исследования зависимости одной переменной у от нескольких объясняющих переменных х1, х2,…, хn. Эта задача решается с помощью множественного регрессионного анализа. Модель множественной линейной регрессии можно представить в виде: yi= β0+ β1xi1+ β2xi2+…+ βpxip+εi, (1) где i=1,…, n; εi – отражает возмущение и случайные ошибки. Модель (1) называется классической нормальной моделью множественной регрессии. Множество объясняющих переменных, присутствующих в модели, значительно усложняет вычисления, поэтому прибегают к применению матричного описания регрессии, для чего вводят следующие обозначения: у представляется в виде матрицы-столбца или вектора:
А значения х тоже представляют в виде матрицы размера n, где n – количество переменных х:
В матрицу дополнительно введем столбец, все элементы которого равны 1. Это сделано для того, чтобы учесть влияние β0. Предполагается, что β0 был умножен на фиктивную переменную х0, принимающую значение 1 при любых условиях. – матрица-столбец параметров уравнения. – матрица-столбец случайных ошибок. Тогда в матричной форме модель (1) примет вид: Y=XB+ε. Оценкой этого уравнения является модель: Y=Xb+e, где b=(b0, b1, …,bp)', e=(e1, e2, …,ep)'. Для оценки вектора неизвестных параметров β применяется метод наименьших квадратов. Для этого определяют произведение транспонированной матрицы e' на саму матрицу e: (e1, e2, …,ep)*=e12+ e22+…+ ep2=Σ ei2, i=1,…, p. В методе наименьших квадратов (МНК) должно соблюдаться условие минимизации квадрата отклонения теоретических данных от фактических: S= = e'e=(Y-Xb)'*(Y-Xb) →min. (2) При транспонировании произведения матриц получается произведение транспонированных матриц, взятых в обратном порядке, т.е. соблюдается правило: (Xb)'=b'X'. Т.о., после раскрытия скобок в формуле (2), получится следующее выражение: S= (Y-Xb)'*(Y-Xb) = (Y'-b'X')'*(Y-Xb) →min, S=Y'Y-Y'Xb-b'X'Y+b'X'Xb →min. Y'Xb можно представить в виде b'X'Y. Тогда S примет вид: S=Y'Y-2b'X'Y+ b'X'Xb →min. Для нахождения минимума (экстремумов) функции необходимо первую производную этой функции приравнять к 0. Но т.к. у нас выражение представлено в матричной форме, то получится матрица-вектор частных производных:
Для вектора частных производных существуют следующие формулы:
где b, c – векторы-столбцы; А – симметрическая матрица, т.е. элементы которой расположены симметрично от главной диагонали. Поэтому полагая, что c=X’Y, A=X’X примет вид: = - 2X’Y+2X’Xb=0, X’Xb=X’Y. (3) В матричной форме Х'X получается умножением матрицы Х на транспонированную матрицу X’: X’X= Определим произведение X’Y: X’Y= Тогда в матричной форме уравнение (3) примет вид: . (4) Решением уравнения будет являться выражение: b==X’Y (X’X)-1. Выражение (4) может быть решено через систему линейных уравнений: (5) Пример. Имеются следующие данные о производительности труда рабочего, мощности оборудования и уровне механизации работ. Информация дана по 10 предприятиям. Составить уравнение множественной регрессии на основе имеющихся данных. Таблица 5
1 способ. Матрица Х'X в нашем примере примет вид: Х'X= Запишем матрицу Х’Y: X’Y= Определим параметры b, исходя из условия: b=(X’X)-1X’Y, где (X’X)-1=, где – присоединенная матрица, все элементы которой являются алгебраическими дополнениями матрицы (X’X)’. Найдем определитель матрицы X’X:
(X’X)-1=. b= Т.о. b0=-3,5393, b1=0,8539, b2=0,3670. Теперь уравнение множественной регрессии примет вид: =- 3,5393+0,8539x1+0,3670x2. Т.о. значения b1 и b2 показывают, что при увеличении мощности оборудования на единицу производительность труда увеличивается на 0,8539 единиц, а при увеличении уровня механизации на единицу производительность труда увеличивается на 0,3670 единиц. 2 способ. Данную задачу можно решить через систему линейных уравнений, общий вид которой представлен в виде модели (5). Если в модели присутствуют у, х1 и х2, то общий вид системы принимает следующую форму:
Решим матричным способом.
Δ=3738. -13230, 3192, 1372.
После определения параметров b рассчитывают коэффициенты эластичности, показывающие уровень влияния b на изучаемое явление у. Коэффициент эластичности показывает, на сколько процентов (от средней) изменится у при увеличении х на один процент. Коэффициент эластичности рассчитывается по формуле:
E1=0,854*9,4/6,8=1,18. E2=0,367*6,3/6,8=0,34. Т.е. при изменении только х1 на один процент у увеличится на 1,18% от среднего значения. При увеличении х2 на один процент у увеличится на 0,34% от среднего значения. Т.о. фактор «мощность оборудования» оказывает большее влияние на у (производительность труда), чем фактор «уровень механизации работ». После расчета коэффициента эластичности определяют линейные коэффициенты частной корреляции между у и х1, затем между у и х2. Также определяется коэффициент корреляции между самими переменными х1 и х2.
1) Определим.
2) Рассчитаем. .
3) Рассчитаем.
Мы определили линейные коэффициенты корреляции (парные). На их основе определим частные коэффициенты корреляции:
Полученные значения необходимо сравнить с парными коэффициентами. Существуют отличия между коэффициентами, особенно оно значимо по переменной х2. Парный коэффициент показывает наличие слабой связи, а частный коэффициент её отсутствие. Далее рассчитывается линейный коэффициент множественной корреляции: , где
Т.о. наблюдается наличие слабой связи между у, х1, х2. – коэффициент детерминации – показывает, что изменение у только на 24% обусловлено влиянием х1 и х2, а на 76% влиянием прочих факторов. Оценим статистическую значимость уравнения множественной регрессии, рассчитав F – критерий Фишера. Для множественной регрессии он определяется по формуле:
Сравним полученное F с табличным при уровне значимости α=0,05 и числе степеней свободы k1=m-1, k2=n-m. k1=2, k2=7, Fтабл=4,74. Т.к. Fрасч<Fтабл, то уравнение считается не значимым. Помимо этого рассчитываются частные F – критерии – Fx1 и Fx2, которые оценивают значимость присутствия факторов х1 и х2 в уравнении множественной регрессии, а также целесообразность включения в модель одного фактора после другого, т.е. Fx1 оценивает целесообразность включения в уравнение фактора x1 после того, как в модель был включен х2, а Fx2 показывает, нужно ли было включать в модель фактор х2. Эти критерии рассчитываются по следующим формулам:
Fтабл=5,32. Низкое значение Fx1 и Fx2 свидетельствует о статистической не значимости и не целесообразности включения их в модели, но Fx1 > Fx2, т.е. фактор х1 более целесообразно включить в модель, чем х2. Для коэффициентов и функций регрессии определяются доверительные интервалы, т.к. в расчетах всегда присутствует ошибка. Кроме того, регрессионные модели часто используются для прогнозирования, где также необходимо представление прогнозных оценок в виде интервалов. Доверительными эти интервалы называются потому, что при их определении используется t – критерий Стьюдента, который называется критерием доверия. Доверительные интервалы определяются для коэффициентов регрессии зависимой переменной у. Интервальные значения для коэффициентов регрессии имеют вид:
tтабл=2,36. 0,8539-2,36*0,82 ≤ β1 ≤ 0,8539+2,36*0,82, -1,08≤ β1 ≤ 2,79, 0,3670-2,36*0,87 ≤ β2 ≤ 0,3670+2,36*0,87, -1,69 ≤ β2 ≤ 2,42. tтабл, что еще раз подтверждает гипотезу о не значимости коэффициентов регрессии. Полученные интервалы показывают, что: сила влияния переменной х1 на у будет не меньше, чем -1,08 и не больше, чем 2,79, а сила влияния переменной х2 на у будет не меньше, чем -1,69 и не больше, чем 2,42. Интервал для индивидуальных значений зависимой переменной у имеет вид:
Se= 0,951. 6,8-2,36*0,951 6,8+2,36*0,951, 4,56 9,04. Т.е. при уровне значимости α=0,05 значение будет находиться в пределах от 4,56 до 9,04.
Дата добавления: 2014-01-07; Просмотров: 921; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |