Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Множественное линейное уравнение регрессии в стандартизированном масштабе. Решение квадратных систем линейных уравнений методом Гаусса

Классический метод наименьших квадратов для модели множественной регрессии

 

Общий вид линейного уравнения множественной регрессии:

 

 

b
b
x
b
e
yi = 0+ 11 i +ј+ nxki + i,

 

 

1 i ki
b
где yi —значение i nойзависимойпеременной, i =1, n; x, ј, x значения независимых переменных;

n
0, ј, b— параметры уравнения регрессии, подлежащие оценке;

i
e— случайные ошибки множественного уравнения регрессии.

 

 
Чтобы найти оценки неизвестных параметров линейного уравнения множественной регрессии, используется обычный меn тод наименьших квадратов. Его суть состоит в нахождении вектоn ра оценки b, который минимизировал бы сумму квадратов отклоn нений (остатков) наблюдаемых значений зависимой переменной y от модельных значений y. рассчитанных на основании построенn

ного уравнения регрессии.

Рассмотрим матричную форму функционала F метода наименьn ших квадратов:

 

å
(
 
b
b
 
T
i i
F = n yy)=(YX) ´ (YX)®min, i =1

 

 


 
ç ÷
x
÷
÷
÷
ç
ç
ç
ј
ç

 

æ y ö

 

ç ÷
=
 
ç ÷
è ø
Y ç y 2÷ ç yn ÷


 

 

— вектор значений зависимой переменной размерn ности n ´ 1;


 

 


æ1 X = 1

è
ç1


 

x
x
11 12 ј x 21 x 22 ј

ј ј

 

xn 1 xn 2 ј


1 k ö x 2 k ÷

ј

x
ø
÷ nk


 

 

.

.
— вектор значений независимой переменной размерности n ґ (k + 1)


 

 
Первый столбец является единичным, так как в уравнении реn грессии параметр b умножается на 1.

Для того чтобы найти минимум функции (F), нужно вычиcn лить частные производные этой функции по каждому из оцениваеn мых параметров и приравнять их к нулю. Полученная стационарn ная система уравнений может быть записана как:

 

 

=
 
ï
ì F

 

 
 
ï
ïb

í
 
b
ï
ï F =0,

 

 
ï
ï 1

 

ï
î

 

 

 
ç ÷
где æb ö

 

 
=
ç ÷
 
b çb÷ —вектороцениваемыхпараметровуравнения

ç ÷
b
ç ÷ регрессии.

k
è ø

Общий вид стационарной системы уравнений можно записать как:

 

 

 
 
b
F =−2 XTY +2 XTX b=0.

 

 

В результате решения системы нормальных уравнений полуn чим следующие МНКnоценки неизвестных параметров уравнеn ния регрессии:

 

 
b=(XTX) 1 XTY.

 

 


(
å
 

 


Рассмотрим применение метода наименьших квадратов на приГ мере модели множественной линейной регрессии с двумя переменn ными:

 

b
b
x
b
e
yi = 0+ 11 i + 2 x 2 i + i,

 

где i =1, n.

 

Для нахождения оценок неизвестных параметров данного уравn нения регрессии минимизируем выражение:

 


n

 

b
b
x
i
F = y − 0− 11 i

 

 
i =


 

 
b
b
b
b
,
,
0 1 2
2 x 2 i) ⎯⎯⎯⎯⎯®min.


 

Стационарная система уравнений для модели множественной линейной регрессии с двумя переменными строится следующим образом:

F
b
ï
ì

b
ï
ï
F
=−2 XTY +2 XTX 0, ï 0

 
b
 
ï
í =−2 XTY +2 XTX b,

 

F
ï
ï 1

 
ï
 
 
îb =−2 XTY +2 XTX b.

 

После элементарных преобразований данной стационарной системы уравнений получим систему нормальных уравнений:

 

å å å
 
b b
b
ï
ì n n n

i
ï
1 1 1
ï
n ´ 0+ 1 x 1+ 2 x 2 i = yi, i = i = i =

 

ï
å å å å
 
n n n n

b
b
b
 
x x
x
x
ï
= = = =
ï
í0 1 i + 1 1 i + 2 1 i ´ x 2 i = yi ´ 1 i, i 1 i 1 i 1 i 1

 

å å å å
ï
 
n n n n

b
b
b
 
x
x
ï
î
1 1 1 1
0 x 2 i + 11 i ´ x 2 i + 2 1 i = yi ´ x 2 i. i = i = i = i =

 

 

 
 
 
b
 
 
Данная система называется системой нормальных уравнений относительнокоэффициентов b, b и 2 для зависимости

 

 

b
b
x
b
e
yi = 0+ 11 i + 2 x 2 i + i.

 

 
0 1 2
Система нормальных уравнений является квадратной, т. е. коn личество уравнений равняется количеству неизвестных переменn ных,поэтомукоэффициентыb, b и b можнонайтиспоnмощью метода Крамера или метода Гаусса.

 


 

 

Метод Крамера заключается в следующем.

 

Единственное решение квадратной системы линейных уравнеn ний определяется по формуле:

 

D
K j = D j, j =1, n,

 

D
где D — основной определитель квадратной системы линейных уравнений;

j—определитель, полученный из основного определителя пуn тем замены j nго столбца на столбец свободных членов.

 

Если основной определитель системы D равен нулю и все определители D j также равны нулю, то данная система имеет бесn конечное множество решений.

Если основной определитель системы D равен нулю и хотя бы один из определителей D j также равен нулю, то система решений не имеет.

 

Метод Гаусса применяется в основном для решения систем линейных уравнений, когда количество неизвестных параметров не совпадает с количеством уравнений.

Однако его используют и для решения квадратных систем лиn нейных уравнений.

 

 

 

Оценки неизвестных параметров уравнения регрессии опреn деляются с помощью метода наименьших квадратов. Однако суn ществует и другой способ оценивания этих коэффициентов в слуn чае множественной линейной регрессии. Для этого строится уравнение множественной регрессии в стандартизированном (нормированном) масштабе. Это означает, что все переменные, участвующие в регрессионной модели, стандартизируются с поn мощью специальных формул.

 

Процесс стандартизации позволяет установить точкой отсчета для каждой нормированной переменной ее среднее значение по выборке. При этом единицей измерения стандартизированной переменной становится ее среднеквадратическое отклонение.

 


 

 

Формула для перевода независимой переменной x в стандарn тизированный масштаб:

 

(
G x
()
txij)= xijxii

 

где i =1, n, j =1, k;

 

G (xi) — среднеквадратическое отклонение независимой пере менной.

 

Формула для перевода зависимой переменной y в стандартиn зированный масштаб:

 

 

=
y
)
G
t (i) yi (yy.

 

В случае линейной зависимости между изучаемыми переменn ными процесс стандартизации не нарушает этой связи, поэтому справедливо следующее равенство:

 

 

å
()
n

 
b
t (y)= i ´ L xi. i =1

 

Для того чтобы найти неизвестные коэффициенты данной функции, можно использовать классический метод наименьn ших квадратов для множественной регрессии, т. е. необходимо минимизировать функционал вида:

 

 

æ ö
å
(
b
 
b
ç ÷
è ø
F = t (y)− n i ´ S xi) ⎯⎯®min. i =1

 

При этом в качестве переменных в системе нормальных уравn нений будут выступать парные коэффициенты корреляции. Таn кой подход основывается на следующем равенстве:

 

 

m
(
(
å
L x
j =1 txijtxkj)= riLk = rixk.

 

 


 

 

Таким образом, система нормальных уравнений для стандарn тизированной модели множественной регрессии имеет вид:

 

 
b
b
b
x,
x
x
ï
(
 
ï
b
b b
x
x,
í
ì1+ r (1 x 2) 2+ј+ r (1 xn) n = r (1 y) r x 2 x 1) 1+ 2+ј+ r (2 xn) n = r (2 y)

 
ï
ï

 

 
b b
b
x.
x
x
î
r (nx 1) 1+ r (nx 2) 2+ј+ n = r (ny)

 

 

 
b
b
Данная система нормальных уравнений является квадратной, т. е. количество уравнений равняется количеству неизвестных пеn

ј
ременных, поэтому оценки коэффициентов 0,, n можно найти с помощью метода Крамера, метода Гаусса или метода обn

 

ратных матриц.

 

После того как параметры уравнения множественной регрессии в стандартизированном масштабе определены, необходимо переn вести их в масштаб исходных данных:

 

 
b
b
()
G x
i = i ´ G (y);

 

 

å
n

 

b
 
=
b = yi ´ xi. i 1

 

Основная идея решения квадратной системы линейных уравn нений методом Гаусса заключается в том, что исходную квадратn ную систему из n линейных уравнений с n неизвестными переn менными необходимо преобразовать к треугольному виду. С этой целью в одном из уравнений системы оставляют все неизвестные переменные. В другом уравнении сокращают одну из неизвестn ных переменных для того, чтобы число неизвестных стало (n −1).

В следующем уравнении сокращают две неизвестные переn менные, чтобы число переменных стало (n − 2). В конце данного

 

процесса система примет треугольный вид, первое уравнение коn торой содержит все неизвестные, а последнее — только одну. В последнем уравнении системы остается (n − (n − 1)) неизвестn

 

ных переменных, т. е. одна неизвестная переменная, которая наn зывается базисной. Дальнейшее решение сводится к выражению свободных (n −1) неизвестных переменных через базисную переn

 

менную и получению общего решения квадратной системы лиn нейных уравнений.

 

 

<== предыдущая лекция | следующая лекция ==>
Множественное линейное уравнение регрессии | Чем животные отличаются от растений?
Поделиться с друзьями:


Дата добавления: 2013-12-12; Просмотров: 609; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.01 сек.