Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Оценка методом наименьших квадратов коэффициентов регрессии. По результатам эксперимента могут быть определены не «истинные» коэффициенты регрессии b, соответствующие генеральной совокупности




 

По результатам эксперимента могут быть определены не «истинные» коэффициенты регрессии b, соответствующие генеральной совокупности, а лишь их оценки B = (b0,b1, …,bj,…, bd), вычисленные по выборке объемом n. В этом случае уравнение регрессии в векторной форме имеет вид:

Ŷ=h(Х,В), (13.4)

где Ŷ – предсказанные (прогнозируемые) значения выходной величины.

При выводе и использовании формул регрессионного анализа удобнее пользоваться векторной формой представления уравнений регрессии:

U=Хb+e; Ŷ=ХВ, (13.5)

где U - вектор наблюдений; Х – матрица значений независимых переменных; b,В – векторы коэффициентов и их оценок соответственно; e - вектор ошибок:

 

 

 

Первый столбец матрицы Х содержит фиктивную переменную

х i0=1, i=1,2,…, n.

После вычисления коэффициентов регрессии нужно вернуться к первоначальным обозначениям для того, чтобы облегчить интерпретацию результатов.

 

Задачи регрессионного анализа:

вычисление коэффициентов регрессии;

проверка значимости коэффициентов регрессии;

проверка адекватности модели;

выбор “лучшей” регрессии;

- вычисление стандартных ошибок.

Проверка адекватности модели основана на методах дисперсионного анализа.

Парная регрессия.Рассмотрим решение системы нормальных уравнений в простейшем случае – линейная регрессия от одного фактора х, число определяемых коэффициентов: d=2; Система нормальных уравнений

(13.6)

 

Ршив систему (4.4.8′′) относительно b0 и b1, получим искомое уравнение, которое носит название регрессии Y на Х.

Если Х и Y - система двух нормально распределенных случайных величин, то, преобразуя (13.6) уравнение регрессии Y на Х можно записать:

 

(13.7)

Соответственно уравнение регрессии Х на Y:

(13.8)

 

После построения уравнения регрессии возникает вопрос о качестве решения. Адекватность линии регрессии зависит от того, какая часть суммы квадратов относительно среднего обусловлена суммой квадратов относительно регрессии, а какая суммой квадратов обусловленной регрессией. Суммы квадратов связаны с некоторым числом - числом их степеней свободы n=df. Это число показывает, сколько независимых элементов информации (из n чисел y1, y2,...,yn) необходимо для образования данной суммы квадратов.

Для построения таблицы дисперсионного анализа необходимо получить средние квадраты (MS), для этого каждая сумма SS делится на соответствующие число степеней свободы df ().

Если в уравнении регрессии (y=b0+b1x) b1=0, то величина распределена по распределению Фишера c (1, n-2) степенями свободы. Этот факт используется для проверки гипотезы Н0: b1=0 с уровнем значимости a (риском ошибиться не более чем в a100% случаев), против альтернативы Н1: b1¹0.

Обобщим все в таблице дисперсионного анализа

 

Таблица дисперсионного анализа (основное разложение)

Источник вариации Число степеней свободы, df Суммы квадратов, SS Средние квадраты, MS Fрасч. Fкр.
Обусловленный регрессией   MSR Fa(1, n-2)
Относительно регрессии (остаток) n-2    
Общий, скорректирован-ный на среднее Y n-1      

 

Если Fрасч.>Fкр. при заданном уровне значимости a и соответствующих числах степеней свободы, то гипотеза Н0: b1=0 отбрасывается с риском ошибиться не более чем в a100% случаев (и уравнение регрессии считается статистически значимым).

Доля суммы квадратов, объясняемая регрессией называется множественным коэффициентом детерминации (квадратом множественного коэффициента корреляции R):

. (13.9)

Значимость R2 определяется по F-критерию. . Если Fрасч.>Fкр., то гипотезу Н0:R=0 отвергают и связь между x и y считают статистически значимой. Если Y зависит только от одной переменной Х, то R=r - парному коэффициенту корреляции.

 

 




Поделиться с друзьями:


Дата добавления: 2014-11-20; Просмотров: 441; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.011 сек.