Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Линейная регрессия

Если разброс точек около предполагаемой кривой зависимости одной величины от другой невелик, то эту зависимость можно определить с помощью МНК, подбирая подходящие параметры этой функции. Если разброс точек велик, то, как правило, достаточно трудно подобрать какую-либо иную функцию, кроме линейной. Такая эмпирическая кривая будет прямой регрессии.

Пусть мы имеем некоторое количество пар точек,. Подберем прямую, проходящую между этими точками, и, в некотором смысле, наилучшим способом аппроксимирующую зависимость Y от.

Точки (Xk, Yk), вообще говоря, не лежат на аппроксимирующей прямой. Поэтому, где - расстояние по ординате точки (Xk, Yk) до этой прямой.

Введем в рассмотрение арифметические средние

,

Потребуем, чтобы выполнялось условие.

Получим.

Снова будем пользоваться обозначениями центрированных переменных,. Теперь наши исходные уравнения принимают вид.

Для определения А применим метод наименьших квадратов

,

где, как и раньше,

,

Величина А является коэффициентом регрессии, а уравнение регрессии принимает вид

или.

Для построения функции линейной регрессии применяют полином первой степени, т.е. функцию вида (рис. 8.3.1).

 
Рис. 8.3.1. Линейная регрессия.

Отклонения точек (Xk, Yk) от прямой регрессии создают некоторую неопределенность (ошибку) в вычислении коэффициента регрессии А. Для вычисления ошибки А воспользуемся правилами МНК. Нормальным уравнением для МНК-оценки коэффициента регрессии будет, а остаточные разности суть отклонения Yk от коэффициента регрессии в точках.

Вычислим среднеквадратическую ошибку «единицы веса»

Нужно заметить, что хотя нормальное уравнение содержит одну неизвестную величину, в знаменателе приведенной формулы нужно брать n-2, так как число степеней свободы прямой регрессии две: параллельный перенос и поворот. Степень свободы параллельного переноса мы использовали, выбрав за начало отсчета точку плоскости с координатами.

Весом неизвестного А является коэффициент [xx] нормального уравнения, поэтому

.

Полученную формулу можно упростить, если ввести в рассмотрение эмпирический коэффициент корреляции. Раскрывая скобки и суммируя, получим

.

Подставим сюда.

, где.

Следовательно,. Обозначим. Теперь.

Переменные X и Y в данной задаче равноправны. В отличие от классических задач, в которых используется метод наименьших квадратов, Xk не являются точными значениями аргумента. Несовпадение прямой регрессии с наблюдательными данными в том числе вызвано и погрешностями в определении Xk. Поэтому задачу аппроксимации зависимости этих двух переменных друг от друга можно также решать, как определение линейной зависимости X от.

Тогда, повторяя приведенные выше выкладки, получим

.

Зависимость Y от X при условии минимизации отклонений Yk от прямой регрессии, как уже говорилось, называется регрессией y на x. Наоборот, зависимость X от Y называется регрессией x на y. Эти две прямые, вообще говоря, не совпадают.

<== предыдущая лекция | следующая лекция ==>
Уравнения регрессии. Корреляция и коэффициент корреляции В начало пункта Оглавление | Нелинейная регрессия. Полиномиальная регрессия
Поделиться с друзьями:


Дата добавления: 2014-01-20; Просмотров: 465; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.015 сек.