КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Парная линейная регрессионная модель
Подгонка кривой. Пусть есть результаты наблюдений переменных и , которые можно изобразить в виде точек в декартовой системе координат:
Получаемое таким образом изображение получило название диаграммы рассеяния или корреляционного поля наблюдений. Нашей задачей является подобрать («подогнать») функцию из параметрического семейства функций , «наилучшим» способом описывающую зависимость от . По виду диаграммы рассеивания видно, что примером параметрического семейства может служить семейство линейных функций .
В модели парной линейной регрессии зависимость между переменными и представляется в виде где - случайная ошибка модели. Постоянные — неизвестные параметры модели. Природа случайной ошибки: · попытка учесть влияние на зависимую переменную других факторов, · возможную нелинейность модели, · наличие ошибок измерения.
Выбор линейной модели обычно обуславливается: · содержательными соображениями, · геометрическими соображениями (использование корреляционного поля наблюдений), · вычисление выборочного коэффициента корреляции Пирсона
Встает задача нахождения оценок неизвестных параметров по результатам наблюдений . Точечные оценки неизвестных параметров , найденные по методу наименьших квадратов имеют вид: . Оценку функции регрессии (эмпирическую регрессию, выборочную регрессию, уравнение прямой регрессии по ) определяет соотношение: .
Продолжение примера 1. Построим поле корреляции и определим по нему характер зависимости.
На основании построенного поля корреляции можно сделать вывод о том, что для описания зависимости между X и Y можно воспользоваться уравнением прямой, поскольку точки-наблюдения располагаются близко вдоль некоторой предполагаемой прямой.
Этот факт можно подтвердить или опровергнуть, вычислив значение коэффициента корреляции Пирсона: (см. пример 1). Значение близко к единице. Следовательно, мы имеем достаточно сильную линейную зависимость между X и Y, что подтверждает наше предположение о том, что для описания зависимости между X и Y можно использовать модель: Точечные оценки неизвестных параметров равны:
Таким образом, уравнение регрессии принимает вид Подтвердим графически правдоподобность полученного результата. Построим прямую, задаваемую уравнением, на поле корреляции. Пусть тогда и тогда Давая содержательную интерпретацию полученным коэффициентам уравнения регрессии, можно заключить, что каждый дополнительный год курения увеличивает площадь пораженной части легких у людей, заболевших эмфиземой, в среднем на 1,24%.
Дата добавления: 2015-06-26; Просмотров: 1299; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |