Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Предпосылки регрессионного анализа




Линейная регрессионная модель с двумя переменными имеет вид

,

где Y ‒ объясняемая переменная, X ‒ объясняющая переменная, ‒ случайная ошибка. Для того чтобы регрессионный анализ, основанный на МНК, давал наилучшие из всех возможных результаты, должны выполняться определенные условия (условия Гаусса ‒ Маркова).

1. Математическое ожидание случайной ошибки в любом наблюдении должно быть равно нулю, т.е.

.

2. Дисперсия случайной ошибки должна быть постоянной для всех наблюдений, т. е.

3. Случайные ошибки должны быть статистически независимы (некоррелированы) между собой, т.е.

4. Объясняющая переменная есть величина неслучайная.

При выполнении условий Гаусса-Маркова модель называется классической нормальной линейной регрессионной моделью. Наряду с условиями Гаусса-Маркова обычно предполагается, что случайная ошибка распределена нормально, т. е. . Заметим, что в этом случае требование некоррелированности случайных ошибок эквивалентно их

независимости.

Рассмотрим подробнее условия и предположения, лежащие в основе регрессионного анализа.

Первое условие означает, что случайная ошибка не должна иметь систематического смещения. Если постоянный член включен в уравнение регрессии, то это условие выполняется автоматически.

Второе условие означает, что дисперсия случайной ошибки в каждом наблюдении имеет только одно значение. Под дисперсией имеется в виду возможное поведение случайной ошибки до того, как была сделана выборка. Величина неизвестна, и одна из задач регрессионного анализа состоит в ее оценке. Условие независимости дисперсии случайной ошибки от номера наблюдения называется гомоскедастичностью (что означает одинаковый разброс). Зависимость дисперсии случайной ошибки от номера наблюдения называется гетероскедастичностью. Таким образом,

‒ гомоскедастичность,

‒ гетероскедастичность.

Характерные диаграммы рассеяния гомоскедастичности и гетеро- скедастичности показана на рис. 3, а и б соответственно.

 

Рис. 3

Если условие гомоскедастичности не выполняется, то оценки коэффициентов регрессии будут неэффективными, хотя и несмещенными. Существуют специальные методы диагностирования и устранения гетеро- скедастичности.

Третье условие указывает на некоррелированность случайных отклонений для разных наблюдений. Это условие часто нарушается, когда данные являются временными рядами. В случае когда третье условие не выполняется, говорят об автокорреляции остатков. Типичный вид данных при наличии автокорреляции показан на рис. 4. Если условие независимости случайных ошибок не выполняется, то оценки коэффициентов регрессии, полученные по МНК, оказываются неэффективными, хотя и несмещенными. Существуют методы диагностирования и устранения автокорреляции.

Рис. 4

 

Четвертое условие является особенно важным. Если условие о неслучайности объясняющей переменной не выполняется, то оценки коэффициентов регрессии будут смещенными и несостоятельными. Нарушение этого условия может быть связано с ошибками измерения объясняющих переменных или с использованием лаговых переменных.

Предположение о нормальности распределения случайной ошибки необходимо для проверки значимости параметров регрессии и для интервального оценивания.

Теорема Гаусса-Маркова. Если условия 1 ‒ 4 регрессионного анализа выполняются, то оценки и , сделанные с помощью МНК, являются наилучшими линейными несмещенными оценками, т.е. обладают следующими свойствами:

1) несмещенности: , ,

(означает отсутствие систематической ошибки в положении линии регрессии);

2) эффективности: имеют наименьшую дисперсию в классе всех линейных несмещенных оценок, равную

, ;

3) с остоятельности: , .

 

 




Поделиться с друзьями:


Дата добавления: 2014-11-20; Просмотров: 3167; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.008 сек.