Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Проверка выполнимости предпосылок МНК. Статистика Дарбина–Уотсона




Статистическая значимость коэффициентов регрессии и близкое к единице значение коэффициента детерминации R 2 еще не гарантируют высокого качества уравнения регрессии. Оценивая линейное уравнение регрессии, мы предполагаем, что реальная взаимосвязь переменных линейна, а отклонения от регрессионной прямой являются случайными, независимыми друг от друга величинами. Если эти предположения не выполняются, то анализ значимости коэффициентов регрессии будет неточным. Причинами могут быть либо нелинейный характер зависимости между рассматриваемыми переменными, либо наличие неучтенного в уравнении существенного фактора. Действительно, при нелинейной зависимости между переменными отклонения от прямой регрессии не случайно распределены вокруг нее, а обладают определенными закономерностями, которые зачастую выражаются в существенном преобладании числа пар соседних отклонений с совпадающими знаками над числом пар с противоположными знаками. Отсутствие в уравнении регрессии какого-либо существенного фактора может также служить причиной устойчивых отклонений зависимой переменной от линии регрессии в ту или иную сторону. Добиться выполнимости предпосылок МНК можно либо путем использования какой-то другой нелинейной формулы, либо включением в уравнение регрессии новой объясняющей переменной.

При статистическом анализе уравнения регрессии на начальном этапе чаще других проверяют выполнимость одной предпосылки, а именно, условия статистической независимости отклонений между собой. При этом обычно проверяется их некоррелированность, являющаяся необходимым, но недостаточным условием независимости. Причем проверяется некоррелированность не любых, а только соседних величин e i. Соседними обычно считаются отклонения соседние по возрастанию объясняющей переменной x (при рассмотрении временных рядов по времени). Для этих величин рассчитывают коэффициент корреляции, называемый в этом случае коэффициентом автокорреляции первого порядка.

При этом учитывается, что математическое ожидание отклонений равно нулю.

На практике вместо коэффициента автокорреляциииспользуют статистику Дарбина-Уотсона DW, рассчитываемую по более простойформуле:

Очевидно, что при больших N выполняется соотношение:

Тогда легко вывести зависимость:

Суть статистики Дарбина-Уотсона DW можно осмыслить следующим образом. Если каждое следующее отклонение приблизительно равно предыдущему, то каждое слагаемое в числителе дроби последней формулы близко нулю и, следовательно, статистика DW окажется близкой к нулю. В этом случае коэффициент автокорреляциидолжен быть близок к единице, что будет подтверждать наличие положительной автокорреляции остатков первого порядка (линейной зависимости между остатками).

Если же точки наблюдений поочередно отклоняются в разные стороны от линии регрессии то:

Это случай отрицательной автокорреляции остатков первого порядка.

При случайном поведении отклонений можно предположить, что в одной половине случаев знаки последовательных отклонений совпадают, а в другой - противоположны. Так как абсолютные величины отклонений в среднем предполагаются равными, то можно считать, что в половине случаев они равны, а в другой равны по абсолютной величине, но противоположны по знаку. Тогда

В этом случае коэффициент автокорреляции должен быть нулевым. Таким образом, необходимым условием независимости случайных отклонений является близость к двойке значения статистики Дарбина-Уотсона.

Тогда, если DW ≈ 2, мы считаем отклонения от регрессии случайными (хотя они в действительности могут и не быть таковыми). Это означает, что построенная линейная регрессия, вероятно, отражает реальную зависимость. Скорее всего, не осталось неучтенных существенных факторов, влияющих на зависимую переменную. Какая-либо другая нелинейная формула не превосходит по статистическим характеристикам предложенную линейную зависимость. В этом случае, даже когда R 2 невелико, вполне вероятно, что необъясненная дисперсия вызвана влиянием на зависимую переменную большого числа различных факторов, индивидуально слабо влияющих на исследуемую переменную, и может быть описана как случайная нормальная ошибка.

Чтобы ответить на вопрос, какие значения DW можно считать статистически близкими к двум есть готовые таблицы критических точек статистики Дарбина-Уотсона, позволяющие при данном числе наблюдений N, количестве объясняющих переменных m и заданном уровне значимости (обычно 0,05) определять критические точки, что можно иллюстрировать следующим рисунком.

 

 

Не обращаясь к таблице критических точек Дарбина-Уотсона, можно пользоваться "грубым" правилом и считать, что автокорреляция остатков отсутствует, если 1,5 < DW < 2,5.

Статистика Дарбина—Уотсона, безусловно, является наиболее важным индикатором наличия автокорреляции. Однако, как уже отмечалось, тест обладает и определенными недостатками. Это и наличие зоны неопределенности, и ограниченность результата (выявляется лишь корреляция между соседними членами). Ничего нельзя сказать и о характере автокорреляции.

Это приводит к необходимости использовать также и другие тесты на наличие автокорреляции

При рассмотрении конкретных регрессионных моделей временных рядов с коррелированностью регрессоров и ошибок приходится сталкиваться довольно часто. Наиболее часто используемый прием, применяемый в подобных случаях, — метод инструментальных переменных. Идея метода заключается в том, чтобы подобрать новые переменные Zj (j= 1,..., e), которые бы тесно коррелировали с Xj и не коррелировали с ошибками. Этот набор переменных может включать те регрессоры, которые не коррелируют с ε, а также другие величины. При этом, вообще говоря, количество новых переменных может отличаться от исходного количества регрессоров (обычно в большую сторону). Такие переменные Zi,..., Ze называются инструментальными. Они позволяют построить состоятельную оценку параметра β модели.




Поделиться с друзьями:


Дата добавления: 2014-12-07; Просмотров: 1026; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.009 сек.