КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Модели с дихотомическими (фиктивными) переменными
Эконометрический анализ при нарушении классических модельных предположений
4.1. Гетероскедастичность. Критерии Парка и Голдфелда – Квандта для обнаружения гетероскедастичности. При нахождении оценок коэффициентов эмпирических регрессий по наблюдениям дисперсия случайной переменной Это свойство возмущающей переменной Данное условие подразумевает, что, несмотря на то, что при каждом конкретном наблюдении случайное отклонение может быть большим или маленьким, положительным или отрицательным, не может быть некой априорной причины, вызывающей большее отклонение при одних наблюдениях и меньшее – при других. При невыполнимости данной предпосылки (при гетероскедастичности) последствия применения МНК могут быть следующими. 1. Оценки коэффициентов остаются несмещенными и линейными. 2. Оценки не будут эффективными (т.е. они не будут иметь наименьшую дисперсию по сравнению с другими оценками данного параметра). Они не будут и асимптотически эффективными. Увеличение дисперсии оценок снижает вероятность получения максимально точных оценок. 3. Дисперсии оценок будут рассчитываться со смещением, так как дисперсия 4. Вследствие вышесказанного все выводы, получаемые на основе соответствующих Для обнаружения гетероскедастичности применяются различные методы: графический анализ отклонений, критерии ранговой корреляции Спирмена, Парка, Глейзера, Голдфелда – Квандта. Рассмотрим критерий Парка. Предположим, что дисперсия отклонений 1. Строится уравнение регрессии 2. Для каждого наблюдения определяются 3. Строится регрессия
В случае множественной регрессии зависимость (4.1) строится для каждого факторного признака. 4. Проверяется статистическая значимость коэффициента Критерий Голдфелда – Квандта. Предположим, что дисперсия отклонений 1. Все 2. Упорядоченная выборка разбивается на три подвыборки объема 3. Строятся уравнения регрессии для первой и третьей подвыборок. Если предположение о пропорциональности дисперсий отклонений значениям 4. Для сравнения дисперсий составляется 5. Если Голдфелд и Квандт для парной регрессии предлагают следующие размеры подвыборок: если При множественной регрессии данный критерий применяется для факторного признака с найбольшей дисперсией Критерий Голдфелда – Квандта можно применять и при обратной пропорциональной зависимости между Пример 4.1. По эмпирическим данным, описывающих величину потребления (
построить линейную регрессионную модель и проверить случайность остатков. Р е ш е н и е. Линейная регрессионная модель зависимости объема потребления от величины дохода и инвестиций имеет вид:
Коэффициенты
Подставив в полученное уравнение регрессии значения
Случайность остатков проверим при помощи критерия серий. Для этого образуем последовательность из плюсов и минусов по следующему правилу: если
Общее число серий Проведем графический анализ зависимости остатков
Рис 4.1
4.2. Методы смягчения проблемы гетероскедастичности. При установлении гетероскедастичности возникает необходимость преобразования модели с целью устранения этого недостатка. Вид преобразований зависит от того, известны или неизвестны дисперсии А). Если для каждого наблюдения известны значения Рассмотрим парную линейную регрессию
Разделим все члены уравнения на известное
Рассмотренный метод преобразований называется взвешенным методом наименьших квадратов (ВМНК), который включает следующие шаги. 1. Значения каждой пары эмпирических данных 2. Для преобразованных значений Б). Если фактические значения дисперсий - дисперсии
Можно показать, что для случайных отклонений - дисперсии
После определения оценок параметров 4.3. Автокорреляция остатков регрессионной модели. Критерий Дарбина – Уотсона. Другой важной предпосылкой МНК является предположение о попарной независимости значений случайных отклонений (остатков) Корреляция между упорядоченными во времени или в пространстве последовательными или смещенными на лаг Автокорреляция остатков (отклонений) – это корреляция между последовательными значениями возмущающей переменной Последствия автокорреляции в определенной мере сходны с последствиями гетороскедастичности, т.е. все выводы, получаемые на основе соответствующих Для установления статистической независимости отклонений
На практике, вместо коэффициента корреляции используют другие критерии. Наиболее распространенным критерием, позволяющим установить наличие автокорреляции остатков первого порядка, т.е. между соседними остаточными членами, является критерий Дарбина – Уотсона (см. п. 2.7). При применении этого критерия формулируется основная гипотеза
При больших значениях
так как при больших значениях При случайном поведении отклонений (остатков)
Таким образом, необходимым условием независимости случайных отклонений является близость к двойке значения статистики Дарбина – Уотсона. Следовательно, если Для ответа на вопрос, какие значения статистики
При грубой оценке считают, что если Применение статистики Дарбина – Уотсона основано на следующих предположениях: 1. Регрессионные модели должны содержать свободный член. 2. Случайные отклонения 3. Эмпирические данные должны иметь одинаковую периодичность. 4. Критерий не применяется для авторегрессионных моделей. При подтверждении автокорреляции остатков в первую очередь необходимо проанализировать спецификацию модели, т. е. уточнить состав факторных признаков, оказывающих влияние на результативный признак. Если после этого автокорреляция имеет место, то применяются различные преобразования модели, устраняющие автокорреляцию. Для устранения автокорреляции можно воспользоваться авторегрессионной схемой первого порядка AR(1), применение которой рассмотрим на парной линейной регрессии
Тогда наблюдения
Предположим, что случайные отклонения описываются авторегрессионной моделью первого порядка:
где
Введем обозначения
коэффициенты
Если значение коэффициента автокорреляции В случае, когда автокорреляция остатков велика, то применяется метод первых разностей. При этом методе уравнение регрессии (4.12), в котором полагаем
где 4.4. Мультиколлинеарность экзогенных переменных. Методы устранения мультиколлинеарности. Мультиколлинеарностью называется линейная зависимость между двумя или несколькими факторными признаками множественной линейной регрессии. Если факторные признаки связаны строгой линейной функциональной зависимостью, то мультиколлинеарность называется совершенной, а при существовании тесной корреляционной зависимости между факторными признаками – несовершенной. При существовании мультиколлинеарности могут возникнуть следующие последствия: 1. Большие стандартные ошибки оценок параметров уравнения регрессии, что приводит к увеличению интервальных оценок, ухудшению их точности. 2. Уменьшаются 3. Становятся неустойчивыми оценки параметров уравнения регрессии при малейшем изменении данных. 4. Затрудняется определение вклада каждого из факторных признаков в объясняемую уравнением регрессии дисперсию результативного признака. 5. Возможно получение неверного знака у коэффициента регрессии. Существует несколько признаков, по которым может быть установлена мультиколлинеорность. 1. Коэффициент детерминации 2. Между малозначимыми факторными признаками существует тесная корреляционная зависимость. 3.Тесная частная корреляционная зависимость между факторными признаками. Мультиколлинеарность может иметь место, если какой – либо факторный признак связан тесной корреляционной зависимостью с другими факторными признаками. Для выявления этой зависимости строятся уравнения регрессии каждого факторного признака Прежде чем устранять мультиколлинеарность, определяется цель исследования. Если модель строится для прогнозирования, то при Простейшим методом устранения мультиколлинеарности является исключение из модели одной или ряда коррелированных переменных. Для уменьшения мультиколлинеарности увеличивается объем выборки, что приводит к увеличению статистической значимости коэффициентов регрессии. Изменяется форма модели, или добавляются факторные признаки, не учтенные в модели, но существенно влияющие на результативный признак (зависимую переменную). Это приводит к уменьшению стандартных ошибок коэффициентов регрессии. Выполняются преобразования уравнения регрессии, путем деления на один из факторных признаков и др.
5.1. Необходимость использования фиктивных переменных. В регрессионных моделях в качестве факторных признаков часто приходится использовать не только количественные признаки, но и качественные. Например, спрос на продукцию может зависеть от вкусов потребителей, их национальных или религиозных особенностей и т. п. Обычно в моделях влияние качественного фактора выражается в виде фиктивной (искусственной) переменной, которая отражает два противоположных состояния качественного фактора:
Переменная Таким образом, в регрессионном анализе рассматриваются модели, содержащие только количественные факторные признаки (обозначаемые Регрессионные модели, содержащие только качественные факторы, называются ANOVA – моделями (моделями дисперсионного анализа). Например, ANOVA - модель парной регрессии имеет вид:
Очевидно, что условное математическое ожидание результативного признака равно:
Следовательно, коэффициент 5.2. Регрессионные модели с количественными и качественными переменными. Модели, которые содержат количественные и качестенные факторные признаки, называются ANCOVA – моделями (моделями ковариационного анализа). Простейшая ANCOVA – модель с одним количественным и одним качественным признаками имеет вид:
Ожидаемое значение результативного признака при альтернативных значениях фиктивного признака равно:
Из моделей (5.2) и (5.3) следует, что значение результативного признака изменяется с одним и тем же коэффициентом пропорциональности Значение фиктивного признака при В регрессионную модель можно вводить произвольное число качественных переменных. Например, регрессионная модель с двумя качественными признаками имеет вид:
где
Из этой модели выводятся следующие регрессионные зависимости:
Регрессии отличаются лишь свободными членами. Дальнейшее определение статистической значимости коэффициентов Описанные схемы могут быть распространены на регрессии с произвольным числом количественных и качественных факторов, при этом отметим, что если качественный фактор имеет В рассмотренных выше случаях, предполагалось, что изменение значения качественного фактора влияет лишь на изменение свободного члена. Но существуют ситуации, когда изменение качественного фактора приводит к изменению, как свободного члена уравнения, так и коэффициента регрессии. Это характерно для временных рядов экономических данных при изменении институциональных условий, введении новых правовых или налоговых ограничений. В этом случае уравнение регрессии будет иметь вид:
где
Ожидаемые значения результативного признака определяются уравнениями:
Коэффициенты Для ответа на вопрос, можно ли за весь рассматриваемый период времени строить единое уравнение регрессии, или же нужно разбить временной интервал на части и на каждой из них строить свое уравнение регрессии, используется тест Чоу. Применение теста Чоу состоит в следующем. 1. Строится уравнение регрессии по выборке объема 2. Выборку разбиваем на две подвыборки объемами 3. Для каждой из подвыборок строим уравнения регрессий и вычисляем суммы квадратов отклонений 4. Проводим сравнение дисперсий на основе
имеющей распределение Фишера с числом степеней свободы 5.3. Модели с фиктивными результативными признаками. Рассмотрим модели с фиктивными результативными признаками, факторные признаки которых могут быть как количественными, так и качественными. Например, при анализе наличия работы у гражданина в зависимости от возраста, образования, семейного положения, доходов остальных членов семьи и т.д., то в качестве результативного признака выступает фиктивная переменная:
Указанные модели представимы в виде:
Модели (5.8) называются линейными вероятностными моделями (LPM – моделями). Предположим, что зависимость фиктивного результативного признака и количественного факторного признака описывается уравнением регрессии:
Из уравнения (5.9) следует, что среднее ожидаемое значение
Так как Поскольку использование LPM моделей имеет определенные ограничения, то применяются logit модели, в которых вероятности
выражаемый линейной функцией. Для определения коэффициентов
Дата добавления: 2014-01-06; Просмотров: 959; Нарушение авторских прав?; Мы поможем в написании вашей работы! |