Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

По первой и третьей группе находят параметры уравнений регрессии и остатки по ним

4. Используя данные об остатках моделей первой и третьей группы, рассчитывают фактическое значение F -критерия.

F = SSE(3) / SSE(1)

df 1= df 2= k-m-1

Вывод: отношения R будет удовлетворять отношение F-критериев. Чем больше будет величина R превышать табличное значение F-критерия, тем более будет нарушена предпосылка о равенстве дисперсий остаточных величин.


29. Использование коэффициента корреляции рангов Спирмэна для проверки наличия гетероскедастичности в остатках

Гетероскедастичность (неоднородность) — проблема, возникающая при построении регрессионных моделей; означает ситуацию, когда дисперсия ошибки в уравнении регрессии изменяется от наблюдения к наблюдению. В этом случае приходится подвергать определенной модификации МНК (иначе возможны ошибочные выводы).

Г. проявляется, если совокупность неоднородна (изучаются разносторонние области).

Суть проверки заключается в том, что в случае гетероскедастичности абсолютные остатки коррелированны со значениями фактора.

1. Эту корреляцию можно измерить с помощью коэффициента ранговой корреляции Спирмена:

p = rСпирмана = 1 - (6Σd2 / (n * (n2-1)))

где, d – абсолютная разность между рангами значений фактора и остатка.

2. Статистическую значимость можно оценить с помощью t-критерия:

t = rСпирмана * корень из (n-2) / корень из (1- r2Спирмана)

3. Сравним эту величину с табличной при кол-ве степеней свободы df = n – 2.

Вывод: Если это значение больше табличного, то корреляция между остатком и фактором статистически значима, то есть имеет место гетероскедастичность остатков. В противном случае принимается гипотеза об ее отсутствии.


30. Использование тестов Уайта, Парка, Глейзера при анализе гетероскедастичности в остатках

Гетероскедастичность (неоднородность) — проблема, возникающая при построении регрессионных моделей; означает ситуацию, когда дисперсия ошибки в уравнении регрессии изменяется от наблюдения к наблюдению. В этом случае приходится подвергать определенной модификации МНК (иначе возможны ошибочные выводы).

Г. проявляется, если совокупность неоднородна (изучаются разносторонние области).

1. тест Парка:

Этот тест относится к тестам гетероскедастичности (для квадрата остатков). Предполагается, что дисперсия остатков связана со значениями факторов функции ln e2 = a + b ln x + u. Данная регрессия строится для каждого фактора в условиях многофакторной модели. Проверяется значимость коэффициента регрессии по критерию Стьюдента. Если коэффициент регрессии для уравнения ln ε2 окажется статистически значимым, то существует зависимость ln ε2от ln x, то есть имеет место гетероскедастичность остатков.

2. тест Глейзера:

Тест Глейзера относится к тестам гетероскедастичности и основывается на регрессии абсолютных значений остатков, то есть рассматривается функция | ei| = a + b*xc + u. c – какое-либо число, например, c = – 1; – 0,5; 0,5; 1. Регрессия абсолютного значения остатка от фактора х строится при разных значениях параметра с; далее отбирается та функция, для которой коэффициент регрессии b оказывается наиболее значимым, то есть имеет место наибольшее значение критерия Стьюдента или критерия Фишера и детерминации.

3. тест Уайта:

Тест предполагает, что дисперсия ошибок регрессии представляет собой квадратичную функцию от значений факторов, то есть:

e2 = a + bx + cx2 + u

e2 = a + b1x1 + b1x12 + b2x2 + b2x22 + u.

Так что модель включает не только значения факторов, но и их квадраты, а также попарные произведения. Поскольку каждый параметр модели e2 = f (x)должен быть рассчитан на основе достаточного числа степеней свободы, то чем меньше объем совокупности, тем в меньшей мере квадратичная функция сможет содержать попарные произведения факторов.

 


31. Применение обобщенного метода наименьших квадратов (ОМНК) для случая гетероскедастичности остатков

Невозможность или нецелесообразность использования традиционного МНК по причине проявляющейся в той или иной степени гетероскедастичности привели к разработке обобщенного метода наименьших квадратов (ОМНК). Фактически при этом корректируется модель, изменяются ее спецификации, преобразуются исходные данные для обеспечения несмещенности, эффективности и состоятельности оценок коэффициентов регрессии.

При нарушении гомоскедастичности и наличии автокорреляции (это статистическая корреляция между случайно распределенными в пространстве переменными одного и того же типа, атрибута, имени и т.д., когда корреляция зависит от расстояния и/или направления между местоположениями) рекомендуют заменять МНК на ОМНК.

Отличие: применяется к преобразованным данным и не только получает несмещенные оценки, но и оценки эти имеют меньшие выборочные дисперсии.

Предполагаем:

-среднее остатков равно нулю,

-гипотеза: их дисперсия уже не является постоянной, она пропорциональна x2

-сама величина дисперсии, входящая общим множителем при этих коэффициентах пропорциональности, неизвестна.

-исходная модель после введения этих коэффициентов в уравнение множественной регрессии продолжает оставаться гетероскедастичной:

y = a + bx + e *корень из(x)

-пусть эти остаточные величины (остатки) не являются автокоррелированными.

1. Введем новые переменные, получающиеся делением исходных переменных модели, зафиксированных в результате i-наблюдения, на корень квадратный из коэффициентов пропорциональности Кi:

y / к.из(x) = (a / к.из(x)) + (bx / к.из(x)) + e

y / к.из(x) = Y

1 / к.из(x) = Z

2. Получим новое уравнение в преобразованных переменных, в котором уже остатки будут гомоскедастичны. Сами новые переменные — это взвешенные исходные переменные:

Y = aZ + b* к. из(x) + e

3. Необходимо минимизировать величину отклонений У; получим систему нормальных уравнений:

Σ (YZ) = a*Σ Z2 + b*Σ (z * к.из(x))

Σ Y к.из(x) = a*Σ (Z *к.из(x)) + b*Σ x

4. Определяем коэфф. регрессии b в ОМНК, как взвешенную величину по отношению к обычному МНК с весами 1 / к.из(x). Преобразовываем систему:

Σ (y/x) = a*Σ (1/x) + n*b

Σ y = n*a + b*Σ x

или

y / к.из(x) = a’ / к.из(x) + b’*x / к.из(x) + e

y = a’ + b’*x.

Вывод: Если в модели обнаружена гетероскедастичность, то ее можно устранить с помощью ОМНК. Все зависит от того, насколько точно мы можем оценить дисперсию ошибок наблюдений. Если мы нашли переменные, которые хорошо их описывают, то ОМНК будет работать.

Недостатки (две технические проблемы)

1. в преобразованной регрессии не будет константы, поэтому коэффициент детерминации перестает быть хорошим измерителем качества регрессии.

2. мы делим все переменные в уравнении регрессии на одну и ту же переменную, это может привести к возникновению ложных связей и мультиколлинеарности (тесная корреляционная взаимосвязь между отбираемыми для анализа факторами, совместно воздействующими на общий результат).

КРАТКО:

1. Преобразование исходных переменных:

t’ = yt – rb * yt-1

xt’ = xt – rb * xt-1

2. Применение обычного МНК к уравнению и определение a* и b:

yt’ = a’ + b*xt’ + Vt

3. Расчет параметра a:

a = a’ / (1 - rb )

4. Переход к исходному уравнению:

yt = a + b*xt + et


32. Мультиколлинеарность факторов – понятие, проявление и меры устранения

Проблемы, возникающие при построении регрессионных моделей:

1. Гетероскедастичность.

2. Мультиколлинеарность.

Мультиколлинеарность — тесная корреляционная взаимосвязь между отбираемыми для анализа факторами, совместно воздействующими на общий результат.

Симптомы М.:

1. завышенное значение коэффициента детерминации r2;

2. высокие стандартные ошибки для коэффициентов регрессии b;

3. широкие доверительные интервалы (для b);

4. низкое значение t-критерия;

5. появление при коэффициентах регрессии b знаков, противоположных ожидаемым.

Методы по устранению М.:

1. Удаление из модели переменных с высоким коэффициентом парной корреляции r между факторами, если это не противоречит теории, положенной в основу построения модели.

2. Увеличение числа наблюдений n.

3. Изменение функциональной формы модели.

4. Использование априорной информации.

5. Построение моделей по отклонениям от средней величины.

6. Использование специальных методов обработки временных рядов.


33. Специфика временного ряда как источника данных в эконометрическом моделировании

Временной (динамический) ряд – это ряд последовательно расположенных во времени числовых значений соответствующего показателя

Элементы временного ряда:

1. уровни ряда (yt)- числовые значения того или иного показателя;

2. время (t).

Виды временных рядов:

1. моментные, если время задано моментами;

2. интервальные, если время задано интервалами.

Модели на основе рядов динамики:

1. Модели изолированного динамического ряда.

2. Модели системы взаимосвязанных рядов динамики.

3. Модели авторегрессии.

4. Модели с распределенным лагом.

Компоненты временного ряда:

1. Тенденция (T) характеризует воздействие всех факторов на динамику изучаемого показателя.

2. Периодические колебания (P)

3. Случайные колебания (E)

yt = f (T, P, E)

Графики:

1. Ряд без тенденции и периодических колебаний: yt = y + E;

2. Ряд с тенденцией: yt = f (T) + E;

3. Ряд с периодическими и случайными колебаниями yt = f (P, E);

4. Ряд с тенденцией, периодическими и случайными колебаниями yt = f (T, P, E).


34. Автокорреляция уровней временного ряда и ее последствия

Автокорреляция уровней временного ряда -корреляционная зависимость между последовательными значениями уровней временного.

rytyt-1 = (ytyt-1cp – yt cp * yt-1cp) / δytδyt-1

rytyt-1 = (Σ(yt – yt cp)* (yt-1 - yt-1cp)) / к.из(Σ(yt – yt cp)2*(yt-1 - yt-1cp) 2)

Последствия:

1. Оценки параметров, оставаясь линейными не смещенными, перестают быть эффективными, они перестают обладать свойствам наилучших линейных несмещенных оценок

2. Дисперсии оценок являются смещенными.

3. Зачастую дисперсии являются заниженными, что привод к увеличению t-статистик. Это может привести к признанию статистически значимыми объясняющие переменные, которые могут ими и не являться.

4. Коэф. регрессии и детерминации м.б. не верными, следовательно ухудшаются прогнозные качества модели.

 


35. Моделирование тенденции временных рядов

Метод аналитического выравнивания сводится к замене фактических данных сглаженными, определенными по выбранной математической функции. При этом, уровни временного ряда рассматриваются как функция от времени: yt = f(t)

Этапы построения модели тенденции (уравнения тренда):

1. Выбор математической функции, описывающей тенденцию;

2. Оценка параметров модели;

3. Проверка адекватности выбранной функции и оценка точности модели;

4. Расчет точечного и интервального прогнозов;

Виды математических функций, описывающих тенденцию:

1. Функции с монотонным характером возрастания (убывания) и отсутствием пределов роста (сниж-я);

2. Кривые с насыщением, т. е. устанавливается нижняя или верхняя граница изменения уровней ряда;

3. S -образные кривые, т. е. кривые с насыщением, имеющие точку перегиба.


36. Оценивание параметров в уравнениях тренда

Уравнения трендов:

1. Линейная y = a + bt

2. Гипербола y = a + b/t

3. Парабола второго порядка y = a + bt + ct2

4. Степенная функция y = atb

5. Показательная функция y = abt

6. Экспонента y = ea + bt

7. Обратная модель y = 1/(a + bx)

8. Логарифмическая y = a + b*lnx

Эконометрическое оценивание моделей включает два основных этапа:

1. Теоретический. Считается, что определена генеральная совокупность. Зная ее статистические свойства, м. теоретически определить параметры модели.

2. Эмпирический. Используются выборочные данные. Можно оценить, но нельзя точно определить значения параметров модели, т.к. они являются случайными величинами.

Параметры - характеристики генеральной совокупности. Оценки - характеристики выборочной совокупности.

Оценка генеральных параметров может быть получена двумя методами:

а) МНК – используется чаще;

б) методом максимального правдоподобия.

Требования к оценкам (свойства):

1. Несмещенность. В среднем оценка соответствует параметру при любом объеме выборки.

2. Эффективность. Несмещенная оценка эффективна, если она имеет мин. дисперсию по сравнению с другими выборочными оценками. Та из оценок, которая имеет меньшую дисперсию, является более эффективной.

3. Состоятельность. Оценка состоятельна, если при увеличении объема выборки она стремится к оцениваемому параметру. Т.е. хср не отличается от µ, когда n → ∞.

Рассмотрим линейный тренд:

t y = a + bt ∆y = yt – yt-1
  a + b -
  a + 2b b
  a + 3b b
  a + 4b b

Можно вывести формулы для нахождения параметров системы:

b = ((yt*t)ср - yt ср * tср) / (t2ср – tср2); а = yt cp - b*tср.

а - свободный член уравнения регрессии; экономически не интерпретируется.

b - абсолютный показатель силы связи (в лин. ур-ии).Наклон линии регрессии или коэффициент регрессии. Мера зависимости у от х.

Σt = 0; a = Σy / n; b = Σyt / Σt2

Система норм. ур-ий: Σy = na + bΣt

Σyt = aΣt + bΣt2

37. Модели сезонности: аддитивная и мультипликативная

Метод аналитического выравнивания сводится к замене фактических данных сглаженными, определенными по выбранной математической функции. При этом, уровни временного ряда рассматриваются как функция от времени: yt = f(t).

Учет сезонности при построении модели регрессии y = a +bxt + c1z1 + c2z2 + c3z3:

z1 = 1 – для первого квартала, z1 = 0 – для остальных;

z2 = 1 – для второго квартала, z2 = 0 – для остальных;

z3 = 1 – для третьего квартала, z3 = 0 – для остальных.

Тимы моделей:

1. Аддитивная модель -модель, в которую факторы входят в виде алгебраической суммы; приблизительно равная сезонная вариация указывает на существование аддитивной модели: yt = T+S+E

2. Мультипликативная модель -модель, в которую факторы входят в виде произведения; усиление сезонной вариации с возрастанием тренда указывает на существование мультипликативной модели: yt = T*S*E

Построение аддитивной модели:

1. Нахождение сглаж. уравнений динамич. ряда методом скользящих средних

2. Оценка сезонной компоненты и ее корректировка

3. Элиминирование сезонной компоненты из исходных данных временного ряда

4. Построение уравнения линейного тренда по уровням ряда с элиминированием сезонности

5. расчет выровненных значений трендовой составляющей

6. расчет теоретических уровней ряда с учетом сезонности

7. расчет случайной компоненты, позволяющей оценить качество построенной модели.

 

Аддитивная. Мультипликативная


38. Исключение тенденции на основе метода отклонений от тренда

Тенденция (T) характеризует воздействие всех факторов на динамику изучаемого показателя.

Существует 3 метода исключения тенденции:

- Метод отклонений от тренда;

- Метод последовательных разностей;

- Включение в модель регрессии по временным рядам фактора времени.

1. eyt = yt – yt с крыш ; ext = xt – xt с крыш

eyt = a – b*ext

2. (yt – yt с крыш) = a + b*(xt - xt с крыш)

yt = yt с крыш + a + b*(xt - xt с крыш)

yp = yt=p с крыш + a + b*(xp – xt=p с крыш)

 

yp - прогнозное значение у;

yt=p с крыш - прогноз у по тренду при t=p;

xp - прогнозное значение х;

xt=p с крыш - прогноз х исходя из уравнения тренда при t=p.

 


39. Исключение тенденции на основе метода последовательных разностей

Тенденция (T) характеризует воздействие всех факторов на динамику изучаемого показателя.

Существует 3 метода исключения тенденции:

- Метод отклонений от тренда;

- Метод последовательных разностей;

- Включение в модель регрессии по временным рядам фактора времени.

1. ∆yt = yt – yt-1 ; ∆xt = xt – xt-1

yt = a + b * ∆xt

2. (yt – yt-1) = a + b*(xt - xt-1)

yt = yt-1 + a + b*(xt - xt-1)

yp = yn + a + b*(xp – xn)

yp - прогнозное значение уровня ряда yt;

yn – конечный уровень динамического ряда yt;

xp - прогнозное значение уровня ряда хt;

xn - конечный уровень динамического ряда хt.

 


40. Исключение тенденции на основе включения в модель регрессии по временным рядам фактора времени

Тенденция (T) характеризует воздействие всех факторов на динамику изучаемого показателя.

Существует 3 метода исключения тенденции:

- Метод отклонений от тренда;

- Метод последовательных разностей;

- Включение в модель регрессии по временным рядам фактора времени.

1. yt = a + b*xt + c*t

yt = a + b1x1 + b2x2 + b3x3 + c*t

2. P = aKb1Lb2Ect

lnP = lna + b1 lnK + b2 lnL +ct

yt = a + bx1 + ct + dt2


41. Автокорреляция в остатках. Критерий Дарбина-Уотсона в оценке качества уравнений, построенных по временным рядам

Автокорреляция в остатках - корреляционная зависимость. Это проблема. Последовательность остатков м. рассматриваться как временной ряд – возникает возможность построения зависимости последовательности остатков от времени. Остатки должны быть случайными (из МНК).

Причины А. остатков:

1. Связана с исходными данными и вызвана ошибками измерения в значениях результативного признака. Т,к. часто остатки содержат циклические колебания – каждое следующее значение остатков зависит от предшествующих.

<== предыдущая лекция | следующая лекция ==>
Коэфф. (индекс) множественной корреляции | Из-за недостатков формулировки модели
Поделиться с друзьями:


Дата добавления: 2014-01-05; Просмотров: 668; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.142 сек.