КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Тема 5. Гетероскедастичність
5.1. Виявлення гетероскедастичності та її природа Розглянемо класичну лінійну багатофакторну модель (5.1) Як завжди, , (5.2). , Для застосування МНК при оцінюванні параметрів моделі раніше було сформульовано основні припущення, які на практиці можуть порушуватись. Раніше розглядався особливий випадок багатофакторного регресійного аналізу, пов'язаний з проблемою мультиколінеарності. Тепер розглянемо інший особливий випадок, що стосується сталості дисперсії кожної випадкової величини (гомоскедастичність залишків). Означення 5.1. Якщо дисперсія залишків стала для кожного спостереження, то це явище називається гомоскедастичністю: , . (5.3) Якщо це припущення не задовольняється в якомусь окремому випадку, то маємо гетероскедастичність (помилки некорельовані, але мають несталу дисперсію). Означення 5.2. Якщо дисперсія залишків змінюється для кожного спостереження або групи спостережень, то це явище називається ге- тероскедастичністю: , . (5.4) Розглянемо питання про доцільність припущення (5.3) і про те, що відбувається, якщо це припущення не задовольняється. Насамперед зауважимо, що сутність припущення про гомоскедастичність полягає в тому, що варіація кожної випадкової складової навколо її математичного сподівання не залежить від значення факторів : Форма гетероскедастичності залежить від знаків і значень коефіцієнтів у залежності Оскільки не спостережувана випадкова величина, ми не знаємо справжньої форми гетероскедастичності. У прикладних дослідженнях, як правило, використовують зручне припущення, а саме: в разі простої лінійної регресії гетероскедастичиість має форму = (, яку потрібно оцінити).
Наслідки порушення припущення про гомоскедастичність: 1)неможливо знайти середньоквадратичне відхилення параметрів регресії, а отже, неможливо оцінити значущість параметрів; 2)неможливо побудувати довірчий інтервал для прогнозних значень ; 3) отримані за МНК оцінки параметрів регресії не є ефективними (не мають найменшої дисперсії). Зазначимо, що якщо, незважаючи на гетероскедастичність, ми використовуватимемо звичайні процедури перевірки гіпотез, то висновки можуть бути неправильними. Зрозуміло, гетероскедастичність є суттєвою проблемою, а тому потрібно вміти з’ясовувати її наявність.
5.2. Тестування наявності гетероскедастичності Як і в разі мультиколінеарності, єдиних правил виявлення гетероскедастичності немає, а є різноманітні тести (критерії): критерій , параметричний та непараметричний тести Гольдфельда–Квандта, тест Глейсера, тест рангової кореляції Спірмена та ін. Розглянемо лише деякі з них.
5.2.1. Параметричний тест Гольдфельда–Квандта Зауваження. 1. Цей тест застосовується до великих вибірок. 2. Тест припускає нормальний розподіл і незалежність випадкових величин . 1-й крок: спостереження (вихідні дані) впорядкувати відповідно до величини елементів вектора , який може спричинити зміну дисперсії залишків. 2-й крок: відкинути спостережень, які розміщені всередині векторів вихідних даних. 3-й крок: побудувати дві моделі на основі звичайного МНК за двома створеними сукупностями спостережень обсягом за умови, що , де – кількість змінних. 4-й крок: знайти суму квадратів залишків моделей і за першою і другою моделями: , де , і – залишки відповідно за першою і другою моделями. 5-й крок: розрахувати експериментальне значення критерію , який у разі виконання гіпотези про гомоскедастичність відповідатиме F -розподілу з ступенями свободи; 6-й крок: значення критерію порівняти з табличним значенням критерію при вибраному рівні значущості і відповідних ступенях свободи і ; якщо , то гетероскедастичність відсутня.
Зауваження: чим більше значення , тим більша гетероскедастичність залишків.
5.2.2. Непараметричний тест Гольдфельда–Квандта Цей тест базується на встановленні кількості піків значень залишків після впорядкування (ранжування) спостережень за . Якщо для всіх значень змінної залишки розподіляються приблизно однаково, то дисперсія їх однорідна і гетероскедастичність відсутня. Якщо вона змінюється, то гетероскедастичність присутня. Зазначимо, що цей тест не цілком надійний для перевірки на гетероскедастичність. Однак він дуже простий і часто використовується для першої оцінки наявності гетероскедастичності множини спостережень.
5.2.3. Тест Глейсера Перевірка на гетероскедастичність базується на побудові регресійної функції, що характеризує залежність величини залишків за модулем від пояснюючої змінної ,яка може зумовити зміну дисперсії залишків. Аналітична форма регресійних функцій може мати вигляд , , тощо. Рішення про відсутність гетероскедастичності залишків приймається на основі значущості коефіцієнтів і . Перевага цього методу полягає в можливості розрізняти випадок чистої () і змішаної () гетероскедастичності. Залежно від цього потрібно використовувати різні матриці . Оскільки явище гетероскедастичності пов’язане з тим, що змінюються дисперсії залишків, а коваріація між ними відсутня, то матриця у співвідношенні має бути додатно визначеною й діагональною. Приклад. Перевірити гіпотезу про відсутність гетероскедастичності для побудови моделі, яка характеризує залежність заощаджень від доходів населення. Статистичні дані наведено в таблиці.
Таблиця 5.2 Дані до задачі
Розв'язання: Ідентифікуємо змінні: – заощадження, – дохід. Специфікуємо модель у вигляді
Для перевірки гіпотези про відсутність гетероскедастичності залишків моделі застосуємо параметричний тест Гольдфельда–Квандта. 1-й крок: спостереження впорядкуємо за зростанням за величиною доходу (вектор ), який може спричинити зміну дисперсії залишків. Таблиця 5.3 Дані до задачі
2-й крок: відкинемо спостережень усередині вектора вихідних даних. Отримаємо дві сукупності спостережень обсягом . Таблиця 5.3 Перша сукупність спостережень:
Друга сукупність спостережень:
3-й крок: побудуємо дві моделі на основі звичайного МНК за двома створеними сукупностями спостережень:
4-й крок: знайдемо суму квадратів залишків і , за першою і другою моделями: , де і – залишки відповідно за першою і другою моделями. 5-й крок: розрахуємо фактичне (експериментальне) значення критерію . Приймаємо рівень значущості . Число ступенів свободи: . Розраховане значення критерію порівняємо з табличним F -критерію при рівні значущості і відповідних ступенях свободи : . Оскільки , то гетероскедастичність відсутня. Отже, МНК-оцінки параметрів регресійної моделі можуть застосовуватися для подальших досліджень.
5.3. Усунення гетероскедастичності Розглянемо питання усунення гетероскедастичності трансформуванням початкової моделі. Припустимо, що за статистичними даними побудовано початкову регресійну модель і на базі будь-якого тесту встановлено наявність гетероскедастичності: Для усунення гетероскедастичності початкову модель змінюють (трансформують) так, щоб помилки мали сталу дисперсію:
Трансформація моделі зводиться до зміни початкової форми моделі методом, який залежить від специфічної форми гетероскедастичності, тобто від форми залежності між дисперсіями залишків і значеннями незалежних змінних: (5.5). Розглянемо сутність трансформації моделі на прикладі простої лінійної регресії. Нехай початкова модель (5.6), де компоненти випадкового вектора гетероскедастичні, але відповідають іншим класичним припущенням лінійної регресії. Припустимо, що гетероскедастичність має форму (5.7) де , –функція від . Трансформація початкової моделі здійснюється діленням її на . Зазначимо, що така трансформація еквівалентна застосуванню зваженого методу найменших квадратів (ЗМНК), який є особливим випадком узагальненого методу найменших квадратів (УМНК). Суть ЗМНК полягає в мінімізації зваженої суми квадратичних відхилень: Зазначимо також, що ЗМНК, застосований до початкової моделі, дає такі самі результати, що й МНК, застосований до трансформованої моделі. Твердження. Оцінки трансформованої моделі мають меншу дисперсію (ефективніші), ніж оцінки, отримані із застосуванням МНК до початкової моделі. Нарешті, потрібно пам'ятати, що гетероскедастичність може існувати за рахунок неврахованих факторів (поганої специфікації моделі). У цьому разі можливим рішенням є включення неврахованих факторів у модель. Сліпе застосування трансформації (без аналізу причин гетероскедастичності) зробить гомоскедастичною випадкову змінну, однак оцінки параметрів залишаться неправильними через неврахування важливих факторів.
Дата добавления: 2014-10-23; Просмотров: 4013; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |