Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Дисперсійний та кореляційний аналіз побудованої моделі




Після знаходження оцінок параметрів моделі, її перевіряють на якість та точність

здійснюється за допомогою наступних показників:

1) тісноти кореляційного зв’язку;

2) точності;

3) надійності;

Тіснота кореляційного зв’язку. Взагалі показником тісноти кореляційного зв’язку для будь-якої моделі (лінійної і нелінійної, парної і множинної) служить коефіцієнт множинної кореляції (). Його величина використовується як міра тісноти зв’язку між результативною ознакою і чинниками, що увійшли до рівняння регресії. Для парної лінійної моделі ||, тобто коефіцієнт множинної кореляції співпадає з абсолютною величиною коефіцієнта парної кореляції. змінюється від нуля до одиниці і тлумачиться аналогічно ||. Останній знаходиться за формулою:

r(x,y)= (2.9)

Точність. Абсолютною мірою точності побудованої парної моделі служить середня квадратична (стандартна) помилка регресії (). Вона розраховується за формулою:

[] (2.10)

Треба пам’ятати, що() залежить від одиниць вимірювання результативної ознаки (). Щоб отримати відносну характеристику точності регресійного рівняння користуються квадратом коефіцієнта множинної кореляції(), який називається коефіцієнтом детермінації. Виражений у відсотках, коефіцієнт детермінації показує долю варіації результативної ознаки (), що пояснюється чинниками, які увійшли до рівняння регресії.

Для малих вибірок (N < 20) при побудові будь-яких регресійних моделей знаходиться також нормований коефіцієнт детермінації (). Він завжди нижче за () і враховує співвідношення числа спостережень (N) і кількості коефіцієнтів рівняння регресії(m). При N→ ∞, . Але на малих вибірках може суттєво відрізнятися від . Для парної лінійної моделі нормований коефіцієнт детермінації розраховується за формулою:

=1-(1-) (2.11)

Для парної лінійної моделі (=), тобто коефіцієнт детермінації дорівнює квадрату коефіцієнта парної кореляції і показує частку варіації результативної ознаки (), що пояснюється чинником ().

Надійність. Надійність побудованої моделі (2.6) визначається надійністю множинних кореляційних зв’язків та надійністю окремих коефіцієнтів регресії. По-перше, перевіряється статистична значущість рівняння регресії у цілому, тобто множинних кореляційних зв’язків між ознаками, що вивчаються. Якщо станеться, що модель ненадійна у цілому, то другий крок — перевірку значущості окремих коефіцієнтів, робити не має сенсу.

Перевірка статистичної значущості моделі у цілому тотожна тестуванню надійності множинних кореляційних зв’язків, тобто перевірці нульової гіпотези (:=0) проти альтернативи(:>0). Оскільки для парного лінійного рівняння , то можна стверджувати, що побудована регресійна модель у цілому і коефіцієнт () будуть статистично значущі, якщо відхиляється нульова гіпотеза (:=0).

Іншими словами, перевірка надійності моделі (коефіцієнта ) зводиться по суті до перевірки статистичної значущості коефіцієнта парної кореляції ().

Це перший підхід до визначення надійності побудованого рівняння регресії. Другий підхід випливає з наступних міркувань. Відомо, що t – розподіл Стьюдента зв’язаний з – розподілом Фішера таким чином:

. (2.12)

Тобто квадрат будь-якої t – статистики з рівнем значущості (α)i числом ступенів вільності () дорівнює – критерію Фішера з рівнем значущості (α)i числом ступенів вільності і . З врахуванням (2.12) формула для перевірки нульової гіпотези (:=0)приймає вигляд:

. (2.13)

Отже для перевірки значущості парного коефіцієнта кореляції застосовують наступний алгоритм.

1. Обчислюють фактичне значення t –статистики за формулою:

(2.14)

2. Для заданої ймовірності р і k =N-2 ступенів волі (де N кількість спостережень результативної ознаки) знаходиться табличне значення tpk - статистики. (таблиці розподіл Студента).

3. Якщо , то заданою надійністю приймається, гіпотеза про наявність кореляційного зв’язку між випадковими величинами х та у (фактором і показником). Тобто, в цьому випадку, можна говорити про наявність лінійного зв’язку між показником і фактором де a0 і a1 - оцінки параметрів парної лінійної регресії.

4. Якщо , то приймається гіпотеза (:>0).. В цьому випадку М говорять, що з надійністю р кореляційний зв’язок між випадковими х і у відсутній.

Для перевірки значущості оцінок параметрів моделі (для парної лінійної регресії достатньо перевірити значущість оцінки ) використовують також критерій Студента за наступним алгоритмом:

1). Обчислюють фактичне значення t –статистики за формулою:

де (2.15)

2). Для заданої ймовірності р і k =N-2 ступенів волі (де N кількість спостережень результативної ознаки) знаходиться табличне значення tpk - статистики. (таблиці розподіл Студента).

3). Якщо , то заданою надійністю приймається гіпотеза про значущість даної оцінки параметра моделі.

(2.16)

5. Наступний крок це перевірка моделі на адекватність статистичним даним на основі критерію Фішера. Для парної лінійної регресії цей алгоритм має вигляд:

За рівнем значущості (α)i числом ступенів вільності (і ), де N – кількість спостережень. Він розраховується за формулою:

(2.17)

Знаходять теоретичне значення критерію Фішера за відповідними статистичними таблицями, з рівнем значущості (α)i числом ступенів вільності (і ), де N – кількість спостережень.

Якщо , то заданою надійністю приймається, гіпотеза про адекватність моделі статичним даним або, що модель статистично значуща і надійна.

5. Для економічного аналізу потрібно, що обчислити коефіцієнт еластичності та - коефіцієнт.

Звичайно еластичність визначають для «середнього» спостереження статистичної сукупності, тобто для і формула коефіцієнта еластичності має вираз:

100% (2.18)

Коефіцієнт еластичності показує, на скільки відсотків у середньому змінюється результативна ознака () зі зміною чинника () на один відсоток (у 1,01 рази).

- коефіцієнт показує, на скільки середніх квадратичних відхилень в середньому змінюється результативна ознака(у)зі зміною чинника ()на одне своє середнє квадратичне відхилення і обчислюється за формулою:

(2.19)

Якщо результати дослідження моделі на якість, точність та надійність дали позитивні результати, то можна перейти до етапу прогнозування.

6. Будуються прогнози двох типів: точкові та інтервальні. Точковий прогноз дає значення результативної ознаки для відповідного рівня () за допомогою екстраполяції отриманого рівняння регресії:

ŷ . (2.20)

 

Однак слід пам’ятати, що модель (2.20) є вибірковою (містить можливі випадкові та систематичні помилки), тому ймовірність співпадіння точкового прогнозу (ŷ )з реальним майбутнім значенням результативної ознаки практично дорівнює нулю. В такій ситуації більш привабливим є прогнозування на основі побудови довірчого інтервалу для точки (ŷ ) з наперед заданою достовірністю. Довірчий інтервал прогнозу будується на основі загального співвідношення:

ŷ (2.21)

де — гранична помилка прогнозу.

Воно є базовим і використовується для визначення довірчих інтервалів прогнозу, побудованих за допомогою будь-яких моделей лінійної регресії, знайдених за методом найменших квадратів.

(2.22)

Доведено, що для парної лінійної моделі гранична помилка прогнозу з достовірністю % має вигляд

Для інтервального прогнозу помилка прогнозу обчислюється за формулою:

(2.23)

При цьому застосовується табличне значення t – критерію Стьюдента з рівнем значущості (i k=N- 1)ступенями вільності у випадку двосторонньої перевірки.

Аналіз формули (2.22) показує, що величина () прямо залежить від трьох чинників і зворотно від одного:

· ріст необхідної достовірності призводить до зниження рівня значущості () та підвищення табличного значеннярозподілу Стьюдента і величини ();

· величина стандартної помилки регресії ()прямо впливає на розмір ();

· з ростом (— періоду упередження) зростає різниця()і величина самої граничної помилки прогнозу; найбільш точний прогноз можна отримати при інтерполяції, коли ();

· при ∞, величина знижується, тобто підвищення обсягу статистичної сукупності спостережень зворотно впливає на розмір ().

 




Поделиться с друзьями:


Дата добавления: 2014-01-11; Просмотров: 1384; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.024 сек.