Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Проста вибіркова лінійна регресія




 

Прості лінійні регресійні моделі встановлюють лінійну залежність між двома змінними, наприклад, витратами на відпустку та складом родини; витратами на рекламу та обсягом продукції, що випускається; витратами на споживання та валовим національним продуктом (ВНП), зміною ВНП залежно від часу, врожайністю культур та кількістю добрив, що вносяться під культури.

При цьому одна зі змінних вважається залежною змінною (y) та розглядається як функція від незалежної змінної (x).

У загальному вигляді проста вибіркова лінійна регресійна модель запишеться так:

                         (2.0)

де y — вектор спостережень за залежною змінною;

;

х — вектор спостережень за незалежною змінною;

;

b0,b1 — невідомі параметри регресійної моделі;

е — вектор випадкових величин (помилок);

. [5]

 

2.1. Оцінка параметрів лінійної регресії за допомогою

методу найменших квадратів

 

Щоб мати явний вид залежності, необхідно знайти (оцінити) невідомі параметри b0, b1 цієї моделі за допомогою критерію. Найпоширенішим є критерій мінімізації суми квадратів відхилень. Логічно, що треба проводити пряму таким чином, щоб сума квадратів помилок була мінімальною. В цьому і полягає критерій найменших квадратів: невідомі параметри b0 та b1 визначаються таким чином, щоб мінімізувати  , тобто

               (2.1.1)

 

Визначимо значення b0 та b1, котрі мінімізують вираз (2.1.1). Рішення системи двох лінійних нормальних рівнянь:

              (2.1.2)

дозволяє одержати такі значення параметрів b1 та b0:

,                         (2.1.3)

де ; ;

.                                           (2.1.4)

В явному вигляді регресія у від х, у якій параметри обчислені за методом найменших квадратів, виразиться так:

 або .                   (2.1.5) [5]

Приклад 1. Побудувати лінійну регресійну модель, що характеризує залежність між обсягом продажу цукерок фабрики “Світоч” (млн. коробок) та витратами на рекламу (млн. грн.), на основі вихідних даних:

 

 п/п Обсяг продажу, млн. коробок Витрати на рекламу, млн. грн.
     

 

Рішення:

 В таблиці представимо результати попередніх розрахунків:

 

№ п/п Обсяг продажу, млн.коробок, yi Витрати на рекламу, млн. грн., xi ^ ^
            -2 -1
                       

 

Розрахуємо параметри b1 та b0:

;

 

.

Таким чином, лінійна регресійна модель має вигляд:

 або .

Зазначимо, що сума оцінених (розрахункових) значень обсягу продажу цукерок ( ) дорівнює сумі фактичних значень yi, а сума помилок дорівнює нулю.

 

Завдання 1. Припустимо, що ви зібрали дані про споживання домашніх господарств в Україні та їх доходів і оцінили таке рівняння: С = 120 + 0,75у

Визначити: а) яка змінна є залежною, а яка — незалежною;

б) пояснити взаємозв’язок між споживанням та доходом. На скільки зросте споживання, якщо доход зросте на 1 одиницю?

 

Завдання 2. Припустимо, ви зібрали дані про річний продаж фірмою “Україна” продукції (у) і суми, які використано на наукові дослідження (х). Ви маєте таку статистику:

коваріація:

варіація:

варіація: .

Середній річний продаж: ( )=1200.

Середня сума на наукові дослідження: ( )=895.

Визначити параметри регресії b0 та b1 і побудувати лінійну регресійну модель. Дати економічну інтерпретацію одрежаній моделі.

 

Завдання 3.Є такі дані:

 

  х   У
           

 

Заповнити пропуски і знайти параметри регресії b0 та b1.

 

Завдання 4. Маємо дані про урожайність зернових (yi) і кількість внесених на 1 га мінеральних добрив (xi) під зернові за 10 років в ПОК “Зоря” Білозерського району Херсонської області:

 

Роки                    
Урожайність, ц/га, yi 65,2 64,4 54,0 54,7 64,0 31,6 44,7 32,3 54,5 46,8
Внесено мін.добрив, ц.д.р. на 1 га, xi 2,6 2,5 2,1 2,2 2,3 1,6 1,8 2,1 2,0 1,9

 

Побудувати лінійну регресійну модель, що характеризує залежність між урожайністю зернових та кількістю внесених на 1 га мінеральних добрив.

 

2.2. Коефіцієнти кореляції та детермінації

 

Найпростішим критерієм, який дає кількісну оцінку зв’язку між двома показниками, є коефіцієнт кореляції:

r                                  (2.2.1)

Значення коефіцієнта завжди розташовані між –1 та +1  

Якщо rух = 0, зв’язок між ознаками відсутній;

 |r yx| — щільність зв’язку низька;

0,3 <|r yx|  — щільність зв’язку середня;

0,75 <|r yx|<1 — щільність зв’язку висока;

r yx= 1 — зв’язок переходить у функціональний;

 r yx<0 — зв’язок зворотний;

r yx>0 — зв’язок прямий.

Поряд з коефіцієнтом кореляції використовується ще один критерій, за допомогою якого також вимірюється щільність зв’язку між двома або більше показниками та перевіряється адекватність (відповідність) побудованої регресійної моделі реальній дійсності. Таким критерієм є коефіцієнт детермінації (R2):

 .              (2.2.2)

Частина дисперсії, котра пояснює регресію, називається коефіцієнтом детермінації.

Цей коефіцієнт показує, яка частина загальної варіації залежної (результативної) ознаки (у) обумовлена варіацією незалежної (факторної) ознаки (х), що включена в регресійну модель.

Коефіцієнт детермінації R2 завжди додатний і знаходиться в межах від 0 до 1 . [5]

Приклад 2. За даними прикладу 1 оцінити щільність зв’язку між обсягом продажу цукерок фірмою “Світоч” та витратами на рекламу.

 

Рішення: Розрахунки представимо в таблиці:

 

 

    №п/п Хі — витрати на рекламу, млн.грн. Уі — обсяг продажу, млн. коробок          
      -5 -1 -1 -15 -10 -5      
             

 

Визначимо коефіцієнт кореляції:

r .

 

Визначимо коефіцієнт детермінації:

R2 = (r yx)2 = (0,995)2 = 0,990 або R2 = 99%.

Висновок: Коефіцієнт кореляції ryx=0,995 свідчить про високу щільність зв’язку між обсягом продажу цукерок та витратами на рекламу фірмою “Світоч”, оскільки 0,75<0,995<1. Коефіцієнт детермінації R2=99% показує, що 99% варіації (коливань) результативної ознаки — обсягу продажу цукерок на 99% обумовлено варіацією незалежної (факторної) ознаки — витратами на рекламу і лише 1% варіації обсягу продажу залежить від варіації факторів, що не включені в регресійну модель.

 

Завдання 5. За даними завдання 2 розрахувати коефіцієнт кореляції між обсягом продажу продукції та сумою, що використана на наукові дослідження в фірмі “Україна”. Визначити коефіцієнт детермінації для регресії. Дати економічну інтерпретацію одержаних результатів.

 

Завдання 6. За даними завдання 3 оцінити щільність зв’язку між залежною змінною (у) та незалежною змінною (х), розрахувавши коефіцієнти кореляції та детермінації. Зробити висновки.

 

Завдання 7. За даними завдання 4 дати кількісну оцінку зв’язку між урожайністю зернових та кількістю внесених мінеральних добрив під зернові в ПОК “Зоря” Білозерського району Херсонської області. Зробити висновки.

Завдання 8. Маємо статистику витрат родини залежно від кількості її членів:

 

Кількість членів родини, осіб, хі Витрати на відпустку, грош.одиниць, уі
   

 

1. Побудувати лінійну регресію і розрахувати параметри.

2. Розрахувати коефіцієнт кореляції та детермінації. Які висновки можна зробити щодо якості регресійної моделі?

 

Завдання 9.   Є 4 динамічні ряди. Якщо ці дані апроксимувати простою лінійною регресією, то вони дадуть однакові результати. Побудувати графіки і проаналізувати їх зображення. Побудувати лінійну модель, оцінивши параметри за методом найменших квадратів. Оцінити щільність зв’язку між залежною (у) та незалежною (х) змінними. Пояснити отримані результати.

 

Х1 У1 Х2 У2 Х3 У3 Х4 У4
  8,04   9,14   7,46   6,58
  9,96   8,1   8,86   5,76
  5,68   4,74   5,73   7,71
  6,95   8,14   6,77   8,84
  8,81   8,77   7,11   8,47
  10,84   9,13   8,15   7,04
  4,26   3,1   5,39   5,25
  4,82   4,26   6,42   12,5
  8,33   9,26   7,81   5,56
  7,58   8,74   12,74   7,91
  7,24   6,13   6,08   6,89

 

Завдання 10. Маємо дані про рівень звільнень на 100 робітників та рівень безробіття у виробничій сфері східного регіону України (дані умовні) протягом 1997-2009 рр.

 

Примітка: Дані про звільнення стосуються людей, що покинули роботу за власним бажанням.

 

Рік Рівень звільнень на 100 робітників, у Рівень безробіття (%), х
  1,3 6,2
  1,2 7,8
  1,4 5,8
  1,4 5,7
  1,5 5,0
  1,9 4,0
  2,6 3,2
  2,3 3,6
  2,5 3,3
  2,7 3,3
  2,1 5,6
  1,8 6,8
  2,2 5,6

 

 

1. Нанесіть дані на координатну площину.

2. Припустимо, що рівень звільнень (у) лінійно пов’язаний з рівнем безробіття (х) і цей зв’язок виражається моделлю . Обчисліть параметри .

3. Обчисліть коефіцієнт кореляції та детермінації.

4. Поясніть отримані результати.

 

Завдання 11. У таблиці подано дані про кількість телефонів на 1000 осіб (у) та валовий внутрішній продукт (ВВП) на душу населення (х) у західному районі України (дані умовні) за 1989-2009 рр. Чи є зв’язок між цими двома змінними? Довести, побудувавши лінійну регресійну модель та обчисливши коефіцієнти кореляції та детермінації. Зробити висновки.

 

Рік у х Рік у х
           
           
           
           
           
           
           
           
           
           
           
           

 




Поделиться с друзьями:


Дата добавления: 2023-10-13; Просмотров: 63; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.008 сек.