Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Порядок выполнения работы. Часть 2. Применение пакета Statistica при построении и анализе нелинейной многофакторной модели регрессии




Пример

Постановка задачи

Часть 2. Применение пакета Statistica при построении и анализе нелинейной многофакторной модели регрессии

Пример

 

В таблице ниже приведены отчетные данные по 31 области Европейской части России за январь-сентябрь 1999 года.

(Статсборник «Социально-экономическое положение России: январь-сентябрь 1999 года. – М.: Российское статистическое агентство, 1999»).

Социально-экономические показатели России

в период январь-сентябрь 1999 года

 

Область Численность населения, тыс. чел. Оборот розничной торговли, млн. руб. Поступление налогов и сборов в бюджет, млн. руб. Объем про-мышленного производства, млн. руб. Инвестиции в основной капитал, млн. руб.
1. Архангельская   7550,7 3395,6    
2. Вологодская   6914,6 4803,2    
3. Мурманская   11208,2 4508,4    
4. Ленинградская   8952,8 4410,3    
5. Новгородская   4891,7 1567,3    
6. Псковская   3598,3 1134,7    
7. Брянская   5574,5 1780,4    
8. Владимирская   7218,2 2802,1    
9. Ивановская   3969,2 1250,5    
10. Калужская   4842,0 1894,2    
11. Костромская   3723,8 1299,6    
12. Московская   32157,7 20054,9    
13. Орловская   5613,8 2464,3    
14. Рязанская   5911,0 2365,5    
15. Смоленская   7747,5 1703,3    
16. Тверская   5565,7 2426,9    
17. Тульская   8654,1 3051,4    
18. Ярославская   8419,4 4346,7    
19. Кировская   8034,1 2844,1    
20. Нижегородская   19539,4 9418,4    
21. Белгородская   9124,9 3195,8    
22. Воронежская   14056,6 3441,8    
23. Курская   7471,7 2219,3    
24. Липецкая   8120,1 2864,6    
25. Тамбовская   7082,4 1538,1    
26. Астраханская   5269,3 1874,1    
27. Волгоградская   11824,9 5087,2    
28. Пензенская   5791,8 1997,1    
29. Самарская   48848,4 14961,1    
30. Саратовская   11799,1 5012,3    
31. Ульяновская   7344,4 2556,4    

 

Задача заключается в расчете модели многофакторной линейной регрессии, характеризующей зависимость инвестиций в основной капитал областей России (Y).

Зависимость определяется следующими четырьмя факторами:

t1 – численность населения области, тыс. чел.,

t2 – оборот розничной торговли, млн. руб.,

t3 – поступление налогов и сборов в бюджет, млн. руб.,

t4 – объем промышленного производства, млн. руб.

 

Оценить параметры нелинейной регрессии в модуле Nonlinear Estimation (Допол-нительные линейные/нелинейные моделиНелинейный подсчет) по данным примера.

Различают два основных класса нелинейных моделей:

1) нелинейные модели относительно факторных переменных, но линейные по оцениваемым параметрам,

2) нелинейные модели по оцениваемым параметрам.

К первому классу относятся полиноминальные функции различных порядков, начиная со второго и гиперболическая функция. Для того, чтобы оценить неизвестные параметры нелинейной регрессионной модели ее приводят к линейному виду. Суть линеаризации нелинейных по независимым переменным регрессионных моделей заключается в замене нелинейных факторов переменных на линейные.

Ко второму классу нелинейных моделей относятся регрессионные модели, в которых результативная переменная нелинейно связана с параметрами уравнения. К такому типу регрессионных моделей относятся – степенная функция, показательная функция (простая экспоненциальная), логарифмическая парабола, экспоненциальная функция, обратная функция, кривая Гомперца, логистическая функция (кривая Перла-Рида). Данные модели распределяются на подлежащие линеаризации и неподлежащие.

Предположим, что связь между факторами (х 1 ,...,хр) и y выражается следующим образом:

y = b о + b1 j 1(х 1 ,..., хр) + b2 j 2(х 1 ,..., хр) +... + b k j k (х 1 ,..., хр) + e

где j j (), j = 1,..., k, - система некоторых функций. Имеется n наблюдений при различных значениях х = (х 1 ,..., хр): x 1, x 2,..., xn; тогда:

в матричной форме:

y = X b + e,

где Х - матрица n x (k + 1), в i -й строке которой (1, j 1 (x i), j 2 (xi),..., j k (x i)).

Пусть имеется 20 наблюдений по некоторому технологическому процессу химического производства; x, y - изменяемое содержание двух веществ, z - контролируемый параметр получаемого продукта. Полагая, что

z = P (x, y) + e,

где P (x, y) = b о + b1 x + b2 y + b3 x 2 + b4 xy + b5 y 2 - многочлен второй степени, e - случайная составляющая, М e = 0, D e = s 2, необходимо оценить функцию P (x, y) и найти точку ее минимума. Данные приведены в таблице ниже

 

i xi yi 1 zi 2 zi 3 zi 4 zi 5 zi 6 zi 7 zi 8 zi
  -3 -2   222.3   17.1   122.3   117.1
  -3   89.4 146.8 161.4 114.8 189.4 46.8 61.4 214.8
  -3   148.5 155.4 60.5 155.4 248.5 55.4 0.5 255.4
  -2 -3 56.8 205.2 248.8 7.7 156.8 105.2 148.8 107.7
  -2   18.5 148.4 186.5 116.4 118.5 48.4 86.5 216.4
  -2     145.5   145.5   45.5   245.5
  -1 -2 29.2 141.4 221.2 53.6 129.2 41.4 121.2 153.6
  -1     175.1   143.1   75.1   243.1
    -3 46.2   174.2 60.9 146.2   74.2 160.9
    -1 18.2 100.6 210.2   118.2 0.6 110.2  
      31.6 118.5 199.6 86.5 131.6 18.5 99.6 186.5
    -1 8.6 108.4 207.9 94.5 108.6 8.4 107.9 194.5
      8.4 121.3 194.5 89.3 108.4 21.3 94.5 189.3
      1.9 189.4 215.4 61.4 101.9 89.4 115.4 161.4
    -3 122.3 107.5 117.1 112.2 222.3 7.5 17.1 212.2
      8.1 125.8 205.4 53.8 108.1 25.8 105.4 153.8
    -3 20.8 205.9 186.9 5.9 120.8 105.9 86.9 105.9
    -2 105.2 120.8 107.7 86.9 205.2 20.8 7.7 186.9
          160.9       60.9  
      7.5 200.4 212.2 0.4 107.5 100.4 112.2 100.4

 

 

1. Задание аппроксимирующей функции и вывод результатов

При запуске пакета Statistica выберите модуль Nonlinear Estimation (Нелинейное оценивание), затем в предложенном меню выберите команду User-specified regression (Задаваемая пользователем регрессия).

При этом вызывается диалоговое окно (см. рисунок ниже).

В поле Missing data остается параметр Casewise (Исключение пары данных при отсутствии одной из переменных). Щелчком по кн. Function to be estimated & loss function (Оцениваемая функция и функция потерь) вызывается одноименное диалоговое окно, в поле Estimated function введите формулу зависимости.

 

В поле Loss function остается предлагаемая по умолчанию функция потерь L в виде квадрата разности OBServed (наблюдаемых) и PREDicted (предсказываемых моделью) значений. Из условия минимума суммы L, т.е. методом наименьших квадратов, находится параметр а, который используется в формуле, набранной в поле Estimated function.

Щелчок по кнопке Ок возвращает в диалоговое окно User-Specified Regression Function, но уже с заполненными выражениями функций и позволяет проверить их ввод (см. рисунок ниже).

Из окна User-Specified Regression Function щелчком по кнопке Ок вызывается диалоговое окно Model Estimation.

 

В верхнем поле этого окна отображается информация по подбору модели:

- ее математическое описание,

- число искомых параметров,

- тип функции потерь,

- название переменных,

- автоматическое исключение строки при отсутствии в ней одной из переменных,

- количество обрабатываемых строк.

Ниже расположены инструменты для задания условий аппроксимации и вывода результатов.

Раскрывающийся список Estimation Method позволяет указать метод подбора искомого параметра. Рекомендуется оставить метод Quasi-Newton (метод Ньютона последовательных приближений способом касательных). Он обеспечивает быструю сходимость итераций.

Флажок Asymptotic standard errors необходимо установить для вывода стандарта асимптотической (в итоге итераций) погрешности оценки искомого параметра.

Флажок Eta for finite difference approximation (Eta≈10-8параметр сглаживания) доступен при установке флажка Asymptotic standard errors.

В раскрывающемся списке Maximum number of iterations указывается максимальное число итераций при подборе параметра (достаточно 50).

Раскрывающийся список Convergence criterion (Критерий сходимости) позволяет установить погрешность вычислений (можно оставить ≈0,0001).

Кнопка Start values выводит диалоговое окно для задания начального значения функции потерь (остается величина, устанавливаемая по умолчанию).

Кнопка Initial step sizes выводит диалоговое окно для задания шага вычислений при подборе параметра (остается величина по умолчанию).

Кнопка Means and standard deviations используется для вывода таблицы средних значений, стандартов и границ переменных (см. рисунок ниже).

При нажатии кнопки Matrix plot for all variables появляется диалоговое окно, в котором выделяются анализируемые переменные x, y, z. После этого выводятся гистограммы и гра-фики линейного приближения (см. рисунок ниже).

Кнопка Box & whisker plot for all variables выводит графики с «усами» для выбираемых статистик, на которой в виде отрезков (усиков) показывает относительный разброс значений от среднего (математического ожидания) или медианы в квартилях, единицах среднеквадратического отклонения или долях размаха для выбранных переменных.

Кнопка Ок предназначена для вывода окна Parameter Estimation с результатами итераций по оценке искомого коэффициента и сообщения о недостаточной сходимости процесса вычислений по используемым критериям.

Если есть необходимость повысить точность вычислений, щелкните по кнопке Нет, чтобы вернуться в диалоговое окно и воспользуйтесь другими способами решения. Если точность достаточна, нажимается кнопка Да, после чего осуществляется переход в окно Parameter Estimation, из него щелчком по кнопке Ок вызывается диалоговое окно Results (Результаты), показанное на рисунке ниже.

В верхней части окна отображаются общие сведения о модели, а также коэффициент корреляции и корреляционное отношение R.

Щелчок по кнопке Parameter Estimates выводит таблицу с результатами вычисления искомого параметра и стандарта погрешности его оценки (см. рисунок ниже).

В верхнем поле отражена сумма Final loss (Конечная остаточная сумма квадратов), корреляционное отношение R и доля Variance explained (Доля объясненного рассеяния в %). Величина t (14) – t-отношение Std.Err. (Стан-дарт погрешности для асимптотической оцен-ки параметра) к Estimate (Сама оценка) при 14 степенях свободы.

Кнопка Cov/corrs. of parameters выводит ковариацию и корреляцию асимптотической (в итоге итераций) и найденной оценки искомого параметра.

Флажок Scale Mean Square Error to 1 рекомендуется установить для оценки искомого параметра методом максимального правдоподобия.

Кнопка Residual выводит таблицу с остатками (разностями фактических значений z и предсказываемых моделью).

Кнопка Predicted выводит таблицу с прогнозируемыми значениями z.

Кнопка Observed values выводит таблицу с фактическими значениями z.

Кнопка Means and standard deviations выводит таблицу со статистическими параметрами фактических значений z.

Кнопка Difference (previous model) недоступна при заданном типе модели и способе поиска параметра.

Нажатие кнопки Save predicted and residual values позволяет сохранить прогнозируемые значения и остатки.

Кнопка Fitted 3D function & observed values для трехмерного отображения дан-ных выводит график контро-лируемого параметра получае-мого продукта.

Кнопка Distribution of residuals выводит для распре-деления остатков гистограмму и сглаживающую кривую нор-мального закона. Однако более наглядно согласие распреде-ления остатков с нормальным законом проявляется на диаг-рамме со шкалами, спрямляю-щими интегральную кривую при нормальном распреде-лении. Диаграмма вызывается щелчком по кнопке Normal probability plot of residuals.

 

Кнопка Half-normal probability plot выводит распределение остатков на диаграмме со шкалами, спрямляющими интегральную кривую при полунормальном законе.

Кнопка Predicted vs. observed values выводит диаграмму совместного рассеяния фактических и предсказываемых значений z.

Кнопка Predicted vs. residual values выводит диаграмму с совместным рассеянием остатков и прогнозируемых значений z.

Кнопка Matrix plot for all variables вызывает список всех переменных для выделения анализируемых переменных и вывода графика линейного приближения.

Кнопка Box & whisker plot for all variables вызывает список переменных для выделения анализируемых переменных и вывода диаграммы с «усами» (доверительными интервалами) указываемых статистик.

Кнопка Ок выводит результаты подбора параметра.

Кнопка Cancel закрывает диалоговое окно.

Сделайте выводы о применимости данной модели для анализа, прокомментируйте полученные результаты и предложите рекомендации для уточнения модели.

 


Приложение 1

Значение t - критерия Стьюдента

df (v) Уровень значимости α   df (v) Уровень значимости α
0,10 0,05 0,01   0,10 0,05 0,01
  6,3137 12,7062 63,656     1,7341 2,1009 2,8784
  2,9200 4,3027 9,9250     1,7291 2,0930 2,8609
  2,3534 3,1824 5,8408     1,7247 2,0860 2,8453
  2,1318 2,7765 4,6041     1,7207 2,0796 2,8314
  2,0150 2,5706 4,0321     1,7171 2,0739 2,8188
  1,9432 2,4469 3,7074     1,7139 2,0687 2,8073
  1,8946 2,3646 3,4995     1,7109 2,0639 2,7970
  1,8595 2,3060 3,3554     1,7081 2,0595 2,7874
  1,8331 2,2622 3,2498     1,7056 2,0555 2,7787
  1,8125 2,2281 3,1693     1,7033 2,0518 2,7707
  1,7959 2,2010 3,1058     1,7011 2,0484 2,7633
  1,7823 2,1788 3,0545     1,6991 2,0452 2,7564
  1,7709 2,1604 3,0123     1,6973 2,0423 2,7500
  1,7613 2,1448 2,9768     1,6839 2,0211 2,7045
  1,7531 2,1315 2,9467     1,6706 2,0003 2,6603
  1,7459 2,1199 2,9208     1,6576 1,9799 2,6174
  1,7396 2,1098 2,8982   1,6449 1,9600 2,5758

 


Приложение 2

Значение F - критерия Фишера при уровне значимости α = 0,05

(df 1 (v 1) – число степеней свободы для большей дисперсии; df 2 (v 2) – число степеней свободы для меньшей дисперсии)

df 2 (v 2) df 1 (v 1) df 2 (v 2)
                               
                                     
  18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,40 19,41 19,42 19,43 19,45 19,46 19,50  
  10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,76 8,74 8,71 8,69 8,66 8,62 8,53  
  7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,94 5,91 5,87 5,84 5,80 5,75 5,63  
  6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,70 4,68 4,64 4,60 4,56 4,50 4,36  
  5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,03 4,00 3,96 3,92 3,87 3,81 3,67  
  5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,60 3,57 3,53 3,49 3,44 3,38 3,23  
  5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,31 3,28 3,24 3,20 3,15 3,08 2,93  
  5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,10 3,07 3,03 2,99 2,94 2,86 2,71  
  4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,94 2,91 2,86 2,83 2,77 2,70 2,54  
  4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,82 2,79 2,74 2,70 2,65 2,57 2,40  
  4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,72 2,69 2,64 2,60 2,54 2,47 2,30  
  4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,63 2,60 2,55 2,51 2,46 2,38 2,21  
  4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,57 2,53 2,48 2,44 2,39 2,31 2,13  
  4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,51 2,48 2,42 2,38 2,33 2,25 2,07  
  4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,46 2,42 2,37 2,33 2,28 2,19 2,01  

 

ПРОДОЛЖЕНИЕ ПРИЛОЖЕНИЯ 2

 

df 2 (v 2) df 1 (v 1) df 2 (v 2)
                               
  4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,41 2,38 2,33 2,29 2,23 2,15 1,96  
  4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,37 2,34 2,29 2,25 2,19 2,11 1,92  
  4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,34 2,31 2,26 2,21 2,16 2,07 1,88  
  4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,31 2,28 2,22 2,18 2,12 2,04 1,84  
  4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,28 2,25 2,20 2,16 2,10 2,01 1,81  
  4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,26 2,23 2,17 2,13 2,07 1,98 1,78  
  4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,24 2,20 2,15 2,11 2,05 1,96 1,76  
  4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,22 2,18 2,13 2,09 2,03 1,94 1,73  
  4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,20 2,16 2,11 2,07 2,01 1,92 1,71  
  4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,18 2,15 2,09 2,05 1,99 1,90 1,69  
  4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,17 2,13 2,08 2,04 1,97 1,88 1,67  
  4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,15 2,12 2,06 2,02 1,96 1,87 1,65  
  4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,14 2,10 2,05 2,01 1,94 1,85 1,64  
  4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,13 2,09 2,04 1,99 1,93 1,84 1,62  
  4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,04 2,00 1,95 1,90 1,84 1,74 1,51  
  4,03 3,18 2,79 2,56 2,40 2,29 2,20 2,13 2,07 2,03 1,99 1,95 1,89 1,85 1,78 1,69 1,44  
  4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,95 1,92 1,86 1,82 1,75 1,65 1,39  
  3,94 3,09 2,70 2,46 2,31 2,19 2,10 2,03 1,97 1,93 1,89 1,85 1,79 1,75 1,68 1,57 1,28  
3,84 2,99 2,60 2,37 2,21 2,09 2,01 1,94 1,88 1,83 1,79 1,75 1,69 1,64 1,57 1,46 1,00

 

Приложение 3

Титульный лист отчета

Уфимский Государственный Авиационный Технический Университет

Кафедра Экономики предпринимательства

 




Поделиться с друзьями:


Дата добавления: 2014-12-23; Просмотров: 728; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.311 сек.