Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Порядок выполнения работы. Часть 1. Применение пакета Statistica при построении и анализе линейной многофакторной модели регрессии




Пример

Постановка задачи

Часть 1. Применение пакета Statistica при построении и анализе линейной многофакторной модели регрессии

 

 

Провести по данным примера расчет линейной многофакторной регрессионной модели в пакете Statistica в модуле Multiple Regression (Множественная регрессия).

 

Многофакторная стохастическая зависимость рассматривается на примере влияния факторов, определяющих объем продаж пива в Греции. Объем продаж пива определяется выручкой, которая рассматривается для текущего месяца как зависимая переменная St. Основными контролирующими факторами, влияющими на объем продаж (независимыми переменными), являются следующие:

q объем продаж (в стоимостном выражении) St -1 за прошлый месяц,

q ассигнования на рекламу в текущем месяце At,

q ассигнования на рекламу за прошлый месяц Аt -1,

q число туристов в текущем месяце Тt.

Анализируются месячные показатели (переменные) за два года.

Для указанных переменных линейная модель описывается уравнением:

St = b 0 + b 1 St -1 + b 2 At + b 3 At -1 + b 4 Tt,

где b 0, b 1, b 2, b 3, b 4 – неизвестные коэффициенты (параметры модели).

Задача заключается в математическом моделировании зависимостей:

- оценка степени влияния на рынок исследуемых факторов (с выбором релевантных) и возможности воздействия на объемы продаж пива,

- прогнозирование объема продаж пива на очередной месяц.

Выборка анализируемых данных за 24 месяца представлена в таблице ниже, упорядоченной в обратном порядке по времени:

 

Месяц S S1 A A1 T
  8846,4   288,5   1675,2
  8774,7 8846,4 324,2 288,5 1405,7
  9524,7 8774,7 332,2 324,2 722,6
  11134,3 9524,7 439,2 332,2 2229,5
  12239,8 11134,3 98,2 439,2 2614,8
  8862,1 12239,8 212,8 98,2 3088,6
  8646,9 8862,1   212,8 1741,5
  11758,5 8646,9 327,7    
  11867,2 11758,5 160,6 327,7 1777,8
  9577,6 11867,2 403,1 160,6 1378,9
  10898,4 9577,6 269,7 403,1 1253,3
  9638,6 10898,4 280,5 269,7  
  9203,9 9638,6 335,1 280,5 1384,4
  9231,1 9203,9 169,3 335,1 1392,5
  7334,5 9231,1   169,3 2484,3
    7334,5 216,1   2777,5
  7839,6   322,2 216,1 3301,9
    7839,6 285,5 322,2 3635,9
  9600,3   79,2 285,5 3415,9
  7199,9 9600,3 333,6 79,2 2606,8
  9547,7 7199,9 293,1 333,6  
  10187,5 9547,7 238,5 293,1 2834,1
  9661,2 10187,5 255,4 238,5 2481,8
  9189,2 9661,2 383,6 255,4 1474,4

 

 

1. Оценка многофакторной линейной регрессии

Для выявления наличия связи и определения вида функциональной зависимости, которая наиболее подходит для предложенных данных, рассчитаем коэффициент корреляции и построим график «поле корреляции». В модуле Statistic / Multiple Regression (Множественная регрессия) откроем диалоговое окно. Щелчком по кнопке Variables (Переменные) в открывшемся окне Select the variables for analysis (Выбрать переменные для анализа) выберем для анализа в качестве зависимой переменной Dependent данные в первом столбце, переменные со второго по пятый столбец зададим как независимые Independent – предикторы, и щелкнем по кнопке Ок. Во второй закладке отметим флажками первые три пункта для расширенного статистического анализа с описательными характеристиками. Далее нажать кнопку Ок, появится диалоговое окно Review Descriptive Statistics. В случае построения многофакторной модели требуется проверить факторы на мультиколлинеарность.

Для этого в открывшемся окне просмотра описатель-ных статистических характеристик выберем Correla-tions (Корреляции). Откроется корреляционная матри-ца (см. рисунок ниже). В нашем примере коэффициенты корреляции между факторами меньше коэффициентов корреляции факторов с результирующей переменной (0,349666; -0,170562; 0,795733), т.е. мультиколли-неарность отсутствует. В противном случае, следовало бы исключить из анализа один из факторов – тот, который менее тесно связан с результативным признаком. При необходимости для удаления выбросов воспользуйтесь Brushing-Кисть, меню активизируется кнопкой на панели инструментов (выброс – точка, лежащая далеко в стороне от основной массы точек).

 

Меню инструмента Brushing - Кисть В группе опций Action - Действия установите маркер на действие Label и, подведя курсор-лупу к предполагаемому «выбро-су» на графике поля корреляции, щелкните левой кнопкой мыши. Соответствующая точка-«выброс» будет выделена. Далее нажмите кнопку Update-Обновить для определения порядкового номера случая-«выброса». Над точкой появился номер: Case № …- Наблюдение № …. Для удаления «выброса» с графика поля корре-ляции установите маркер на действие Turn OFF - Отключить и нажмите Update-Обновить. Направление аппроксимирующей функ-ции изменилось, теперь все точки лежат в непосредственной ее бли-зости. Можно сделать вывод о сильном влиянии выброса на резуль-тат анализа, удалить выброс (Наблюдение № …) из исходных дан-ных и заново рассчитать коэффициент парной корреляции. Нажа-тием кнопки Quit - Выход закончите использование инструмента Brushing - Кисть. Удалите выброс и из исходных данных, предва-рительно закрыв диалоговое окно Review Descriptive statistics – Про-смотр описательных статистических характеристик. Далее снова вызовите Startup Panel – Стартовую панель в меню Analysis-Анализ и проведите расчет коэффициента парной корреляции.

 

2. Анализ значимости модели и ее компонентов

Для получения оценок качества модели необходимо выполнить расчет модели в полном объеме. Нажатие кнопки Ок в диалоговом окне Review Descriptive Statistics вызывает окно Model Definition.

При нажатии кнопки Ок открывается окно Multiple Regression Results (Результаты множественной регрессии), выводящая итоги. В окне результатов верхняя часть является информационной и показывает результаты анализа, а нижняя часть – функциональная, она содержит кнопки, предназначенные для выполнения детализированных расчетов (с представлени-ем результатов в числовом или графическом виде). Назначение выводимых характеристик:

q Dep. Var. (Подчиненный) – имя зависимой переменной, в примере – S.

q Multiple R (Умножение R) – множественный коэффициент корреляции, в нашем случае равен 0,97794626 (связь между признаками весьма сильная).

q F – значение критерия Фишера, составляет 101,1422 (расчетное значения сравнивается с табличным 2,9 при степенях свободы v 1 = m – 1 =5 – 1 = 4, v 2 = nm = 24 – 5 = =19. Расчетное значение больше табличного более чем в 4 раза, т.е. модель значима).

q R2 – множественный коэффициент детерминации, равен 0,95637889 (достаточно близок к 1, модель значима).

q df – число степеней свободы F-критерия, составляет 4,19.

q No. of cases (Число случаев) – количество наблюдений, равно 24.

q adjusted R2 – скорректированныйкоэффициент детерминации, равен 0,94719550.

q р – критический уровень значимости модели, в примере р = 0,000000.

q Standard error of estimate – среднеквадратическая ошибка, в примере 312,99537275.

q Intercept (Разрыв) – оценка свободного члена модели регрессии, равна –3212,140554.

q Std.Error – стандартная ошибка оценки, составляет 14,12044.

q t(19)=-3,448 и р<0,0027 – значения t-критерия и критического уровня значимости (проверяется значимость свободного члена модели регрессии, табличное значение t-критерия сравнивается с расчетным. При уровне значимости 0,05 табличное значение критерия 2,09, а расчетное значение по модулю 3,448, т.е. параметр значим). Для независимых переменных указаны стандартизированные коэффициенты регрессии (beta).

Кнопка Regression Summary (Итог: результаты регрессии) выводит итоговую таблицу регрессии, в которой, кроме стандартизированных коэффициентов регрессии (beta), даны их нестандартизированные значения, t-отклонения от нуля и вероятности ошибок при отклонении нулевой гипотезы об их равенстве нулю.

 

 

Рассмотрим назначение отдельных столбцов таблицы:

q в 4-ом столбце В содержатся оценки параметров модели регрессии и уравнение принимает вид: S = -3212,14 + 15,25 A1 + 0,66 S1 + 0,51 T + 4,25 A.

Значимость найденных параметров проверяется по таблице t-критерия Стьюдента.

q в пятом столбце St.Err. of В – значения стандартной ошибки параметров модели регрессии.

q в 6-ом и 7-ом столбцах t(19) и p-level – значения t-критерия и минимального уровня значимости, используемые для проверки гипотез о равенстве 0 коэффициентов регрессии. В данном примере р-значения близки к нулю, т.е. оба параметра модели значимы. Расчетные значения t-критерия Стьюдента для каждого параметра, отраженные в столбце t(19), сравниваем с табличным значением t-критерия для числа степеней свобода, равного 19.

 




Поделиться с друзьями:


Дата добавления: 2014-12-23; Просмотров: 453; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.025 сек.