КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Порядок выполнения работы. Часть 1. Применение пакета Statistica при построении и анализе линейной многофакторной модели регрессии
Пример Постановка задачи Часть 1. Применение пакета Statistica при построении и анализе линейной многофакторной модели регрессии
Провести по данным примера расчет линейной многофакторной регрессионной модели в пакете Statistica в модуле Multiple Regression (Множественная регрессия).
Многофакторная стохастическая зависимость рассматривается на примере влияния факторов, определяющих объем продаж пива в Греции. Объем продаж пива определяется выручкой, которая рассматривается для текущего месяца как зависимая переменная St. Основными контролирующими факторами, влияющими на объем продаж (независимыми переменными), являются следующие: q объем продаж (в стоимостном выражении) St -1 за прошлый месяц, q ассигнования на рекламу в текущем месяце At, q ассигнования на рекламу за прошлый месяц Аt -1, q число туристов в текущем месяце Тt. Анализируются месячные показатели (переменные) за два года. Для указанных переменных линейная модель описывается уравнением: St = b 0 + b 1 St -1 + b 2 At + b 3 At -1 + b 4 Tt, где b 0, b 1, b 2, b 3, b 4 – неизвестные коэффициенты (параметры модели). Задача заключается в математическом моделировании зависимостей: - оценка степени влияния на рынок исследуемых факторов (с выбором релевантных) и возможности воздействия на объемы продаж пива, - прогнозирование объема продаж пива на очередной месяц. Выборка анализируемых данных за 24 месяца представлена в таблице ниже, упорядоченной в обратном порядке по времени:
1. Оценка многофакторной линейной регрессии Для выявления наличия связи и определения вида функциональной зависимости, которая наиболее подходит для предложенных данных, рассчитаем коэффициент корреляции и построим график «поле корреляции». В модуле Statistic / Multiple Regression (Множественная регрессия) откроем диалоговое окно. Щелчком по кнопке Variables (Переменные) в открывшемся окне Select the variables for analysis (Выбрать переменные для анализа) выберем для анализа в качестве зависимой переменной Dependent данные в первом столбце, переменные со второго по пятый столбец зададим как независимые Independent – предикторы, и щелкнем по кнопке Ок. Во второй закладке отметим флажками первые три пункта для расширенного статистического анализа с описательными характеристиками. Далее нажать кнопку Ок, появится диалоговое окно Review Descriptive Statistics. В случае построения многофакторной модели требуется проверить факторы на мультиколлинеарность. Для этого в открывшемся окне просмотра описатель-ных статистических характеристик выберем Correla-tions (Корреляции). Откроется корреляционная матри-ца (см. рисунок ниже). В нашем примере коэффициенты корреляции между факторами меньше коэффициентов корреляции факторов с результирующей переменной (0,349666; -0,170562; 0,795733), т.е. мультиколли-неарность отсутствует. В противном случае, следовало бы исключить из анализа один из факторов – тот, который менее тесно связан с результативным признаком. При необходимости для удаления выбросов воспользуйтесь Brushing-Кисть, меню активизируется кнопкой на панели инструментов (выброс – точка, лежащая далеко в стороне от основной массы точек).
2. Анализ значимости модели и ее компонентов Для получения оценок качества модели необходимо выполнить расчет модели в полном объеме. Нажатие кнопки Ок в диалоговом окне Review Descriptive Statistics вызывает окно Model Definition. При нажатии кнопки Ок открывается окно Multiple Regression Results (Результаты множественной регрессии), выводящая итоги. В окне результатов верхняя часть является информационной и показывает результаты анализа, а нижняя часть – функциональная, она содержит кнопки, предназначенные для выполнения детализированных расчетов (с представлени-ем результатов в числовом или графическом виде). Назначение выводимых характеристик: q Dep. Var. (Подчиненный) – имя зависимой переменной, в примере – S. q Multiple R (Умножение R) – множественный коэффициент корреляции, в нашем случае равен 0,97794626 (связь между признаками весьма сильная).
q F – значение критерия Фишера, составляет 101,1422 (расчетное значения сравнивается с табличным 2,9 при степенях свободы v 1 = m – 1 =5 – 1 = 4, v 2 = n – m = 24 – 5 = =19. Расчетное значение больше табличного более чем в 4 раза, т.е. модель значима). q R2 – множественный коэффициент детерминации, равен 0,95637889 (достаточно близок к 1, модель значима). q df – число степеней свободы F-критерия, составляет 4,19. q No. of cases (Число случаев) – количество наблюдений, равно 24. q adjusted R2 – скорректированныйкоэффициент детерминации, равен 0,94719550. q р – критический уровень значимости модели, в примере р = 0,000000. q Standard error of estimate – среднеквадратическая ошибка, в примере 312,99537275. q Intercept (Разрыв) – оценка свободного члена модели регрессии, равна –3212,140554. q Std.Error – стандартная ошибка оценки, составляет 14,12044. q t(19)=-3,448 и р<0,0027 – значения t-критерия и критического уровня значимости (проверяется значимость свободного члена модели регрессии, табличное значение t-критерия сравнивается с расчетным. При уровне значимости 0,05 табличное значение критерия 2,09, а расчетное значение по модулю 3,448, т.е. параметр значим). Для независимых переменных указаны стандартизированные коэффициенты регрессии (beta). Кнопка Regression Summary (Итог: результаты регрессии) выводит итоговую таблицу регрессии, в которой, кроме стандартизированных коэффициентов регрессии (beta), даны их нестандартизированные значения, t-отклонения от нуля и вероятности ошибок при отклонении нулевой гипотезы об их равенстве нулю.
Рассмотрим назначение отдельных столбцов таблицы: q в 4-ом столбце В содержатся оценки параметров модели регрессии и уравнение принимает вид: S = -3212,14 + 15,25 A1 + 0,66 S1 + 0,51 T + 4,25 A. Значимость найденных параметров проверяется по таблице t-критерия Стьюдента. q в пятом столбце St.Err. of В – значения стандартной ошибки параметров модели регрессии. q в 6-ом и 7-ом столбцах t(19) и p-level – значения t-критерия и минимального уровня значимости, используемые для проверки гипотез о равенстве 0 коэффициентов регрессии. В данном примере р-значения близки к нулю, т.е. оба параметра модели значимы. Расчетные значения t-критерия Стьюдента для каждого параметра, отраженные в столбце t(19), сравниваем с табличным значением t-критерия для числа степеней свобода, равного 19.
Дата добавления: 2014-12-23; Просмотров: 453; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |