КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Выбор факторов для регрессионного анализа
Количественная оценка взаимосвязей финансовых показателей компаний 1) Корреляционный анализ данных, включая проверку теста Фаррара-Глоубера на мультиколлинеарность факторов В таблице 2 представлена матрица коэффициентов парной корреляции для всех переменных, участвующих в рассмотрении. Матрица получена с помощью инструмента Корреляция из пакета Анализ данных в Excel. Таблица 2. Матрица коэффициентов парной корреляции
Визуальный анализ матрицы позволяет установить: 1) ЧП имеет довольно высокие парные корреляции со всеми переменными, кроме переменной ЗП (далее ее не будем рассматривать), что вполне объяснимо, так как предприятия отрасли «Связь» имеют специфическую продукцию; 2) большинство переменных анализа демонстрируют довольно высокие парные корреляции, что обуславливает необходимость проверки факторов на наличие между ними мультиколлинеарности. Тем более, что одним из условий классической регрессионной модели является предположение о независимости объясняющих переменных. Для выявления мультиколлинеарности факторов выполним тест Фаррара-Глоубера по факторам ВП, ДЗ, ДО, КО, ОА, ОС, ПП. Проверка теста Фаррара-Глоубера на мультиколлинеарность факторов включает несколько этапов, реализация которых представлена ниже. 1) Проверка наличия мультиколлинеарности всего массива переменных · Построим матрицу межфакторных корреляций R (таблица 3) и найдем её определитель с помощью функции МОПРЕД. Таблица 3. Матрица межфакторных корреляций R
Определитель матрицы R стремится к нулю, что позволяет сделать предположение об общей мультиколлинеарности факторов. Подтвердим это предположение оценкой статистики Фаррара-Глоубера. · Вычислим наблюдаемое значение статистики Фаррара – Глоубера по формуле: , где n = 109 – количество наблюдений (компаний); k = 7 – количество факторов (переменных анализа). Фактическое значение этого критерия сравниваем с табличным значением критерия с степенью свободы и уровне значимости α=0,05. Табличное значение можно найти с помощью функции ХИ2ОБР [10]. ХИ2.ОБР.ПХ(0,05; 21). Так как (953,87>32,67), то в массиве объясняющих переменных существует мультиколлинеарность. 2) Проверка наличия мультиколлинеарности каждой переменной с другими переменными. · Вычислим обратную матрицу с помощью функции Excel МОБР (таблица 4). Таблица 4. Обратная матрица
· Вычисление F-критериев , где – диагональные элементы матрицы (таблица 5).
Таблица 5. Значения F-критериев[11]
· Фактические значения F- критериев сравниваются с табличным значением при n1= 7 и n2 = n - k – 1=109-7-1=101 степенях свободы и уровне значимости α=0.05, где k – количество факторов. · Так как все значения F-критериев больше табличного, то все исследуемые независимые переменные мультиколлинеарны с другими. Больше других влияет на общую мультиколлинеарность факторов фактор ВП, меньше – фактор ДО.
3 ) Проверка наличия мультиколлинеарности каждой пары переменных ● Вычислим частные коэффициенты корреляции по формуле , где – элементы матрицы . Матрицу коэффициентов частной корреляции , можно получить с помощью программ VSTAT, SPSS (таблица 6). Таблица 6. Матрица коэффициентов частных корреляций
● Вычисление t -критериев по формуле (таблица 7). Таблица 7. t-критерии для коэффициентов частной корреляции[12]
Фактические значения t-критериев сравниваются с табличным значением при степенях свободы (n - k – 1)=109-7-1=101 и уровне значимости α=0,05. Из таблиц 6 и 7 видно, что две пары факторов ОА и ДЗ, ПП и ВП имеют высокую статистически значимую частную корреляцию, то есть являются мультиколлинеарными. Для того, чтобы избавиться от мультиколлинеарности, можно исключить одну из переменных коллинеарной пары. В паре ПП и ВП оставляем ПП, так как у нее меньше связи с другими факторами; в паре ОА и ДЗ оставим ОА, во-первых, с экономической точки зрения, а, во-вторых, так как у нее меньше значение F-критерия и, значит, она меньше влияет на общую мультиколлинеарность факторов. Таким образом, в результате проверки теста Фаррара-Глоубера остается пять факторов: ДО, КО, ОА, ОС, ПП. Завершая процедуры корреляционного анализа, целесообразно посмотреть частные корреляции выбранных факторов с результатом ЧП. В последнем столбце таблицы 8 представлены значения t-критерия для столбца ЧП. Таблица 8. Матрица коэффициентов частной корреляции с результатом ЧП
Из таблицы 8 видно, что межфакторные частные корреляции слабые, а переменная ЧП имеет высокую и одновременно статистически значимую частную корреляцию только с фактором ПП. Уточнение набора факторов, наиболее подходящих для регрессионного анализа, осуществим другими методами отбора.
2) Пошаговый отбор факторов методом исключения из модели статистически незначимых переменных В соответствии с общим подходом, пошаговый отбор следует начинать с включения в модель всех имеющихся факторов, то есть в нашем случае с восьмифакторной регрессии. Но мы не будем включать в модель факторы из заранее известных коллинеарных пар (в связи с наличием коллинеарности ранее были исключены из рассмотрения ВП и ДЗ), а также фактор ЗП, имеющий слабую связь с ЧП. Таким образом, пошаговый отбор факторов начнем с пятифакторного уравнения. Фрагмент пятифакторного регрессионного анализа представлен на рисунке 2.
Рисунок 2. Фрагмент пятифакторного регрессионного анализа Статистически незначимыми () оказались три фактора (на рисунке 1 они выделены жирным шрифтом). На следующем этапе пошагового отбора удаляем статистически незначимый фактор с наименьшим значением t-критерия, то есть фактор ОА (на рисунке 2 выделен цветом). Аналогично поступаем до тех пор, пока не получим уравнение, в котором все факторы окажутся статистически значимыми. Этапы получения такого уравнения, то есть фрагменты соответствующих регрессионных анализов, представлены на рисунках 3, 4.
Рисунок 3. Фрагмент четырехфакторного регрессионного анализа
Рисунок 4. Фрагмент трехфакторного регрессионного анализа Из рисунка 3 видно, что уравнение с тремя факторами ОС, ПП и КО обладает статистически значимыми коэффициентами перед факторами (в нем незначим только свободный член), а, значит, и сами эти факторы статистически значимы. Таким образом, в результате пошагового отбора получено трехфакторное уравнение регрессии, все коэффициенты которого (кроме свободного члена) значимы при 5%-ном уровне значимости, вида , где Y – ЧП, – ОС, – ПП, – КО. 3) Проверка теста на «длинную» и «короткую» регрессии По результатам пунктов 1) и 2) возникает необходимость выбора из двух регрессий: «длинной» – с тремя факторами (ОС, ПП и КО) и «короткой» – с одним фактором (ПП). Воспользуемся тестом на «длинную» и «короткую» регрессии. Этот тест используется для отбора наиболее существенных объясняющих переменных. Иногда переход от большего числа исходных показателей анализируемой системы к меньшему числу наиболее информативных факторов может быть объяснен дублированием информации, из-за сильно взаимосвязанных факторов. Стремление к построению более простой модели приводит к идее уменьшения размерности модели без потери её качества. Для этого используют тест проверки «длинной» и «короткой» регрессий. Рассмотрим две модели регрессии: yi= β 0 + β 1 xi1 +…+ β k xik+ε i (длинную) yi= β 0 + β 1 xi1 +…+ β k xik-q+εi (короткую) Предположим, что модель не зависит от последних q объясняющих переменных и их можно исключить из модели. Это соответствует гипотезе H0: β k-q+1 = β k-q+2…= β k =0, т.е. последние q коэффициентов равны нулю. Алгоритм проверки следующий: o Построить по МНК длинную регрессию по всем факторам и найти для неё сумму квадратов остатков – . o Построить по МНК короткую регрессию по первым факторам и найти для неё сумму квадратов остатков – . o Вычислить F -статистику
o Если Fнабл>Fтабл (α, v1=q, v2=n-k-1), гипотеза отвергается (выбираем длинную регрессию), в противном случае – выбираем короткую регрессию. На основании данных нашего примера сравним две модели: «длинную» (с факторами , , ) и «короткую» (только с фактором ). 1) Построим длинную регрессию по трем факторам , , и найдем для неё сумму квадратов остатков – (рисунок 5).
Рисунок 5. Фрагмент регрессионного анализа для длинной (трехфакторной) регрессии 2) Построим короткую регрессию по одному фактору и найдем для неё сумму квадратов остатков – (рисунок 6).
Рисунок 6. Фрагмент регрессионного анализа для короткой (однофакторной) регрессии 3) Вычислим F -статистику
,
4) Так как , отдаем предпочтение длинной регрессии
.
Дата добавления: 2014-11-20; Просмотров: 1747; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |