Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Парный регрессионный анализ




 

Сутью регрессионного анализа является описание "технологии" влияния признаков-факторов на признак-результат, который в конкретных практических задачах выступает объектом управления.

Регрессионный анализ предполагает теоретический анализ природы изучаемого явления с целью определения круга факторов, оказывающих влияние на поведение результативного признака. На базе корреляционного анализа выявляется наличие статистически значимых связей в конкретных условиях места и времени. Затем строится уравнение регрессии (аналитическая форма изучаемой зависимости), которое при определенных условиях может быть признано статистической моделью связи между признаками.

Уравнение регрессии – это математическая функция, описывающая зависимость условного среднего значения результативной (зависимой) переменной от заданных значений факторных (независимых) переменных. Т.о., уравнение регрессии отражает основную тенденцию связи, характерную для изучаемой статистической совокупности в целом.

В регрессионном анализе можно выделить три составляющие:

- определение типа функции (структуры модели) для описания изучаемой зависимости;

- расчет неизвестных параметров уравнения регрессии;

- оценку качества модели.

До широкого распространения компьютерных технологий, перечисленные элементы являлись последовательными этапами анализа. В современных условиях все процедуры выполняются комплексно. Представленное ниже раздельное их описание необходимо для понимания сути каждой процедуры.

Первый этап регрессионного анализа - поиск линии регрессии, которая бы лучшим образом аппроксимировала поле корреляции. При этом необходимо учитывать природу изучаемых показателей, специфику их взаимосвязи, свойства математических функций. Однако, в настоящее время процедура выбора лучшего уравнения связи формализована. Современные ППП позволяют одновременно построить несколько видов уравнений, а затем, пользуясь специальными критериями, отобрать лучшую модель. В качестве критерия могут быть использованы: максимальное значение коэффициента детерминации, максимальное значение F – критерия Фишера, минимальная величина остаточной дисперсии, минимальная величина стандартной ошибки уравнения, минимальное значение средней ошибки аппроксимации.

Для аналитического описания связи между признаками могут быть использованы следующие виды уравнений:

 

1) - прямая, линейная функция;

2) - парабола;

3) - гипербола;

4) - показательная, степенная функция;

5) - экспонента и др.

Некоторые задачи корреляционно-регрессионного анализа, а также возможности ППП, делают необходим проведение операции линеаризации уравнений, то есть приведения их к линейному виду путем логарифмирования. Производится замена признака-фактора и признака-результата на их натуральные логарифмы. При проведении анализа с использованием линеаризации необходимо помнить о том, что все показатели и графические изображения рассчитываются и строятся для логарифмов признаков. Ниже представлены экспоненциальная и степенная функции после линеаризации:

 

; .

 

Простейшим видом уравнения регрессии является парная линейная регрессия:

,

 

где - расчетное, теоретическое значение признака-результата;

– параметры уравнения регрессии;

ε – случайная величина.

 

Присутствие в уравнении ε связано с рядом причин, среди которых: наличие признаков-факторов, не включенных в данное уравнение; неправильное описание структуры модели; ошибки измерений и др.

Чтобы воспользоваться уравнением регрессии, необходимо рассчитать значения его параметров. Чаще всего расчет осуществляется по методу наименьших квадратов (МНК). Суть метода в том, что удается получить такие значения параметров, при которых минимизируется сумма квадратов отклонений эмпирических значений признака-результата от его теоретических значений, т.е.:

 

. (4.12)

 

Рассматривая S как функцию параметров a и b, проводят дифференцирование, приравнивают первые частные производные к нулю:

 

(4.13)

 

(4.14)

 

Решение полученной системы уравнений позволяет получить значения параметров:

,

 

 

, (4.15)

 

. (4.16)

Параметр в уравнении регрессии называется коэффициентом регрессии. Он оценивает силу связи признака-фактора с результатом, показывая, насколько единиц своего измерения изменится в среднем результат при изменении фактора на единицу своего измерения. Знак «+» при коэффициенте регрессии означает, что связь между признаками прямая, знак «-» - зависимость обратная. Параметр в экономических исследованиях, как правило, содержательно не интерпретируется, а определяет точку пересечения линии регрессии с осью Y.

При интерпретации полученных значений и следует помнить, что это лишь оценка «истинных» значений параметров, а уравнение регрессии отражает общую тенденцию зависимости для эмпирической совокупности.

Третий этап регрессионного анализа, как отмечалось выше, предполагает оценку качества полученного уравнения связи. Поскольку уравнение регрессии строится, как правило, на основе выборочных данных, то следует оценить статистическую значимость параметров уравнения и уравнения в целом.

Оценка статистической значимости параметров модели означает проверку нулевых гипотез о равенстве параметров генеральной совокупности нулю, т.е. в условиях парной регрессии:

Но: =0, Но: =0.

Проверка производится с использованием t-статистики, которая в этом случае представляет собой отношение величины параметра к его стандартной (среднеквадратической) ошибке (S):

 

и , (4.17)

поскольку = 0 и = 0, то:

; , (4.18)

 

где - стандартная ошибка параметра : = ;

- стандартная ошибка параметра : = .

 

Фактические значения t-критерия сравниваются с табличными (с учетом уровня значимости (α) и числа степеней свободы (d.f.=n-k-1)). Параметры признаются статистически значимыми, т.е. сформированными под воздействием неслучайных факторов, если tфакт > tтабл.

Значимость уравнения в целом оценивается на основе F-критерия Фишера.

F-критерий – это отношение объяснённой вариации (факторной дисперсии) результативного признака, рассчитанной на одну степень свободы , к необъяснённой вариации (остаточной дисперсии) признака-результата, рассчитанной на одну степень свободы , т.о.:

: , (4.19)

где k – число степеней свободы факторной дисперсии, равное числу независимых переменных (признаков-факторов) в уравнении регрессии;

n-k-1 - число степеней свободы остаточной дисперсии.

Если обе части соотношения разделить на общую дисперсию зависимой переменной (результата), то F-критерий может быть представлен следующим образом:

 

. (4.20)

 

Расчётное значение критерия сопоставляется с табличным (с учётом числа степеней свободы: d.f. = k и d.f.=n-k-1) (Приложение 2). Если , то делается вывод о статистической значимости уравнения в целом. Поскольку F-критерий основан на соотношении факторной и остаточной дисперсий результативного признака, то вполне логично его использование для оценки качества модели. Если объясненная дисперсия существенно больше необъясненной, это означает, что в уравнение связи включены именно те факторы, которые играют определяющую роль в изменении величины признака-результата. Статистическая значимость уравнения одновременно означает статистическую значимость коэффициента детерминации.

Результаты оценки регрессионного уравнения могут быть разными. Возможен вариант, когда уравнение в целом статистически значимо, а некоторые параметры уравнения незначимы. Это означает, что описанная зависимость результата от аргументов может служить основой для принятия некоторых управленческих решений, но полученное уравнение регрессии нельзя использовать для прогнозирования. Уравнение связи признается моделью и может быть использовано в целях прогнозирования, если статистически значимы и параметры, и уравнение в целом.




Поделиться с друзьями:


Дата добавления: 2015-07-02; Просмотров: 5367; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.019 сек.