Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Корреляционно-регрессионный анализ в изучении связей




Статистическое изучение взаимосвязей предполагает не только количественную оценку наличия, направления и силы связи, но и аналитического выражения влияния факторных признаков на результативный, т.е. определение формы связи. Для решения данной задачи применяют методы корреляционного и регрессионного анализа.

С помощью корреляционного анализа измеряют тесноту связи между варьирующими признаками, выявляют неизвестные причинные связи и оценивают наиболее существенные факторы.

Регрессионный анализ позволяет определить и выбрать модель зависимости (установить форму связи), установить степень влияния факторов (независимых переменных) на результат (зависимую переменную) и рассчитать теоретические значения результативного признака (функции регрессии).

Перечисленные выше задачи в статистическом анализе решаются системно и предполагают комплексное использование указанных методов.

В статистике разработаны следующие методологии исследования зависимостей:

1. Парной корреляции, которая рассматривает связь между двумя признаками (результативным и факторным), т.е. представляет собой однофакторный анализ. Выражается двухмерными моделями корреляционного и регрессионного анализа.

2. Частной корреляции, которая характеризует зависимость между результативным и одним факторным признаками при фиксированном значении других факторных признаков.

3. Множественной корреляции, которая описывает зависимость результативного и двух или более факторных признаков, включенных в исследование.

Одним из наиболее важных вопросов определения регрессионной модели (выбора уравнения регресии) является точное установление математической функции, которая отражает реальную связь между изучаемыми признаками. Выбор модели может основываться на качественном анализе сущности явления, результатах аналогичных исследований или на эмпирическом подборе и оценке функций разных типов.

При построении моделей регрессии должны соблюдаться следующие требования:

1. Совокупность исследуемых исходных данных должна быть однородной и математически описываться непрерывными функциями.

2. Должна существовать возможность описания моделируемого явления одним или несколькими уравнениями причинно-следственных связей.

3. Все факторные признаки должны иметь количественное (числовое) выражение.

4. Исследуемая совокупность должна иметь достаточно большой объём.

5. Должно обеспечиваться постоянство территориальной и временной структуры изучаемой совокупности.

Соблюдение данных требований позволяет построить модель, наилучшим образом описывающую реальные социально-экономические явления и процессы.

При исследованиях связей показателей экономической деятельности используют уравнения различных видов прямо- и криволинейных связей.

Аналитическая связь между двумя признаками (однофакторная, или парная, корреляция) описывается уравнениями:

Прямой: (линейная функция).

Гиперболы: (функция).

Параболы (кривая второго порядка): (или другой ее степени, степенная функция).

Экспонента (экспоненциальная функция).

Если результативный и факторный признаки возрастают одинаково, то это свидетельствует о том, что связь между ними линейная, а при обратной связи – гиперболическая. Если результативный признак увеличивается в арифметической прогрессии, а факторный значительно быстрее, то используется параболическая или степенная регрессия.

В большинстве случаев нелинейные формы связи для выполнения расчётов преобразуют в линейную форму.

Уравнение линейной связи имеет следующий вид:

,

где – теоретические (расчётные) значения результативного признака; а0, а1 – параметры уравнения регрессии.

Параметр а0 представляет собой среднее значение признака (у) в точке х=0, поэтому его экономическая интерпретация часто невозможна.

Параметр а1 в уравнении парной регрессии является показателем силы связи между вариацией факторного признака х и вариацией результативного признака у. Он показывает на сколько в среднем изменится значение результативного признака при изменение факторного признака на одну единицу его измерения. Знак параметра а1 характеризует направление изменения.

Оценка параметров уравнений регрессии осуществляется методом наименьших квадратов, согласно которому сумма квадратов отклонений фактических значений (уi) от расчётных () является минимальной.

 

Для нахождения параметров a0 и a1 в соответствии с методом наименьших квадратов используем систему нормальных уравнений:

 

Параметры уравнения также можно рассчитать по следующим формулам:

, или;

.

Правильность расчётов параметров модели проверяется путём сравнения сумм фактических (эмпирических) значений результативного признака и расчётных (теоретических):

.

Часто корреляционный и регрессионный анализ проводят для ограниченных по величине совокупностей (выборочных). В результате этого значения основных показателей (параметров моделей, показателей тесноты связи) могут быть искажены под влиянием случайных факторов. Для распространения полученных результатов на генеральные совокупности, необходимо проверить надёжность, адекватность построенных регрессионных моделей.

Значимость параметров однофакторной линейной регрессии (для совокупностей, имеющих объём до 30 единиц) проверяют с помощью t-критерия Стьюдента. Для каждого параметра рассчитывают значения t-критерия, а затем сравнивают их с табличными (критическими) значениями критерия.

Так, значение t-критерия для параметра а0 определяют по формуле:

;

для параметра а1:

,

где n – объём выборки; – среднее квадратическое отклонение фактических значений результативного признака (у) от теоретических значений (); – среднее квадратическое отклонение факторного признака.

Таким образом,

, а.

После расчёта значений t-критерия для параметров модели, их сравнивают с критическим значением, определённым по таблице Стьюдента. Для его нахождения задают уровень значимости α (вероятность, с которой может быть опровергнута гипотеза о той или иной форме связи) и число степеней свободы вариации v (число свободно варьирующих элементов совокупности; v = n-2). Обычно для социально-экономических исследований уровень значимости принимают равным 0,05.

Параметр уравнения считается надёжным (значимым), если выполняется условие:

tрасч ˃ tтабл.

В этом случае вероятность того, что рассчитанные значения параметров уравнения обусловлены случайными совпадениями, ничтожно мала.

После проверки адекватности модели можно определить тесноту корреляционной связи между факторным и результативным признаками, т.е. перейти к корреляционному анализу.

В случае наличия линейной или нелинейной зависимости между двумя признаками для измерения тесноты связи применяют так называемое корреляционное отношение. Различают эмпирическое и теоретическое корреляционное отношение.

Эмпирическое корреляционное отношение (ηэ) рассчитывается по данным группировки, когда δ2межгр (межгрупповая дисперсия) характеризует отклонения групповых средних результативного показателя от общей средней:

.

Теоретическое корреляционное отношение (η т) является универсальным показателем тесноты связи и определяется как отношение среднего квадратического отклонения теоретических (расчётных) значений результативного признака (δ2) и среднего квадратического отклонения его фактических значений (σ2) по формуле:

,

где;.

Расчёт значения теоретического отношения основывается на правиле сложения дисперсий (п. 6.2), согласно которому

,

где – характеризует вариацию результативного признака у за счёт остальных факторов, кроме х, т.е. является остаточной дисперсией.

Следовательно, теоретическое корреляционное отношение можно рассчитать, как:

.

Подкоренное выражение (или квадрат теоретического корреляционного отношения) представляет собой коэффициент детерминации (η2), который показывает долю вариации результативного признака под влиянием вариации факторного признака.

Теоретическое корреляционное отношение применяют для измерения тесноты связи в условиях линейных и криволинейных зависимостей. При криволинейных связях теоретическое корреляционное отношение (η т) нередко называют индексом корреляции (R).

Корреляционное отношение может изменяться в пределах от 0 до 1 (0≤ ηт≤1). Чем ближе его значение к единице, тем теснее связь между признаками.

К тому же, теснота связи при линейной зависимости измеряется с помощью линейного коэффициента корреляции:

,

где σх и σу – средние квадратические отклонения, соответственно, факторного (х) и результативного (у) признаков; и – средние значения признаков; – среднее значение произведений факторного и результативного признаков.

Линейный коэффициент корреляции принимает значения от -1 до +1. При r˂0 связь является обратной, при r˃0 – прямой. Если r=0, то линейная связь отсутствует. Чем ближе значение коэффициента к единице, тем связь теснее.

Квадрат линейного коэффициента корреляции (r2) называется линейным коэффициентом детерминации и принимает значения от 0 до 1.

Совпадение значений теоретического корреляционного отношения и линейного коэффициента корреляции свидетельствует о наличие линейной связи между признаками (в этом случае η2-r2 ≤ 0,1). Если их значения не совпадают, то связь является криволинейной.

Если показатели тесноты связи были рассчитаны по данным небольших статистических совокупностей, то их значения могут искажаться влиянием случайных причин. Следовательно, прежде чем распространять выводы по результатам выборки на генеральную совокупность, необходимо проверить существенность (значимость) показателей корреляции.

Так, для оценки значимости линейного коэффициента корреляции рассчитывают t-критерий Стьюдента:

.

Рассчитанное значение t-критерия сравнивают с табличным (α=0,05; v=n-2). Если выполняется условие: tрасч ˃ tтабл, то вероятность того, что найденное значение коэффициента корреляции обусловлено только случайными факторами, ничтожно мала.

После проверки адекватности и надёжности построенной регрессионной модели её необходимо подвергнуть качественному анализу. В первую очередь необходимо проверить соответствуют ли знаки параметров теоретическим представлениям о направлении влияния факторного признака на результативный.

Кроме того, для удобства интерпретации параметра а1 (при однофакторной связи) вычисляют коэффициент эластичности, который показывает, на сколько процентов в среднем изменится значение результативного признака при изменении факторного признака на 1%:

.

Экономический смысл имеет расчёт остатков (ε), или отклонений фактических значений от расчётных (). Важное значение имеют как положительные, так и отрицательные остатки (отклонения от ожидаемого уровня). Например, при изучении зависимости производительности труда от стажа, рабочие (единицы совокупности), имеющие наибольшие отрицательные отклонения, являются в данном случае отстающими, требующими особого внимания. Рабочие с наибольшими положительными остатками являются передовиками и обеспечивают наибольшее повышение средней выработки.




Поделиться с друзьями:


Дата добавления: 2014-01-03; Просмотров: 842; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.03 сек.