Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Парная корреляция и парная регрессия




Рассмотрим построение парной регрессии и корреляции на примере.

Пример 7.1. Изучается зависимость себестоимости единицы изделия (y, тыс. руб.) от величины выпуска продукции (х, тыс. шт.). Обследовав 5 предприятий, результаты заполнены в корреляционную таблицу (табл.7.1.).

 

 

Таблица 7.1.

Корреляционная таблица зависимости себестоимости единицы изделия (y) и величины выпуска продукции (х).

n y x х*y x2 y2 (y-yсред)2 (x-xсред)2 yх
  1,9   3,8   3,61 0,048   1,90
  1,7   5,1   2,89     1,79
  1,8   7,2   3,24 0,014   1,68
  1,6       2,56 0,006   1,57
  1,4   8,4   1,96 0,078   1,46
8,4   32,5   14,26 0,15  
Средн. 1,68   6,5   2,85
s2 0,03  
s 0,17 1,41

Наглядным изображением корреляционной таблице служит корреляционное поле. Оно представляет собой график, где на оси абсцисс откладывают значения Х, по оси ординат – У, а точками показывается сочетание Х и У. По расположению точек, их концентрации в определенном направлении можно судить о наличии связи.

Рис.7.1. Поле корреляции

 

Из рис. 7.1. видно, что точки формируют линейную связь. Направление связи, скорее всего обратное, так как с увеличением X, значения Y уменьшаются. Докажем это проведя корреляционный анализ. Последовательность точек (Xi,Yxi) дает график, который иллюстрирует зависимость среднего значения результативного признака У от факторного X, – эмпирическую линию регрессии, наглядно показывающую, как изменяется У по мере изменения X. По существу, и корреляционная таблица, и корреляционное поле, и эмпирическая линия регрессии предварительно уже характеризуют взаимосвязь, когда выбраны факторный и результативный признаки и требуется сформулировать предположения о форме и направленности связи. В то же время количественная оценка тесноты связи требует дополнительных расчетов. Практически для количественной оценки тесноты связи широко используют линейный коэффициент корреляции. Иногда его называют просто коэффициентом корреляции. Если заданы значения переменных Х и У, то он вычисляется по формуле: , где - среднее квадратичное отклонение (стандартное отклонение), получаемый как корень квадратный из дисперсии - – средний квадрат отклонений индивидуальных значений признака от их средней величины .

Коэффициент корреляции принимает значения в интервале от -1 до + 1. Принято считать, что если |r|< 0,30, то связь слабая; при |r|= (0,3÷0,7) – средняя; при |r|> 0,70 – сильная, или тесная. Когда |r|= 1 – связь функциональная. Если же r принимает значение около 0, то это дает основание говорить об отсутствии линейной связи между У и X. Однако в этом случае возможно нелинейное взаимодействие, что требует дополнительной проверки и других измерителей, рассматриваемых ниже. В нашем примере, значения коэффициента парной корреляции показывает, что степень тесноты связи, очень высокая, по направлению – обратная, так как . Для характеристики влияния изменений Х на вариацию У служат методы регрессионного анализа. В случае парной линейной зависимости строится регрессионная модель: , где n – число наблюдений; а, b – неизвестные параметры уравнения; ei – ошибка случайной переменной У; Уx – рассчитанное выравненное значение результативного признака после подстановки в уравнение X. Параметры а и b оцениваются с помощью процедур, наибольшее распространение из которых получил метод наименьших квадратов. Его суть заключается в том, что наилучшие оценки а и b, получают, когда: т.е. сумма квадратов отклонений эмпирических значений зависимой переменной от вычисленных по уравнению регрессии должна быть минимальной. Сумма квадратов отклонений является функцией параметров а и b. Ее минимизация осуществляется решением системы нормальных уравнений (СНУ): .

Решением этой системы относительно а и b, являются оценки неизвестных коэффициентов модели парной регрессии:

;

ковариация признаков (корреляционный момент) – это взаимосопряженное отклонение от средних значений.

В нашем примере для построения парной линейной регрессии рассчитаем параметры (коэффициенты) уравнения с помощью СНУ:

. Выразим из 1-го уравнения а: . Подставим данное выражение во 2-ое уравнение: . Тогда , следовательно . Найдем коэффициент а, подставив b в 1-ое уравнение: .

Тогда, уравнение парной регрессии будет иметь вид: . Параметр a – это постоянная величина в уравнении регрессии. На наш взгляд, экономического смысла он не имеет, но в ряде случаев его интерпретируют, как начальное значение У. Параметр b в уравнении регрессии называется коэффициентом регрессии, показывает, на сколько единиц, в среднем изменяется результативный признак Y, с изменением на 1 единицу факторного признака X, т.е. увеличении выпуска продукции на 1 тыс. шт., себестоимость 1 изделия в среднем уменьшится на 0,11 тыс. руб. Значение функции Ух называется расчетным значением и на графике образует теоретическую линию регрессии, смысл которой заключается в том, что это оценка среднего значения переменной У для заданного значения X. Парная корреляция или парная регрессия могут рассматриваться как частный случай отражения связи некоторой зависимой переменной, с одной стороны, и одной из множества независимых переменных – с другой. Когда же требуется охарактеризовать связь всего указанного множества независимых переменных с результативным признаком, говорят о множественной корреляции или множественной регрессии.




Поделиться с друзьями:


Дата добавления: 2014-12-29; Просмотров: 487; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.012 сек.