Парная корреляция и парная линейная регрессия

Простейшим приемом выявления связи между двумя признаками является построение корреляционной таблицы. В основу таблицы положена группировка двух изучаемых во взаимосвязи признаков – X и Y. Частоты f _ij показывают количество соответствующих сочетаний X и Y. Если f _ij расположены в таблице беспорядочно, можно говорить об отсутствии связи между переменными. В случае образования какого-либо характерного сочетания f _ij допустимо утверждать о связи между X и Y. При этом, если f _ij концентрируются около одной из двух диагоналей, имеет место прямая или обратная линейная связь.

Уровни признака X	Уровни признака Y
Y ₁	Y ₂	…	Y_m	Итого
X ₁	f ₁₁	f ₁₂	…	f _{1 m}
X ₂	f ₂₁	f ₂₂	…	f _{2 m}
…	…	…	…	…	…	…
X _k	f _k1	f _k2	…	f _{k m}
Всего			…		n
			…			–

Рисунок 7.1. Схема корреляционной таблицы

Наглядным отображением корреляционной таблицы служит корреляционное поле. Оно представляет график, где на оси абсцисс откладываются значения X, по оси ординат – Y, а точками показывается сочетание первичных наблюдений X и Y. По расположению точек, их концентрации в определенном направлении можно судить о наличии и форме связи.

В итогах корреляционной таблицы по строкам и столбцам приводятся два распределения – одно по X, другое по Y. Рассчитаем для каждого X_i среднее значение Y и для Y_j среднее значение X.

; i = 1, 2, …, k; j = 1, 2, …, m.

Последовательность точек на графике иллюстрирует зависимость среднего значения результативного признака Y от факторного X; соединяя точки линиями, получаем эмпирическую линию регрессии, наглядно показывающую, как изменяется Y по мере изменения X. Аналогичным образом, последовательность точек на графике иллюстрирует зависимость среднего значения факторного признака X от результативного Y; соединяя точки линиями, также получаем эмпирическую линию регрессии, наглядно показывающую, как изменяется X по мере изменения Y. Таким образом, на одном графическом поле можно расположить две линии регрессии.

Пример. Ниже в корреляционной таблице представлены итоги статистического наблюдения уровня оплаты труда и производственного стажа работников.

Стаж работы (X _i), лет	Уровень оплаты (Y _j), руб.	Итого	Средний уровень оплаты, (руб.)
1500÷1750	1750÷2000	2000÷2250	2250 и выше

			-	-		1708,3
				-		1875,0
	-		-			1875,0
	-	-	-			2375,0
	–	-	-			2375,0
Всего						-
Средний стаж –(лет)	0,333			3,25	-	–

На графике (рисунок 7.2) по данным таблицы показаны две эмпирические линии регрессии. Одна из них иллюстрирует изменение среднего уровня оплаты труда по мере увеличения производственного стажа (Х). Вторая линия показывает средний стаж работы при данном уровне оплаты труда (уровень Y_i в серединах интервалов равен 1625, 1875, 2125 и 2375 руб.).

Рисунок 7.2. Эмпирические регрессии оплаты труда и стажа работы

Для количественной оценки тесноты связи в первую очередь используется линейный коэффициент корреляции (или коэффициент линейной корреляции). Корреляция переменных X и Y оценивается по формуле

Известны и другие модификации этого выражения. Здесь n – количество наблюдений; σ_X, σ_Y – соответствующие средние квадратические отклонения. Коэффициент корреляции принимает значения в интервале от –1 до +1. Принято считать, что если | r | <0,3, то связь слабая; при | r | =(0,3÷0,7) – средняя; при | г | > 0,70 – сильная или тесная. Когда | r | =1, связь функциональная. Если же r»0, то это дает основание говорить об отсутствии линейной связи между Y и X. Но в этом случае вполне возможно нелинейное взаимодействие, что требует дополнительной проверки и других измерителей (см. ниже).

Для характеристики влияния X на изменение уровня Y служат методы регрессионного анализа. В случае парной линейной зависимости строится регрессионная модель

Y _i = a ₀+ a ₁× X _i+ e_i, i =1,…, n,

где i – номер наблюдения, n – число наблюдений; а ₀, а ₁, – неизвестные параметры уравнения регрессии; e_i – случайная составляющая (ошибка) переменной Y. Собственно уравнение регрессии записывается как

Y _i_теор = a ₀+ a ₁· X _i,

где Y _i_.теор –рассчитанное по уравнению регрессии значение результативного признака (после подстановки в уравнение числового значения X_i.). Параметры а ₀ и а ₁ оцениваются с помощью процедур, наибольшую известность из которых получил метод наименьших квадратов. Суть его в том, что наилучшие оценки а ₀ и а ₁получают, когда

Иначе говоря, сумма квадратов отклонений фактических значений зависимой переменной Y от значений, вычисленных по уравнению регрессии должна быть минимальной. Сумма квадратов отклонений является функцией параметров а ₀ и а ₁. Минимальному значению суммы квадратов отклонений соответствует решение системы линейных относительно а ₀ и а ₁уравнений:

n·a ₀ + a ₁·S X = S Y;

a ₀·S X + a ₁·S X ² = S XY.

Можно воспользоваться и другими формулами, вытекающими из метода наименьших квадратов, например:

Аппарат линейной регрессии достаточно хорошо разработан и обязательно имеется в наборе стандартных программ статистического анализа на ПЭВМ. Смысл параметров: а ₁ – это коэффициент регрессии, характеризующий влияние, которое оказывает изменение X на Y. Он показывает, на сколько единиц в среднем изменится Y при изменении X на одну единицу[8]. Если а ₁ больше 0, то наблюдается положительная связь. Если а ₁ отрицателен, то увеличение X на единицу влечет за собой уменьшение Y в среднем на а ₁. Параметр а ₁ обладает размерностью отношения Y к X. Например, по данным о стоимости оборудования X и уровне производительности труда Y методом наименьших квадратов получена зависимость Y = -12,14+0,208· X. Коэффициент а ₁=0,208 означает, что увеличение стоимости оборудования на 1 тыс. руб. ведет к среднему росту производительности труда на 0,208 тыс. руб. Параметр а ₀ – это постоянная величина в уравнении регрессии. Его интерпретируют как начальное значение Y (или значение Y при X =0). Значения функции Y = а ₀ + а ₁· X на графике образуют теоретическую линию регрессии. Смысл теоретической регрессии в том, что это оценка среднего значения переменной Y для любого возможного значения X.

<== предыдущая лекция	\|	следующая лекция ==>
Основные понятия корреляционного и регрессионного анализа	\|	Множественная линейная регрессия

Поделиться с друзьями:

Дата добавления: 2014-01-03; Просмотров: 764; Нарушение авторских прав?; Мы поможем в написании вашей работы!

Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет

studopedia.su - Студопедия (2013 - 2025) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление

Генерация страницы за: 0.01 сек.