Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Статистическое моделирование связи методом корреляционного и регрессионного анализа




Простейшие методы изучения стохастических связей

Метод сопоставления двух параллельных рядов. Установить наличие стохастической связи, а также получить представление о ее характере и направлении можно с помощью сопоставления двух параллельных рядов статистических величин. Для этого факторы, характеризующие результативный признак, располагают в возрастающем или убывающем по­рядке (в зависимости от эволюции процесса и целей исследования), а затем прослеживают изменение величины результативного признака. Сопоставление и анализ расположенных таким образом рядов значений изучаемых величин позволяют установить наличие связи и ее направление. Зависимость между факторами и показателями может прослеживаться во времени (параллельные динамические ряды).

До исследования методом параллельных рядов (априори) необходимо провести анализ сопоставляемых явлений и установить наличие между ними причинных связей (а не простого сопутствия). Например, только потому, что между урожайностью и себестоимостью продукции сельского хозяйства имеется причинная связь, становится возможным построение, а затем сопоставление параллельных рядов этих показателей.

К недостатку метода взаимозависимых параллельных рядов следует отнести невозможность определения количественной меры связи между изучаемыми признаками. Однако он удобен и эффективен, когда речь идет о необходимости установления связей между показателями и факторами, характеризующими экономический процесс.

Метод аналитических группировок. Стохастическая связь будет проявляться отчетливее, если применить для ее изучения аналитические группировки. Чтобы выявить зависимость с по­мощью этого метода, нужно произвести группировку единиц совокупности по факторному признаку и для каждой группы вычислить среднее или относительное значение результативного признака. Сопоставляя затем изменения результативного признака по мере изменения факторного, можно выявить направление, характер и тесноту связи между ними (см. главу 5, раздел 5.3). Однако метод группировок не позволяет определить форму (аналитическое выражение) влияния факторных признаков на результативный.

 

В общем виде задача статистики в области изучения взаимосвязей состоит не только в количественной оценке их наличия, направления и силы связи, но и в определении формы (аналитического выражения) влияния факторных признаков на результативный. Для ее решения применяют методы корреляционного и регрессионного анализа.

Задачи корреляционного анализа сводятся к измерению тесноты известной связи между варьирующими признаками, определению неизвестных причинных связей (причинный характер которых, должен быть выяснен с помощью теоретического анализа) и оценке факторов, оказывающих наибольшее влияние на результативный признак.

Задачами регрессионного анализа являются выбор типа модели (формы связи), установление степени влияния независимых переменных на зависимую и определение расчетных значений зависимой переменной (функции регрессии).

* Переменными в статистике

называют количественно варьирующие величины.

 

Решение всех названных задач приводит к необходимости комплексного использования этих методов.

Корреляционный и регрессионный анализ. Исследование связей в условиях массового наблюдения и действия случайных факторов осуществляется, как правило, с помощью экономико-статистических моделей. В широком смысле модель — это аналог, условный образ (изображение, описание, схема, чертеж и т.п.) какого-либо объекта, процесса или события, приближенно воссоздающий "оригинал". Модель представляет собой логическое или математическое описание компонентов и функций, отображающих существенные свойства моделируемого объекта или процесса, дает возможность установить основные закономерности изменения оригинала. В модели оперируют показателями, исчисленными для качественно однородных массовых явлений (совокупностей). Выражение модели в виде функциональных уравнений используют для расчета средних значений моделируемого показателя по набору заданных величин и для выявления степени влияния на него отдельных факторов.

По количеству включаемых факторов модели могут быть однофакторными и многофакторными (два и более факторов).

В зависимости от познавательной цели статистические модели подразделяются на структурные, динамические и модели связи.

Рассмотрим основные проблемы статистического моделирования связи методами корреляционного и регрессионного анализа.

Двухмерная линейная модель корреляционного и регрессионного анализа (однофакторный линейный корреляционный и регрессионный анализ). Наиболее разработанной в теории статистики является методология так называемой парной корреляции, рассматривающая влияние вариации факторного признака х на результативный признак у и представляющая собой однофакторный корреляционный и регрессионный анализ. Овладение теорией и практикой построения и анализа двухмерной модели корреляционного и регрессионного анализа представляет собой исходную основу для изучения многофакторных стохастических связей.

Важнейшим этапом построения регрессионной модели (уравнения регрессии) является установление в анализе исходной информации математической функции. Сложность заключается в том, что из множества функций необходимо найти такую, которая лучше других выражает реально существующие связи между анализируемыми признаками. Выбор типа функции может опираться на теоретические знания об изучаемом явлении, опыт предыдущих аналогичных исследований, или осуществляться эмпирически — перебором и оценкой функций разных типов и т.п.

При изучении связи экономических показателей производства (деятельности) используют различного вида урав­нения прямолинейной и криволинейной связи. Внимание к линейным связям объясняется ограниченной вариацией переменных и тем, что в большинстве случаев нелинейные формы связи для выполнения расчетов преобразуют (путем логарифмирования или замены переменных) в линейную форму. Уравнение однофакторной (парной) линейной корреляц­онной связи имеет вид:

у = ао + ахх, (9.2)

где у — теоретические значения результативного признака, полученные по уравнению регрессии; ао,а1 ~~ коэффициенты (параметры) уравнения регрессии.

Поскольку uq является средним значением у в точке х = О, экономическая интерпретация часто затруднена или вообще невозможна.

Коэффициент парной линейной регрессии' aj. имеет смысл показателя силы связи между вариацией факторного признака х и вариацией результативного признака у. Уравнение (9.2) показывает среднее значение изменения результативного признака у при изменении факторного признака х на одну единицу его измерения, т.е. вариацию у, приходящуюся на единицу вариации х. Знак а± указывает направление этого изменения.

Параметры уравнения aQ, a± находят методом наименьших квадратов (метод решения систем уравнений, при котором в качестве решения принимается точка минимума суммы квадратов отклонений), т.е. в основу этого метода положено требование минимальности сумм квадратов отклонений эмпирических данных yt от выравненных у: - -У)2 =

Для нахождения минимума данной функции приравняем к нулю ее частные производные и получим систему двух линейных уравнений, которая называется системой нормальных уравнений:

(9-3)

Решим эту систему в общем виде:

1

Параметры уравнения парной линейной регрессии иногда удобно исчислять по следующим формулам, дающим тот же результат:

ао=у-ахх.

Определив значения a0, al и подставив их в уравнение связи у = ао1х, находим значения у, зависящие только от заданного значения jc.

Пример. Рассмотрим построение однофакторного уравнения регрессии зависимости производительности труда у от стажа работы х по данным табл. 9.1 (10 рабочих одной бригады заняты производством радиоэлектронных изделий, данные ранжированы по стажу их работы).

Исходя из экономических соображений стаж работы выбран в качестве независимой переменной х. Сопоставление данных параллельных рядов признаков х и у (табл. 9.1) показывает, что с возрастанием признака х (стажа работы), растет, хотя и не всегда, результативный признак у (производительность труда). Следовательно, между х и у существует прямая зависимость, пусть неполная, но выраженная достаточно ясно.

          Таблица 9.1
: Распределение . рабочих бригады по выработке и стажу работы  
Исходные данные Расчетные значения  
    Дневная        
Номер Стаж выработ-        
рабо- работы, ка рабо- х2 у1 ху У
  годы чего, шт. ■ у        
4-й 6-й 3-й 1-й 2-й 7-й 9-й 10-й 8-й 5-й 2. 3 4 5 6 7 8 9 10 4 5 ' 6 7 7 8 ■ 8 ■'■1 9 10 9 1 4 9 16 25 36 49 64 81 100 16 25 36 49 49 64 64 81 100 81 4 10 18 ' 28 35 48 56 72 90 90 4,6 5,2 5,8 6,4 7,0 7,6 8,2 8,8 9,4 10,0
          Удсу-451 73,0
Итого 5> = 55 Х>=73 2^х -385 2_,у э®э    

Для уточнения формы связи между рассматриваемыми при­знаками используем графический метод. Нанесем на график точки, соответствующие значениям х, у, получим корреляционное поле, а соединив их отрезками, — ломаную регрессии* (рис. 9.1).

Анализируя ломаную линию, можно предположить, что возрастание выработки у идет равномерно, пропорционально росту стажа работы рабочих х. В основе этой зависимости в данных конкретных условиях лежит прямолинейная связь (см. пунктирную линию на рис. 9.1), которая может быть выражена простым линейным уравнением регрессии:

где у — теоретические расчетные значения результатив­ного признака (выработки одного рабочего, шт.), полученные по уравнению регрессия; Oq п\ — неизвестные параметры урав­нения регрессии; х — стаж работы рабочих, годы.

Данный метод эффективен лишь при небольшом объеме совокупности и доста­точно тесной связи между признаками. Более наглядную характеристику связи можно получить, построив ломаную регрессии по частным средним.

 

 

и • 8- (.   У = /(х)      
    j) = ao + a1x  
4-          

1. з 5. ', 7 ■.■• ■...;■.-? • ^годы,-,.

Рис.9.1. Зашвсимоль выработгсм одного рабочего.у от стажа работы х

■ ■ ■, ■ ■. (ио данным табл. 9.1)..

Пользуясь расчетными значениями (см. табл. 9.1), исчислим параметры для данного уравнения регрессии:

ху-х-у 45,1-40,15 п,

п\ = _____ =------------ и и.о.

1 Y2 -2 38,5-30,25. " «о =У - «1* = 7,3 - 0,6 • 5,5 = 4,0.

Следовательно, регрессионная модель распределения вы­работки по стажу работы для данного примера может быть записана в виде конкретного простого уравнения регрессии:

3?-4,0+0,бж..

Это уравнение характеризует зависимость среднего уровня выработки рабочими бригады от стажа работы. Расчетные значения у, найденные по данному уравнению, приведены в табл. 9.1. Правильность расчета параметров уравнения регрессии может быть проверена сравнением сумм 2у = 2у (при этом возможно некоторое расхождение вследствие округления расчетов).

Проверка адекватности регрессионной модели. Для практического использования моделей регрессии большое значение имеет их адекватность, т.е. соответствие фактическим стати­стическим данным.

Корреляционный и регрессионный анализ обычно (особенно в условиях так называемого малого и среднего бизнеса) проводится для ограниченной по объему совокупности. Поэтому показатели регрессии и корреляции — параметры уравнения регрессии, коэффициенты корреляции и детерминации могут быть искажены действием случайных факторов. Чтобы проверить насколько эти показатели характерны для всей генеральной совокупности, не являются ли они результатом стечения случайных обстоятельств, необходимо проверить адекватность построенных статистических моделей.

При численности объектов анализа до 30 единиц возникает необходимость проверки значимости (существенности) каждого коэффициента регрессии. При этом выясняют насколько вычисленные параметры характерны для отображения комплекса условий: не являются ли полученные значения параметров результатами действия случайных причин.

Значимость коэффициентов простой линейной регрессии (применительно к совокупностям, у которых п < 30) осуществляют с помощью t-критерия Сшьюденша. При этом вычисляют расчетные (фактические) значения ^-критерия для параметра ай;

(9.4)

/и-2

•" ост

для параметра

 

где и — объём выборки; аост =-л|2ЛЭ'"£)'./ п ~ среднее квадра-тическое отклонение результативного признака у от выравнен­ных значений у;

или Сту =. - -4sL- — среднее

} и; Vй J:;;■

квадратическое отклонение факторного признака х от общей; средней х.

Вычисленные по формулам (9.4) и (9.5) значения, сравнивают с критическими /, которые определяют по таблице Стьюдента с учетом принятого уровня значимости* а и числом степеней свободы** вариации v=n-2. В социально-экономических исследованиях уровень значимости а обычно принимают равным 0,05. Параметр признается значимым (существенным) при условии, если tpa^trau,. В таком случае практически невероятно, что найденные значения параметров обусловлены только случайными совпадениями. Для проверки значимости коэффициентов регрессии исследуемого уравнения у = 4,0+ 0,6* исчис­лим /-критерий Стьюдента с v= 10 - 2 = 8 степенями свободы.

Рассмотрим вспомогательную таблицу (табл. 9.2).

Таблица 9.2

Расчетные значений, необходимые для исчисления ас

 

у-у (у-у)2 У-У (у-у)2 у-у (у-у)2
-3,3 -2,3 ■-1,3 -р,з -0,3 0,7 0,7 ■ 2,71,7 • 10,89 5,29 1,69 0,09 0,09 0,49 0,49 2,89 7,29 2,89 -2,7 -2,1 -1,5 -0,9 -0,3 0,3 0,9 1,5 2,1 2,7 7,29 4,41 2,25 0,81 0,09 0,09 0,81 2,25 4,41 7,29 -0,6 -0,2 0,2 0,6 0,0 0,4 -0,2 0,2 0,6 -1,0 0,36 0,04 0,04 0,36 0,0 0,16 0,04 0,04 0,36 1,0
Итого " 32,10 29,70 2,40



Поделиться с друзьями:


Дата добавления: 2014-01-07; Просмотров: 1196; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.025 сек.