Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Распределение рабочих бригады по выработке и стажу работы




Исходные данные Расчетные значения
Номер рабочего Стаж ра­боты, годы X Дневная выработка рабочего, шт. У ху
4-й           4,6
6-й           5,2
3-й           5,8
1-й           6,4
2-й           7,0
7-й           7,6
9-й           8,2
10-й           8,8
8-й           9,4
5-й           10,0
Итого ∑x=55 ∑y = 73 = 385 = 565 ∑xy= 451 73,0

Для уточнения формы связи между рассматриваемыми признака­ми используем графический метод. Нанесем на график точки, соответ­ствующие значениям х, у, получим корреляционное поле, а соединив их отрезками, — ломаную регрессии (рис. 9.1).

Анализируя ломаную линию, можно предположить, что возрас­тание выработки у идет равномерно, пропорционально росту стажа работы рабочих х. В основе этой зависимости в данных конкрет­ных условиях лежит прямолинейная связь (см. пунктирную линию на рис.,9.1), которая может быть выражена простым линейным уравнением регрессии:

= a0 + a1 х,

где — теоретические расчетные значения результативного при­знака (выработки одного рабочего, шт.), полученные по уравнению регрессии;

a0, a1, - неизвестные параметры уравнения регрессии;

х - стаж работы рабочих, годы.

 

Рис.9.1. Зависимость выработки одного рабочего

от стажа работы х (по данным табл. 9.1)

Пользуясь расчетными значениями (см. табл. 9.1), исчислим пара­метры для данного уравнения регрессии:

= 7,3-0,6 ∙ 5,5 = 4,0.

Следовательно, регрессионная модель распределения выработки по стажу работы для данного примера может быть записана в виде кон­кретного простого уравнения регрессии:

=4,0+0,6x

Это уравнение характеризует зависимость среднего уровня выра­ботки рабочими бригады от стажа работы. Расчетные значения , най­денные по данному уравнению, приведены в табл. 9.1. Правильность расчета параметров уравнения регрессии может быть проверена сравнением сумм ∑y = ∑(при этом возможно некоторое расхождение вследствие округления расчетов).

9.2.2.3 Проверка адекватности

регрессионной модели

Для практического использования моделей регрессии очень важна их адекватность,

т. е. соответствие фактическим стати­стическим данным.

Корреляционный и регрессионный анализ обычно (осо­бенно в условиях так называемого малого и среднего бизнеса) проводится для ограниченной по объему совокупности. По­этому показатели регрессии и корреляции — параметры урав­нения регрессии, коэффициенты корреляции и детерминации могут быть искажены действием случайных факторов. Чтобы проверить, насколько эти показатели характерны для всей ге­неральной совокупности, не являются ли они результатом стечения случайных обстоятельств, необходимо проверить адекватность построенных статистических моделей.

При численности объектов анализа до 30 единиц возникает необходимость проверки значимости (существенности) каждого коэффициента регрессии. При этом выясняют, насколько вычисленные параметры характерны для отображения комплекса условий: не являются ли полученные значения параметров ре­зультатами действия случайных причин.

Значимость коэффициентов простой линейной регрессии (применительно к совокупностям, у которых n< 30) осуществляют с помощью t-критерия Стьюдента. При этом вычисляют расчетные (фактические) значения t- критерия:

для параметра a0

(9.4)

для параметра a1

(9.5)

 

где n – объем выборки;

– среднее квадратическое отклонение результативного признака y от выравненных значений ;

или – среднее квадратическое отклонение факторного признака x от общей средней.

Вычисленные по формулам (9.4) и (9.5) значения, сравнива­ют с критическими t, которые определяют по таблице Стьюдента с учетом принятого уровня значимости α и числом степеней свободы вариации ν = n - 2. В социально-экономических исследованиях уровень значимости α обычно принимают рав­ным 0,05. Параметр признается значимым (существенным) при условии, если tрасч > tтабл. В таком случае практически невероят­но, что найденные значения параметров обусловлены только случайными совпадениями. Для проверки значимости коэффи­циентов регрессии исследуемого уравнения = 4,0 + 0,6х исчис­лим t-критерий Стьюдента с ν = 10 — 2 = 8 степенями свободы. Рассмотрим вспомогательную таблицу (табл. 9.2).

Таблица 9.2

Расчетные значения, необходимые для исчисления дост, дx

 

у- (у-)2 - (-)2 y-
-3,3 10,89 -2,7 7,29 -0,6 0,36
-2,3 5,29 -2,1 4,41 -0,2 0,04
-1,3 1,69 -1,5 2,25 0,2 0,04
-0,3 0,09 -0,9 0,81 0,6 0,36
-0,3 0,09 -0,3 0,09 0,0 0,0
0,7 0,49 0,3 0,09 0,4 0,16
0,7 0,49 0,9 0,81 -0,2 0,04
1,7 2,89 1,5 2,25 0,2 0,04
2,7 7,29 2,1 4,41 0,6 0,36
1,7 2,89 2,7 7,29 -1,0 1,0
Итого 32,10 29,70 2,40

Средние квадратические отклонения (см. табл. 9.1):

=2,87.

Расчетные значения t- критерия Стьюдента:

По таблице распределения Стьюдента для ν= 8 находим критическое значение t-критерия: (tтабл = 3,307 при α = 0,05).

Поскольку расчетное значение tрасч > tтабл, оба параметра a0, a1 признаются значимыми (отклоняется гипотеза о том, что каждый из этих параметров в действительности равен нулю, и лишь в силу случайных обстоятельств оказался равным прове­ряемой величине).

Проверка адекватности регрессионной модели может быть дополнена корреляционным анализом. Для этого необходимо определить тесноту корреляционной связи между переменными х и у. Теснота корреляционной связи, как и любой другой, может быть измерена эмпирическим корреляционнымотношением ηэ, когда (межгрупповая дисперсия) харак­теризует отклонения групповых средних результативного признака от общей средней: ηэ =.

Говоря о корреляционном отношении как о показателе из­мерения тесноты зависимости, следует отличать от эмпириче­ского корреляционного отношения — теоретическое.

Теоретическое корреляционное отношение η представляет собой относительную величину, получающуюся в результате сравнения среднего квадратического отклонения выровненных значений ре­зультативного признака δ, т. е. рассчитанных по уравнению регрес­сии, со средним квадратическим отклонением эмпирических (факти­ческих) значений результативного признака σ:

ηэ =.

Где ;

Тогда η= (9.6)

Изменение значения η объясняется влиянием факторного признака.

В основе расчета корреляционного отношения лежит правило

сложения дисперсий (см. главу 5), т. е., где - отра­жает вариацию у за счет всех остальных факторов, кроме х, т. е. является остаточной дисперсией:

Тогда формула теоретического корреляционного отношения примет вид:

(9.7)


 

или (9.8)

Подкоренное выражение корреляционного отношения пред­ставляет собой коэффициент детерминации (меры определенно­сти, причинности). Коэффициент детерминации показывает до­лю вариации результативного признака под влиянием вариации признака-фактора.

Теоретическое корреляционное отношение применяется для измерения тесноты связи при линейной и криволинейной зависи­мостях между результативным и факторным признаком. При кри­волинейных связях теоретическое корреляционное отношение, ис­числяемое по формулам (9.7), (9.8), часто называют индексом кор­реляции R. При значительной корреляции расчет по формулам (9.7) и (9.8) значительно проще, так как отклонение (у-), как прави­ло, по значению меньше, чем отклонение (-).

Как видно из формул (9.7) и (9.8), корреляционное отноше­ние может находиться в пределах от 0 до 1, т. е. (0 ≤ η ≤ 1). Чем ближе корреляционное отношение к 1, тем связь между призна­ками теснее.

Проиллюстрируем расчет теоретического корреляционного от­ношения как меры тесноты связи на примере, рассмотренном в табл.9.1, для которого по уравнению прямой регрессии = 4 + 0,6x найдены значения дневной выработки каждого рабочего.

Теоретическое корреляционное отношение рассчитываем дву­мя способами (см. данные табл.9.2):

По формуле (9.6) =;

По формуле (9.8) =

Полученное значение теоретического корреляционного отно­шения свидетельствует о возможном наличии весьма тесной пря­мой зависимости между рассматриваемыми признаками.

Коэффициент детерминации равен 0,925. Отсюда заключаем, что 92,5% общей вариации выработки в изучаемой бригаде обуслов­лено вариацией фактора — стажа работы рабочих (и только 7,5% общей вариации нельзя объяснить изменением стажа работы).

Кроме того, при линейной форме уравнения применяет­ся другой показатель тесноты связи - линейный коэффици­ент корреляции:

(9.9)

где n— число наблюдений.

Для практических вычислений при малом числе наблюде­ний, n ≤ (20 ÷30), линейный коэффициент корреляции удобнее исчислять по следующей формуле:

. (9.10)

Значение линейного коэффициента корреляции важно для исследования социально-экономических явлений и процессов, распределение которых близко к нормальному. Он принимает значения в интервале: -1 ≤ r ≤ +1.

Отрицательные значения указывают на обратную связь, по­ложительные — на прямую. При r = 0 линейная связь отсутствует. Чем ближе коэффициент корреляции по абсолютной вели­чине к единице, тем теснее связь между признаками. И, наконец, при r= ±1 связь — функциональная.

Используем данные табл. 9.1 и рассчитаем линейный коэффициент корреляции по формуле (9.10):

Квадрат линейного коэффициента корреляции называется линейным коэффициентом детерминации. Из определения коэффици­ента детерминации очевидно, что его числовое значение всегда за­ключено в пределах от 0 до 1, т. е. 0 < < 1. Степень тесноты связи полностью соответствует теоретическому корреляционному отно­шению, которое является более универсальным показателем тесно­ты связи по сравнению с линейным коэффициентом корреляции.

Факт совпадений и несовпадений значений теоретического корреляционного отношения з и линейного коэффициента кор­реляции r используется для оценки формы связи.

Выше отмечалось, что посредством теоретического корреля­ционного отношения измеряется теснота связи любой формы, а с помощью линейного коэффициента корреляции - только прямолинейной. Следовательно, значения η и r совпадают толь­ко при наличии прямолинейной связи. Несовпадение этих зна­чений свидетельствует, что связь между изучаемыми признаками не прямолинейная, а криволинейная. Установлено, что если разность квадратов и не превышает 0,1, то гипотезу о пря­молинейной форме связи можно считать подтвержденной. В приведенном ранее примере совпадение значений η и r (η = r = 0,962) дает основание считать связь между выработкой рабочих и их стажем прямолинейной.

Показатели тесноты связи, исчисленные по данным сравни­тельно небольшой статистической совокупности, могут искажаться действием случайных причин. Это вызывает необходимость про­верки их существенности, дающей возможность распространять выводы по результатам выборки на генеральную совокупность.

Для оценки значимости коэффициента корреляции r исполь­зуют t-критерий Стьюдента, который применяется при t-распределении, отличном от нормального.

При линейной однофакторной связи t-критерий можно рас­считать по формуле:

(9.11)

где (n -2) — число степеней свободы при заданном уровне значимости б и объеме выборки п.

Полученное значение tрасч сравнивают с табличным значе­нием t-критерия (для α = 0,05 и 0,01). Если рассчитанное зна­чение tрасч превосходит табличное значение критерия tтабл, то практически невероятно, что найденное значение обусловлено только случайными колебаниями (т. е. отклоняется гипотеза о его случайности).

Так, для коэффициента корреляции между выработкой и ста­жем работы получим:

Это значительно больше критического значения t для n — 2 = 8 степеней свободы и α = 0,01 (tтабл = 3,356), что свидетельствует о значимости коэффициента корреляции и существенности связи между выработкой и стажем работы.

Таким образом, построенная регрессионная модель= 4 + 0,6x в целом адекватна, и выводы, полученные по результатам малой выбор­ки, можно с достаточной вероятностью распространить на всю гипоте­тическую генеральную совокупность.

9.2.2.4. Экономическая интерпретация параметров регрессии

После проверки адекватности, установления точности и на­дежности построенной модели (уравнения регрессии) ее необходимо проанализировать. Прежде всего нужно проверить согласуются ли знаки параметров с теоретическими представлениями и соображениями о направлении влияния признака-фактора на результативный признак (показатель).

В рассмотренном уравнении =4+0,6x, характеризующем за­висимость выработки за смену рабочим у от стажа работы х, пара­метр a1 >0. Следовательно, с возрастанием стажа выработка, как и ожидалось, также увеличивается.

Из уравнения следует, что возрастание на 1 год стажа рабочего приводит к увеличению им дневной выработки в среднем на 0,6 изделия (величину параметра a1).

Для удобства интерпретации параметра a1используют коэф­фициент эластичности. Он показывает средние изменения ре­зультативного признака при изменении факторного признака на 1% и вычисляется по формуле, %:

(9.12)

В рассматриваемом примере Э = 0,6= 0,45. Следовательно, с возрастанием стажа работы на 1 % следует ожидать повышения производительности труда в среднем на 0,45 %.

Этот вывод справедлив только для изучаемой совокупности ра­бочих при конкретных условиях работы.

Если данная совокупность и условия работы типичны, то коэффициент регрессии может быть использован для норми­рования и планирования производительности труда рабочих этой профессии.

Имеет смысл вычислить остатки - , характеризующие отклонение i -х наблюдений от значений, которые следует ожи­дать в среднем.

Анализируя остатки, можно сделать ряд практических выводов. Значения остатков (см. табл.9.2) имеют как положительные, так и от­рицательные отклонения от ожидаемого уровня анализируемого пока­зателя. Экономический интерес представляют выработки рабочих, обозначенных номерами: 5; 1; 4; 8; 7, поскольку их выработки отлича­ются наибольшими отклонениями. Тем самым выявляются передовые рабочие — номера: 1; 8; 7, обеспечивающие наибольшее повышение средней выработки (наибольшие положительные остатки) и отстаю­щие, требующие особого внимания рабочие — номера: 5, 4 (наиболь­шие отрицательные остатки). В итоге положительные отклонения вы­работки большинства рабочих уравновешиваются отрицательными от­клонениями небольшого числа рабочих, т. е. ∑ = 0.

9.2.2.5. Многофакторный корреляционный и регрессионный анализ

Как известно, явления общественной жизни складываются под воздействием не одного, а целого ряда факторов, т. е. эти явления многофакторны. Между факторами существуют слож­ные взаимосвязи, поэтому их влияние комплексное и его нельзя рассматривать как простую сумму изолированных влияний.

Многофакторный корреляционный и регрессионный анализ по­зволяет оценить меру влияния на исследуемый результативный

показатель каждого из включенных в модель (уравнение) факто­ров при фиксированном положении (на среднем уровне) ос­тальных факторов, а также при любых возможных сочетаниях факторов с определенной степенью точности найти теоретиче­ское значение этого показателя (важным условием является от­сутствие между факторами функциональной связи).

Математически задача формулируется следующим образом. Требуется найти аналитическое выражение, наилучшим образом отражающее установленную теоретическим анализом связь не­зависимых признаков с результативным, т. е. функцию

В условиях использования ЭВМ выбор аппроксимирующей математической функции осуществляется перебором решений, наиболее часто применяемых в анализе корреляции уравнений регрессии.

После выбора типа аппроксимирующей функции приступают

к многофакторному корреляционному и регрессионному анализу,

задачей которого является построение уравнения множественной

регрессии и нахождение его неизвестных параметров a0, a1,...,an.

Параметры уравнения множественной регрессии, как и в случае I парной регрессии, находят по способу наименьших квадратов. Затем с помощью корреляционного анализа осуществляют проверку адекватности полученной модели. Адекватную модель эко­номически интерпретируют.

9.2.2.6. Построение и статистический анализ

двухфакторной линейной модели

(трехмерной регрессии)

Для расчета параметров простейшего уравнения множест­венной линейной двухфакторной регрессии

где — расчетные значения зависимой переменной (результа­тивного признака);

— независимые переменные (факторные признаки);

a0, a1, a2— параметры уравнения.

Построим следующую систему нормальных уравнений:

(9.13)

Параметры этой системы могут быть найдены, например, методом К. Гаусса.

9.2.2.7. Трехфакторные линейные регрессионные модели

 

В случае линейнойтрехфакторной связи уравнение регрессии имеет вид

Для расчета параметров по способу наименьших квадратов используют следующую систему нормальных уравнений:

(9.14)

Чтобы получить эту систему, необходимо иметь таблицу зна­чений следующих показателей:

Для решения множественной регрессии с n-факторами
= a0+ a1x1+ a2 x2+... + an xn, система нормальных уравне­ний такова:

(9.15)

Вручную целесообразно выполнять построение и анализ только двух-, максимум трехфакторных моделей. Для n >3 все расчеты рекомендуется осуществлять на компьютерах по специ­альным программам, предусматривающим исчисление парамет­ров уравнения и показателей, используемых для проверки его адекватности.

Многофакторный корреляционный и регрессионный анализ может быть использован в экономико-статистических исследованиях:

● для приближенной оценки фактического и заданного уровней;

● в качестве укрупненного норматива (для этого доста­точно в уравнение регрессии подставить вместо фак­тических значений факторов их средние значения);

● для выявления резервов производства;

● для проведения межзаводского сравнительного анали­за и выявления на его основе скрытых возможностей предприятий;

● для краткосрочного прогнозирования развития произ­водства и др.

Построение и анализ трехмерной регрессионной модели рас­смотрим на конкретном примере.

Пример 2. По выборочным данным, представленным в табл.9.3, о выработке деталей за смену 20 рабочими цеха требуется вы­явить зависимость производительности труда у от двух факторов: внутрисменных простоев x1 и квалификации рабочих x2.

Таблица 9.3




Поделиться с друзьями:


Дата добавления: 2014-01-06; Просмотров: 1321; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.098 сек.