Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Показатели вариации

Вариация —это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени. Например, работники фирмы различаются по доходам, затратам времени на работу, росту, весу, любимому занятию в свободное время и т.д. Она возникает в результате того, что индивидуальные значения признака складываются под совокупным влиянием разнообразных факторов (условий), которые по-разному сочетаются в каждом отдельном случае. Таким образом, величина каждого варианта объективна.

Средняя величина дает обобщающую характеристику при­знака изучаемой совокупности, но она не раскрывает строения совокупности, которое весьма существенно для ее познания. Средняя не показывает, как располагаются около нее варианты осредняемого признака, сосредоточены ли они вблизи средней или значительно отклоняются от нее. Средняя величина при­знака в двух совокупностях может быть одинаковой, но в одном случае все индивидуальные значения отличаются от нее мало, а в другом — эти отличия велики, т.е. в одном случае вариация признака мала, а в другом — велика, это имеет весьма важное значение для характеристики надежности средней величины.

Чем больше варианты отдельных единиц совокупности различаются между собой, тем больше они отличаются от своей средней, vi наоборот, — чем меньше варианты отличаются друг

от друга, тем меньше они отличаются от средней, которая в таком случае будет более реально представлять всю совокуп­ность. Вот почему ограничиваться вычислением одной средней в ряде случаев нельзя. Нужны и другие показатели, характери­зующие отклонения отдельных значений от общей средней.

Это можно показать на таком примере. Предположим, что одинаковую работу выполняют две бригады, каждая — из трех человек. Пусть количество деталей, шт., изготовленных за смену отдельными рабочими составляло:

в первой бригаде — 95, 100, 105 (х1 = 100 шт.);

во второй бригаде — 75, 100, 125 (х2 = 100 шт.).

Средняя выработка на одного рабочего в обеих бригадах одинакова и составляет х\ = хг - 100 шт., однако колеблемость выработки отдельных рабочих в первой бригаде значительно меньше, чем во второй.

Поэтому возникает необходимость измерять вариацию признака в совокупностях. Для этой цели в статистике приме­няют ряд обобщающих показателей.

К показателям вариации относятся: размах вариации, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение, коэффициент вариации.

Самым элементарным показателем вариации признака явля­ется размах вариации R, представляющий собой разность между максимальным и минимальным значениями признака:

В нашем примере размах вариации сменной выработки деталей составляет: в первой бригаде — R\= 10 шт. (т.е. 105 — 95); во второй бригаде —i?2= 50 шт. (т.е. 125 — 75), что

в 5 раз больше.

Это свидетельствует о том, что при численном равенстве средняя выработка первой бригады более "устойчива". Размах вариации может служить базой расчета возможных резервов роста выработки. Таких резервов больше у второй бригады, поскольку в случае достижения всеми рабочими максимальной для этой бригады выработки деталей, ею может быть изготовлено 375 шт., т.е. (3x125), а в первой - только 315 шт., т.е. (3 х 105).

Однако размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов в ряду. При изучении вариации нельзя ограничиваться только определением ее размаха. Для анализа вариации необходим показатель, который отражает все колебания варьирующего признака и даёт обобщённую характеристику. Простейший показатель такого типа — среднее линейное отклонение.

Среднее линейное отклонение d представляет собой среднюю арифметическую абсолютных значений отклонений отдельных вариантов от их средней арифметической (при этом всегда предполагают, что среднюю вычитают из варианта: (х-х).-

Среднее линейное отклонение:

(5.18)

для несгруппированных данных d =

где и — число членов ряда;

(5.19)

 

.

В формулах (5.18) и (5.19) разности в числителе взяты по модулю, (иначе в числителе всегда будет ноль — "0" — алгебраическая сумма отклонений вариантов от их средней арифметической). Поэтому среднее линейное отклонение как меру вариации признака применяют в статистической практике ред­ко (только в тех случаях, когда суммирование показателей без учета знаков имеет экономический смысл). С его помощью, например, анализируется состав работающих, ритмичность производства, оборот внешней торговли.

Дисперсия признака представляет собой средний квадрат отклонений вариантов от их средней величины, она вычисляется по формулам простой и взвешенной дисперсий (в зависимости от исходных данных):

(5.21)

 

Формула (5.21) применяется при наличии у вариантов своих весов (или частот вариационного ряда).

Формулу для расчета дисперсии (5.20) можно преобразовать, учитывая, что У х = пх:

 

т.е. дисперсия равна разности средней из квадратов вариантов и квадрата их средней.

Техника вычисления дисперсии по формулам (5.20), (5.21) достаточно сложна, а при больших значениях вариантов и час­тот может быть громоздкой. Расчет можно упростить, исполь­зуя свойства дисперсии (доказываемые в. математической ста­тистике).

Приведем два из них:

первоеесли все значения признака уменьшить или увеличить на одну и ту же постоянную величину А, то дисперсия от этого не изменится;

второе — если все значения признака уменьшить или увели­чить в одно и то же число раз (i раз), то дисперсия соответственно уменьшится или увеличится в i2 раз.

Используя второе свойство дисперсии, разделив все варианты на величину интервала, получим следующую формулу вычисления дисперсии в вариационных рядах с равными интервалами по способу моментов:

где ст2 — дисперсия, исчисленная по способу моментов; * — величина интервала;

— новые (преобразованные) значения вариантов

(А — условный ноль, в качестве которого удобно использовать середину интервала, обладающего наибольшей частотой);

момент второго порядка

квадрат момента первого порядка.

Расчет дисперсии по формуле (5.23) менее трудоемок.

Дисперсия имеет большое значение в экономическом анализе. В математической статистике важную роль для характеристики качества статистических оценок играет их дисперсия. Ниже, в частности, будет показано разложение дисперсии на соответствующие элементы, позволяющие оценить влияние различных факторов, обуславливающих вариацию признака; использование дисперсии для построения показателей тесноты корреляционной связи при оценке результатов выборочных наблюдений.

Среднее квадратическое отклонение а равно корню квадратному из дисперсии:

 
(5.24)

для несгруппированных данных

 

 

Среднее квадратическое отклонение — это обобщающая характеристика размеров вариации признака в совокупности; оно показывает на сколько в среднем отклоняются конкретные варианты от их среднего значения; является абсолютной мерой колеблемости признака и выражается в тех же единицах, что и варианты, поэтому экономически хорошо интерпретируется.

Обозначим: 1 — наличие интересующего нас признака; О — его отсутствие; /; — доля единиц, облагающих данным при­знаком; q — доля единиц, не обладающих данным признаком; p+q =1. Исчислим среднее значение альтернативного признака

и его дисперсию.

Среднее значение альтернативного признака

так как р + а = \.

(5.27)

Дисперсия альтернативного признака

Подставив в формулу дисперсии q = 1 - р, получим

 

= ра
 

Таким образом, 2р = pq — дисперсия альтернативного признака равна произведению доли единиц, обладающих признаком, на долю единиц, не обладающих данным признаком.

Например, если на 10 000 человек населения района приходится 4500 мужчин и 5500 женщин, то

 

4500 Л._

Я =

р =------- = 0,45;

* 10000

Дисперсия альтернативного признака Up = Pq = 0,45 ■ 0,55 = 0,2475.

Предельное значение дисперсии альтернативного призна­ка равно 0,25. Оно получается при р = 0,5.

Среднее квадратическое отклонение альтернативного признака

(5.29)

Если, например, 2% всех деталей бракованные (j» то 98% — годные {q -■ 98%), тогда дисперсия доли брака

о-р =0,02-0,98 = 0,0196.

Среднее квздратическое отклонение доли брака составит:

а =

= 0,14, т.е. гт =

 

При вычислении средних величин и дисперсии для интервальных рядов распределения истинные значения признака заменяются центральными (серединными) значениями интервалов, которые отличаются от средней арифметической значений, включенных в интервал. Это приводит к появлению систематической погрешности при расчете дисперсии. В.Ф.Шеппард установил, что погрешность в расчете диспер­сии, вызванная применением сгруппированных данных, составляет 1/12 квадрата величины интервала (т.е. i2/l2), как в сторону занижения так и в сторону завышения величины дисперсии.

Поправка Шеппарда должна применяться, если распределение близко к нормальному, относится к признаку с непрерывным характером вариации, построено по боль­шому количеству исходных данных (я>500). Однако исходя из того, что в ряде случаев обе погрешности, действуя в противоположных направлениях, нейтрализуются и компенсируют друг друга, можно иногда отказаться от введения поправок.

Чем меньше значение дисперсии и среднего квадратического отклонения, тем однороднее (количественно) сово­купность и тем более типичной будет средняя величина.

В статистической практике часто возникает необходимость сравнения вариаций различных признаков. Например, большой интерес представляет сравнение вариаций возраста рабочих и их квалификации, стажа работы и размера заработной платы, себестоимости и прибыли, стажа работы и производительности труда и т.д. Для подобных сопоставлений показатели абсолютной колеблемости признаков непригодны: нельзя сравнивать колеблемость стажа работы, выраженного в годах, с вариацией заработной платы, выраЖеНН Для существлешш такого рода сравнений, а также соавнений колеблемости одного и того же признака в не-cS™ совокупностях с различным средним арифметиче-ским используют относительный показатель вариации ко-

Ко^:^еаРиаЦии представляет собой выраженное в процентах отношение среднего квадратического отклонения к средней арифметической:

К = — 100. <5-3°)

■ ' ■ х

Коэффициент вариации используют не только для сравнительной оценки вариации единиц совокупности, но и ш характеристику однородности совокупности^ Совокупность считается количественно однородной, если коэффициент вариа-

ции не превышает 33 %.

Покажем расчет различными способами показателей вариации на примере данных о сменной выработке рабочих бри-вд представленных интервальным радом распределения

Та Л Исчислим среднесменную выработку рабочих, шт.: -_£*/_ 21600 = 216.

Z/ 10°

Рассчитаем дисперсию выработки по формуле (5.21):

,304

2

ст -

Найдем среднее квадратическое отклонение, шт.:

Таким образом, данная бригада рабочих достаточно однородна по выработке, поскольку вариация признака составляет лишь 8%.

Теперь выполним расчет дисперсии по формуле (5.22) и по способу моментов по формуле (5.23), для расчета воспользу­емся данными табл. 5.7, графы 8—11.

Расчет дисперсии по формуле (5.20):

7 3 -2 I*2/ (I*/? 4696000 2

= 46960-46656 = 304. Расчет дисперсии по способу моментов, см. формулу (5.21):

т2=/2(/И2_2) = /2

где А = 50 — центральный вариант с наибольшей частотой; / = 20 — величина интервала данного ряда;

loo vloo

= 400 (0,8-0,04) = 304,

Как видим, наименее трудоемким является метод исчис­ления дисперсии способом моментов.

Правил® сложения дисперсий

Вариация признака обусловлена различными факторами, некоторые из этих факторов можно выделить, если статистическую совокупность разбить на группы по какому-либо призна­ку. Тогда, наряду с изучением вариации признака по всей совокупности в целом, становится возможным изучить вариацию для каждой из составляющих ее группы, а также и между этими группами. В простейшем случае, когда совокупность расчленена на группы по одному фактору, изучение вариации достига­ется посредством исчисления и анализа трех видов дисперсий: общей, межгрупповой и внутригрупповой.

Общая дисперсия а2 измеряет вариацию признака по всей совокупности под влиянием всех факторов, обусловивших эту вариацию. Она равна среднему квадрату отклонений отдельных значений признака х от общей средней х и может быть вычислена как простая дисперсия (по формуле (5.20) или взвешен­ная дисперсия ло формуле (5.21).

Межгрупповая дисперсия Ь2 характеризует систематическую вариацию результативного порядка, обусловленную влиянием признака-фактора, положенного в основание группировки. Она равна, среднему квадрату отклонений групповых (частных) средних х/ от общей средней х:

где / — численность единиц в группе.

Внутригрупповая (мастная) дисперсия сг," отражает случайную вариацию, т.е. часть вариации, обуслоаченную влиянием неучтен­ных факторов и не зависящую от признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклоне­ний отдельных значений признака внутри группы х от средней арифметической этой группы х,- (групповой средней) и может

быть исчислена как простая дисперсия или как взвешенная диспер­сия по формулам, соответственно:

 

(5,32)

На основании внутригрупповой дисперсии по каждой группе, т.е. на основании ст,2 можно определить общую сред­нюю из внутригрупповых дисперсий:

(5.33)

(5.34)

Согласно правилу сложения дисперсий общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий:

(5.35)

= а,- + о

 

Пользуясь правилом сложения дисперсий, можно всегда по двум. известным дисперсиям определить третью — неизвестную, а также судить о силе влияния грушшровочного признака.

Рассмотрим вычисление этих дисперсий и покажем справедливость соотношения (5.35) на следующем примере.

Пусть при изучений влияния квалификации (тарифного разряда) рабочих на уровень производительности труда в цехе были получены данные, представленные в табл. 5.8.

Таблица 5.8

 

  Рабочие [V разряда   Рабочие Уразряда
п/п Выработка рабочего, шт., У/ У-У/ (у-уд2 п/п Выработка рабочего, шт., >•/ У ~ У,- (у-у>)2
    ___ 1 9.     -1  
    -1       -1  
    -1          
            -2  
               
               
I   -   I      

Для результативного признака исчислим: 1) групповые дисперсии;. 2) среднюю из внутригрупповых дисперсий; 3)межгрупповую дисперсию; 4) общую дисперсию; 5)проверим правило сложения дисперсий.

В этом примере данные группируются по квалификации (тарифному разряду) рабочих, являющейся факторным признаком х

Результативный признак у, варьирует как под влиянием систематического фактора х ~ квалификации (межгрупповая вариация), так и других неучтенных случайных факторов (внутригрупповая вариация). Задача заключается в измерении этих вариаций с помощью дисперсий: общей, межгрупповой и внутригрупповых.

1. Для расчета групповых дисперсий исчислим средние выработки по каждой группе и общую среднюю выработку, шт.

60 "in

по первой группе у,:. =.•-—■ = 10;
. о

60,. по второй группе у,,-= — = 15;

по двум группам - -5-V 10-6 + 1

_ 60^60 _ 120 _

Данные для расчета дисперсий по группам представлены в табл. 5.8. Подставив необходимые значения в формулу (5.32), получим внутригрупповые дисперсии;

по первой группе ст.- = —---- '- — = — = 4;

п о

 

по второй группе

__1Д

Внутригрупповые дисперсии показывают вариации выра­ботки в каждой группе, вызванные всеми возможными фак­торами (техническое состояние оборудования, обеспечен­ность инструментами и материалами, возраст рабочих, ин­тенсивность труда и т.д.), кроме различий в квалификаци­онном разряде (внутри группы все рабочие имеют одну ква­лификацию).

2. Рассчитаем среднюю из внутригрупповых дисперсий (/ = п) по формуле (5.34):

-4
i:6

= Ъ?3(. = i:6 + ^ -_4 = 3{1 = 1 о

ю.idio.

Средняя из внутригрупповых дисперсий отражает вариацию выработки, обусловленную всеми факторами, кроме квалифи­кации рабочих, но в среднем по всей совокупности.

3. Исчислим межгрупповую дисперсию по формуле (5.31):

2/ _ (1^~ [2)jl +(15^12)^4_ 24 + 36 _ 60,0 _ ~ |() ~ 10 ~ 10,0= '

Межгрупповая дисперсия характеризует вариацию группо­вых средних, обусловленную различиями групп рабочих по ква­лификационному разряду.

 

 

4. Исчислим общую дисперсию но формуле (5.20):

С? -—

~У—= [(7 - 12)2 + (9 - 12)2 + (9 - 12)2 + (10 -12)2 +
+ (12-12)2+(13-12)2 + (14 - 12)2 + (14 - 12)2 + (15 - 12)2 +
. +(17- 12)2:]: 10 = 90 /10 = 9,0. '

Общая дисперсия отражает суммарное влияние всех воз­можных факторов на общую вариацию среднечасовой выработ­ки изделий всеми рабочими цеха.

5. Суммирование средней из внутритрупповых дисперсий и межгрупповой дает общую дисперсию:.

а2 = й2 + ст? = 6,0 + 3,0 = 9,0.

Очевидно, чем больше доля межгрупповой дисперсии в общей дисперсии, тем сильнее влияние группировочного признака (квалификационного разряда) на изучаемый признак (количество изготавливаемых изделий).

ст

Поэтому в статистическом анализе широко используется эмпирический коэффициент детерминации (г\2) — показатель, представляющий собой долю межгрупповой дисперсии в общей дисперсии результативного признака и характеризующий силу влияния группировочного признака на образование общей вариации:

 

(5.36)

 

Эмпирический коэффициент детерминации показывает долю вариации результативного признака у под влиянием факторного признака л- (остальная часть общей вариации у обуславливается вариацией прочих факторов). При отсутствии связи эмпирический коэффициент детерминации равен нулю, а при функциональной связи — единице,

<'

В нашем примере ту2 = -~2 = Q = 0,666

Это означает, что на 66,6 % вариация производительности труда рабочих обусловлена различиями в их квалификации и на 33,4 % — влиянием прочих факторов.

Эмпирическое, корреляционное отношение — это корень квадратный из эмпирического коэффициента детерминации:

оно показывает тесноту связи между группировочным и резуль­тативным признаками.

Эмпирическое корреляционное отношение ц, как и г]2, может принимать значения от 0 до 1.

Если связь отсутствует, то корреляционное отношение равно нулю, т.е. все групповые средние будут равны между собой, межгрупповой вариации не будет. Значит, группировочный признак никак не влияет на образование общей ва­риации.

Если связь функциональная, то корреляционное отноше­ние будет равно единице. В этом случае дисперсия групповых средних равна общей дисперсии (52 = ст2), т.е. внутригрупповой вариации не будет. Это означает, что группировочный признак целиком определяет вариацию изучаемого результативного признака.

Чем значение корреляционного отношения ближе к единице, тем теснее, ближе к функциональной зависимости связь между признаками.

Для качественной оценки тесноты связи на основе показателя эмпирического корреляционного отношения можно воспользоваться соотношениями Чэдцока:

Лэ Сила связи
0,9-0,99 Весьма тесная

0,1-0,30,3-0,5 0,5-0,7 0,7-0,9 Слабая Умеренная Заметная Тесная

В нашем примере цэ = ^/0^666 «0,812, что свидетельствует о тесной связи между квалификацией рабочих и производи­тельностью их труда.

Контрольные вопросы

 

1.Как исчисляется средняя арифметическая из
вариационного ряда?

2. Почему средняя арифметическая интервального ряда является приближенной средней, от чего зависит степень ее приближения?

3. Каковы основные свойства средней арифметической?

4. Каков алгоритм исчисления средней арифметической из вариационного ряда по способу моментов? В чем его преимущества?

5. Для чего служит средняя гармоническая? Чем онао тличается от средней арифметической?

6. Какие признаки называются прямыми, а какие —
обратными? Приведите примеры.

 

<== предыдущая лекция | следующая лекция ==>
Структурные средние | Понятие о выборочном наблюдении, его задачи
Поделиться с друзьями:


Дата добавления: 2014-01-07; Просмотров: 2031; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.012 сек.