КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Показатели вариации
Вариация —это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени. Например, работники фирмы различаются по доходам, затратам времени на работу, росту, весу, любимому занятию в свободное время и т.д. Она возникает в результате того, что индивидуальные значения признака складываются под совокупным влиянием разнообразных факторов (условий), которые по-разному сочетаются в каждом отдельном случае. Таким образом, величина каждого варианта объективна. Средняя величина дает обобщающую характеристику признака изучаемой совокупности, но она не раскрывает строения совокупности, которое весьма существенно для ее познания. Средняя не показывает, как располагаются около нее варианты осредняемого признака, сосредоточены ли они вблизи средней или значительно отклоняются от нее. Средняя величина признака в двух совокупностях может быть одинаковой, но в одном случае все индивидуальные значения отличаются от нее мало, а в другом — эти отличия велики, т.е. в одном случае вариация признака мала, а в другом — велика, это имеет весьма важное значение для характеристики надежности средней величины. Чем больше варианты отдельных единиц совокупности различаются между собой, тем больше они отличаются от своей средней, vi наоборот, — чем меньше варианты отличаются друг от друга, тем меньше они отличаются от средней, которая в таком случае будет более реально представлять всю совокупность. Вот почему ограничиваться вычислением одной средней в ряде случаев нельзя. Нужны и другие показатели, характеризующие отклонения отдельных значений от общей средней. Это можно показать на таком примере. Предположим, что одинаковую работу выполняют две бригады, каждая — из трех человек. Пусть количество деталей, шт., изготовленных за смену отдельными рабочими составляло: в первой бригаде — 95, 100, 105 (х1 = 100 шт.); во второй бригаде — 75, 100, 125 (х2 = 100 шт.). Средняя выработка на одного рабочего в обеих бригадах одинакова и составляет х\ = хг - 100 шт., однако колеблемость выработки отдельных рабочих в первой бригаде значительно меньше, чем во второй. Поэтому возникает необходимость измерять вариацию признака в совокупностях. Для этой цели в статистике применяют ряд обобщающих показателей. К показателям вариации относятся: размах вариации, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение, коэффициент вариации. Самым элементарным показателем вариации признака является размах вариации R, представляющий собой разность между максимальным и минимальным значениями признака: В нашем примере размах вариации сменной выработки деталей составляет: в первой бригаде — R\= 10 шт. (т.е. 105 — 95); во второй бригаде —i?2= 50 шт. (т.е. 125 — 75), что в 5 раз больше. Это свидетельствует о том, что при численном равенстве средняя выработка первой бригады более "устойчива". Размах вариации может служить базой расчета возможных резервов роста выработки. Таких резервов больше у второй бригады, поскольку в случае достижения всеми рабочими максимальной для этой бригады выработки деталей, ею может быть изготовлено 375 шт., т.е. (3x125), а в первой - только 315 шт., т.е. (3 х 105). Однако размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов в ряду. При изучении вариации нельзя ограничиваться только определением ее размаха. Для анализа вариации необходим показатель, который отражает все колебания варьирующего признака и даёт обобщённую характеристику. Простейший показатель такого типа — среднее линейное отклонение. Среднее линейное отклонение d представляет собой среднюю арифметическую абсолютных значений отклонений отдельных вариантов от их средней арифметической (при этом всегда предполагают, что среднюю вычитают из варианта: (х-х).- Среднее линейное отклонение:
для несгруппированных данных d = где и — число членов ряда;
. В формулах (5.18) и (5.19) разности в числителе взяты по модулю, (иначе в числителе всегда будет ноль — "0" — алгебраическая сумма отклонений вариантов от их средней арифметической). Поэтому среднее линейное отклонение как меру вариации признака применяют в статистической практике редко (только в тех случаях, когда суммирование показателей без учета знаков имеет экономический смысл). С его помощью, например, анализируется состав работающих, ритмичность производства, оборот внешней торговли. Дисперсия признака представляет собой средний квадрат отклонений вариантов от их средней величины, она вычисляется по формулам простой и взвешенной дисперсий (в зависимости от исходных данных): (5.21)
Формула (5.21) применяется при наличии у вариантов своих весов (или частот вариационного ряда). Формулу для расчета дисперсии (5.20) можно преобразовать, учитывая, что У х = пх:
т.е. дисперсия равна разности средней из квадратов вариантов и квадрата их средней. Техника вычисления дисперсии по формулам (5.20), (5.21) достаточно сложна, а при больших значениях вариантов и частот может быть громоздкой. Расчет можно упростить, используя свойства дисперсии (доказываемые в. математической статистике). Приведем два из них: первое — если все значения признака уменьшить или увеличить на одну и ту же постоянную величину А, то дисперсия от этого не изменится; второе — если все значения признака уменьшить или увеличить в одно и то же число раз (i раз), то дисперсия соответственно уменьшится или увеличится в i2 раз. Используя второе свойство дисперсии, разделив все варианты на величину интервала, получим следующую формулу вычисления дисперсии в вариационных рядах с равными интервалами по способу моментов: где ст2 — дисперсия, исчисленная по способу моментов; * — величина интервала; — новые (преобразованные) значения вариантов (А — условный ноль, в качестве которого удобно использовать середину интервала, обладающего наибольшей частотой); момент второго порядка квадрат момента первого порядка. Расчет дисперсии по формуле (5.23) менее трудоемок. Дисперсия имеет большое значение в экономическом анализе. В математической статистике важную роль для характеристики качества статистических оценок играет их дисперсия. Ниже, в частности, будет показано разложение дисперсии на соответствующие элементы, позволяющие оценить влияние различных факторов, обуславливающих вариацию признака; использование дисперсии для построения показателей тесноты корреляционной связи при оценке результатов выборочных наблюдений. Среднее квадратическое отклонение а равно корню квадратному из дисперсии:
для несгруппированных данных
Среднее квадратическое отклонение — это обобщающая характеристика размеров вариации признака в совокупности; оно показывает на сколько в среднем отклоняются конкретные варианты от их среднего значения; является абсолютной мерой колеблемости признака и выражается в тех же единицах, что и варианты, поэтому экономически хорошо интерпретируется. Обозначим: 1 — наличие интересующего нас признака; О — его отсутствие; /; — доля единиц, облагающих данным признаком; q — доля единиц, не обладающих данным признаком; p+q =1. Исчислим среднее значение альтернативного признака и его дисперсию. Среднее значение альтернативного признака так как р + а = \.
Дисперсия альтернативного признака Подставив в формулу дисперсии q = 1 - р, получим
Таким образом, <з2р = pq — дисперсия альтернативного признака равна произведению доли единиц, обладающих признаком, на долю единиц, не обладающих данным признаком. Например, если на 10 000 человек населения района приходится 4500 мужчин и 5500 женщин, то 4500 Л._
р =------- = 0,45; * 10000 Дисперсия альтернативного признака Up = Pq = 0,45 ■ 0,55 = 0,2475. Предельное значение дисперсии альтернативного признака равно 0,25. Оно получается при р = 0,5. Среднее квадратическое отклонение альтернативного признака (5.29) Если, например, 2% всех деталей бракованные (j» то 98% — годные {q -■ 98%), тогда дисперсия доли брака о-р =0,02-0,98 = 0,0196. Среднее квздратическое отклонение доли брака составит:
= 0,14, т.е. гт =
При вычислении средних величин и дисперсии для интервальных рядов распределения истинные значения признака заменяются центральными (серединными) значениями интервалов, которые отличаются от средней арифметической значений, включенных в интервал. Это приводит к появлению систематической погрешности при расчете дисперсии. В.Ф.Шеппард установил, что погрешность в расчете дисперсии, вызванная применением сгруппированных данных, составляет 1/12 квадрата величины интервала (т.е. i2/l2), как в сторону занижения так и в сторону завышения величины дисперсии. Поправка Шеппарда должна применяться, если распределение близко к нормальному, относится к признаку с непрерывным характером вариации, построено по большому количеству исходных данных (я>500). Однако исходя из того, что в ряде случаев обе погрешности, действуя в противоположных направлениях, нейтрализуются и компенсируют друг друга, можно иногда отказаться от введения поправок. Чем меньше значение дисперсии и среднего квадратического отклонения, тем однороднее (количественно) совокупность и тем более типичной будет средняя величина. В статистической практике часто возникает необходимость сравнения вариаций различных признаков. Например, большой интерес представляет сравнение вариаций возраста рабочих и их квалификации, стажа работы и размера заработной платы, себестоимости и прибыли, стажа работы и производительности труда и т.д. Для подобных сопоставлений показатели абсолютной колеблемости признаков непригодны: нельзя сравнивать колеблемость стажа работы, выраженного в годах, с вариацией заработной платы, выраЖеНН Для существлешш такого рода сравнений, а также соавнений колеблемости одного и того же признака в не-cS™ совокупностях с различным средним арифметиче-ским используют относительный показатель вариации ко- Ко^:^еаРиаЦии представляет собой выраженное в процентах отношение среднего квадратического отклонения к средней арифметической: К = — 100. <5-3°) ■ ' ■ х Коэффициент вариации используют не только для сравнительной оценки вариации единиц совокупности, но и ш характеристику однородности совокупности^ Совокупность считается количественно однородной, если коэффициент вариа- ции не превышает 33 %. Покажем расчет различными способами показателей вариации на примере данных о сменной выработке рабочих бри-вд представленных интервальным радом распределения Та Л Исчислим среднесменную выработку рабочих, шт.: -_£*/_ 21600 = 216. Z/ 10° Рассчитаем дисперсию выработки по формуле (5.21):
2 ст - Найдем среднее квадратическое отклонение, шт.: Таким образом, данная бригада рабочих достаточно однородна по выработке, поскольку вариация признака составляет лишь 8%. Теперь выполним расчет дисперсии по формуле (5.22) и по способу моментов по формуле (5.23), для расчета воспользуемся данными табл. 5.7, графы 8—11. Расчет дисперсии по формуле (5.20): 7 3 -2 I*2/ (I*/? 4696000 2 = 46960-46656 = 304. Расчет дисперсии по способу моментов, см. формулу (5.21): т2=/2(/И2_/и2) = /2 где А = 50 — центральный вариант с наибольшей частотой; / = 20 — величина интервала данного ряда;
= 400 (0,8-0,04) = 304, Как видим, наименее трудоемким является метод исчисления дисперсии способом моментов. Правил® сложения дисперсий Вариация признака обусловлена различными факторами, некоторые из этих факторов можно выделить, если статистическую совокупность разбить на группы по какому-либо признаку. Тогда, наряду с изучением вариации признака по всей совокупности в целом, становится возможным изучить вариацию для каждой из составляющих ее группы, а также и между этими группами. В простейшем случае, когда совокупность расчленена на группы по одному фактору, изучение вариации достигается посредством исчисления и анализа трех видов дисперсий: общей, межгрупповой и внутригрупповой. Общая дисперсия а2 измеряет вариацию признака по всей совокупности под влиянием всех факторов, обусловивших эту вариацию. Она равна среднему квадрату отклонений отдельных значений признака х от общей средней х и может быть вычислена как простая дисперсия (по формуле (5.20) или взвешенная дисперсия ло формуле (5.21). Межгрупповая дисперсия Ь2 характеризует систематическую вариацию результативного порядка, обусловленную влиянием признака-фактора, положенного в основание группировки. Она равна, среднему квадрату отклонений групповых (частных) средних х/ от общей средней х: где / — численность единиц в группе. Внутригрупповая (мастная) дисперсия сг," отражает случайную вариацию, т.е. часть вариации, обуслоаченную влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений отдельных значений признака внутри группы х от средней арифметической этой группы х,- (групповой средней) и может быть исчислена как простая дисперсия или как взвешенная дисперсия по формулам, соответственно: (5,32) На основании внутригрупповой дисперсии по каждой группе, т.е. на основании ст,2 можно определить общую среднюю из внутригрупповых дисперсий: (5.33) (5.34) Согласно правилу сложения дисперсий общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий:
= а,- + о
Пользуясь правилом сложения дисперсий, можно всегда по двум. известным дисперсиям определить третью — неизвестную, а также судить о силе влияния грушшровочного признака. Рассмотрим вычисление этих дисперсий и покажем справедливость соотношения (5.35) на следующем примере. Пусть при изучений влияния квалификации (тарифного разряда) рабочих на уровень производительности труда в цехе были получены данные, представленные в табл. 5.8. Таблица 5.8
Для результативного признака исчислим: 1) групповые дисперсии;. 2) среднюю из внутригрупповых дисперсий; 3)межгрупповую дисперсию; 4) общую дисперсию; 5)проверим правило сложения дисперсий. В этом примере данные группируются по квалификации (тарифному разряду) рабочих, являющейся факторным признаком х Результативный признак у, варьирует как под влиянием систематического фактора х ~ квалификации (межгрупповая вариация), так и других неучтенных случайных факторов (внутригрупповая вариация). Задача заключается в измерении этих вариаций с помощью дисперсий: общей, межгрупповой и внутригрупповых. 1. Для расчета групповых дисперсий исчислим средние выработки по каждой группе и общую среднюю выработку, шт. 60 "in по первой группе у,:. =.•-—■ = 10; 60,. по второй группе у,,-= — = 15; по двум группам - -5-V 10-6 + 1 _ 60^60 _ 120 _ Данные для расчета дисперсий по группам представлены в табл. 5.8. Подставив необходимые значения в формулу (5.32), получим внутригрупповые дисперсии; по первой группе ст.- = —---- '- — = — = 4; п о по второй группе __1Д Внутригрупповые дисперсии показывают вариации выработки в каждой группе, вызванные всеми возможными факторами (техническое состояние оборудования, обеспеченность инструментами и материалами, возраст рабочих, интенсивность труда и т.д.), кроме различий в квалификационном разряде (внутри группы все рабочие имеют одну квалификацию). 2. Рассчитаем среднюю из внутригрупповых дисперсий (/ = п) по формуле (5.34):
= Ъ?3(. = i:6 + ^ -_4 = 3{1 = 1 о ю.idio. Средняя из внутригрупповых дисперсий отражает вариацию выработки, обусловленную всеми факторами, кроме квалификации рабочих, но в среднем по всей совокупности. 3. Исчислим межгрупповую дисперсию по формуле (5.31):
Межгрупповая дисперсия характеризует вариацию групповых средних, обусловленную различиями групп рабочих по квалификационному разряду.
~У—= [(7 - 12)2 + (9 - 12)2 + (9 - 12)2 + (10 -12)2 + Общая дисперсия отражает суммарное влияние всех возможных факторов на общую вариацию среднечасовой выработки изделий всеми рабочими цеха. 5. Суммирование средней из внутритрупповых дисперсий и межгрупповой дает общую дисперсию:. а2 = й2 + ст? = 6,0 + 3,0 = 9,0. Очевидно, чем больше доля межгрупповой дисперсии в общей дисперсии, тем сильнее влияние группировочного признака (квалификационного разряда) на изучаемый признак (количество изготавливаемых изделий).
Поэтому в статистическом анализе широко используется эмпирический коэффициент детерминации (г\2) — показатель, представляющий собой долю межгрупповой дисперсии в общей дисперсии результативного признака и характеризующий силу влияния группировочного признака на образование общей вариации:
(5.36)
Эмпирический коэффициент детерминации показывает долю вариации результативного признака у под влиянием факторного признака л- (остальная часть общей вариации у обуславливается вариацией прочих факторов). При отсутствии связи эмпирический коэффициент детерминации равен нулю, а при функциональной связи — единице,
В нашем примере ту2 = -~2 = Q = 0,666 Это означает, что на 66,6 % вариация производительности труда рабочих обусловлена различиями в их квалификации и на 33,4 % — влиянием прочих факторов. Эмпирическое, корреляционное отношение — это корень квадратный из эмпирического коэффициента детерминации: оно показывает тесноту связи между группировочным и результативным признаками. Эмпирическое корреляционное отношение ц, как и г]2, может принимать значения от 0 до 1. Если связь отсутствует, то корреляционное отношение равно нулю, т.е. все групповые средние будут равны между собой, межгрупповой вариации не будет. Значит, группировочный признак никак не влияет на образование общей вариации. Если связь функциональная, то корреляционное отношение будет равно единице. В этом случае дисперсия групповых средних равна общей дисперсии (52 = ст2), т.е. внутригрупповой вариации не будет. Это означает, что группировочный признак целиком определяет вариацию изучаемого результативного признака. Чем значение корреляционного отношения ближе к единице, тем теснее, ближе к функциональной зависимости связь между признаками. Для качественной оценки тесноты связи на основе показателя эмпирического корреляционного отношения можно воспользоваться соотношениями Чэдцока:
0,1-0,30,3-0,5 0,5-0,7 0,7-0,9 Слабая Умеренная Заметная Тесная В нашем примере цэ = ^/0^666 «0,812, что свидетельствует о тесной связи между квалификацией рабочих и производительностью их труда. Контрольные вопросы
1.Как исчисляется средняя арифметическая из 2. Почему средняя арифметическая интервального ряда является приближенной средней, от чего зависит степень ее приближения? 3. Каковы основные свойства средней арифметической? 4. Каков алгоритм исчисления средней арифметической из вариационного ряда по способу моментов? В чем его преимущества? 5. Для чего служит средняя гармоническая? Чем онао тличается от средней арифметической? 6. Какие признаки называются прямыми, а какие —
Дата добавления: 2014-01-07; Просмотров: 2153; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |