Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Виды средних величин




 

Средние величины

↓ ↓

Степенные   Структурные
Средняя арифметическая
Средняя геометрическая
Средняя гармоническая
Средняя квадратическая
Мода
Медиана

↓ ↓

 

Средние, относящиеся к классу степенных средних, объединяются общим видом формулы:

где x − среднее значение исследуемого явления; x − текущее значение (вариант) усредняемого признака;

m − показатель степени средней величины; n − число признаков.

В зависимости от значения показателя степени m степенные средние подразделяются на следующие виды:

если m = −1, то получается средняя гармоническая; если m = 0, то получается средняя геометрическая; если m = 1, то получается средняя арифметическая; если m = 2, то получается средняя квадратическая.

При расчете степенных средних на основе одних и тех же исходных данных (x, n), чем больше значение показателя степени m, тем больше значение средней величины:

xгарм. ≤ xгеом. ≤ xарифм. ≤ xквадр.

Свойство степенных средних возрастать с увеличением показателя степени функции называется в правовой статистике правилом мажорантности средних.

Выбор одного истинного среднего значения показателя в каждом конкретном случае определяется целью исследования и характером имеющихся данных.

Средняя арифметическая

Наиболее распространенным видом средних является средняя арифметическая. Она применяется при оценке нагрузки следователей, прокуроров, судей, оперативных работников и других сотрудников юридических учреждений; расчете среднего абсолютного прироста (снижения) преступности; числа уголовных и гражданских дел и других показателей правовой статистики.

Средняя арифметическая используется в тех случаях, когда объем варьирующего признака для всей совокупности является суммой значений признака отдельных единиц совокупности. Так, например, общая годовая нагрузка судей городского суда – это сумма индивидуальных годовых нагрузок всех судей.

Расчет средней арифметической достаточно прост: нужно сумму всех значений признака усредняемого признака разделить на общее число значений признака. В вышеприведенном примере для вычисления средней арифметической надо сложить значения всех индивидуальных нагрузок судей (x1, x2,..., xn) и разделить на общее число судей (n).

x арифм. = 1 ∑x1 = x1 + x2 +...+ xn = ∑x, n n

где x1, x2,..., xn − индивидуальные значения варьирующего при-

знака (варианты); n – число единиц совокупности.

Таким образом, мы получили среднюю арифметическую простую. Она применяется в тех случаях, когда имеются несгруппированные индивидуальные значения признака или когда каждая единица совокупности имеет различные значения изучаемого признака, т.е. значения признака не повторяются.

Если значения (варианты) изучаемого признака повторяются различное число раз, то вычисляется не простая, а взвешенная средняя арифметическая, при этом число одинаковых вариантов называется весами (или частотами). В различные группы совокупности объединяются одинаковые варианты и в качестве весов выступают численности единиц в этих группах совокупности.

xарифм. = x1f1f1 ++xf22f2++......++fnxnfn = ∑∑xf f,

где f1, f2,..., fn − веса (частоты повторения одинаковых признаков); ∑xf − сумма произведений величины признаков на их частоты; ∑f − общая численность единиц совокупности.

Технику вычисления взвешенной средней арифметической можно продемонстрировать на приведенном выше примере. Предположим, что в городском суде работают 10 судей, и они распределяются по числу рассмотренных дел следующим образом:

Таблица 15

Распределение судей по нагрузке делами

Число рассмотренных дел (варианты), x Число судей

(частота), f Произведение вариантов на частоты, xf

30 1 30

34 2 68

35 4 140

36 2 72

40 1 40

Итого 10 350

Подставив наши данные в формулу средней арифметической взвешенной, получим, что средняя нагрузка на одного судью составляет 35 дел.

xарифм. = = 35

На практике встречается необходимость вычисления средней не по индивидуальным численным значениям изучаемого признака, а по средним отдельных частей совокупности (частным или групповым средним), т.е. приходится вычислять среднюю из средних. Так, например, средняя годовая нагрузка судей гражданскими делами по стране представляет собой среднюю из средних чисел гражданских дел, приходящихся на одного судью в год, по отдельным регионам страны.

Средняя из средних равна средней из частных средних, взвешенных по численности соответствующих частей совокупности. При этом частные средние служат в качестве вариантов.

Расчет средней арифметической взвешенной из групповых средних (xгр.) осуществляется по следующей формуле:

∑x

xарифм. = ∑грf f,

где f – число единиц в каждой группе.

Часто приходится исчислять среднюю для интервальных рядов статистических данных, т.е. когда индивидуальные численные значения сгруппированы в интервалы («от − до»). В правовой статистике интервальными рядами представлены сроки наказания, сроки расследования, сроки рассмотрения дел в судах, возраст правонарушителей и другие данные.

В таком случае при расчете средней арифметической в качестве значений признаков в группах принимают середины интервалов (простая средняя между верхней и нижней границами каждого интервала). При таком вычислении средней допускается некоторая условность, поскольку считается, что полусумма интервала является его средней, предполагая, что единицы признака распределены внутри группы равномерно. Очевидно, чем уже будут границы интервала, тем меньше будет ошибка.

При этом величина открытых интервалов (первого или последнего) либо условно приравнивается к интервалам, граничащим с ними (второй интервал − с первым, предпоследний − с последним интервалом), либо определяется на основе дополнительных изучений. Так, например, в УК РФ указаны минимальный возраст, с которого лицо может быть привлечено к уголовной ответственности, минимальный (шесть месяцев) и максимальный (20 лет) сроки лишения свободы.

Предположим, требуется рассчитать средний возраст осужденных на основе следующих данных:

Таблица 16

Распределение осужденных по возрасту

Группы осужденных по возрасту, лет Число осужденных, чел. f Середина интервала, лет, x Произведение вариантов на частоты, xf

14-18 12 16 192

18-25 30 21,5 645

25-30 15 27,5 412,5

30-50 38 40 1520

50 и старше 5 60 300

Итого 100 - 3069,5

Условно приняв середину интервалов за среднее значение признака в каждой группе, можно рассчитать средний возраст осужденных по формуле средней взвешенной:

= ∑xf = 3069,5 = 30,7. xарифм. ∑f 100

Таким образом, средний возраст осужденных составляет 30,7 лет или 30 лет 8 месяцев.

Средняя арифметическая, как правило, применяется в тех случаях, когда известны значения варьирующего признака (x) и их частоты (f). В некоторых случаях частоты могут быть представлены не абсолютными величинами, а относительными (процентами или долями единицы). В этом случае формула средней арифметической взвешенной будет иметь следующий вид:

= ∑xd, xарифм. ∑d

где d = f − доля каждой частоты в общей сумме всех частот, ∑f

т.е. в общей численности единиц совокупности.

Причем, если частоты рассчитывают в долях (коэффициентах), то ∑d будет равняться единице, а формула средней арифметической взвешенной будет иметь вид:

xарифм. = ∑xd.

Средняя геометрическая

Средняя геометрическая используется, как правило, в тех случаях, когда индивидуальные значения признака представлены в виде относительных цепных показателей динамики (темпов роста), построенных на основе отношения каждого уровня в ряду динамики к предыдущему уровню. В правовой статистике этот вид средней применяется при изучении динамики преступности, раскрываемости преступлений, судимости, числа правонарушителей, заключенных, оправданных, динамики общего числа гражданских дел, удовлетворенных и неудовлетворенных исков, а также изменяющихся во времени правовых и других юридически значимых явлений и процессов.

Однако в чистом виде динамика правовых явлений (преступности, ее отдельных видов и других юридически значимых явлений) в геометрической прогрессии, т.е. когда каждый последующий уровень ряда приблизительно равен предыдущему, умноженному на некоторое постоянное число, называемое знаменателем прогрессии, наблюдается достаточно редко.

Средняя геометрическая есть результат извлечения корня степени n из произведений отдельных значений – вариантов признака x:

xгеом. = n x1 ⋅x2 ⋅...⋅xn = n Пx,

где n – число значений признака (вариантов); П – знак произведения.

В табл. 13 приведены цепные темпы роста (снижения) общего числа выявленных преступлений в России: в 1996 г. – 0,953; в 1997 г. –

0,913; в 1998 г. – 1, 077; в 1999 г. – 1,163. В нашем примере среднегодовой темп изменения уровня преступности будет равен:

xгеом. = 4 0,953×0,913×1,077 ×1,163 = 1,022

Если известны уровни динамического ряда, то расчет средней геометрической упрощается. Для того чтобы рассчитать среднегодовые темпы роста, необходимо знать абсолютные показатели первого (базисного) и последнего уровней ряда динамики и продолжительность всего периода, для которого рассчитывается средний темп роста (количество лет).

Средняя геометрическая в таком случае может быть получена на основе следующей формулы:

y n

xгеом. = n−1, y1

где yn – абсолютное значение последнего уровня ряда динамики; y1 – абсолютное значение первого (базисного) уровня ряда динамики; n − число уровней ряда динамики в изучаемом периоде, включая базисный.

Значение среднегодовых темпов роста, независимо от способа расчета, будет одинаковым.

Использование средней геометрической для расчета среднегодовых темпов роста имеет свои недостатки. Как видно из нашего примера, несмотря на то, что в первой половине периода (с 1995 по 1997 гг.) уровень преступности снижался, в целом за период получается, что уровень преступности возрастал на 2,2% в год. Применение средней геометрической имеет смысл, как правило, если на протяжении всего исследуемого периода происходит либо непрерывный рост, либо непрерывное снижение признаков изучаемого явления. При скачкообразном характере уровней ряда, т.е. их росте и снижении, средний темп роста имеет сомнительное значение.

Структурные средние

Структурные средние являются особым видом средних величин, их значение имеет какой-либо определенный средний вариант в вариационном ряду. Структурные средние применяются для изучения структуры распределения значений признака и являются в отличие от степенных средних конкретными характеристиками. К этому виду средних относятся мода и медиана.

Мода (M0) – значение признака (вариант), встречающееся с наибольшей вероятностью в совокупности или в вариационном ряду. Другими словами, мода – это вариант, который чаще всего встречается в конкретной совокупности.

Например, 100 уголовных дел по конкретному виду преступлений за год распределились по срокам расследования следующим образом:

Распределение уголовных дел по срокам расследования

Сроки расследования, месяцы Число дел

1 10

2 20

3 50

4 15

5 5

Итого 100

 

В табл. 17 наибольшей частотой является 50. Этой частоте соответствует модальное значение признака, т.е. срок расследования. Следовательно, модой в данном примере будет 3 месяца, что свидетельствует о том, что наибольшее количество дел данной категории расследуется за три месяца.

Мода в интервальных рядах распределения с равными интервалами определяется по следующей формуле:

fMO − fMO−1

MO = xMO +iM O (fM O −fMO −1)+(fMO −fMO+1),

где МО − модальное (наиболее часто встречающееся) значение признака; хМО − нижняя граница модального интервала; iМО − величина модального интервала; fМО − частота модального интервала; fМО-1 − частота интервала, предшествующего модальному; fМО+1 − частота интервала, следующего за модальным.

Модальные интервалы в рядах распределения определяются по наибольшей частоте. Формула, используемая для нахождения моды в модальном интервале, применяется только для вариационных рядов с равными интервалами. На практике статистические данные в отчетности правоохранительных органов и органов юстиции очень часто представлены рядами распределения с неравными интервалами (данные о судимости, данные о жертвах дорожно-транспортных происшествий и др.). Расчет моды для вариационных рядов с неравными интервалами может значительно исказить реальную статистическую картину. Поэтому, если возникает необходимость рассчитать моду для рядов распределения с различными интервалами, следует прибегнуть к методу вторичных группировок для приведения интервалов к равной величине.

Медиана (Me) – вариант, который находится в середине ранжированного (упорядоченного) ряда, расположенного в определенном порядке – по возрастанию или по убыванию вариантов. Медиана делит вариационный ряд на две равные части: со значениями признака меньше медианы и со значениями признака больше медианы. По обе стороны от медианы находится одинаковое число единиц совокупности.

Если всем единицам ранжированного ряда несгруппированных данных придать порядковые номера, то нахождение медианы сведется к определению порядкового номера медианы, который рассчитывается по формуле:

 

N Me = n + 1,

где n – число членов ряда.

Например, в одном городском суде по уголовным делам было осуждено в течение месяца 11 человек со следующими сроками лишения свободы:

№ осужденного

1 2 3 4 5 6 7 8 9 10 11

 

Срок лишения свободы, лет

1 1,5 2 2 2,5 3 3,5 4 5 6 6

 

В нашем примере номер медианы равен 6, а медиана равна 3 годам, т.е. одна половина осужденных к лишению свободы получила срок наказания менее 3 лет, а другая – более 3 лет лишения свободы.

Если ряд имеет четное число индивидуальных значений (вариантов), то медиана равна средней из двух вариантов, находящихся в середине ряда.

 

№ осужденного

1 2 3 4 5 6 7 8 9 10

 

Срок лишения свободы, лет

1 1,5 2 2 2,5 3 3,5 4 5 6

 

В этом случае NMe = 5,5, а медиана равна средней арифметической двух соседних значений 2,5 и 3, т.е. Me = 2,75 года.

Для нахождения медианы в интервальном ранжированном ряду необходимо сначала определить медианный интервал. Медианный интервал определяется по кумулятивной частоте (накопленная сумма частот), которая является последовательной суммой всех предыдущих частот, начиная с первого интервала с наименьшим значением признака. Общая сумма накопленных частот равна общей сумме частот ряда (общему числу всех значений признака).

Медианный интервал определяется тем, что его кумулятивная частота равна или превышает полусумму всех частот ряда. Значение медианы в интервальном ряду определяется по следующей формуле:

∑f − SMe −1

Me = xMe + iMe 2,

 

fMe

 

где xMe − нижняя граница медианного интервала; iMe − величина медианного интервала; половина суммы частот ряда;

SMe −1 − сумма накопленных частот, предшествующих медианному интервалу; fMe − частота медианного интервала.

Рассмотренная формула определения значения медианы предполагает, что нарастание накоплений частоты внутри интервала происходит равномерно, и применима для любого интервального ряда, как с равными, так и с неравными интервалами.

Значения моды и медианы обычно отличаются от значения средней, совпадая только в случае симметричного распределения частот вариационного ряда. Медиана, в отличие от средней, не зависит от крайних или характерных для совокупности значений признака. На практике мода и медиана, как правило, являются дополнительными характеристиками совокупности к средней арифметической. При использовании вместе они дополняют друг друга, позволяя оценить асимметрию ряда распределения.

 

 

6.3. Показатели вариации признака

Средние величины дают обобщающую характеристику варьирующего признака совокупности, но не показывают, насколько однородна изучаемая совокупность, как располагаются возле средней индивидуальные значения (варианты) признака.

Различия в значениях признака у разных единиц совокупности за один и тот же период (момент) времени называется в правовой статистике вариацией.

Предположим, что в различных следственных отделах работает две группы следователей, каждая из трех человек. На начало месяца у каждого следователя находилось в производстве следующее количество уголовных дел:

в первой группе – 8, 10, 12 (x1 = 10 дел); во второй группе − 1, 10, 19 (x2 = 10 дел).

 

Средняя нагрузка на одного следователя в обеих группах равна, хотя в первой группе различия в следственной нагрузке значительно меньше, чем во второй.

В целях установления показательности и типичности средней рассчитываются показатели, характеризующие отклонения отдельных значений от общей средней, или другими словами, показатели вариации. К показателям вариации относятся: размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение, коэффициент вариации.

Самый простой показатель вариации признака – размах вариации (R). Он рассчитывается как разность между максимальным и минимальным значениями признака:

R = xmax − xmin.

 

В нашем примере размах вариации следственной нагрузки составляет: в первой группе следователей − R1 = 12 −8 = 4 дела, а второй группе − R2 = 19 −1 = 18 дел. Различие значительное: R2 > R1 в 4,5 раза. Это свидетельствует о том, что в первом случае совокупность более однородна и средняя следственная нагрузка первой группы следователей более показательна.

Однако размах вариации отражает только крайние отклонения признака и не указывает, насколько велики отклонения от среднего значения всех вариантов в вариационном ряду. Более точной характеристикой вариации признака является среднее линейное отклонение.

Среднее линейное отклонение (d) представляет собой сумму взвешенных по частоте отклонений отдельных значений признака (по абсолютной величине) от их средней арифметической:

 

d = ∑ x − x f,

∑f

где f – веса (частота повторения одинаковых значений признака); ∑f − сумма частот вариационного ряда.

 

Для несгруппированных данных формула будет иметь следующий вид:

d = ∑ x − x, n

где n – число членов ряда.

 

Причем отклонение вариантов от их средней арифметической всегда берется по модулю (иначе в числителе всегда будет ноль).

Еще более точными характеристиками вариации признаков являются дисперсия и среднее квадратическое отклонение. Дисперсия признака (σ2) – средний квадрат отклонений отдельных значений признака от их средней величины. В зависимости от того, как представлены исходные данные, применяются следующие формулы:

 

для несгруппированных данных;

σ2 = ∑(x − x)2 f − для сгруппированных данных.

∑f

Среднее квадратическое отклонение (σ) равно корню квадратному из дисперсии и показывает, на сколько в среднем отклоняются конкретные значения признака от их средней величины.

 

σ= ∑(x−x)2 − для несгруппированных данных; n

σ= ∑(x − x)2 f − для сгруппированных данных. ∑ f

 

Дисперсия и среднее квадратическое отклонение служат наилучшим способом проверки однородности совокупности. Чем меньше их значение, тем однороднее совокупность и тем типичнее характеризующая ее средняя величина. Так как среднее квадратическое отклонение выражается в тех же единицах измерения, что и значения признака, то на практике оно лучше поддается интерпретации.

Применение дисперсии и среднего квадратического отклонения получило достаточно широкое распространение в правовой статистике. Они используются для обоснования ошибки репрезентативности (ошибки выборки) при проведении выборочного наблюдения, широко применяемого в социально-правовых обследованиях; при изучении влияния различных факторов, обуславливающих преступность и другие правовые и юридически значимые явления.

Для сравнения вариаций различных признаков (таких как вариации стажа работы следователей и их следственной нагрузки, возраста преступников и их срока наказания и т.д.), а также для сравнения вариации одного и того же признака в различных совокупностях (например, возраста преступников в различных регионах) применяют относительный показатель вариации – коэффициент вариации (V).

 

V %,

 

где σ − среднее квадратическое отклонение; x − средняя арифметическая.

Коэффициент вариации используется не только для сравнительной оценки, но и для характеристики однородности совокупности по варьирующему признаку. Совокупность считается однородной, если коэффициент вариации не превышает 33%. Соответственно, надежность и типичность средней такой совокупности является достаточно высокой.




Поделиться с друзьями:


Дата добавления: 2015-04-24; Просмотров: 2421; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.007 сек.