Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Тема 5. Анализ рядов распределения

 

Результаты статистических сводок и группировок могут быть представлены в виде статистических рядов – упорядоченных совокупностей значений показателей (статистического признака). По своему содержанию статистические ряды подразделяются на ряды динамики и ряды распределения.

Рядом динамики называют систематизированную совокупность числовых данных, характеризующих изменения изучаемых явлений во времени.

Ряд распределения, представляет собой систематизированную последовательность статистических единиц, сгруппированных по конкретному признаку. Он характеризует состав изучаемого явления, позволяет судить об однородности совокупности, закономерности распределения статистических единиц. Обычно ряд распределения представляет собой результат структурной группировки.

 

Ряд распределения считается построенным, если известно, каким образом меняются в совокупности значения признака и как часто встречаются отдельные значения признака.

Для различных статистических признаков строятся ряды распределения разного типа:

• атрибутивные – строятся по описательным признакам в порядке возрастания или убывания наблюденных значений признака; примером атрибутивных рядов могут служить распределения населения по национальности, по профессиям, по полу; распределение предприятий по формам собственности;

• вариационные - строятся по количественным признакам, например, распределение рабочих по уровню квалификации, по заработной плате, распределение студентов по успеваемости. Вариационные ряды делятся на дискретные и интервальные.

В дискретных рядах признак принимает только целые значения, например, размер семьи, тарифный разряд.

Интервальные ряды основаны на непрерывных признаках, принимающих любые, в том числе и дробные значения. В зависимости от того, какая структурная группировка лежит в основе интервального ряда, различают равноинтервальные и неравноинтервальные ряды.

В равноинтервальных рядах ширина интервала является величиной постоянной, в неравноинтервальных – она различна для разных групп.

Ряды распределения состоят из двух элементов – вариант и частот.

Варианта (х) – это любое значение варьирующего признака в пределах совокупности.

Частота (f) – количество раз повторения одного и того же значения варьирующего признака либо численность каждой группы вариационного ряда.

Сумма всех частот составляет объем или численность совокупности (N):

Частости - это частоты, выраженные в виде относительных величин (долях единиц или процентах). Сумма частостей равна единице или 100%.

 

Дополнительной характеристикой вариационных рядов распределения является кумулятивная частота Sf. Они образуются последовательным суммированием абсолютных ли относительных частот (S1=f1; S2=f1+f2; S3= f1+f2+f3).

 

Имеются следующие данные о результатах сдачи вступительного экзамена 20 абитуриентами: 54342454345432525323 построить ряд распределения абитуриентов по уровню успеваемости (неуспевающие – 2; успевающие – 3 и выше) и по баллам полученных оценок. Рассчитать кумулятивные частоты.

Решение. При наличии достаточно большого количества вариантов значений признака первичный ряд является труднообозримым и непосредственное рассмотрение его не дает представления о распределении единиц по значению признака в совокупности. Поэтому первым шагом в упорядочении первичного ряда является его ранжирование, то есть расположение всех вариант в возрастающем или убывающем порядке. В нашем случае ранжированный ряд баллов оценок, полученных абитуриентами на экзамене, будет иметь следующий вид:

2 2 2 2 3 3 3 3 3 4 4 4 4 4 4 5 5 5 5 5.

При группировке абитуриентов по уровню успеваемости получим две группы: неуспевающие, получившие 2 балла и успевающие – 3 балла и выше. Построим таблицу из трех граф: в первой отразим варианты (баллы оценок), во второй – их частоты (количество абитуриентов), а в третьей – кумулятивные частоты.

Таблица 1.

Распределение абитуриентов по уровню успеваемости

Уровень успеваемости х Число абитуриентов F Кумулятивные частоты Sf
Неуспевающие    
Успевающие   20=4+16
Итого   -

 

Полученный ряд распределения – атрибутивный, поскольку он построен по атрибутивному признаку – уровень успеваемости.

При построении ряда распределения по баллам оценок, имеем четыре группы абитуриентов. Подсчитав количество раз повторения каждого бала, получим их частоты.

Таблица 2.

Распределение абитуриентов по баллам оценок, полученных на экзамене

Баллы оценок, полученных студентами на экзамене х Число абитуриентов F Кумулятивные частоты Sf
«2»    
«3»   9=4+5
«4»   15=4+5+6
«5»    
Итого   -

 

Данный ряд распределения – дискретный вариационный, поскольку группировочный признак выражен целым числом.

 

В отношении вариант и частот проявляется закономерность распределения. Она описывается различными статистическими характеристиками:

- центр распределения;

- вариации;

- неравномерности распределения.

 

К характеристикам центра распределения относят среднюю, моду, медиану, квартиль, дециль, перцентиль.

Средняя величина характеризует типичный уровень признака в совокупности. По данным ряда распределения она рассчитывается по формулам средней арифметической простой или взвешенной.

Мода – наиболее часто встречающееся значение признака в совокупности. В дискретном ряду распределения - это варианта, имеющая наибольшую частоту.

Определите моду на основании следующих исходных данных о распределении проданной обуви по размерам:

Таблица 3

Размер обуви                   45 и выше
Число пар в % к итогу -                  

 

Решение

В этом дискретном ряду распределения мода равна 41. Именно этот размер обуви пользовался наибольшим спросом покупателей, так как доля реализованной обуви этого размера оставила 30% от всей проданной продукции.

 

 

Медиана – варианта, делящая численность ранжированного ряда на 2 равные части. Если ряд распределения – дискретный и имеет нечетное число членов, то медианой будет варианта, находящаяся в середине упорядоченного ряда.

Задача

Стаж работы пяти рабочих составил 2, 4, 7, 8, 10 лет. Определите медиану.

Ответ. Медиана – 7, поскольку по обе стороны от нее находится одинаковое число рабочих – 2 чел.

 

Если упорядоченный ряд состоит из четного числа членов, то медианой будет средняя арифметическая из двух вариант, расположенных в центе ряда.

 

Пусть в бригаде шесть человек, имеющих стаж работы 2, 4, 6, 7, 8, 10 лет. В этом ряду имеются две варианты, стоящие в центе - 6 и 7. Средняя арифметическая из этих значений и будет медианой ряда – 6,5 лет.

 

В интервальных рядах распределения с равными интервалами мода вычисляется по формуле:

 

 

ХМо – это начальное значение модального интервала.

iМо – это размах модального интервала.

fМо – это вес модального интервала.

fМо-1 – вес интервалов предшествующего модального интервала.

fМо+1 – вес интервалов следующего за модальным интервалом.

 

В интервальных рядах распределения медианное значение, делящее всю совокупность на две равные части находится в интервале, чья кумулятивная частота (накопленная сумма частот) равна или превышает полусумму всех частот ряда.

 

 

ХМЕ – это начальное значение модального интервала.

і МЕ – это размах модального интервала.

fМЕ – это вес модального интервала.

SМЕ-1 – сумма накопленных частот предмедианного интервала.

 

Пример

По данным таблицы рассчитать моду и медиану.

 

Таблица 1

Распределение предприятий по стоимости ОПФ

№ п/п Группы предприятий по стоимости ОПФ, тыс. грн., х Число предприятий f Кумулятивные частоты Sf
  14-16    
  16-18    
  18-20    
  20-22    
  22-24    
Итого     -

 

Найдем моду по формуле:

 

 

тыс.грн.

 

То есть, наиболее встречающимся значением стоимости ОПФ малых предприятий региона является стоимость, равная 18,8 тыс. грн.

 

Найдем медиану по формуле. Медианным интервалом является тоже третий интервал, так как его накопленная частота (18) превышает половину суммы всех частот совокупности (25:2=12.5)

 

тыс.грн.

Из расчетов видно, что половина малых предприятий региона имеет стоимость ОПФ меньше 18.9 тыс.грн.. а половина больше.

 

Квартиль Q – значение вариант, которые делят упорядоченный ряд по объему на четыре равные части.

Децили D – значение вариант, которые делят упорядоченный ряд по объему на десять равных частей.

Перцентили P – значение вариант, которые делят упорядоченный ряд по объему на сто равных частей.

 

 

Вариация – различие индивидуальных значений признака внутри изучаемой совокупности в один и тот же период или момент времени.

Средняя величина признака в двух совокупностях может быть одинаковой, но в одном случае вес индивидуальные значения отличаются от нее мало, а в другом – эти отличия велики.

Пример.

Две бригады, по три человека в бригаде выполняют одинаковую работу. Количество изготовленных деталей за смену каждым рабочим составляло:

Первая бригада – 95,100,105 деталей.

Вторая бригада – 75, 100,127 деталей.

Средняя выработка на одного рабочего в обеих бригадах одинакова и составляет 100 деталей. Однако колеблемость выработки отдельных рабочих в первой бригаде значительно меньше, чем во второй.

 

 

Для характеристики размера вариации признака используются показатели:

· размах вариации;

· среднее линейное отклонение;

· дисперсия;

· среднее квадратическое отклонение.

Размах вариации

где , - соответственно максимальное и минимальное значения признака. Величина показателя зависит от величины только двух крайних вариант и не учитывает степени колеблемости основной массы членов ряда.

В примере вариации сменной выработки деталей составляет:

В первой бригаде – R1 =10 шт. (105-95)

Во торой бригаде – R2 =50 шт. (125-75), что в 5 раз больше.

Это свидетельствует о том, что при численном равенстве средняя выработка первой бригады более «устойчива».

 

 

Среднее линейное отклонение показывают на сколько, отличаются индивидуальные значения признака от среднего значения совокупности.

Среднее линейное отклонение определяется по формулам:

а) для несгруппированных данных (первичного ряда)

б) для п вариационного ряда:

 

 

Дисперсия признака представляет собой средний квадрат отклонений вариант от их средней величины и вычисляется по формулам простой и взвешенной дисперсий (в зависимости от исходных данных):

простая дисперсия для несгруппированных данных

 

 

взвешенная дисперсия для вариационного ряда

 

Дисперсия равна средней из квадратов индивидуальных значений признака минус квадрат средней величины. Следовательно,

.

 

 

Среднее квадратическое отклонение (средний квадрат отклонений)

представляет собой корень квадратный из дисперсии и показывает на сколько в среднем отклоняются конкретные варианты от их среднего значения.

для несгруппированных данных:

для вариационного ряда:

 

 

Чем меньше значение дисперсии и среднего квадратического отклонения, тем однороднее (количественно) совокупность и тем более типичной будет средняя величина.

 

 

Для сравнения степени колеблемости изучаемого признака исчисляются показатели колеблемости в относительных величинах.

Коэффициент осцилляции: отражает относительную колеблемость крайних значений признака вокруг средней.

 

Относительное линейное отклонение: характеризует долю усредненного значения абсолютных отклонений от средней величины.

 

Коэффициент вариации: представляет собой отношение среднего квадратического отклонения к средней арифметической и характеризует качественную однородность изучаемой совокупности.

 

Если коэффициент вариации не превышает 33%, то изучаемая совокупность считается качественно однородной.

 

 

Задача

По данным о стаже работников банка определите:

1. Размах вариации.

2. Средний стаж работников.

3. Среднее линейное отклонение.

4. Дисперсию.

5. Среднее квадратическое отклонение.

6. Коэффициент осцилляции.

7. Относительное линейное отклонение.

8. Коэффициент вариации.


Таблица ___

Распределение работников банка, в зависимости от стажа работы

Стаж работы, лет х Среднесписочная численность работников, чел. F Середина интервала x xf f f x‘2f
                 
1-3                
3-5                
5-7                
7-9                
9-11                
Итого   -   -   -    

 

 

1. Размах вариации равен: 11-1=10 лет.

2. Средний стаж работников находим по формуле средней арифметической взвешенной. Поскольку изучаемый признак представлен в виде интервала, находим середину каждого интервала (гр. 3) и полученные значения умножаем на частоты. Суммируем полученные произведения и делим на сумму всех частот совокупности:

3. Среднее линейное отклонение рассчитаем пошагово:

- определяем абсолютные отклонения вариант от средней - гр.5

- полученные значения умножаем на частоты и суммируем f – гр.6

 

4. Дисперсию находим по формуле

- находим отклонение каждого значения признака от средней, возводим их в квадрат гр.7

- умножаем квадраты отклонений на их частоты и суммируем полученные значения гр. 8 f

 

5. Среднее квадратическое отклонение рассчитывается как квадратный корень из дисперсии:

 

6. Коэффициент осцилляции равен:

 

7. Относительное линейное отклонение равно:

8. Коэффициент вариации равен:

 

Данная совокупность не является качественно однородной.

 

<== предыдущая лекция | следующая лекция ==>
Пожарная безопасность. Средства и методы защиты от шума | 
Поделиться с друзьями:


Дата добавления: 2014-01-11; Просмотров: 3021; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.016 сек.