КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Показатели вариации
Для суждения о вариации признака в статистике используют ряд показателей. 1. Среднее линейное отклонение ( ): (для несгруппированных данных) или (для вариационного ряда),
где — абсолютные значения отклонений отдельных вариантов () от средней арифметической (). 2. Среднее квадратическое отклонение — наиболее распространенный и применяемый показатель вариации, рассчитываемый по формуле
(для несгруппированных данных) или
(для вариационного ряда).
Порядок расчета среднего квадратического отклонения по основной формуле таков:
1) Находим среднюю арифметическую ряда . 2) Находим отклонение каждого варианта от средней арифметической . 3) Возводим каждое отклонение в квадрат: . 4) Умножаем каждый квадрат отклонений на соответствующие веса: . 5) Суммируем все произведения: . 6) Делим сумму произведений на сумму весов (частот) и получаем дисперсию (). 7) Извлекаем квадратный корень из частного, тогда . Полученный результат и представляет собой среднее квадратическое отклонение (). Среднее квадратическое отклонение в квадрате, т. е. , называется дисперсией: или .
Практически для расчета дисперсии иногда удобнее пользоваться другими формулами, непосредственно вытекающими из приведенной выше. Так, если возвести в квадрат правую часть равенства и почленно разделить на , то получим формулу дисперсии в следующем виде: , где — средняя величина квадратов вариантов (х); — квадрат средней арифметической (х).
Или, записав в числителе первой формулы постоянное число со знаком «+» и «—», после несложных алгебраических преобразований получим формулу дисперсии в следующем виде:
, где — средний квадрат отклонения отдельных вариантов от произвольного числа а, или «дисперсия от ». Пользуясь последней формулой, можно рассчитывать дисперсию от любого постоянного числа а, затем корректировать эту дисперсию на квадрат разности между средней арифметической и числом а. Для сравнения вариации в разных совокупностях рассчитывается относительный показатель вариации, именуемый коэффициентом вариации (V), представляющий собой процентное отношение среднего квадратического отклонения к средней арифметической: . Следует помнить, что если в совокупности исследуется доля единиц, обладающих тем или иным альтернативным признаком, то дисперсия этой доли определяется по формуле = pq, где р — доля единиц, обладающих данным признаком, a q — доля единиц, не обладающих данным признаком. Максимальное значение доли дисперсии равно 0,25 (когда р — q = 0,5). Задача 5.3 Воспользовавшись исходными данными задачи 4.2, где = 3,9, рассчитаем основные показатели вариации. Расчет оформим в следующей таблице:
А. Среднее линейное отклонение: . Б. Дисперсия: .
В. Среднее квадратическое отклонение: . Г. Коэффициент вариации: . Задача 5.4 Воспользовавшись исходными данными задачи 4.3, рассчитаем среднюю арифметическую, дисперсию и коэффициент вариации, предварительно уменьшив до предела варианты (т. е. способом расчета от условного нуля):
1. Средняя арифметическая .
2. Рассчитаем дисперсию. Сначала найдем средний квадрат отклонений от произвольного числа — в нашем примере от 650, а затем скорректируем его на квадрат разности между средней арифметической и этим произвольным числом, т.е. применим формулу ;
,
. Отсюда среднее квадратическое отклонение . Коэффициент вариации .
Задача 5.5 Пусть имеются следующие данные о результатах экзаменационной сессии на I и II курсах одного из вузов: на I курсе 85% студентов сдали сессию без двоек, а на II курсе − 90%. Определить дисперсию доли студентов, успешно сдавших сессию (или, что то же самое, доли студентов, получивших двойки на сессии).
Так как и , а и , то: на I курсе = 0,85 * 0,15 = 0,1275 => 0,35; на II курсе .
Следовательно, на II курсе дисперсия и среднее квадратическое отклонение доли студентов, успешно сдавших сессию, меньше, чем на I курсе.
Задача 5.6 Имеются следующие данные о распределении населения РФ по размеру среднедушевого денежного дохода в месяц в июле 2010 г. (графы 1, 2, 3 табл. 1).
Определить: 1) среднедушевой доход с помощью средней арифметической, моды и медианы; 2) среднее квадратическое отклонение душевого дохода и коэффициент вариации; 3) децильный коэффициент дифференциации доходов; 4) степень концентрации (неравномерности) доходов у отдельных групп населения (коэффициент Джини).
Решение. Необходимые для расчета суммы показаны в табл. 1.
1. а) Среднедушевой доход
(В качестве весов можно принимать и w. — относительный показатель численности населения в процентах (%) к итогу. Результат будет тот же). Таблица 1
б) Мода (наиболее часто встречающийся размер душевого дохода) находится в интервале 400—600. Определим ее как = = (тыс.руб.),
где хн — нижняя граница модального интервала.
в) Медиану удобнее находить по данным распределения в процентах (%), т. е. по . Тогда порядковый номер медианы равен .
По накопленным частностям определяем, что медиана (50-й процент) находится в интервале 600—800.
Отсюда ,
т. е. в июле 2010 г. половина населения имела среднедушевой денежный доход ниже 755,7 тыс. руб., а половина — выше 755,7 тыс. руб.
2. а) Среднее квадратическое отклонение найдем по формуле
(тыс.руб.)
(Можно было использовать и формулу ).
б) Коэффициент вариации
.
Такая вариация весьма значительна, т. е. население далеко не однородно по размеру душевого дохода.
3. Для оценки степени дифференциации доходов по накопленным частностям (графа 6) определяем, что первая дециль (D1) находится в первом интервале (200—400), а девятая дециль (D9) — в предпоследнем интервале (1600—2000):
(тыс. руб.),
— это максимальный размер душевого дохода у десяти процентов населения с наименьшими доходами.
Учитывая, что частость первого интервала (17,5%) больше 10% (порядкового номера D1), расчет D1 удобнее вести от значения верхней границы интервала, вычитая из него величину интервала, приходящуюся на излишние 7,5% единиц, т. е.
(тыс.руб.) — это минимальный размер душевого дохода у десяти процентов населения с наиболее высокими доходами;
в) децильный коэффициент дифференциации (ДКД) доходов
Примечание. Поскольку в первом интервале не указана нижняя граница, а последующий интервал равен 200 (400—600), то мы вправе и в первом интервале принимать такую же величину, т. е. (200—400).
4. Для расчета коэффициента Джини, G, сначала определяем долю (в %) суммарного дохода по каждой группе как (: )х100% (графа 8 в продолжении табл. 1), а затем в графе 9 находим кумулятивные (накопленные) итоги суммарного дохода в % ().
Продолжение табл. 1
По данным граф 6 и 9,
По G = 0,33 делаем вывод, что степень концентрации суммарных денежных доходов у населения с более высокими доходами средняя, не очень высокая.
Дата добавления: 2014-12-24; Просмотров: 1466; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |