КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Распределение численности безработных по возрастным группам
Задачи для самостоятельного решения Мода и медиана. Меры вариации. Практика №2 (см. методические рекомендации стр.4) Задача 1
Имеется следующее распределение безработных по возрастным группам:
По данным распределения определить: 1) средний (арифметический) возраст безработных; 2) среднее квадратическое отклонение; 3) коэффициент вариации.
Ответ: 1) = 34,3 года; 2) σ = 11,5 года; 3) V = 33,5%. Задача 2 Имеются следующие данные за 2005 и 2006 гг. об урожайности, посевных площадях и валовом сборе пшеницы (озимой и яровой).
Определить среднюю урожайность пшеницы: а) в 2005 г. и б) в 2006 г.
О т в е т: а) 12,56 ц/га; б) 13,48 ц/га. Задача 3 По данным таблицы
определить средний возраст безработных: а) мужчин; б) женщин.
Ответ: а) 35,5 года; б) 33,8 года. Задача 4 (похожая задача будет в контрольной работе) Имеются следующие данные о распределении семей области по уровню среднегодового дохода.
Определить в данном распределении: 1) среднегодовой доход семей по области в целом; 2) моду; 3) медиану; 4) среднее квадратическое отклонение доходов; дисперсию, коэффициент вариации. 5) дециальный коэффициент дифференциации (ДКД) доходов; 6) коэффициент Джини (G).
Ответ: 1) = 367,6 тыс. руб.; 2) Мо = 313,1 тыс. руб.; 3). Me = 337,2 тыс. руб.; 4)σ = 193,8 тыс. руб.; 5) ДКД = 4,7 раза; 6) G= 0,76.
Задача 5 По переписи населения 1926 г. в России доля грамотных среди женщин составляла 46%, а среди мужчин 77%. Определить общий (средний) процент грамотности всего населения и дисперсию этого показателя, если женщины составляли 53% в общей численности населения.
О т в е т: 1) = 60,57% (0,6057); 2)σ2 = = 0,2388. Задача 6
В коллективных хозяйствах района средняя урожайность зерновых составила 19 ц/га при среднем квадратическом отклонении 3 ц/га, а в фермерских хозяйствах — соответственно 26 ц/га и 4 ц/га. Определить: 1) среднюю урожайность зерновых по району, если известно, что посевная площадь под зерновыми в коллективных хозяйствах в 9 раз превышает площадь фермерских хозяйств; 2) общую дисперсию и среднее квадратическое отклонение урожайности зерновых в районе (по правилу сложения дисперсии). О т в е т: 1) = 19,7 ц/га; 2) σ2 = 2 + δ2 = 8,5 + 4,41 = 12,91, σ = 3,6 ц/га. Задача 7 Для изучения уровня заработной платы рабочих на предприятии выборочно обследовано 500 мужчин и 300 женщин. Результаты исследования показали, что у мужчин средняя заработная плата составила 1200 руб. при среднем квадратическом отклонении 200 руб., а у женщин — соответственно 800 руб. и 150 руб. Определить: 1) общую среднюю заработную плату рабочих на заводе; 2) среднюю из групповых дисперсий; 3) межгрупповую дисперсию; 4) общую дисперсию зарплаты; 5) коэффициент вариации зарплаты на предприятии. Ответ: 1) = 1050 руб.; 2) = 33 437,5; 3) δ2 = 37 500; 4) σ2 = 70 937,5; 5) V= 25,4%.
Методические рекомендации для студентов Задача 1 Определить моду по данным:
Для интервального ряда с равными интервалами мода рассчитывается по формуле , где x0 - начальная (нижняя) граница модального интервала; h - величина интервала; f2 - частота модального интервала; f1 - частота интервала, предшествующего модальному; f3 - частота интервала, следующего за модальным.
В условии задачи наибольшую частоту (60) имеет интервал (700—800). Отсюда Мо =700 + 100 (руб.) т.е. наиболее часто встречается дневная заработная плата в размере 731,6 руб. В ряду с неравными интервалами мода определяется в интервале, имеющем наибольшую плотность распределения, и в формуле вместо f1, f2, f3, принимаются соответствующие плотности распределения. Задача 2 Для приведенного в задаче 1 распределения рабочих по размеру заработной платы определить медиану. Перепишем этот ряд и рассчитаем в нем накопленные частоты:
Для нахождения медианы (значения признака у средней единицы ранжированного ряда) сначала определяется ее порядковый номер , а затем по накопленным частотам определяется либо сама медиана (для дискретных рядов), либо медианный интервал (для интервальных рядов), в котором путем простой интерполяции рассчитывается значение медианы по формуле где х0 — нижняя граница медианного интервала; — порядковый номер медианы; — накопленная частота до медианного интервала; — частота медианного интервала. Определяем порядковый номер медианы: По накопленным частотам видно, что сотая единица находится в интервале (700—800), ее значение определяем по формуле (руб.), т.е. делаем вывод по медиане, что половина рабочих получает заработную плату ниже 736,7 руб., а половина — выше.
Примечание. Мода и медиана могут быть определены графически: первая — по гистограмме, а вторая — по кумуляте. Рассмотрим это на примере. Построим гистограмму распределения 200 рабочих по размеру заработной платы (рис. 3), для чего на оси абсцисс построим ряд сомкнутых прямоугольников, у каждого из которых основанием служит величина интервала признака (размер заработной платы в рублях), а высотой — частота каждого интервала (число рабочих). (Для рядов с неравными интервалами в качестве высоты прямоугольников принимается плотность распределения.)
Рис. 3. Гистограмма распределения 200 рабочих по размеру заработной платы (графическое определение моды)
В прямоугольнике, имеющем наибольшую высоту, проводим две линии, как показано на рис. 3, и из точки их пересечения опускаем перпендикуляр на ось абсцисс. Значение х на оси абсцисс в это точке есть мода (Мо).
Рис. 4. Кумулята распределения 200 рабочих по размеру заработной платы (графическое определение медианы)
Для графического отыскания медианы по накопленным частотам строим кумуляту (рис. 4). Для этого из верхней границы каждого интервала на оси абсцисс восстанавливаем перпендикуляр, соответствующий по высоте накопленной частоте с начала ряда по данный интервал. Соединив последовательно вершины перпендикуляров, мы и получим кривую, называемую кумулятой. Из точки на оси ординат, соответствующей половине всех частот (порядковому номеру медианы), проводим прямую, параллельную оси абсцисс, до пересечения ее с кумулятой. Опустив из этой точки перпендикуляр на ось абсцисс, находим значение медианы (Me). Пользуясь кумулятой, можно определить значение признака у любой единицы ранжированного ряда. Аналогично рассчитываются показатели, именуемые квартилями. Первая квартиль (Q1) — значение признака у единицы, делящей ранжированный ряд в соотношении 1/4 и 3/4> вторая квартиль равна медиане (Q2 = Me), третья квартиль (Q3) — значение признака у единицы, делящей ранжированный ряд в соотношении 3/4 и 1/4. Порядковый номер Q1 определяется как Σf/4, для Q3 — соответственно как 3/4 Σf. Представляет интерес и расчет показателей, именуемых децилями (значение признака у единицы, делящей ранжированный ряд в соотношении 1/10 и 9/10 (первая дециль — D1), 2/l0 и 8/l0 (вторая дециль — D2) и т.д.). Для симметричных распределений характерно совпадение значений средней арифметической, моды и медианы. Если Мо> , то ряд будет иметь левостороннюю асимметрию, а если Мо< , то правостороннюю асимметрию. В умеренно асимметричных рядах соотношение между указанными показателями выражается следующим образом:
Задача 3 Воспользовавшись исходными данными задачи Имеется следующее распределение 60 рабочих по тарифному разряду:
где =3,9, рассчитаем основные показатели вариации. Расчет оформим в следующей таблице:
А. Среднее линейное отклонение: Б. Дисперсия:
В. Среднее квадратическое отклонение: Г. Коэффициент вариации: Задача 4 Воспользовавшись исходными данными задачи
Рассчитаем среднюю арифметическую, дисперсию и коэффициент вариации, предварительно уменьшив до предела варианты (т.е. способом расчета от условного нуля):
= 732 (руб.). 2. Рассчитаем дисперсию. Сначала найдем средний квадрат отклонений от произвольного числа — в нашем примере от 650, а затем скорректируем его на квадрат разности между средней арифметической и этим произвольным числом, т.е. применим формулу 3. Отсюда среднее квадратическое отклонение . 4. Коэффициент вариации V= 100% = 17,6%. Задача 5 Пусть имеются следующие данные о результатах экзаменационной сессии на I и II курсах одного из вузов: на I курсе 85% студентов сдали сессию без двоек, а на II курсе - 90%. Определить дисперсию доли студентов, успешно сдавших сессию (или, что то же самое, доли студентов, получивших двойки на сессии).
Так как p1= 0,85 и q1 = 0,15, а р2 = 0,9 и q2 = 0,1, то: на I курсе σ21=p1q1 = 0,85 • 0,15 = 0,1275 => σ1 = 0,35; на II курсе σ22 = р2 q2 = 0,9 • 0,1 = 0,09 => σ2 = 0,3. Следовательно, на II курсе дисперсия и среднее квадратическое отклонение доли студентов, успешно сдавших сессию, меньше, чем на I курсе. Задача 6 Имеются следующие данные о распределении семей их 3-х человек по размеру годового денежного дохода. (графы 1,2, 3 табл., ниже см.). Определить: 1) годовой доход семей с помощью средней арифметической, моды и медианы; 2) среднее квадратическое отклонение годового дохода и коэффициент вариации; 3) децильный коэффициент дифференциации доходов; 4) степень концентрации (неравномерности) доходов у отдельных семей (коэффициент Джини). Решение. Необходимые для расчета суммы показаны в таблице. 1. а) Средний годовой доход = 900,75 (тыс. руб.). (В качестве весов можно принимать и wi — относительный показатель численности семей в % к итогу. Результат будет тот же.). Таблица
б) Мода (наиболее часто встречающийся размер годового дохода) находится в интервале 400—600. Определим ее как = =484 (тыс. руб.), где хн — нижняя граница модального интервала.
в) Медиану удобнее находить по данным распределения в %, т.е. по wi.Тогда порядковый номер медианы равен . По накопленным частостям определяем, что медиана (50-й процент) находится в интервале 600—800.
Отсюда Ме= (тыс. руб.), т.е. в июле 1997 г. половина семей имела годовой денежныйдоход ниже 755,7 тыс. руб., а половина — выше 755,7 тыс.
2. а) Среднее квадратическое отклонение найдем по формуле (тыс. руб.). (Можно было использовать и формулу ) б) Коэффициент вариации
= 60%. Такая вариация весьма значительна, т.е. годовые доходы семей далеко не однородны по размеру. 3. Для оценки степени дифференциации доходов по накопленным частостям (графа 6) определяем, что первая дециль (D1) находится в первом интервале (200—400), а девятая дециль (D9) — в предпоследнем интервале (1600—2000): a) (тыс.руб.). D1 — это максимальный размер годового дохода у десяти процентов семей с наименьшими доходами. Учитывая, что частость первого интервала (17,5%) больше 10% (порядкового номера D1), расчет D1 удобнее вести от значения верхней границы интервала, вычитая из него величину интервала, приходящуюся на излишние 7,5% единиц, т.е. (тыс.руб.) б) = 1600 + 189,5 = 1789,5 (тыс. руб.). D9 - это минимальный размер годового дохода у десяти процентов семей с наиболее высокими доходами; в) децильный коэффициент дифференциации {ДКД) доходов ДКД = = 5,7 (раза). Примечание. Поскольку в первом интервале не указана нижняя граница, а последующий интервал равен 200 (400—600), то мы вправе и в первом интервале принимать такую же величину, т.е. (200—400).
4. Для расчета коэффициента Джини, G, сначала определяем долю (в %) суммарного дохода по каждой группе как (xifi: Σ xifi)* 100% (графа 8 в продолжении табл. 1), а затем в графе 9 находим кумулятивные (накопленные) итоги суммарного дохода в % (qi). Продолжение табл. 1
По данным граф 6 и 9, = [(17,5*16,6 + 37*29,6 + 53,7*42,6 + 66,7*54 + 76,1*71,5 + 87,3*82,9 + 93*100) - (37,0*5,8 + 53,7*16,6 + 66,7*29,6 + 76,1* *42,6 + 87,3*54 + 93*71,5 + 100*82,9)]: 10 000 = (29253,44 - 25975,9): 10 000 = 0,327 0,33. По G = 0,33 делаем вывод, что степень концентрации суммарных годовых денежных доходов у семей с более высокими доходами средняя, не очень высокая. Задача 7 Имеются следующие условные данные по трем группам рабочих с разным стажем работы:
Рассчитать: а) среднюю дневную зарплату для всей совокупности рабочих; б) общую дисперсию и среднее квадратическое отклонение зарплаты. Решение: Общая средняя = 630 (руб.). Общая дисперсия находится по правилу сложения дисперсий: . Находим среднюю из групповых дисперсий: . Межгрупповая дисперсия Общая дисперсия зарплаты = 258,8 + 6100 = 6358,8. Отсюда среднее квадратическое отклонение зарплаты во всей совокупности рабочих 79,7 (руб.).
Примечание. Соотношение моды, медианы и средней арифметической указывает на характер распределения признака в совокупности, позволяет оценить его асимметрию. Если , то имеет место правосторонняя асимметрия, при следует сделать вывод о левосторонней асимметрии ряда. Средняя арифметическая часто используется как показатель центра распределения, положительные и отрицательные отклонения от которого индивидуальных значений признака в сумме взаимно погашаются. Медиана отражает значение признака, сумма отклонений от которого, является наименьшей величиной. Мода является величиной, вокруг которой группируется наибольшее количество единиц совокупности. При нормальном распределении все эти три показателя имеют одинаковую величину. Установив значения характеристик центра распределения (), возникает вопрос, в какой мере индивидуальные значения признака отличаются между собой и центральных характеристик от средней. Для этого рассчитываются показатели вариации. Чем меньше вариация, тем более однородна совокупность и более надежна (типична) средняя величина. Среднее квадратическое отклонение также, как и среднее линейное отклонение, показывает, на сколько в среднем отклоняются конкретные значения признака от среднего их значения. Среднее квадратическое отклонение всегда больше среднего линейного отклонения. Среднее линейное отклонение обладает большим преимуществом перед размахом вариации в отношении полноты характеристики колеблемости признака. Однако при этом в некотором смысле нарушается элементарное правило математики, так как отклонения от среднего значения признака складываются без учета знаков. Среднее квадратическое отклонение измеряет абсолютный размер колеблемости признака и выражается в тех же единицах измерения, что и значения признака (рублях, тоннах, процентах и т. д.). Оно является абсолютной мерой вариации. Чем больше коэффициент вариации, тем менее однородная совокупность и тем менее типична средняя для данной совокупности. Установлено, в соответствии со свойствами нормального распределения, что совокупность количественно однородна, если коэффициент вариации не превышает 33%.
Дата добавления: 2015-05-26; Просмотров: 12584; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |