КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Для самостоятельной работы 1 страница
ЗАДАЧИ И УПРАЖНЕНИЯ (ПО ТЕМАМ 4 И 5)
Задача 1 На конец октября 2010 г. в РФ имелось следующее распределение безработных по возрастным группам:
По данным распределения определить: 1) средний (арифметический) возраст безработных; 2) модальный возраст (моду); 3) медианный возраст (медиану); 4) среднее квадратическое отклонение; 5) коэффициент вариации. Ответ: 1) = 34,3 года; 2) Мо = 22,4 года; 3) Me = 33,6 года; 4) = 11,5 года; 5) V =33,5%.
Задача 2 Имеются следующие данные за 2009 и 2010 гг. по РФ об урожайности, посевных площадях и валовом сборе пшеницы (озимой и яровой).
Определить среднюю урожайность пшеницы: а) в 2009 г. и б) в 2010 г.
Ответ: а) 12,555 ц/гa; б) 13,48 ц/га. Задача 3 По данным таблицы «б» из задачи 3 темы 2 определить средний возраст безработных в 2010 г.: а) мужчин; б) женщин.
Ответ: а) 35,5 года; б) 33,8 года.
Задача 4 По тем же данным (таблица «б» из задачи 3 темы 2) определить: модальный возраст (моду) для мужчин и женщин; медианный возраст (медиану) для мужчин и женщин.
Ответ:1) Мо мужчин = 22,6 года и Мо женщин = 22 года; 2) Ме мужчин = 35 лет и Ме женщин = 33,3 года.
Задача 5 Имеются следующие данные о распределении населения Московской области по уровню среднемесячного душевого дохода в 2009 г.
Определить в данном распределении: 1) среднемесячный душевой доход по области в целом; 2) моду; 3) медиану; 4) среднее квадратическое отклонение доходов; 5) децильный коэффициент дифференциации (ДКД) доходов; 6) коэффициент Джини (G). Ответ 1) = 367,6 тыс. руб.; 2) Мо = 313,1 тыс. руб.; 3) Me = 337,2 тыс. руб.; 4) ; 5) ДКД = 4,7 раза; 6) G = 0,265.
Задача 6 Распределение населения Москвы по уровню среднемесячного в 2009 г. характеризовалось следующими данными.
Определить: 1) среднедушевой денежный доход на основе среднеарифметической моды и медианы; 2) дисперсию, среднее квадратическое отклонение, коэффициент вариации; 3) децильный коэффициент дифференциации доходов, ДКД; 4) коэффициент Джинни (показатель концентрации доходов),G. Ответ: 1) = 720,6 тыс. руб., Мо = 1091,8. руб.; Ме = 724,7 тыс. руб.; 2) = 126405,6; = 356 тыс. руб.; V= 49,4%; 3) ДКД = 4,8 раза; 4) G = 0,272. Задача 7 Имеются следующие данные о распределении населения Санкт-Петербурга по уровню среднемесячного душевого дохода в 2009 г.
Определить: 1) среднемесячный душевой доход в целом, по городу; 2) моду и медиану (по формулам и графически); 3) коэффициент вариации доходов; 4) ДКД населения по доходам; 5) степень концентрации доходов по группам (с помощью G). 6) построить кривую Лоренца. По результатам анализа сделать выводы. Ответ:1) = 541 тыс. руб.; 2) Мо = 345,8 тыс. руб.; Me = 479,5 тыс. руб.; 3) V= 57,5%; 4) ДКД = 5,75 раза; 5) G = 0,265.
Задача 8 По переписи населения 1926 г. в России доля грамотных среди женщин составляла 46%, а среди мужчин 77%. Определить общий (средний) процент грамотности всего населения и дисперсию этого показателя, если женщины составляли 53% в общей численности населения. Ответ: = 60,57% (0,6057); 2) = 0,2388.
Задача 9 В коллективных хозяйствах района средняя урожайность зерновых составила 19 ц/га при среднем квадратическом отклонении 3 ц/га, а в фермерских хозяйствах — соответственно 26 ц/га и 4 ц/га. Определить: 1) среднюю урожайность зерновых по району, если известно, что посевная площадь под зерновыми в коллективных хозяйствах в 9 раз превышает площадь фермерских хозяйств; 2) общую дисперсию и среднее квадратическое отклонение урожайности зерновых в районе (по правилу сложения дисперсии).
Ответ: 1) = 19,7 ц/га; 2) ; ц/га.
Задача 10 Для изучения уровня заработной платы рабочих на предприятии выборочно обследованы 500 мужчин и 300 женщин. Результаты исследования показали, что у мужчин средняя заработная плата составила 1200 руб. при среднем квадратическом отклонении 200 руб., а у женщин — соответственно 800 руб. и 150 руб. Определить: 1) общую среднюю заработную плату рабочих на заводе; 2) среднюю из групповых дисперсий; 3) межгрупповую дисперсию; 4) общую дисперсию зарплаты; 5) коэффициент вариации зарплаты на предприятии. Ответ: 1) руб.; 2) ; 3) ; 4) ; 5) V = 25,4%.
Тема 6 КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ
При исследовании социально-экономических явлений часто приходится иметь дело со взаимосвязанными показателями. При этом часто связь, существующая между двумя или несколькими показателями, затушевывается, усложняется наслоением действия других причин (факторов). Изучить, насколько изменение одного показателя зависит от изменения другого (или нескольких), — одна из важнейших задач статистики. Следует различать функциональные и корреляционные связи. В отличие от функциональной зависимости, при которой каждому значению одной переменной строго соответствует одно определенное значение другой переменной, зависимость, при которой одному значению переменной (х) может соответствовать (в силу наслоения действия других причин) множество значений другой переменной (у), называют корреляционной. Корреляционная зависимость проявляется лишь на основе массового наблюдения. Примером корреляционной зависимости может служить зависимость производительности труда от стажа работы рабочих, зависимость урожайности от срока сева, зависимость годового удоя коров от количества отелов и т. п. Наиболее простым случаем корреляционной зависимости является парная корреляция, т.е. зависимость между двумя признаками (результативным и одним из факторных). Основными задачами при изучении корреляционных зависимостей являются: 1) отыскание математической формулы, которая бы выражала эту зависимость у от х; 2) измерение тесноты такой зависимости. Решение первой задачи, т.е. определение формы связи с последующим отысканием параметров уравнения, называется нахождением уравнения связи (уравнения регрессии). Показатели, рассматриваемые как функция х, обозначают (читается: «игрек, выравненный по икс»). Возможны различные формы связи: 1) прямолинейная: ; 2) криволинейная в виде: а) параболы второго порядка (или высших порядков); б) гиперболы ; в) показательной функции и т. д. Параметры для всех уравнений связи чаще всего определяют из так называемой системы нормальных уравнений, отвечающих требованию «метода наименьших квадратов» (МНК). Это требование можно записать как или, при линейной зависимости, , ,требуется определить, при каких значениях параметров и сумма квадратов отклонений y от будет минимальной. Найдя частные производные указанной суммы по и и приравняв их к нулю, легко записать систему уравнений, решение которой и дает параметры искомой функции, т. е. уравнения регрессии. Так, система нормальных уравнений при линейной зависимости имеет вид . Если связь выражена параболой второго порядка , то система нормальных уравнений для отыскания параметров , , выглядит следующим образом: . Вторая задача — измерение тесноты зависимости — для всех форм связи может быть решена с помощью исчисления теоретического корреляционного отношения (): , где - дисперсия в ряду выравненных значений результативного показателя - дисперсия в ряду фактических значений у. Так как дисперсия 2 отражает вариацию в ряду только за счет вариации фактора х, а дисперсия 2 отражает вариацию у за счет всех факторов, то их отношение, именуемое теоретическим коэффициентом детерминации, показывает, какой удельный вес в общей дисперсии ряда у занимает дисперсия, вызываемая вариацией фактора х. Квадратный корень из отношения этих дисперсий дает нам теоретическое корреляционное отношение. Если 2 = 2, то это означает, что роль других факторов в вариации у сведена на нет, и отношение означает полную зависимость вариации у от х. Если 2 = 0, то это означает, что вариация x никак не влияет на вариацию у, и в этом случае . Следовательно, максимальное значение, которое может принимать корреляционное отношение, равно 1, минимальное значение - 0. Математически легко доказывается, что в случае линейной зависимости корреляционное отношение может быть заменено выражением , которое называют линейным коэффициентом корреляции и обозначают r, здесь — коэффициент регрессии в уравнении связи, и — соответственно среднее квадратическое отклонение в ряду х и в ряду у. Линейный коэффициент корреляции можно выразить и другими формулами, тождественными первой, в частности: ; ; или , а также .
Линейный коэффициент корреляции может принимать по модулю значения от 0 до 1 (знак «+» при прямой зависимости и знак «—» при обратной зависимости). Рассмотрим решение некоторых задач по этой теме.
Задача 6.1 Пусть по 10 однотипным предприятиям имеются следующие данные о выпуске продукции (х) в тыс. ед. и о расходе условного топлива (у) в тоннах (графы 1 и 2 таблицы). Требуется найти уравнение зависимости расхода топлива от выпуска продукции (или уравнение регрессии у по x) и измерить тесноту зависимости между ними. Решение. А. Рассматривая уравнение регрессии в форме линейной функции вида , параметры данного уравнения ( и ) найдем из системы нормальных уравнений ,
а необходимые для решения суммы , , , рассчитаны выше в таблице. Подставляем их в уравнение и решаем систему: , = 1,16; = 0,547. Отсюда = 1,16 + 0,547х. Подставляя в это уравнение последовательно значения х = 5, 6, 8, 10 и т. д., получаем выравненные (теоретические) значения результативного показателя (графа 5 таблицы). Поскольку параметры уравнения регрессии являются оценочными, то для каждого из них рассчитывается средняя ошибка, т. е. . Конкретный расчет ошибок для и по данным нашего примера приведен далее. Б. Для измерения тесноты зависимости между у и х воспользуемся, прежде всего, линейным коэффициентом корреляции (поскольку зависимость рассматривалась линейной): а) по формуле находим = 121,8; = 12,5; = 8; = 196,1. Определяем и , предварительно найдя = 770 и = 77;
,
. Отсюда .
Значение линейного коэффициента корреляции r = 0,96 (т. е. близкое к единице) характеризует не только меру тесноты зависимости вариации у от вариации х, но и степень близости этой зависимости к линейной; воспользуемся еще одной формулой линейного коэффициента корреляции: , т. е. результат тот же. При расчете коэффициента корреляции, особенно если он исчислен для небольшого числа наблюдений (n), очень важно оценить его надежность (значимость). Для этого рассчитывается средняя ошибка коэффициента корреляции () по формуле , где (n-2) — число степеней свободы при линейной зависимости. А затем находится отношение коэффициента корреляции к его средней ошибке, т.е. , которое сравнивается с табличным значением t-критерия Стьюдента. В рассматриваемом примере средняя ошибка коэффициента корреляции , а . По таблице находим, что при числе степеней свободы k = 10-2 = 8 и уровне значимости = 0,05 табличное (критическое, пороговое) t равно 2,306, т. е. = 2,306. Поскольку фактическое (расчетное) t больше табличного, т. е. , то линейный коэффициент корреляции r = 0,96 считается значимым, а связь между х и у — реальной. В. Кроме линейного коэффициента корреляции для измерения тесноты зависимости можно воспользоваться теоретическим корреляционным отношением: ,
где и — дисперсии соответственно теоретических и эмпирических значений результативного показателя. Расчет их показан ниже в таблице.
Дисперсия выравненных значений результативного показателя, или факторная дисперсия, ;
общая дисперсия эмпирических значений результативного показателя ; теоретическое корреляционное отношение . Рассчитанные показатели позволяют сделать вывод о том, что связь между вариацией результативного показателя (у) и факторного (х) весьма высокая. Вместо дисперсии выравненных значений у, т. е. 2, можно воспользоваться остаточной дисперсией. В соответствии с правилом сложения дисперсий можно записать, что , где , тогда . В нашем примере расчет остаточной дисперсии () показан в графах 8 и 9 таблицы: = 1,074. Отсюда . Остаточная дисперсия, вернее, корень квадратный из нее, т. е. , используется для расчета средних ошибок параметров уравнения регрессии. Так, средняя ошибка параметра равна , а для равна . Сопоставляя значение параметра с его средней ошибкой, по значению судят о значимости данного параметра. Если число наблюдений п > 20, то параметр считается значимым при t >-3. Если п < 20, то обращаются к специальным таблицам значений t-критерия Стьюдента. И в данном случае параметр считается значимым при t факт > . В рассмотренном примере для уравнения регрессии 1,16 + 0,547х ошибки параметров , т. е. = 1,16 ± 0,366,
Дата добавления: 2014-12-24; Просмотров: 3308; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |