КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Тема 4. Основы корреляционного, регрессионного и дисперсионного анализа применительно к правоохранительной и управленческой деятельности
Начальник учебного отдела О.Ю.Чернышова Эм (семинарские занятия) – 15.30-17.10 по понедельникам Ч. 15.30-17.10 Часы лекций: 2ч. 13.40-15.20 ОСЕННИЙ СЕМЕСТР) 2013-2014 уч.г. Начальник учебного отдела О.Ю.Чернышова Эм (7 практических занятий) – среда 16.00-17.40 с 18.09-30.10 Ч. 15.30-17.10 Часы лекций: 2ч. 13.40-15.20 ОСЕННИЙ СЕМЕСТР) 2013-2014 уч.г.
Гр.401-404 (02.09,09.09,16.09) Гр.405-408 (23.09,30.09,07.10) Гр.409-411 (14.10,21.10,28.10) При решении прикладных задач нередко возникает необходимость установления факта существования функциональных или иных зависимостей между переменными величинами, которые могут быть и случайными.
Пусть существуют переменные Y, X 1, Х 2,…, Хk. Необходимо установить степень влияния X 1, Х 2,…, Хk на Y. Переменная Y может быть случайной величиной, даже если X 1, Х 2,…, Хk таковыми не являются, так как может существовать еще ряд неучтенных факторов и ошибки измерения. В таком случае связь между X 1, Х 2,…, Хk и Y является не функциональной, а стохастической. Кроме того, исследователя может интересовать, существует ли взаимозависимость между случайными величинами. Таким образом, задачей корреляционного анализа является исследование наличия и силы взаимосвязей между случайными величинами. Выборочный эмпирический корреляционный момент определяется следующим образом: , где и — выборочные средние. Справедлива формула: Для оценки связи между случайными величинами используется выборочный коэффициент корреляции: , где - выборочные средние квадратичные отклонения величин Х и Y соответственно. Пример 11. По данным примера 7 найти выборочные коэффициенты корреляции между количеством населения и общим количеством зарегистрированных преступлений, количеством тяжких преступлений, количеством умышленных убийств. Решение. Найдем выборочные средние: Далее найдем выборочные корреляционные моменты:
Найдем выборочные среднеквадратичные отклонения:
При известных выборочных корреляционных моментах и выборочных среднеквадратичных отклонениях найдем искомые выборочные коэффициенты корреляции:
Пример 12. По приведенным в таблице 1 статистическим данным найти выборочные коэффициенты корреляции между уровнем преступности и каждым из динамических рядов независимых факторов преступности.
Таблица 1
Решение.
Найдем выборочные средние. Обозначим через выборочную среднюю уровня преступности, через и т.д. – выборочные средние независимых факторов: Далее найдем выборочные корреляционные моменты: Найдем выборочные среднеквадратичные отклонения: При известных выборочных корреляционных моментах и выборочных среднеквадратичных отклонениях найдем искомые выборочные коэффициенты корреляции: Таким образом, можно сделать вывод о том, что существует тесная связь между уровнем преступности и следующими независимыми факторами: долей городского населения, долей несовершеннолетних, долей ранее судимых, долей незанятых, долей наркоманов, потреблением алкоголя, плотностью сотрудников уголовного розыска. Необходимо также отметить, что существует слабая отрицательная корреляция между уровнем преступности и выпуском промышленной и сельскохозяйственной продукции. Кроме того, слабое влияние плотности сотрудников ОВД на уровень преступности может свидетельствовать о неэффективной организации их работы, ответ на данный вопрос требует дополнительного исследования. При рассмотрении двумерной случайной величины (Y, X) используются различные приближения одной случайной величины с помощью другой. Важнейшим из них является линейное приближение. Предположим, что случайная величина приближенно представляет случайную величину Y. При различных a и b она может по-разному отклоняться от Y. Если числа подобраны так, что величина будет наименьшей, то числовая функция a х +b называется линейной средней квадратичной регрессией Y на Х. Коэффициент a обозначают через r xy и называют выборочным коэффициентом регрессии Y на Х. Нахождение такой прямой называют наилучшим приближением Y по методу наименьших квадратов.
Известно, что , причем: Таким образом, задачей регрессионного анализа является установление аналитических зависимостей между случайными величинами. Пример 12. По данным примера 7 найти параметры линейной регрессии для зависимостей общего числа зарегистрированных преступлений, тяжких преступлений и умышленных убийств от количества населения. Решение. Подставляя исходные данные в расчетные формулы, получим: Дисперсионный анализ позволяет ответить на вопрос о наличии существенного влияния некоторых факторов на изменчивость признака, значения которого могут быть получены в результате опыта. При проверке статистических гипотез предполагается случайность вариации изучаемых факторов. В дисперсионном анализе один или несколько факторов изменяются заданным образом, причем эти изменения могут влиять на результаты наблюдений. Исследование такого влияния является целью дисперсионного анализа. Идея дисперсионного анализа заключается в том, что дисперсия разлагается в сумму составляющих ее дисперсий, каждое слагаемое которой соответствует действию определенного фактора. Например, в однофакторном анализе получится разложение вида: Здесь: DA (X) – дисперсия, вызванная влиянием фактора А. DZ (X) – остаточная дисперсия. Часто рассматривается случай, когда этот единичный фактор принимает некоторое количество различных фиксированных уровней. Если фактор имеет k различных уровней, и на каждом уровне сделано n наблюдений, то имеется таблица размером n x k. Таблица 5.2
Рассматривается гипотеза Н 0 – фактор не оказывает влияния на изменчивость признака. Сравниваются дисперсия, вызванная влиянием фактора, и остаточная дисперсия. Если различие между этими дисперсиями значимо, то фактор оказывает существенное влияние на случайную величину; в этом случае средние наблюдаемых значений на каждом уровне (групповые средние x 1, x 2,…, xk) различаются также значимо.
Дата добавления: 2014-01-11; Просмотров: 325; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |