Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Часть 2. Корреляционный анализ. Линейная двумерная модель




Путешествуя по сайту федеральной службы государственной статистики, можно найти множество показателей, характеризующих уровень преступности в современной России. Но абсолютные числа, размещённые в базах данных, вряд ли помогут проследить логические связи, осознать, почему такая ситуация имеет место, и что нужно делать для обеспечения безопасности граждан. Чтобы понять, насколько связаны друг с другом некоторые показатели, мы выбрали 3 пары характеристик и провели их корреляционный анализ. Первая пара – это число преступлений, совершенных несовершеннолетними (х), и число преступлений, связанных с незаконным оборотом наркотиков (у), совершённых в 1998 г. Рассмотрим двумерные пространственные данные по 26 областям: (здесь и далее используются данные из источника http://www.gks.ru, если не оговаривается иное).

  Число преступлений, совершенных несовершеннолетними и при их соучастии Число преступлений, связанных с незаконным оборотом наркотиков      
      x*y x2 y2
Белгородская область          
Брянская область          
Владимирская область          
Воронежская область          
Ивановская область          
Курская область          
Липецкая область          
Рязанская область          
Смоленская область          
Тверская область          
Тульская область          
Ярославская область          
Республика Карелия          
Республика Коми          
Архангельская область          
Вологодская область          
Калининградская область          
Ленинградская область          
Мурманская область          
Астраханская область          
Республика Дагестан          
Республика Северная Осетия - Алания          
Удмуртская Республика          
Кировская область          
Забайкальский край          
Амурская область          
Среднее 1888,115385 1039,692308 1876979,6 4147168,1 1323387,1

Определим тесноту связи двух признаков. Коэффициент корреляции можно подсчитать двумя способами: по формуле (S – среднее квадратическое отклонение), либо с помощью встроенной статистической функции Excel КОРРЕЛ(). Для нахождения коэффициента корреляции и построения линейной модели, необходимы дополнительные подсчёты:

Sx= 763,0128
Sy= 492,3688
R по функции -0,22913
R вручную -0,22913

Оба способа дают идентичные результаты: r = - 0,229. Это означает, что связь обратная и к тому же очень слабая, так как чем больше коэффициент корреляции, тем более тесная связь между величинами x и y. Можно сделать вывод, что между преступлениями, связанными с наркотиками и преступлениями несовершеннолетних нет никакой зависимости. Это отчётливо видно на графике. Как мы видим, корреляционное облако расплывчато и по очертаниям напоминает круг.

Следующая пара – число преступлений с насильственными действиями в отношении потерпевших (х) и число женщин, совершивших преступление (у) в 2005 году. На сайте Росстата представлены следующие данные по 30 областям:

 

 

  Число преступлений с насильственными действиями в отношении потерпевших Число женщин, совеpшивших пpеступление      
      x*y x2 y2
Калужская область          
Костромская область          
Курская область          
Липецкая область          
Московская область          
Орловская область          
Рязанская область          
Смоленская область          
Тамбовская область          
Тверская область          
Тульская область          
Ярославская область          
Республика Карелия          
Вологодская область          
Ленинградская область          
Краснодарский край          
Ставропольский край          
Республика Башкортостан          
Республика Марий Эл          
Удмуртская Республика          
Чувашская Республика          
Оренбургская область          
Ульяновская область          
Курганская область          
Ханты-Мансийский авт.округ-Югра          
Республика Бурятия          
Забайкальский край          
Красноярский край          
Усть-Ордынский Бурятский авт.округ          
Кемеровская область          
Среднее 7355,833333 2159,366667      

Для нахождения коэффициента нам понадобятся промежуточные рассчёты

Sx= 4079,738
Sу= 1516,235
R по функции 0,695129
R вручную 0,695129

Двумя способами был получен один и тот же ответ r = 0,695. Это означает, что связь между этими показателями средняя по силе и прямо пропорциональная, то есть увеличение числа насильственных убийств происходит частично за счёт возрастания числа женщин-преступниц, но также и за счёт некоторых других факторов. На графике мы видим подтверждение наших выводов: облако рассеивания напоминает «овал», оно вытянуто, и можно даже проследить, в каком направлении.

Построим уравнение регрессии, описывающее зависимость между выбранными переменными. Для этого нужно найти и . Используя данные формулы, получим ŷ = 259,02 + 0,2583 * x, что полностью совпадает с уравнением линии тренда.

Третья и последняя пара характеристик – число преступлений, совершенных лицами, находящимися в состоянии алкогольного опьянения (х), и число преступлений совершенных лицами, ранее совершавшими преступления (у), в 1999 году. Нами были найдены данные из 28 областей:

  Число преступлений, совершенных лицами, находящимися в состоянии алкогольного опьянения Число преступлений совеpшенных лицами, pанее совеpшавшими пpеступления      
      x*y x2 y2
Республика Дагестан          
Республика Ингушетия          
Кабардино-Балкарская Республика          
Карачаево-Черкесская Республика          
Республика Северная Осетия - Алания          
Республика Мордовия          
Республика Татарстан          
Удмуртская Республика          
Коми-Пермяцкий авт.округ          
Самарская область          
Свердловская область          
Тюменская область          
Ямало-Ненецкий авт.округ          
Республика Алтай          
Республика Тыва          
Алтайский край          
Агинский Бурятский авт.округ          
Красноярский край          
Таймырский (Долгано-Ненецкий) авт.округ          
Эвенкийский авт.окpуг          
Иркутская область          
Усть-Ордынский Бурятский авт.округ          
Камчатский край          
Корякский авт.округ          
Магаданская область          
Сахалинская область          
Еврейская автономная область          
Чукотский авт.округ          
Среднее 4252,107143 5946,571429      

Значения промежуточных величин следующее:

Sx= 5596,1811
Sy= 7925,5356
R по функции 0,9987
R вручную 0,9987

Подсчитывая коэффициент корреляции, получаем r = 0,999. Это значит, что связь между двумя переменными прямо пропорциональна и необычайно сильна, зависимость близка к функциональной.

Другими словами, при увеличении числа рецидивов непременно будет расти число людей, совершивших преступление в состоянии алкогольного опьянения. График подтверждает полученные результаты: видно, что наблюдения практически выстроились в прямую линию, осталось только соединить точки линией тренда.




Поделиться с друзьями:


Дата добавления: 2014-12-24; Просмотров: 874; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.013 сек.