Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Определение аномальных значений совокупностей




Статистически характеристик

Если коэффициент вариации менее 33%, то совокупность можно считать однородной, в противном случае – неоднородной. Так как в нашем примере коэффициент вариации равен 127,9%, можно сделать вывод о высокой степени неоднородности совокупности значений показателя «Число преступлений, совершенных несовершеннолетними и при их соучастии».

Следовательно, необходимо перейти к этапу выявления аномальных значений совокупностей (так называемых «выбросов»).

 

Неоднородные совокупности следует проверить на наличие «выбросов». «Выбросы» - это нетипичные или редкие значения, которые существенно отклоняются от распределения остальных выборочных данных. Эти данные могут отражать истинные свойства изучаемого явления (переменной), а могут быть связаны с ошибками измерения или аномальными явлениями, и поэтому не должны включаться в модель. Визуально «выбросы» можно проследить на графике. Для этого необходимо построить линейный график, ось абсцисс которого – название регионов, ось ординат – значения показателя (рис. 36).

Рис.36. График определения аномальных значений совокупности «сверху».

Получаем график, визуальный анализ которого позволяет сделать вывод о регионах – точках «выбросов» по данному показателю. В нашем случае это г. Москва, так как значение этого показателя выше верхней границы.

Аналитически (один из простейших способов) «выбросы» определяются с помощью следующего правила: значение может быть отброшено, если оно лежит вне области Хср. ± 4σ. Причем среднее значение и стандартное отклонение рассчитывается без учета экстремальных значений (в нашем случае без значения г. Москвы).

Пример. Определим, является ли значение среднедушевых доходов г. Москвы аномальным для рассматриваемой совокупности регионов. Зная значение «аномальной» точки, определим верхнюю допустимую границу. Все расчеты оформим в виде таблицы (рис. 37). Заполнение ее будет состоять из следующих этапов:

1) определить числовое значение показателя, соответствующего точки выброса (максимальное или минимальное значение по столбцу);


Рис. 37. Фрагмент таблицы в режиме формул определения допустимых границ значений показателей

 


2) рассчитать среднее значение показателя без учета точки выброса с помощью формулы: =(СУММ($C$3:$C$81)-$C$20)/(СЧЁТ($C$3:$C$81)-1);

3) найти квадрат отклонения текущих значений от среднего (без учета значения г.Москвы) с помощью, например для Белгородской области, формулы:

=(C3-$D$3)^2;

4) определить среднеквадратическое отклонение признака без учета точки

выброса с помощью формулы:

КОРЕНЬ((СУММ($E$3:$E$81)/СЧЁТ($E$3:$E$81))),

включив ее в формулу расчета верхней и нижней границ допустимых интервалов соответственно:

=D3+4*КОРЕНЬ((СУММ($E$3:$E$81)/СЧЁТ($E$3:$E$81))) – для верхней границы;

=D3-4*КОРЕНЬ((СУММ($E$3:$E$81)/СЧЁТ($E$3:$E$81))) – для нижней

В режиме значений таблица дана на рис. 38.

Рис. 38. Фрагмент таблицы в режиме «значений» определения допустимых границ показателей

Для определения является ли значение г. Москвы точкой «выброса» введем логическую функцию, например в ячейку D86:

=ЕСЛИ(C20>F3;"аномальное значение";"значение принадлежит совокупности"),

где С20 – ячейка, содержащая среднедушевые доходы г. Москвы;

F3 – ячейка, содержащая верхние допустимые границы.

В нашем случае в ячейке результат будет сообщение: аномальное значение. Следовательно, при проведении корреляционно-регрессионного анализа необходимо значение г. Москвы исключить из совокупности, например, сформировав новую таблицу с помощью расширенного фильтра.

Следующий этап разведочного анализа – определение характера распределения совокупности значений данных визуально с помощью построения гистограмм.

 




Поделиться с друзьями:


Дата добавления: 2014-11-20; Просмотров: 1097; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.009 сек.