Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Вопрос 18. Поиск аномалий. Простейшие методы

Есть некая предметная область и ее модель. Существуют различные методы исследования.

Если говорим об аномалиях, то ест некоторый набор данных, который мы называем аномалией. Техника поиска выбросов делится на поиск аномалий и поиск интересных особенностей. Интересная особенность после того, как обнаружена, включается в область нормальных данных. Аномалия может быть пространственно (относительно остальных данны) и временной.

Снимаемые данных. Можно отнести к непрерывным данным и категориальным (например, доступ к файлам). Надо объединять атрибуты из отдельных характеристик.

Данные надо нормализовывать для того, чтобы иметь возможность учитывать величины разных порядков – клометры и миллиметры.

Можно смотреть частотные характеристики данных. Когда мы переходим от атрибутов данных к их характеристикам, отбрасываем структуру данных, мы теряем информацию.

Что делать с категоримальными данными?

По частоте обращения к каждой категории. Если всегда обращался к своим документам, а полез в system – то это аномалия.

Если количество категорий конечно, то каждой категории мы приписываем ось пространства. Если атрибут присутствует в образце данных, то координата. Между двумя токами будет вносить вклад в соответствующее расстояние.

Расстояние между двумя точками, принадлежащих разным образцам.

Самый простой способ – операционная модель. Каждое новое наблюдение должн укладываться в определенные рамки.

Адрес среднего значения из СКО. Эти две величины показывают рассеивание случайной величины относительно ее мат ожидания. Оценки эти для нормального распределения. Около 60% всех значения величины будет попадать в один СКО. 95% значений будут попадать в диапазон двух СКО. Есть правило трех сигм – почти все значения попадают в интервал +- 3 сигмы.

На обучающих данных оцениваем мю и сигма, а потом просто проверяем, попали ли в этот диапазон.

Есть набор образцов, каждый из которых имеет определенны набор значений. Кажды образец данных состоит из определенного количества атрибутов.

Критерий Хателлинга хорош тем, что борется с зависимостями переменных. Зависимость не хороша к тому, что одна и та же аномалия будет учтена много раз. Одна аномальность потянет аномальность в другом признаке. По этому аномальности лучше устранять.

Критерий хи квадрат не учитывает зависимостей.

Оценка т квадрат (Хателлинга) нивелирует зависимости между атрибутами. Чем больше значение оценки т квадрат, тем…

Sназывается матрицей вариаций-ковариаций.

 

Выявление аномалий:

· Основаны на сравнении ожидаемой активности в ВС с текущей активностью

· Предполагается, что отклонение от нормального поведения является подозрительным и может быть оценено как признак вторжения

· Основаны на статистических методах анализа активности

Группы свойств событий:

· Частотные свойства

· Временные свойства

· Свойства порядка

 

<== предыдущая лекция | следующая лекция ==>
Модуль анализа | Вопрос 19. Марковские процессы. Основы для применения в СОВ. Вопрос 20. Применение в СОВ
Поделиться с друзьями:


Дата добавления: 2014-01-15; Просмотров: 676; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.009 сек.