Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Информационные технологии поиска закономерностей в данных




В том случае, когда необходимо проводить многокритериальный анализ, выявить закономерности в данных и решать другие подобные задачи, целесообразно использовать технологии Data-Mining.

Эти технологии включают в себя поиск корреляционных зависимостей, тенденций, взаимосвязей и закономерностей посредством различных математических и статистических алгоритмов: кластеризации, создания подвыборок, регрессионного и корреляционного анализа.

Основное отличие Data-Mining от OLAP технологий заключается в том, что технологии Data-Mining выявляют закономерностей в данных, а технологии OLAP проверяют достоверность предлагаемых гипотез. Качество результатов технологий поиска закономерностей зависит от полноты и достоверности данных. Достоверность полученных результатов проверяется путем использования не одного, а нескольких алгоритмов обработки одних и тех же данных и сравнения близости результатов.

Традиционно выделяют пять стандартных типов закономерностей, выявляемых методами Data Mining [16]:

· ассоциация - высокая вероятность связи событий друг с другом (например, один товар часто приобретается вместе с другим),

· последовательность - высокая вероятность цепочки связанных во времени событий (например, в течение определенного срока после приобретения одного товара будет с высокой степенью вероятности приобретен другой),

· классификация - имеются признаки, характеризующие группу, к которой принадлежит то или иное событие или объект (обычно при этом на основании анализа уже классифицированных событий формулируются некие правила),

· кластеризация - закономерность, сходная с классификацией и отличающаяся от нее тем, что сами группы при этом не заданы - они выявляются автоматически в процессе обработки данных,

· временные закономерности — наличие шаблонов в динамике поведения тех или иных данных (типичный пример — сезонные колебания спроса на те или иные товары либо услуги), используемых для прогнозирования.

Поиск закономерностей в данных в настоящее время базируется на довольно большом количестве разнообразных методов исследования данных, среди них можно выделить [10-12]:

· регрессионный, дисперсионный и корреляционный анализ,

· методы анализа в конкретной предметной области, базирующиеся на эмпирических моделях,

· нейросетевые алгоритмы, идея которых основана на аналогии с функционированием нервной ткани и заключается в том, что исходные параметры рассматриваются как сигналы, преобразующиеся в соответствии с имеющимися связями между «нейронами», а в качестве ответа, являющегося результатом анализа, рассматривается отклик всей сети на исходные данные,

· деревья решений,

· кластерные модели,

· алгоритмы ограниченного перебора, вычисляющие частоты комбинаций простых логических событий в подгруппах данных.

В последнее время имеет место тенденция снижения стоимости средств, использующих технологию Data-Mining, что делает данную технологию более массовой и дает возможность среднему и малому бизнесу оценить плюсы использования данной технологии и внедрять ее использование в повседневную практику.

Одним из недостатков Data – Mining, как известно, является жесткая зависимость результата анализа от репрезентативности первоначальной информации.

Тенденции развития средств бизнес – анализа ведут к объединению систем бизнес – аналитики в составе сетей бизнес - интеллекта (BI networks) и дополнению средствами мониторинга бизнес деятельности (Business activity monitoring, BAM).




Поделиться с друзьями:


Дата добавления: 2014-11-20; Просмотров: 773; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.01 сек.