Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Системы извлечения знаний




Прорыв в области высокоскоростных коммуникаций, ориентация сети Internet на реализацию коммерческих прило­жений привели к тому, что объем данных, требующих осмыс­ленной обработки, возрос настолько, что появилась реальная потребность в недорогих, простых в обращении, но достаточно гибких программах для осмысленного анализа лавинообраз­ного потока «сырой» информации. В результате этого спроса возник рынок интеллекту­альных систем нового поколения. Стали появляться програм­мы, способные самостоятельно, без предварительного обуче­ния на опыте эксперта, извлекать информацию (знания) из баз данных большого объема и глобальных информационных се­тей. Многие из этих программ были выпущены на рынок не совсем доработанными, что объясняется стремлениемих про­изводителей закрепиться в новой рыночной нише, однако тем­пы роста нового рынка и интерес, проявляемый к нему со сто­роны бизнесменов и политиков, позволяют специалистам пред­сказывать ему большое будущее.

В настоящее время нет строго определенного термина, обо­значающего новый класс интеллектуальных систем.

Чаще всего в литературе для их обозначения используется англоязычное словосочетание «data mining». В русскоязычном варианте можно встретить названия: «системы добычи данных (зна­ний)», «системы извлечения знаний», DM-системы и некото­рые другие.

Наиболее важными отличительными особенностями сис­тем, относимых к DM-системам.

1. Прежде всего, DM-системы обеспечивают автоматичес­кое выявление корреляций между различными атрибутами эле­ментов данных в реляционных БД. С их помощью можно полу­чить ответы, например, на такие вопросы, как: «Какие факто­ры способствуют увеличению числа продаж того или иного товара? Какие события влияют на изменения котировок цен­ных бумаг? Какова общая картина политических симпатий из­бирателей по регионам?» Часто в качестве одного из контро­лируемых параметров выступает шкала времени, тогда систе­ма имеет возможность отображать динамику валютных тор­гов, прогнозы пополнения сырьевых запасов, эволюцию взгля­дов электората.

Современные DM-системы способны не только находить корреляционные зависимости, но и оценивать вероятность каждой гипотезы. А наиболее мощные системы, использую­щие аппарат нечеткой логики, способны оперировать как количественными, так и качественными параметрами — «по­пулярный», «прибыльный», «стабильный» и др.

2. Важной функцией DM-систем является автоматичес­кая кластеризация данных для ответов, например, на такие вопросы: «На какие группы делятся клиенты страховой ком­пании?» «Какая группа наиболее представительна?» «Какая наиболее доходна?» Обычно пользователей интересует не только количество и размер кластеров, но и расположение их центров, характеризующее черты типичного представи­теля данного класса объектов, четкость границ и многие дру­гие параметры.

3. Следующим важным атрибутом больших DM-систем является возможность автоматизированной обработки не­структурированной текстовой информации.

4. Еще одна важная особенность — каждая DM-система в той или иной степени обладает способностью генерировать итоговые отчеты в форме, максимально приближенной к тек­сту на естественном языке.

Для решения основной задачи DM-систем — выделения корреляционных зависимостей между данными — чаще всего используются три подхода: многомерный корреляционный ана­лиз, обработка гипотез по принципу «запрос-отчет» и так на­зываемые «интеллектуальные агенты».

Основными потребителями систем искусственного интел­лекта в настоящее время являются военно-промышленные ком­плексы, а также финансовые и банковские структуры. Индустриальные компании, обладающие исследовательс­ким потенциалом, обычно идут по пути создания собствен­ных систем для обработки технической, управленческой и маркетинговой информации.

Литература к лекции

1. Симонович С.В. Информатика для юристов и экономистов. — СПб: Питер, 2001

2. Симонович С.В. Информатика. Базовый курс. — СПб: Питер, 2000

3. Косарев В.П. Компьютерные системы и сети: Учебное пособие. — М.: Финансы и статистика, 1999

 

О Г Л А В Л Е Н И Е   Сстр.  
Введение …………………………………………………………  
Лекция 1. Роль и информатики и информационных технологий в развитии общества………………………………..  
Языки программирования. Алгоритмы. Решение задач с использованием ПК.  
Лекция 2. Персональный компьютер ………………………….  
Лекция 3 Операционные системы  
Лекция 4. Решение задач с использованием ПК ……………………………………………………………………..  
Лекция 5  
Методы защиты информации и сетевые технологии  
Лекция 6. Сетевые технологии …………………………………  
Лекция 7 Методы защиты информации  
Компьютерный практикум  
Лекция 8. Текстовые редакторы ………………………………..  
Лекция 9. Обработка данных средствами электронных таблиц …………………………………………………………….  
Лекция 10. Информационные системы………………………...  
Список сокращений ………………...…………………………...  
Литература …...………………………………………………….  

 

КРАТКИЙ СЛОВАРЬ ТЕРМИНОВ

Адаптер - устройство, обеспечивающее согласование параметров входных и выходных сигналов в системе.

Алгоритм - точное предписание, определяющее процесс, ведущий от варьируемых начальных данных к искомому результату.

Архитектура ЭВМ - концепция, определяющая модель, общую орга­низационную структуру, выполняемые функции, взаимосвязь устройств, методы кодирования обрабатываемых данных в ЭВМ.

Архитектура безопасности данных - концептуальные положения, определяющие методы и средства защиты данных.

Архитектура "клиент-сервер" - концепция локальной сети, при ко­торой основная часть ее ресурсов размешена на серверах, об­служивающих своих клиентов.

База данных - совокупность взаимосвязанных, хранящихся вместе данных при минимальной избыточности, допускающей их оп­тимальное использование для одного или нескольких прило­жений.

База знаний - организованная по особым принципам совокупность знаний, относящихся к какой-либо предметной области.

Банк данных - информационная система, содержащая комплекс специальных методов и средств поддержки информаци­онной модели предметной области с целью обеспечения ин­формационных запросов пользователей.

Безопасность данных - концепция защиты данных от случайного или преднамеренного их изменения, уничтожения, разглаше­ния или несанкционированного использования.

Буфер - запоминающее устройство для временного хранения дан­ных и согласования скоростей взаимодействия устройств с разными возможностями.

Видеоадаптер, или видеоконтроллер - специальная плата ПК, обес­печивающая формирование изображения на экране монито­ра информации, передаваемой процессором.

Внешняя память - память компьютера, непосредственно не доступ­ная процессору.

Данные - материальные объекты произвольной формы, выступаю­щие в качестве средства представления информации.

Дисплей - устройство ввода, редактирования и визуального отобра­жения информации на экране.

Домен - выделенное множество объектов.

Драйвер - специальная вспомогательная программа, управляющая внешними устройствами ПК или управляющая выполнением программ.

Знание жесткое - знание, которое может быть выражено в виде стро­гих математических моделей и категорий естественнонаучных теорий.

Знание мягкое - спектр решений, между которыми приходится де­лать выбор, когда правила и критерии такого выбора жестко не определены.

Идентификация - процесс отождествления какого-либо объекта с одним из известных.

Инструментальное ПО - средство разработки и развития программ­ного обеспечения.

Интегральная схема - миниатюрное электронное устройство, эле­менты которого соединены технологически.

Интерфейс - определенная система правил взаимодействия между взаимодействующими объектами (пользователями, устрой­ствами, программами, процессами и др.).

Интерфейс пользователя - порядок, определяющий процедуры вза­имодействия пользователя с системой.

Информатика - научная область, изучающая модели, методы и сред­ства преобразования информации.

Информация - мера устранения неопределенности в отношении ис­хода тогоили иного события.

Информационная база - вся совокупность информации реального объекта.

Информационный поток - совокупность информационных масси­вов конкретной деятельности, имеющая динамический ха­рактер.

Информационная сеть - сеть для обработки, хранения и передачи данных.

Клавиатура - устройство ручного ввода информации в ПК.

Кодирование - процесс представления данных последовательностью символов иной формы или значения.

Команда ЭВМ - инструкция, представленная в специальном фор­мате.

Коммуникационная сеть - сеть, основной задачей которой является передача данных.

Компьютерный вирус - специально написанная, небольшая по раз­мерам программа, вызывающая нарушения нормального вы­полнения различных программ пользователя, порчу файлов, создающая различные помехи при работе ПК.

Контроллер - специализированное устройство (или плата), управ­ляющее работой некоторого периферийного устройства и обеспечивающее его связь с системной платой.

Компьютер - общее название вычислительной машины, предназна­ченной для выполнения преобразований над вводимыми и хранимыми в ней данными.

Криптография - способ преобразования данных с целью сделать их непонятными для непосвященных лиц.

Локальная вычислительная сеть - система взаимодействующих и связанных между собой средствами передачи информации компьютеров, размещенных на ограниченной территории.

Макрокоманда - последовательность команд, выделяемая в виде небольшой программы.

Маршрутизация - процесс определения в коммуникационной сети пути, по которому может происходить передача данных.

Массив - упорядоченное множество однотипных элементов данных.

Меню - список команд или функций, представляемых пользовате­лю на выбор.

Микропроцессор - процессор, выполненный в одном или несколь­ких взаимосвязанных полупроводниковых кристаллах интег­ральных схем.

Модем - устройство преобразования сигналов при передаче их меж­ду удаленными компьютерами.

Модуль - функционально законченная часть программы или кон­структивно законченный элемент.

Мышь - устройство позиционирования, служащее для указания координат на экране.

Накопитель информации - устройство для долговременного хране­ния больших объемов информации.

Нейрокомпьютер - вычислительная система, аппаратное и про­граммное обеспечение которой ориентировано на реализацию нейросетевых алгоритмов.

Одноранговая архитектура сети - концепция архитектуры сети, в которой ее ресурсы рассредоточены среди равноправных або­нентов.

Окно - средство фрагментации данных при их представлении и об­работке.

Оперативная память - память для хранения команд и данных, необ­ходимых процессору для выполненияим операций.

Операционная система (ОС) - комплекс программ для управления и координации работы всех устройств ПК, управления процес­сом выполнения прикладных программ и обеспечения диало­га с пользователем.

Пакет - блок данных, передаваемый между абонентами на сетевом уровне.

Память - обобщенное название устройств в компьютере, предназ­наченных для хранения данных.

Папка - средство организации и представления системных ресур­сов ПК в операционных системах Windows.

Параллельная обработка - модель выполнения прикладных процес­сов (программ) одновременно группой процессоров.

Пароль - признак, удостоверяющий полномочия пользователя или программы на использование какого-либо ресурса.

Периферийное устройство ПК - устройство, которое непосредствен­но не размещено на его системной плате.

Пиктограмма - небольшое графическое изображение объекта или действия в виде условного значка.

Поле - часть записи для размещения определенного типа данных.

Порт - точка доступа к устройству либо к программе.

Прикладная программа - программа, описывающая процесс выпол­нения определенной задачи.

Принтер - устройство вывода данных на бумагу.

Провайдер - организация (юридическое лицо), обеспечивающая ра­боту узла (сайга) в сети Интернет.

Проводник - специальная программа для управления файловой си­стемой в Windows.

Программа - формализованное описание последовательности действий устройств компьютера по реализации той или иной задачи.

Программирование - процесс создания программы для ЭВМ.

Программное средство - формализованное описание процесса, обес­печивающее автоматизацию решения на компьютере задач пользователя как независимо, так и с помощью программно-инструментальных средств.

Программное обеспечение ПК - совокупность программ и необхо­димой документации, обеспечивающих обработку или пере­дачу данных.

Программно-инструментальное средство - комплекс программных продуктов для автоматизации разработки программного обеспечения.

Протокол - стандарт, определяющий способ преобразования ин­формации для ее передачи по сетям.

Процессор - устройство компьютера, служащее для выполнения команд.

Рабочая станция - компьютер в сети, специализированный на ре­шении определенных задач пользователя.

Разделение времени - технология работы ПК, предусматривающая чередование во времени нескольких процессов (программ), выполняемых в одном компьютере.

Реляционная база данных - база данных, логически организован­ная в виде набора отношений ее компонентов.

CASE-технология - совокупность средств системного анализа, про­ектирования, разработки и сопровождения сложных про­граммных систем, поддерживаемых комплексом взаимосвя­занных инструментальных средств автоматизации всех эта­пов разработки программ.

Сервер - как правило, компьютер высокой производительности, предоставляющий сервис другим компьютерам сети.

Сеть - взаимодействующая совокупность объектов, образуемых устройствами передачи и обработки данных.

Сеть Интернет - глобальная международная ассоциация информа­ционных сетей.

Система - организованное множество, образующее целостное един­ство, направленное на достижение определенной цели.

Сканер - устройство автоматизированного ввода графической и текстовой информации в компьютер.

Сообщение - набор данных со смысловым содержанием, пригодных для обработки и передачи.

Список - упорядоченная последовательность произвольных элемен­тов данных.

Стример - устройство для хранения и воспроизведения больших объемов информации на кассетную магнитную ленту.

Текстовый редактор - обобщенное название комплекса прикладных программ для создания и редактирования текстов, программ и документов.

Телеконференция - метод проведения дискуссий между удаленны­ми группами пользователей в сети Интернет,

Терминал - устройство ввода-вывода данных и команд в компью­тер или в сеть.

Технология - совокупность методов обработки, изготовления, из­менения состояния, свойств, формы сырья и материалов, включая информацию, в процессе производства конечной про­дукции.

Транслятор - специальная программа перевода исходной програм­мы на машинный язык компьютера.

Утилита - программа вспомогательного или служебного назначе­ния для ПК.

Файл - поименованная целостная совокупность данных в памяти ПК или на машинном носителе.

Формат - структура информационного объекта.

Форматирование диска - процесс записи на него управляющей ин­формации, определяющей точки начала и конца отдельных секторов диска.

Шрифт - набор форм символов алфавита, служащий для восприя­тия устройствами компьютера и людьми.

Экономическая информация - информация, отражающая и обслу­живающая процессы производства, распределения, обмена и потребления материальных продуктов и благ.

Экспертная система - система, объединяющая возможности компь­ютера со знаниями и опытом эксперта в такой форме, что она может предложить разумный совет или разумное решение задачи с пояснением хода своих рассуждении в понятной че­ловеку форме.

Электронная почта - средство передачи сообщений по сети без при­менения бумажного носителя.

Электронная таблица - распространенное название комплекса при­кладных программ для обработки таблиц.

Ярлык - в операционной системе Windows определяется как файл, содержащий путь к объекту.

Ячейка - адресуемый элемент однородной структуры, например таблицы.

 




Поделиться с друзьями:


Дата добавления: 2014-01-03; Просмотров: 1199; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.053 сек.