Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Базы данных и знаний




 

По мере развития и совершенствования вычислительной техники, программного обеспечения, автоматизированных информационных технологий появилась необходимость в разработке такой организации информационных массивов, которая позволила бы использовать единый массив различными пользователями для различных бизнес-приложений. Совокупность таких информационных массивов, описывающих определенные классы объектов, получила название база данных (БД). Комплекс программ, реализующих создание БД и поддержание её в актуальном состоянии, а также обеспечивающих различным пользователям возможность использовать информацию, хранящуюся в БД, в своих целях, называется системой управления базой данных (СУБД).

Основной составной частью СУБД является ее ядро - управляющая программа, предназначенная для автоматизации всех процессов, связанных с обращением к базам данных. После запуска СУБД ее ядро постоянно находится в основной памяти и организует обработку поступающих запросов, управляет очередностью их выполнения, взаимодействует с прикладными программами и операционной системой, контролирует завершение операций доступа к базе данных, выдает сообщение. Важнейшей функцией ядра является организация параллельного выполнения запросов.

Другой частью СУБД является набор обрабатывающих программ: трансляторов с языков описания данных, языков запросов и языков программирования, редакторов, отладчиков. Отдельную группу программ составляет сервис банков данных.

Наконец, сама СУБД, являясь инструментальным средством и средством организации доступа к базам данных, не решает никаких прикладных расчетных задач. Обработка найденных системой данных, вычисления, формирование выходных документов по заданной форме выполняется с помощью прикладных программ.

В банке данных может быть более одной базы данных. Таким образом, банк данных представляет собой совокупность баз данных (одной или нескольких), систем управления базами данных и набора прикладных программ.

Процесс проектирования баз данных включает 2 этапа: разработку логической организации базы данных и создание базы данных на носителе.

Логическая организация БД - это представление пользователя (проектировщика) о той предметной области, информация о которой должна храниться в банке данных. Результатом логического проектирования является концептуальная (внешняя, информационно- логическая) схема базы данных - логическая модель предметной области. Такая модель отражает три вида информации: сведения об объектах предметной области, их свойствах и отношениях между объектами. Объекты это записи; свойства объектов это данные в полях записей; отношения - связи между типами записей и полями. Такая модель абстрагируется от смыслового содержания данных, отражая формы представления информации и связи между данными.

Логическую модель можно представить несколькими способами. Для информационных систем характерны 2 способа схемного представления данных - графический и табличный.

Графический способ основан на изображении модели данных в виде ориентированного графа, вершины которого служат для отображения типов записей, а дуги - связей между записями. Табличный способ структурирования данных состоит в представлении информации о предметной области в виде одной или нескольких таблиц, заголовок каждой из которых из которых аналогичен типу записи в графической модели данных.

В настоящее время известны 3 логические модели: иерархическая, сетевая и реляционная.

Иерархическая модель данных основана на использовании графического способа: она представляет собой дерево, в вершинах которого располагаются типы записей. Каждая из вершин связана только с одной вершиной вышележащего уровня иерархии.

ФАКУЛЬТЕТ

 

 

 
 

 


ДЕКАНАТ КАФЕДРА КУРС

 

 

ПРЕПОДАВАТЕЛЬ ДИСЦИПЛИНА ГРУППА

 

 

СТУДЕНТ

 

Рис. Иерархическая модель данных.

Поиск данных в такой структуре выполняется всегда по одной из ветвей, начиная с корневого элемента, то есть должен быть указан полный путь движения по ветви. Так для поиска и выборки одного или нескольких экземпляров записи типа СТУДЕНТ необходимо указать корневой элемент ФАКУЛЬТЕТ и элементы КУРС, ГРУППА. Поиск данных в такой модели аналогичен поиску файлов в операционной системе MS DOS.

Сетевая модель данных также использует графический способ представления данных. Концептуальная схема отображается в виде графа. Никаких ограничений на количество связей, входящих в каждую вершину, не накладывается, что позволяет отображать связи между объектами предметной области практически любой степени сложности, в частности кольцевые структуры.

ФАКУЛЬТЕТ

 

 

 
 

 

 


ДЕКАНАТ КАФЕДРА КУРС

 

ПРЕПОДАВАТЕЛЬ ДИСЦИПЛИНА ГРУППА

 
 

 

 


СТУДЕНТ

 

 

Рис. Сетевая модель данных

 

Пример сетевой модели представлен на рис.. Эта модель получена путем добавления в рассмотренную выше иерархическую модель дополнительных связей “ПРЕПОДАВАТЕЛЬ - ДИСЦИПЛИНА” и “ДИСЦИПЛИНА - СТУДЕНТ”.

Реляционная модель данных строится на использовании табличных методов и средств представления данных и манипулирования ими. В реляционной модели информация о предметной области отображается таблицей - отношением. Строка таблицы называется кортежем, столбец - атрибутом.

Отношение характеризуется числом кортежей и числом атрибутов. В отношении не может быть двух одинаковых кортежей. Порядок следования кортежей и атрибутов не играет существенной роли.

Под физической организацией баз данных понимается совокупность методов и средств размещения данных во внешней памяти и созданная на их основе внутренняя (физическая) модель данных. Физическая модель указывает, каким образом записи размещаются в базе данных, как они упорядочиваются, как организуются связи, каким путем можно найти записи и осуществить их выборку. Внутренняя модель разрабатывается средствами СУБД.

Все функции СУБД можно разделить на 3 группы: управление базами данных (система выполняет роль менеджера); разработка, отладка и выполнение прикладных программ (система осуществляет функции транслятора); выполнение вспомогательных операций (сервис).

При запуске СУБД в основную память загружается большая часть управляющих программ (ядро). Остальные модули вызываются по мере необходимости.

Основным признаком классификации СУБД является логическая модель базы данных. Поэтому различают сетевые, иерархические и реляционные СУБД. К числу наиболее распространенных реляционных СУБД относятся dBASE, FoxBase, FoxPro, Clipper, Clarion, Paradox, Acces и др. В настоящее время разработано и используется свыше 20 СУБД. Большинство из них являются реляционными. Они предоставляют пользователю удобные средства интерактивного взаимодействия с базами данных (режим меню) и имеют развитый язык программирования.

 

Базы знаний. Консультационные или экспертные системы базируются на моделировании рассуждений. Это направление является одним из наиболее дискуссионных направлений автоматизации процессов использования права. И хотя большинство экономистов, работающих в этой области, представляют себе круг проблем, связанных с организацией функционирования электронных консультантов, все же попытки создания и использования интеллектуальных консультационных систем во многих сферах права вызывают многочисленные споры. Кроме того, вопросы разграничения прав и ответственности между такими системами и людьми, призванными осуществлять правоприменительные функции, в целом остаются открытыми. Отметим, что, однако, это не мешает появлению значительного числа консультационных систем, реально обеспечивающих решение различных правовых вопросов (от анализа исков до разрешения конфликтных ситуаций) и позволяющих практически исследовать возможность автоматизации интеллектуальных функций, включающих в себя принятие правовых решений.

Консультационные системы или системы поддержки принятия решений, или системы выбора решения, или экспертные системы основаны на исследованиях в области искусственного интеллекта или инженерии знаний.

Исследования по ИИ уходят корнями в далекое прошлое. Природу знаний и природу размышлений изучали Аристотель, Платон и Сократ, но собственная история ИИ как науки началась уже в наше время.

Термин “искусственный интеллект” впервые ввел Джон Маккарти, профессор Стэнфордского университета, автор многих ярких работ по пограммированию. Он же провел первую конференцию по ИИ и начал теоретическую работу, которая привела к созданию символьного языка программирования Лисп.

Первая программа ИИ, которая доказывала теоремы в символьной логике, появилась в 1956 г. в институте Карнеги (США). Авторы этой программы Аллен Ньюэлл и Герберт Саймон основывались на том, что мышление следует понимать как механизм для обработки информации. Почти одновременно с ними та же мысль была высказана в философии, психологии, лингвистике, антропологии, нейрофизиологии и социологии.

Позднее, в 60-е годы, Ньюэлл и Саймон доказали, что большинство человеческих рассуждений может быть представлено с помощью правил вида “ЕСЛИ условие, ТО выполнение действий”. Однако если даже современным компьютерам тяжело обрабатывать за один раз несколько сотен правил, то, как подчеркивал Саймон, человек-эксперт обрабатывает за один раз около 50 000 правил в своей предметной области. А если рассматривать экспертизу обо всем мире в целом, то потребуется миллионы и биллионы правил. За чет чего же можно уместить в памяти компьютера информацию о мире? За счет повышения уровня абстракции представления знаний о мире.

Когда программа доказательства теорем заработала, Ньюэллом и Саймоном была начата разработка системы GPS - универсального решателя проблем, основанного на модели человеческого мыслительного процесса. Эта программа применялась для программирования игровых и некоторых других задач.

Приблизительно в это же время появилась работа психолингвиста Джоржа Миллера “Магическое число семь, плюс или минус два: некоторые ограничения на наши возможности обработки информации”. В этой работе он, в частности, обосновывал, что человек может одновременно работать с 7 порциями информации. Результаты, полученные Миллером, легли в основу когнитивной науки - науки о способах представлени и применения знаний для решения задач, использующих принципы человеческой памяти и моделирование вывода на основе этих принципов.

В области теоретического описания моделей представления знаний большой вклад внес Ноэм Хомский, который представил новую ситему понимания языка, называемую формальной грамматикой, позволяющую структурно описывать язык. кроме того, теория трансформационных грамматик Хомского обеспечила понимание того, как язык можно использовать. Работы Хомского положили теоретическую основу разработки большинства компьютерных языков.

Еще одним источником ИИ является кибернетика, появившаяся в начале 40-х годов. В переводе с греческого “кибернетика” означает “рулевой” Кибернетика - наука об управлении в живых и неживых организмах. Суть кибернетики, согласно одному из ее авторов, американскому ученому Норберту Винеру, состоит из 3-х концепций: учения об обратных связях, учение об информации, формализованное в 1948 г. К. Шенноном, и третьим элементом является электронная вычислительная машина.

В последние годы из общего направления ИИ выделилось поднаправление, связанное с созданием экспертных систем, предназначенных для решения задач экспертного оценивания ситуаций в различных предметных областях.

Понятие экспертной системы. Экспертная система - это машинная программа, которая моделирует знания качественного характера и опыт человека-эксперта. Такая система должна обладать следующими характеристиками:

- способностью рассуждать при неполных и противоречивых данных:

- способностью объяснять цепочку рассуждений понятным для пользователя способом;

- факты и механизм вывода должны быть четко отделены друг от друга;

- конструкция системы должна обеспечивать возможность наращивания базы знаний;

- по окончании работы система должна давать конкретный совет;

- она должна быть экономически выгодна.

Основу ЭС составляет база знаний, хранящая множество фактов и набор правил, полученных от экспертов и из специальной литературы. База знаний отличается от базы данных тем, что если единицы информации в базе данных представляют собой не связанные друг с другом сведения, формулы, теоремы, аксиомы, то в базе знаний те же элементы уже связаны как между собой. так ис понятиями внешнего мира определенными отношениями и сами содержат в себе эти отношения.

Рассмотрим классификацию ЭС по предметным областям, в которых они используются. при этом предметные области определяются основными классами задач, эффективно решаемыми методами экспертных систем. Можно выделить 6 основных классов задач, для решения которых создаются ЭС.

1. Интерпретация данных, то есть анализ поступающих в систему данных с целью идентификации ситуации в предметной области.

2. Диагностика, то есть идентификация критических ситуаций в предметной области на основе интерпретации данных.

3. Контроль, то есть слежение за ходом событий в предметной области с целью определения момента возникновения критической ситуации на основе непрерывной интерпретации данных.

4. Прогнозирование, то есть предсказание возникновения в предметной области тех или иных ситуаций в будущем на основе моделей прошлого и настоящего.

5. Планирование, то есть создание программ действий, выполнение которых позволит достичь поставленные цели.

6. Проектирование, то есть разработка объектов, удовлетворяющих определенным требованиям.

По своему назначению ЭС можно условно разделить на консультационные, или информационные, исследовательские и управляющие. Консультационные предназначены для получения пользователем квалифицированных советов; исследовательские призваны помогать пользователю квалифицированно решать научные задачи; управляющие служат для автоматизации управления процессами в реальном масштабе времени.

рассмотрим структуру, используемую для создания большинства современных экспертных систем.

Структура экспертной системы. Современные экспертные системы включают, как правило, следующие компоненты:

- подсистему приобретения знаний;

- базу знаний;

- машину вывода;

- доску объявлений (рабочую память);

- интерфейс пользователя;

- подсистему объяснения;

- подсистему совершенствования вывода и “очищения” знаний.

Подобная структура обеспечивает пользователю возможность консультаций с системой при решении конкретных задач. При этом система работает как бы в двух средах: среда разработки используется создателем ЭС для введения и представления экспертных знаний, а Среда консультации доступна пользователям (неэкспертам) для получения экспертных знаний и советов.

Подсистема приобретения знаний. приобретение знаний - это сбор, передача и приобретение опыта решения проблем из некоторых источников знаний в компьютерные программы при их создании или расширении. Потенциальные источники знаний включают людей-экспертов, учебники, базы данных, исследовательские отчеты, собственный опыт пользователей.

Извлечение знаний из экспертов - сложная задача, представляющая узкое место в создании ЭС. Для построения базы знаний необходим инженер по знаниям, помогающий эксперту структурировать его знания о предметной области, интерпретируя и интегрируя ответы на вопросы, находя аналогии, предлагая контрпримеры и выявляя концептуальные трудности.

База знаний. Информация в базе знаний - это необходимое для понимания, формирования и решения проблемы. Она содержит два основных элемента: факты (данные) из предметной области и специальные эвристики или правила, которые управляют использованием фактов при решении проблем.

База знаний часто включает мета-правила (правила о правилах) для решения проблем и получения выводов. Эвристики отражают формальные суждения о предметной области. Именно знания, а не чистые факты являются первичным материалом для ЭС. Информация базы знаний переносится в компьютерную программу в процессе представления знаний.

Машина вывода является центральной частью ЭС. Машина вывода посредством формирования и организации последовательности шагов, предпринимаемых для решения проблемы управляет использованием системных знаний.

Основными элементами машины вывода являются:

- интерпретатор (в большинстве систем интерпретатор правил), который выполняет выбранную последовательность шагов, применяя соответствующие правила из базы знаний;

- планировщик, который управляет процессом выполнения последовательности шагов, оценивая эффект применения различных правил с точки зрения приоритетов или других критериев.

Доска объявлений - область рабочей памяти, выделенной для описания текущей проблемы с использованием исходных данных, для записи промежуточных результатов. На доску объявлений записываются текущие гипотезы и управляющая информация: план - какая стратегия выбрана для решения проблемы; повестка - потенциальные действия, ожидающие выполнения; решения - гипотезы и альтернативные способы действий, сгенерированные системой.

Интерфейс пользователя. ЭС содержит языковый процессор для дружественного, проблемно-ориентированного общения между пользователем и компьютером. Это общение может быть организовано с помощью естественного языка, сопровождаться графикой или многооконным меню.

Подсистема объяснения. Возможность проверки соответствия выводов их посылкам имеет важное значение как при передаче опыта, так и при решении проблем. Подсистема объяснения может проследить это соответствие и объяснить поведение ЭС, интерактивно отвечая на вопросы типа: “Как было получено некоторое заключение?”, “Почему некоторая альтернатива была отвергнута?”, “Каков план получения решений?”.

В процессе решения задачи ЭС проводит двусторонний диалог с пользователем, запрашивая его о фактах, касающихся конкретного случая. После получения ответов ЭС, пытается получить заключение. Эта попытка осуществляется машиной вывода, решающей, какая стратегия эвристического поиска должна быть использована для определения порядка применения к данной проблеме знаний из базы знаний. Пользователь может запросить объяснение поведения ЭС и ее заключений. Качество вывода определяется методом, выбранным для представления знаний, объемом базы знаний и мощностью машины вывода.

Модели представления экспертных знаний. Можно выделить 3 наиболее общих метода представления знаний в экспертных системах: правила, фреймы и семантические сети.

Продукционные правила — это упорядоченная пара цепочек символов, содержащая левую и правую части, — посылку и следствие. Идея этого метода принадлежит Э.Посту (1943 г.). Этот метод широко используется в разработке информационных систем.

Вначале правила продукций имели вид:

ЕСЛИ <условия> ТО <действие>.

Слова в угловых скобках являются посылками или ут­верждениями. В дальнейшем они приобрели более общую форму. Наряду с написанной используются следующие формы:

ЕСЛИ <предшествующий> ТО <последующий>

ЕСЛИ <основание> ТО <гипотеза>

 

Таким образом, правило состоит из двух частей. Часть ЕСЛИ указывает "условия", "предшествующий" или "осно­вание", а часть ТО представляет соответственно "заключение", "последующий" или "гипотезу". Перечисленные элементы второй части генерируются при истинности условий первой части.

Примером правила продукции может служить следующее:

ЕСЛИ клиент работает на одном месте более двух лет

ТО клиент имеет постоянную работу.

 

Например, в примере, представленном выше, если кли­ент имеет возраст, равный или выше 18 лет, то мы имеем пра­во заключить, что клиент имеет право претендовать на полу­чение кредита.

На множествен правил задано отношение порядка. В ходе работы с правилами производятся просмотр левых частей правил и сравнение их с символами из базы данных. В случае их совпадений символ в базе данных заменяется на то, что содержится в правой части правила.

Важное место в продукционных моделях занимают стратегии вывода, т. е. перехода от одного правила к другому. Различаются прямой и обратный выводы. При прямом выводе отправной точкой служат предоставленные данные (левые части правил), процесс оценки приостанавливается в узлах и(или) дереве, связывающих в единое целое факты и заключения с отрицанием, причем в качестве заключения используется гипотеза, соответствующая корню дерева. При обратном выводе отправным моментом служит требуемое заключение, которому в конечном счете ставится в соответствие множество фактов, делающих его правомочным. Возможно и совместное использование этих стратегий путем их чередования. В этом случае имеет место двунаправленный вывод.

Пример. Рассмотрим базу знаний задачи по за­кладной для получения кредита банка под залог недвижимого имущества (ссуды). Для получения кредита клиент должен иметь постоянную работу, приемлемый доход, хороший кре­дитный рейтинг и приемлемое имущество (собственность).

Если клиент не имеет постоянной работы, то он дол­жен иметь адекватные активы. Величина кредита не может быть больше 80 процентов стоимости его имущества и клиент должен иметь 20 процентов ценности в кассе банка.

Определение "постоянная работа" состоит в том, что клиент должен иметь одну и ту же работу более двух лет. Определение "адекватные активы" заключается в том, что иму­щество клиента должно быть оценено как десятикратная вели­чина кредита или клиент должен иметь ликвидные активы, оцениваемые как пятикратная величина кредита. "Приемлемое имущество" - это имущество, находящееся на территории рас­положения банка.

 

Проверка кредитного рейтинга проводится вручную.

Смысл "адекватного дохода" состоит в следующем. Ес­ли клиент одиночка, то оплата закладной должна быть менее чем 70 процентов от его чистого дохода.

Если клиент женат, то оплата закладной должна быть менее чем 60 процентов от чистого дохода семьи.

В продукционных правилах мы будем использовать логические операции И, ИЛИ и НЕ.

1. ЕСЛИ клиент имеет постоянную работу

И клиент имеет адекватный доход

И имущество приемлемо

И клиент имеет хороший кредитный рейтинг

И величина кредита меньше 80% стоимости имущества

И клиент имеет 20% стоимости имущества в кассе

ТО одобрить кредит.

 

2. ЕСЛИ клиент имеет адекватные активы

И клиент имеет адекватный доход

И имущество приемлемо

И клиент имеет хороший кредитный рейтинг

И величина кредита меньше 80% стоимости имущества

И клиент имеет 20% стоимости имущества в кассе

ТО одобрить кредит.

 

3. ЕСЛИ клиент имеет работу

И клиент имел более чем два года эту работу

ТО клиент имеет постоянную работу

 

4. ЕСЛИ имущество находится в зоне расположения банка

ИЛИ имущество в запрещенном списке

ТО имущество приемлемо.

 

5. ЕСЛИ доход имеется и адекватен

ИЛИ доход одиночки адекватен

ТО клиент имеет адекватный доход

 

6. ЕСЛИ клиент женат

И оплата закладной меньше 60% чистого дохода семьи

ТО доход семьи адекватен

 

7. ЕСЛИ клиент не женат

И оплата закладной меньше 70% чистого дохода клиента

ТО доход одиночки адекватен

 

8. ЕСЛИ стоимость имущества клиента больше десяти­кратной

величины кредита

ИЛИ ликвидные активы клиента больше пятикрат­ной величины

кредита

ТО клиент имеет адекватные активы.

 

Популярность продукционных правил объясняются не­сколькими причинами:

- большинство знаний можно представить в виде продукционных

правил.

- модульность продукции позволяет добавлять в систе­му новые продукции без изменения прежних.

- продукции могут реализовать любые алгоритмы и, следовательно, любые процедурные знания.

- параллелизм и асинхронность продукций делают их удобной моделью вычислений, отвечающей подобным требо­ваниям новых поколений компьютеров.

Недостаток продукций состоит в том, что при их большом количестве становиться трудоёмкой проверка непротиворечивости системы продукций, например, при добавлении новых правил.

Для компенсации этих недостатков вводятся наряду с продукциями и другие представления, вводящие структуру на множестве правил. Это может быть иерархия, продукций, задание списков свойств для параметров, фреймовые представления и т.п.

В семантической сети представление знаний основано на сетевой структуре. Семантические сети состоят из точек, называемых узлами, и связываю их дуг, описывающих отношения между узлами и связывающих их дуг, описывающих отношения между узлами. Узлы в семантической сети соответствуют объектам, концепциям или событиям, зависящим от вида представляемых знаний. Обычно дуги, используемые для представления иерархии, включают дуги типа isa (является) и has-part (имеет часть).

Например в семантической сети, представляющей корабль, такие его части, как двигательная установка, корпус, котельная, включены один раз на уровне корабля, вместо того, чтобы повторять эти узлы на более низком уровне иерархии, вроде типа корабля или конкретного корабля. Это может сберечь большие объемы памяти. По сети можно затем осуществить поиск, используя знания о смысле отношений, обозначаемых дугами сети, чтобы установить факты вроде “Куин Мери имеет котельную”

 

  КОРАБЛЬ
имеет часть

является

имеет

является часть

               
 
ОКЕАНСКИЙ ЛАЙНЕР
 
  ДВИГАТЕЛЬ
 
  КОРПУС
   
НЕФТЯНОЙ ТАНКЕР
 

 

 


имеет

часть является является

 

 

               
 
ПЛАВАТЕЛЬНЫЙ БАССЕЙН
 
КУИН МЕРИ
 
  ЛИВЕРПУЛЬ
 
  КОТЕЛ

 

 





Поделиться с друзьями:


Дата добавления: 2014-10-17; Просмотров: 3681; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.008 сек.