КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Базы данных
Свойства баз знаний Применение баз знаний База знаний — важный компонент интеллектуальной системы. Наиболее известный класс таких программ — экспертные системы. Они предназначены для построения способа решения специализированных проблем, основываясь на записях БЗ и на пользовательском описании ситуации. Простые базы знаний могут использоваться для создания экспертных систем и хранения данных об организации: документации, руководств, статей технического обеспечения. Главная цель создания таких баз — помочь менее опытным людям найти существующее описание способа решения какой-либо проблемы предметной области. Машинное обучение: Это модификация своей БЗ в процессе работы интеллектуальной системы, адаптация к проблемной области. Аналогична человеческой способности «набирать опыт». Автоматическое доказательство (вывод): Способность системы выводить новые знания из старых, находить закономерности в БЗ. Некоторые авторы считают, что БЗ отличается от базы данных наличием механизма вывода. Интроспекция: Нахождение противоречий, нестыковок в БЗ, слежение за правильной организацией БЗ. Доказательство заключения: Способность системы «объяснить» ход её рассуждений по нахождению решения, причем «по первому требованию». На прошлом занятии мы рассмотрели с вами различные формы организации данных, используемые в ИС. Как правило, информационной базой ИС является база данных. База данных – совокупность структурированных данных, относящихся к определенной предметной области и совместно используемых несколькими приложениями и/или пользователями. Достоинством баз данных являются: · хорошая структуризация информации;
· поддержание ее целостности и непротиворечивости; · минимальная избыточность представления в памяти компьютера; · снижения трудоемкости сбора и обновления данных (однократная подготовка и многократное применение данных для решения различных задач различными должностными лицами); · независимость прикладных программ от данных содержащихся в БД; Для реализации технологии баз данных ИС должна включать следующие 2 компонентов: СУБД – комплекс программных и языковых средств, необходимых для создания баз данных, поиска, добавления и удаления данных в них, а также других основных операций с БД. Централизованный характер управления данными предполагает наличие администратора БД – человека, отвечающего за проектирование БД, ее эффективное использование и сопровождение. Не менее важной функцией администратора является поддержка целостности базы данных. Фундаментом технологий баз данных является модель данных. Модель описывает набор понятий и признаков, которыми должна обладать конкретная СУБД и управляемые ей базы данных, которые основываются на этой модели. Выделяют 4 типа моделей данных: иерархическая, сетевая, реляционная и объектно-ориентированная. Каждой модели данных соответствует одноименный тип базы данных, т.е. существуют иерархические, сетевые, реляционные и объектно-ориентированные базы данных. Иерархическая модель данных строится по принципу иерархии типов объектов, т. е. один тип объекта является главным, а остальные, находящиеся на низших уровнях иерархии, — подчиненными. В иерархической модели данные организованы в виде дерева (древовидной структуры). Деревом в информатике называют структуру, состоящую из корневого элемента и множества подчиненных ему элементов (), в которой отношения между элементами носят подчиненный вертикальный характер. Иерархическое дерево имеет только одну вершину (корень дерева), не подчиненную никакой другой вершине и находящуюся на самом верхнем (первом) уровне. Подчиненные элементы находятся на втором, третьем, и последующих уровнях. Количество деревьев в базе данных определяется числом корневых записей. К каждой записи иерархической БД существует только один путь от корневой записи. Т.е. чтобы получить доступ к элементу 4-го уровня необходимо последовательно пройти путь, включающий корневой элемент, элемент второго уровня этой ветви, и элемент 3-го уровня ветви, содержащей этот элемент.
Для иерархической модели данных характерны вертикальные связи (от корня дерева к элементам более низких уровней). Горизонтальные связи в этой модели не допускаются. Примером простого иерархического представления может служить административная структура организации. Сетевой подход к организации данных является расширением иерархического. В иерархических структурах запись-потомок должна иметь в точности одного предка; в сетевой структуре данных потомок может иметь любое число предков. На связи между объектами в сетевых моделях не накладывается никаких ограничений – возможны как вертикальные, так и горизонтальные связи, поэтому каждый элемент сетевой структуры данных может быть связан с любым другим элементом. Такая структура данных называется сетью. В сетевой модели данных понятия главного и подчиненных объектов несколько расширены. Любой объект может быть и главным, и подчиненным (в сетевой модели главный объект обозначается термином «владелец набора», а подчиненный — термином «член набора»). Это означает, что каждый объект может участвовать в любом числе взаимосвязей. Примером сложной сетевой структуры может служить структура базы данных, содержащая сведения об учащихся, занимающихся в различных кружках. При этом возможны занятия одного и того же ученика в разных кружках, а также посещение несколькими учениками занятий одного кружка. Сетевые и иерархические структуры можно свести к простым двумерным таблицам. Несмотря на некоторые различия – сетевая и иерархическая модели имеют много общего. Общее название иерархической и сетевой модели данных – ранние (дореляционные) БД. Считаются в настоящее время устаревшими.
o Недостатки ранних БД: o Слишком сложно пользоваться; o Фактически необходимы знания о физической организации; o Прикладные системы зависят от этой организации; o Их логика перегружена деталями организации доступа к БД. На сегодняшний день основной моделью данных является реляционная модель. Своим успехом реляционная модель данных во многом обязана, в первую очередь тому, что опирается на строгий математический аппарат (Реляционная алгебра). Реляционные базы данных организованы в виде набора отношений ее элементов и представляют связанную между собой совокупность таблиц. Каждая таблица БД представляется как совокупность строк и столбцов, где строки соответствуют экземпляру объекта, конкретному событию или явлению, а столбцы – характеристикам этого объекта, события или явления. Поскольку реляционные базы данных являются наиболее распространенными в наши дни их следует описать более подробно. Теория реляционных баз данных, разработанная в 70-х годах в США доктором Э. Коддом, имеет под собой мощную математическую основу, описывающую правила эффективной организации данных. Реляционная база данных — это совокупность отношений, содержащих всю информацию, которая должна храниться в базе данных. То есть база данных представляет набор таблиц, необходимых для хранения всех данных. Таблицы реляционной базы данных логически связаны между собой. Таблица состоит из столбцов (полей) и строк (записей); имеет имя, уникальное внутри базы данных. Таблица отражает тип объекта реального мира (сущность), а каждая ее строка— конкретный объект. Каждый столбец таблицы — это совокупность значений конкретного атрибута объекта. Значения выбираются из множества всех возможных значений атрибута объекта, которое называется доменом (domain). Общие правила построения реляционных БД: Каждая таблица имеет уникальное в базе данных имя и состоит из однотипных строк. Каждая таблица состоит из фиксированного числа столбцов и значений. В одном столбце строки не может быть сохранено более одного значения. Например, если есть таблица с информацией об авторе, дате издания, тираже и т. д., то в столбце с именем автора не может храниться более одной фамилии. Если книга написана двумя и более авторами, придется использовать дополнительные таблицы.
Ни в какой момент времени в таблице не найдется двух строк, дублирующих друг друга. Строки должны отличаться хотя бы одним значением, чтобы была возможность однозначно идентифицировать любую строку таблицы. Каждому столбцу присваивается уникальное в пределах таблицы имя; для него устанавливается конкретный тип данных, чтобы в этом столбце размещались однородные значения (даты, фамилии, телефоны, денежные суммы и т. д.). Полное информационное содержание базы данных представляется в виде явных значений самих данных, и такой метод представления является единственным. Например, связь между таблицами осуществляется на основе хранимых в соответствующих столбцах данных, а не на основе каких-либо указателей, искусственно определяющих связи. При обработке данных можно свободно обращаться к любой строке или любому столбцу таблицы. Значения, хранимые в таблице, не накладывают никаких ограничений на очередность обращения к данным. Порядок следования строк и столбцов может быть произвольным. Для идентификации объектов в БД (строк) используется первичный ключ – один или несколько столбцов, однозначно определяющий строку (например, серия и номер паспорта могут однозначно определять человека в БД). Первичный ключ должен быть уникальным (не должно быть двух или более строк с одинаковым значением первичного ключа) и минимально достаточным (это означает, что не стоит создавать ключ, включающий и номер паспорта, и идентификационный номер. Достаточно использовать любой из этих атрибутов, чтобы однозначно идентифицировать запись, кортеж) Взаимосвязь таблиц является важнейшим элементом реляционной модели данных. Она поддерживается внешними ключами (foreign key). Работа с реляционной БД строится на использовании запросов – специальных обращений к БД. (например, запрос на поиск нужной информации). Для построения запросов к реляционной БД был разработан язык SQL (язык структурированных запросов). На сегодняшний день, это стандарт в реляционных СУБД. Объекты предметной области, занесенные в БД, могут находиться друг с другом в определенных отношениях (функциональных, подчиненности, видовых и т.д.). Говорят, что между ними существует связь. Существуют 4 разновидности связей между таблицами базы данных. · один к одному (1:1). Одному экземпляру объекта А соответствует один экземпляр объекта Б или не соответствует ни один экземпляр объекта Б. Это соотношение симметрично. Примером может служить связь таких объектов как “муж” и “жена”; · один ко многим (1:М или 1: ¥). Одному экземпляру Объекта А соответствует любое количество (0, 1, 2, …) экземпляров объекта Б, а любому экземпляру объекта Б соответствует один экземпляр объекта А. Примером может служить отношение объектов “учебная группа” и “студент”; · многие к одному. По сути, этот тип связи является обратным к предыдущему. Например, несколько экземпляров объекта «сотрудник» соответствуют одному экземпляру «Отдел предприятия». Многие ко многим. Например, такой вид связи возникает между такими объектами “учебные группы” и “учебные дисциплины”. Отношение "многие-ко-многим" имеет место, когда: а) записи в родительской таблице может соответствовать больше одной записи в дочерней таблице; б) записи в дочерней таблице может соответствовать больше одной записи в родительской таблице. Многие СУБД не поддерживают связи "многие-ко-многим". Для реализации подобной связи используют 3-ю таблицу (для хранения связей между ними). Для того, чтобы структура таблиц и связей в реляционных БД была оптимальной применяют процедуру нормализации отношений. Нормализация отношений способствует построению эффективной структуры данных, что обеспечивает: 1) обеспечить быстрый доступ к данным; 2) исключить ненужное повторение данных, которое может являться причиной ошибок при вводе, а также привести к нерациональному использованию дискового пространства; (обеспечивает минимальную избыточность данных) 3) обеспечить целостность данных, т.о. чтобы при изменении одних объектов автоматически происходило соответствующее изменение связанных с ними объектов. В последние годы четко обозначилась тенденция развития СУБД в объектно-ориентированом направлении. Объектно-ориентированная модель считается дальнейшим развитием и расширением реляционного подхода. Однако отсутствие у объектно-ориентированных моделей развитого математического аппарата, какой существует для реляционных моделей, является препятствием для их повсеместного распространения. В наши дни объектно-ориентированные модели, несмотря на их перспективность, не стандартизированы.
Дата добавления: 2014-01-13; Просмотров: 895; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |