Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Базы данных

Свойства баз знаний

Применение баз знаний

База знаний — важный компонент интеллектуальной системы. Наиболее известный класс таких программ — экспертные системы. Они предназначены для построения способа решения специализированных проблем, основываясь на записях БЗ и на пользовательском описании ситуации. Простые базы знаний могут использоваться для создания экспертных систем и хранения данных об организации: документации, руководств, статей технического обеспечения. Главная цель создания таких баз — помочь менее опытным людям найти существующее описание способа решения какой-либо проблемы предметной области.

Машинное обучение: Это модификация своей БЗ в процессе работы интеллектуальной системы, адаптация к проблемной области. Аналогична человеческой способности «набирать опыт».

Автоматическое доказательство (вывод): Способность системы выводить новые знания из старых, находить закономерности в БЗ. Некоторые авторы считают, что БЗ отличается от базы данных наличием механизма вывода.

Интроспекция: Нахождение противоречий, нестыковок в БЗ, слежение за правильной организацией БЗ.

Доказательство заключения: Способность системы «объяснить» ход её рассуждений по нахождению решения, причем «по первому требованию».

На прошлом занятии мы рассмотрели с вами различные формы организации данных, используемые в ИС. Как правило, информационной базой ИС является база данных.

База данных – совокупность структурированных данных, относящихся к определенной предметной области и совместно используемых несколькими приложениями и/или пользователями.

Достоинством баз данных являются:

· хорошая структуризация информации;

· поддержание ее целостности и непротиворечивости;

· минимальная избыточность представления в памяти компьютера;

· снижения трудоемкости сбора и обновления данных (однократная подготовка и многократное применение данных для решения различных задач различными должностными лицами);

· независимость прикладных программ от данных содержащихся в БД;

Для реализации технологии баз данных ИС должна включать следующие 2 компонентов: СУБД – комплекс программных и языковых средств, необходимых для создания баз данных, поиска, добавления и удаления данных в них, а также других основных операций с БД. Централизованный характер управления данными предполагает наличие администратора БД – человека, отвечающего за проектирование БД, ее эффективное использование и сопровождение. Не менее важной функцией администратора является поддержка целостности базы данных.

Фундаментом технологий баз данных является модель данных. Модель описывает набор понятий и признаков, которыми должна обладать конкретная СУБД и управляемые ей базы данных, которые основываются на этой модели.

Выделяют 4 типа моделей данных: иерархическая, сетевая, реляционная и объектно-ориентированная. Каждой модели данных соответствует одноименный тип базы данных, т.е. существуют иерархические, сетевые, реляционные и объектно-ориентированные базы данных.

Иерархическая модель данных строится по принципу иерархии типов объектов, т. е. один тип объекта является главным, а остальные, находящиеся на низших уровнях иерархии, — подчиненными. В иерархической модели данные организованы в виде дерева (древовидной структуры).

Деревом в информатике называют структуру, состоящую из корневого элемента и множества подчиненных ему элементов (), в которой отношения между элементами носят подчиненный вертикальный характер. Иерархическое дерево имеет только одну вершину (корень дерева), не подчиненную никакой другой вершине и находящуюся на самом верхнем (первом) уровне. Подчиненные элементы находятся на втором, третьем, и последующих уровнях. Количество деревьев в базе данных определяется числом корневых записей. К каждой записи иерархической БД существует только один путь от корневой записи. Т.е. чтобы получить доступ к элементу 4-го уровня необходимо последовательно пройти путь, включающий корневой элемент, элемент второго уровня этой ветви, и элемент 3-го уровня ветви, содержащей этот элемент.

Для иерархической модели данных характерны вертикальные связи (от корня дерева к элементам более низких уровней). Горизонтальные связи в этой модели не допускаются. Примером простого иерархического представления может служить административная структура организации.

Сетевой подход к организации данных является расширением иерархического. В иерархических структурах запись-потомок должна иметь в точности одного предка; в сетевой структуре данных потомок может иметь любое число предков. На связи между объектами в сетевых моделях не накладывается никаких ограничений – возможны как вертикальные, так и горизонтальные связи, поэтому каждый элемент сетевой структуры данных может быть связан с любым другим элементом. Такая структура данных называется сетью.

В сетевой модели данных понятия главного и подчиненных объектов несколько расширены. Любой объект может быть и главным, и подчиненным (в сетевой модели главный объект обозначается термином «владелец набора», а подчиненный — термином «член набора»). Это означает, что каждый объект может участвовать в любом числе взаимосвязей. Примером сложной сетевой структуры может служить структура базы данных, содержащая сведения об учащихся, занимающихся в различных кружках. При этом возможны занятия одного и того же ученика в разных кружках, а также посещение несколькими учениками занятий одного кружка. Сетевые и иерархические структуры можно свести к простым двумерным таблицам.

Несмотря на некоторые различия – сетевая и иерархическая модели имеют много общего. Общее название иерархической и сетевой модели данных – ранние (дореляционные) БД. Считаются в настоящее время устаревшими.

o Недостатки ранних БД:

o Слишком сложно пользоваться;

o Фактически необходимы знания о физической организации;

o Прикладные системы зависят от этой организации;

o Их логика перегружена деталями организации доступа к БД.

На сегодняшний день основной моделью данных является реляционная модель. Своим успехом реляционная модель данных во многом обязана, в первую очередь тому, что опирается на строгий математический аппарат (Реляционная алгебра). Реляционные базы данных организованы в виде набора отношений ее элементов и представляют связанную между собой совокупность таблиц. Каждая таблица БД представляется как совокупность строк и столбцов, где строки соответствуют экземпляру объекта, конкретному событию или явлению, а столбцы – характеристикам этого объекта, события или явления.

Поскольку реляционные базы данных являются наиболее распространенными в наши дни их следует описать более подробно.

Теория реляционных баз данных, разработанная в 70-х годах в США докто­ром Э. Коддом, имеет под собой мощную математическую основу, описывающую правила эффективной организации данных.

Реляционная база данных — это совокупность отношений, содержащих всю ин­формацию, которая должна храниться в базе данных. То есть база данных пред­ставляет набор таблиц, необходимых для хранения всех данных. Таблицы реля­ционной базы данных логически связаны между собой.

Таблица состоит из столбцов (полей) и строк (записей); имеет имя, уникаль­ное внутри базы данных. Таблица отражает тип объекта реального мира (сущ­ность), а каждая ее строка— конкретный объект. Каждый столбец таблицы — это совокупность значений конк­ретного атрибута объекта. Значения выбираются из множества всех возможных значений атрибута объек­та, которое называется доменом (domain).

Общие правила построения реляционных БД:

Каждая таблица имеет уникальное в базе данных имя и состоит из однотипных строк.

Каждая таблица состоит из фиксированного числа столбцов и значений. В одном столбце строки не может быть сохранено более одного значения. Например, если есть таблица с информацией об авторе, дате издания, тираже и т. д., то в столбце с именем автора не может храниться более одной фамилии. Если книга написана двумя и более авторами, придется использовать дополнительные таблицы.

Ни в какой момент времени в таблице не найдется двух строк, дублирующих друг друга. Строки должны отличаться хотя бы одним значением, чтобы была возможность однозначно идентифицировать любую строку таблицы.

Каждому столбцу присваивается уникальное в пределах таблицы имя; для него устанавливается конкретный тип данных, чтобы в этом столбце размещались однородные значения (даты, фамилии, телефоны, денежные суммы и т. д.).

Полное информационное содержание базы данных представляется в виде яв­ных значений самих данных, и такой метод представления является единствен­ным. Например, связь между таблицами осуществляется на основе хранимых в соответствующих столбцах данных, а не на основе каких-либо указателей, искусственно определяющих связи.

При обработке данных можно свободно обращаться к любой строке или лю­бому столбцу таблицы. Значения, хранимые в таблице, не накладывают ни­каких ограничений на очередность обращения к данным.

Порядок следования строк и столбцов может быть произвольным.

Для идентификации объектов в БД (строк) используется первичный ключ – один или несколько столбцов, однозначно определяющий строку (например, серия и номер паспорта могут однозначно определять человека в БД). Первичный ключ должен быть уникальным (не должно быть двух или более строк с одинаковым значением первичного ключа) и минимально достаточным (это означает, что не стоит со­здавать ключ, включающий и номер паспорта, и идентификационный номер. Достаточно использовать любой из этих атрибутов, чтобы однозначно иденти­фицировать запись, кортеж)

Взаимосвязь таблиц является важнейшим элементом реляционной модели данных. Она поддерживается внешними ключами (foreign key).

Работа с реляционной БД строится на использовании запросов – специальных обращений к БД. (например, запрос на поиск нужной информации). Для построения запросов к реляционной БД был разработан язык SQL (язык структурированных запросов). На сегодняшний день, это стандарт в реляционных СУБД.

Объекты предметной области, занесенные в БД, могут находиться друг с другом в определенных отношениях (функциональных, подчиненности, видовых и т.д.). Говорят, что между ними существует связь. Существуют 4 разновидности связей между таблицами базы данных.

· один к одному (1:1). Одному экземпляру объекта А соответствует один экземпляр объекта Б или не соответствует ни один экземпляр объекта Б. Это соотношение симметрично. Примером может служить связь таких объектов как “муж” и “жена”;

· один ко многим (1:М или 1: ¥). Одному экземпляру Объекта А соответствует любое количество (0, 1, 2, …) экземпляров объекта Б, а любому экземпляру объекта Б соответствует один экземпляр объекта А. Примером может служить отношение объектов “учебная группа” и “студент”;

· многие к одному. По сути, этот тип связи является обратным к предыдущему. Например, несколько экземпляров объекта «сотрудник» соответствуют одному экземпляру «Отдел предприятия».

Многие ко многим. Например, такой вид связи возникает между такими объектами “учебные группы” и “учебные дисциплины”. Отношение "многие-ко-многим" имеет место, когда:

а) записи в родительской таблице может соответствовать больше одной записи в дочерней таблице;

б) записи в дочерней таблице может соответствовать больше одной записи в родительской таблице.

Многие СУБД не поддерживают связи "многие-ко-многим". Для реализации подобной связи используют 3-ю таблицу (для хранения связей между ними).

Для того, чтобы структура таблиц и связей в реляционных БД была оптимальной применяют процедуру нормализации отношений.

Нормализация отношений способствует построению эффективной структуры данных, что обеспечивает:

1) обеспечить быстрый доступ к данным;

2) исключить ненужное повторение данных, которое может являться причиной ошибок при вводе, а также привести к нерациональному использованию дискового пространства; (обеспечивает минимальную избыточность данных)

3) обеспечить целостность данных, т.о. чтобы при изменении одних объектов автоматически происходило соответствующее изменение связанных с ними объектов.

В последние годы четко обозначилась тенденция развития СУБД в объектно-ориентированом направлении. Объектно-ориентированная модель считается дальнейшим развитием и расширением реляционного подхода. Однако отсутствие у объектно-ориентированных моделей развитого математического аппарата, какой существует для реляционных моделей, является препятствием для их повсеместного распространения. В наши дни объектно-ориентированные модели, несмотря на их перспективность, не стандартизированы.

<== предыдущая лекция | следующая лекция ==>
Формы организации данных в информационных системах | Организация баз данных
Поделиться с друзьями:


Дата добавления: 2014-01-13; Просмотров: 895; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.022 сек.