Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Отображение один к одному полное




Отображение один к одному частичное.

Полное функциональное отображение.

Отображение без ограничений.

N-арная связь (множество связей между многими сущностями)

Бинарная связь.

(Кафедра СС) 1-------------(Препод-Кафедра АС)----------------N (Преподаватель СС)

Преподаватели: Табл связей: Кафедры:

Код препод ФИО Должность   Код препод Код кафедры   Код кафедры Название Тел
П1 Иванов     П1 К2   К1 ИВТ  
П2 Петров     П2 К1   К2 ПМ  
П3 Сидоров           К3 АСОИУ  

Дисциплина--------------Расписание (АС) -----------Преподаватель

Аудитория-----------------| | |-----------------Группа

Пара-------------------------|

Связь – ассоциирование двух или более сущностей

Кардинальные числа – хар-ка отображения, хар-зующая число Эл-тов S1, связанных с одним числом из S2.

S1(n,m): n – минимальное число Эл-тов S1, связанных с одним элементом в S2, m – максимальное число Эл-тов S1, связанных с одним элементом S2. n,m – кардинальные числа.

Виды отображений:

R(S1(0,∞):S2(0, ∞)) – любой элемент S2 может

быть связан минимум с 0 и максимум с ∞

элементами S1 и наоборот.

2. Отображение многие ко многим.

R(S1(n1,m1):S2(n2,m2)) – любой элемент S2

может быть связан минимум с n1 и максимум с m1

элементами S1 и любой элемент S1 может быть

связан минимум с n2 и максимум с m2

элементами S2.

3. Отображение, полностью определенное на S2.

R(S1(0,∞):S2(1,∞)) – каждый элемент S1

связан по крайней мере с одним

элементом S2.

R(S1(1,1):S2(0,∞)) – каждый элемент S2

отображается точно одним

элементом S1.

5. Частичное функциональное отображение.

R(S1(0,1):S2(0, ∞)) – каждый элемент S2

отображается не более, чем одним элементом S1.

R(S1(0,1):S2(0, 1)) – каждый элемент S2

отображается не более, чем одним элементом S1,

и наоборот.

R(S1(1,1):S2(1, 1)) – каждый элемент S2

отображается ровно одним элементом S1,

и наоборот.

Пример. Связь 1→∞: S1(1,1) → S2(0, ∞)

 

 

9. Оптимизация структуры данных. Понятие ключа отношения. Первичный и вторичный ключ. Транзитивные, неполные функциональные и многозначные зависимости атрибутов.

Структура данных - атрибутивная форма представления свойств и связей предметной области, ориентированная на выражение описания данных средствами формальных языков и т.о. учитываются возможности и ограничения конкретных средств, с целью сведения описаний к стандартным типам и регулярным связям. Структура данных с т.з. программирования – это способ отображения значений в памяти – размер области и порядок ее выделения(который и определит характер процедуры адресации – выборки.)

Оптимизация структур баз данных с учетом требований к достоверности данных

Эффективность и надежность функционирования автоматизированных информационно–управляющих систем (АИУС) существенно зависит от достоверности данных, содержащихся в базах данных (БД). Анализ факторов, влияющих на качество и эффективность процессов проектирования и эксплуатации БД, позволяет выделить следующие их характерные особенности, которые определяют специфику исследования вопросов обеспечения достоверности информации: наличие большого количества пользователей и решаемых ими задач с различными требованиями к достоверности данных; хранение в БД большого объема разнородной информации, требующей эффективных мер по обеспечению целостности и достоверности хранимых данных; усложнение структур хранения и доступов к данным; хранение в БД как собственно данных, так и связей (отношений) между ними, что обусловливает необходимость комплексного рассмотрения проблемы повышения достоверности информации в БД; обеспечение возможности параллельного доступа пользователей к данным.

Необходимый уровень достоверности данных БД может быть достигнут как структурными методами, обеспечивающими анализ и синтез оптимальных канонических, логических и физических структур БД, так и применением определенных механизмов и систем повышения достоверности данных в БД. В работе предложены аналитические выражения для определения достоверности структур данных при отображении предметной области АИУС в каноническую структуру БД, канонической структуры БД – в логическую, логической структуры БД – в физическую структуру, а также определения достоверности хранимой в БД информации. Разработан комплекс моделей и методов синтеза оптимальных логических и физических структур БД по критериям эффективности, коррелированным с требованиями достоверности данных. К ним относятся: минимум числа точек входа и числа альтернативных путей доступа к данным; минимум суммарной длины путей доступа к искомым данным; максимум достоверности хранения и обработки данных. Поставлена и решена задача выбора оптимальных методов контроля данных.

Результатами решения поставленных задач являются оптимальные с учетом требований к достоверности данных логические и физические структуры БД (состав и структуры логических записей и связей, структуры размещения в памяти ЭВМ и др. характеристики), а также производится выбор оптимальных методов контроля данных в физической структуре БД.

Первичный ключ (ПК) – одно или несколько полей, однозначно идентифицирующих запись. Если первичный ключ состоит из одного поля, он называется простым, если из нескольких – составным ключом. Вторичный ключ (ВК) – поле, значение которого может повторяться в нескольких записях файла, т.е. он не является уникальным. Если по значению первичного ключа может быть найдет один единственный экземпляр записи, то по вторичному – несколько. Название структуры данных используется в ряде СУБД, что делает эти понятия в определенном смысле универсальными. Индексирование – средство эффективного доступа по ключу к записям. При индексировании создается дополнительный индексный файл, который содержит в упорядоченном виде все значения ключа файла данных. Для каждого значения ключа в индексном файле содержится указатель на соответствующую запись файла данных. При наличии индексного файла, размеры которого меньше основного файла, по заданному ключу быстро отыскивается запись. С помощью указателя на запись в файле данных осуществляется прямой доступ к этой записи. Индексирование может производиться не только по первичному ключу, но и по вторичному. Реляционная модель представляет собой базу данных в виде множества взаимосвязанных отношений. В каждой связи одно отношение может выступать как основное, а другое отношение выступает в роли подчиненного. Таким образом, один кортеж основного отношения может быть связан с несколькими кортежами подчиненного отношения. Для поддержки этих связей оба отношения должны содержать наборы атрибутов, по которым они связаны. В основном отношении это первичный ключ отношения, который однозначно определяет кортеж основного отношения. В подчиненном отношении для моделирования связи должен присутствовать набор атрибутов, соответствующий первичному ключу основного отношения. Однако здесь этот набор атрибутов уже является вторичным ключом или внешним ключом, т.е. он определяет множество кортежей отношения, которые связаны с единственным кортежем основного отношения.

Один из способов структуризации данных является использование абстракций. Абстракция - совокупность предметов или их деталей, которые можно рассматривать как единое целое. Абстрагирование позволяет рассмотреть в объектах и окружающем мире только существенное, опуская детали. Классификация: 1. Обобщение (классификация, обобщение). 2. Агрегация. Обобщение используется для образования новых категорий данных. Агрегация позволяет на основе одних категорий данных, создавать новые, более общие. Объект – конкретный экземпляр. Класс – множество подобных объектов. 1)Обобщения: Классификация, Обобщение. Процесс выражения класса через объект или класс называется обобщением. Классификация – выражение класса через объект (обратно – экземпляризация). Обобщение – выражения класса через класс (обратно – специализация)

2)Иерархия агрегации:

Пример: Агрегат – автомобиль; Способы агрегирования – марка бензина, стоимость автомобиля, владелец автомобиля.

 

Поле В таблицы функционально зависит от поля А той же таблицы в том и только в том случае, когда в любой заданный момент времени для каждого из различных значений поля А обязательно существует только одно из различ­ных значений поля В. Отметим, что здесь допускается, что поля А и В могут быть составными. Полная функциональная зависимость. Поле В находится в полной функциональной зависимости от составного поля А, если оно функционально зависит от А и не зависит функционально от любого подмножества поля А.

Многозначная зависимость. Поле А многозначно определяет поле В той же таблицы, если для каждого значения поля А существует хорошо определенное множество соот­ветствующих значений В. Транзитивная зависимость: Если А→В→С, то А→С – транзитивная зависимость.

 

 

10. Нормализация: первая, вторая, третья, четвертая нормальные формы.

Нормализация – разбиение таблицы на несколько, которые обладают лучшими свойствами при обновлении, вставке и удалении данных. Т.е. нормализация представляет собой процесс последовательной замены таблицы ее полными декомпозициями до тех пор, пока все они не будут находиться в 5НФ, однако, на практике достаточно привести таблицы к НФБК.

1. Отношение находится в первой нормальной форме (1НФ) тогда и только тогда, когда ни одна из его строк не содержит в любом своем поле одного значения и ни одного из ключевых полей отношения не пусто. По 1, любое отношение будет находиться в 1НФ, т.е. отношение, удовлетворяющее свойствам отношений: в отношении нет одинаковых кортежей; кортежи не упорядочены; атрибуты не упорядочены и различаются по наименованию; все значения атрибутов атомарны.

2. Отношение находится во второй нормальной форме (2НФ) тогда и только тогда, когда отношение находится в 1НФ и нет неключевых атрибутов, зависящих от части сложного ключа (т.е. все поля, не входящие в первичный ключ, связаны полной функциональной зависимостью с первичным ключом). Если потенциальный ключ является простым, то отношение автоматически находится в 2НФ. Чтобы устранить зависимость атрибутов от части сложного ключа, необходимо произвести декомпозицию отношения на несколько отношений. Атрибуты, которые зависят от части сложного ключа, выносятся в отдельное отношение. Атрибуты отношения называются взаимно-независимыми, если ни один из них не является функционально зависимым от другого.

3. Отношение находится в третьей нормальной форме (3НФ) тогда и только тогда, когда отношение находятся в 2НФ и все неключевые атрибуты взаимно независимы (т.е. ни одно из неключевые полей отношения не зависит функционально от любого другого неключевого поля). Чтобы устранить зависимость неключевых атрибутов, нужно произвести декомпозицию отношения на несколько отношений. При этом те неключевые атрибуты, которые являются зависимыми, выносятся в отдельное отношение. При приведении отношений при помощи алгоритма нормализации к отношениям в 3НФ предполагается, что все отношения содержат один потенциальный ключ. Это не всегда верно. Бывают случаи, когда отношение может содержать несколько ключей.

4. Отношение находится в нормальной форме Байса-Кодда (НФБК) тогда и только тогда, когда детерминанты всех функциональных зависимостей являются потенциальными ключами (либо - если любая функциональная зависимость между его палями сводится к полной функциональной зависимости от возможного ключа). Если отношение находится в НФБК, то оно автоматически находится в 3НФ, что следует из определения 4. Чтобы устранить зависимость от детерминантов, не являющихся потенциальными ключами, следует провести декомпозицию, вынося эти детерминанты и зависимые от них части в отдельное отношение. Бывают случаи, когда отношение не содержит никаких функциональных зависимостей. Т.е. отношение является полностью ключевым, т.е. ключом отношения является все множество атрибутов. Т.о., мы имеем многозначную зависимость, т.к. взаимосвязь между атрибутами все-таки имеется.

5. Отношение находится в четвертой нормальной форме (4НФ) тогда и только тогда, когда отношение находится в НФБК и не содержит нетривиальных многозначных зависимостей. Отношения с нетривиальными многозначными зависимостями возникают, как правило, в результате естественного соединения двух отношений по общему полю, которое не является ключевым ни в одном из отношений. Реально это ведет к хранению в одном отношении информации о двух независимых сущностях. Для устранения нетривиальных многозначных зависимостей можно декомпозировать исходное отношение на несколько новых.

 

11. Операции. Навигационные и спецификационные операции. Действия над данными.

Операции средствами ЯМДпереводят БД из одного состояния в другое. Состав БД соответствует конкретной глобальной схеме и выполнение операции не приводит к изменению свойств данных, отраж в схеме.

Операции: Действие опред характер операции: – установка тек логич позиции БД – выборка - вкл/добавление в БД – удаление – обновление/модификация; Селекция, содержащая критерии отбора данных над кот б действие – посредством указания логич позиции – посредством значения данных – посредством связей м/д данными.

Операции м б навигационные (результат равен объекту), спецификационные (результат равен новой структуре), процедурные.

Действия над данными: объединение, пересечение, разность, селекция, проекция(выбор столбцов), естественное объединение. Процедуры – последовательность операций в БД выполн при опред условиях. Составные части процедур: условие, действие, уведомление.

 

12. Виды и способы селекции данных. Алгебра отношений. Объединение, пересечение, разность, проекция, соединение.

Селекция – ограничение. Селекция по значению – форма анализа атрибута. Чаще всего имеет вид: <имя атрибута, операционные условия селекции, значения>. Всего 6 видов селекции 1. Запрос на значение атрибута: А(О)∆? 2.перечислить сущности имеющ задан значение атрибута: А(?)∆V 3. перечислить все атрибуты в задан сущности имеющ знач в данн требовании:?(O)∆V 4.Перечис все атрибуты и их значения:?(O)∆?. 5.перечислить знач данного атрибута во всех сущностях: A(?)∆? 6. Перечис атрибуты имеющ заданное значение в любой из сущностей:?(?)∆V (А-атрибут, ∆ - операционое условие, V(Value)-значение атрибута, О – отношение,?-значение)

Язык описания данных (DDL - Data Definition Language), предназначен для описания данных на разных уровнях абстракции: внешнем, логическом и внутреннем.

Язык манипулирования данными (DML - Data Manipulation Language) используется для обработки данных, их преобразований и написания программ. DML может быть базовым или автономным.

Реляционная алгебра представляет собой основу доступа к реляционным данным. Основная цель алгебры – обеспечить запись выражений. Отношение: подмножество прямого произведения множеств A1 х A2 х …х An={<a1,a2,…,an>},где а1€A1,…,an € An. Объединение: Т1:спорт,Т2:наука,Т3:студент.Спорт (секция, ФИО, группа). Наука (кружок, ФИО, Группа). Студент (№студ билета, ФИО, пол, группа, адрес). Т=Т1UТ2={t/ t=T1 U t/ t=T2}-активный студент(или спорт или наука). Пересечение: Т=Т1 ∩ Т2={t/ t € Т1& t/ t € T2} Студент, занимающийся и спортом и наукой. Разность: Т=Т1-Т2={t/t€T1 & t/t €Т2} – только спортсмены. Проекция: Пx(Т)={Пx(t)/t€T} Проекция: ФИО (студента). Соединение (естественное объединение): Т=Т1*Т2={(t1 ∩ t2) t1€T1 & t2€T2 & Пx(t1) * Пy(t2)}

 

13. Ограничения целостности. Определение и классификация. Ограничения на операции. Ограничения на значения атрибутов. Семантическая целостность. Агрегатные ограничения. Свойства ограничений.

Логические ограничения, накладываемые на данные – ограничения целостности – свойства, кот для данного множества или описания ИСТИННО или ЛОЖНО. Классификация: внутренние, явные(на операции, на значение, агрегатное), подразумеваемые. Явное ограничение – обычно ограничение на значение. Внутреннее ограничение – иерархическая структура. Каждый порожденный тип сущности связан только с одним, родительским типом сущности. Подразумеваемое ограничение – базируются на внутренних и явных ограничениях.

Ограничения: статические – правила определяющие допустимые реализации БД, динамические – определяющие допустимость переходов одной реализации в другую. Ограничения на значение атрибутов – ограничение определяет принадлежность к домену. Ограничения на операции – пусть атрибуты «скорость» и «возраст» определены на домене «целых положительных чисел» в диапазоне 0-150. Для ЭВМ это один домен, для пользователя два разных домена.

{{ Под целостностью понимают св-во БД, означающее, что БД содержит полную, непротиворечивую и адекватно отражающую предметную область инф-цию.

Различают физическую и логическую целостность. Физическая целостность означает наличие физ доступа к данным и то, что данные не утрачены. Логическая целостность означает отсутствие логических ошибок в базе данных, к которым относятся нарушение стр-ры БД или ее объектов, удаление или изменение установленных связей между объектами и т.д.

Поддержание логической целостности БД включает контроль целостности и ее восстановление в случае обнаружения противоречий в базе. Целостное состояние БД задается с помощью ограничений целостности в виде условий, которым должны удовлетворять данные, хранимые в базе.

Среди ограничений целостности можно выделить 2 осн типа: ограничения значений атрибутов отношений и структурные ограничения на кортежи отношений.

Примером ограничений значений атрибутов отношений является требование недопустимости пустых или повторяющихся значений в атрибутах, а также контроль принадлежности значений атрибутов заданному диапазону. Например: дата рождения не может превышать сегодняшней даты.

Структурные ограничения определяют требования целостности сущностей и целостности ссылок. Каждому экземпляру сущности, представленному в отношении, соотв-ет только один его кортеж. Требование целостности сущностей состоит в том, что любой кортеж отношения должен быть отличим от любого другого кортежа этого отношения, т.е. любое отношение должно обладать первичным ключом.

Формулировка требования целостности ссылок тесно связана с понятием внешнего ключа. Внешние ключи служат для связи отношений (таблиц БД) между собой. При этом атрибут одного отношения (родительского) называется внешним ключом данного отношения, если он явл-ся первичным ключом другого отношения (дочернего).

Требование целостности ссылок состоит в том, что для каждого значения внешнего ключа родительской таблицы должна найтись строка в дочерней таблице с таким же значением первичного ключа .}}

Логические ограничения, накладываемые на данные – ограничения целостности – свойства, кот для данного множества или описания ИСТИННО или ЛОЖНО. Классификация: внутренние, явные(на операции, на значение, агрегатное), подразумеваемые. Явное ограничение – обычно ограничение на значение. Внутреннее ограничение – иерархическая структура. Каждый порожденный тип сущности связан только с одним, родительским типом сущности. Подразумеваемое ограничение – базируются на внутренних и явных ограничениях.

Ограничения: статические – правила определяющие допустимые реализации БД, динамические – определяющие допустимость переходов одной реализации в другую. Ограничения на значение атрибутов – ограничение определяет принадлежность к домену. Ограничения на операции – пусть атрибуты «скорость» и «возраст» определены на домене «целых положительных чисел» в диапазоне 0-150. Для ЭВМ это один домен, для пользователя два разных домена.

{{ Под целостностью понимают св-во БД, означающее, что БД содержит полную, непротиворечивую и адекватно отражающую предметную область инф-цию.

Различают физическую и логическую целостность. Физическая целостность означает наличие физ доступа к данным и то, что данные не утрачены. Логическая целостность означает отсутствие логических ошибок в базе данных, к которым относятся нарушение стр-ры БД или ее объектов, удаление или изменение установленных связей между объектами и т.д.

Поддержание логической целостности БД включает контроль целостности и ее восстановление в случае обнаружения противоречий в базе. Целостное состояние БД задается с помощью ограничений целостности в виде условий, которым должны удовлетворять данные, хранимые в базе.

Среди ограничений целостности можно выделить 2 осн типа: ограничения значений атрибутов отношений и структурные ограничения на кортежи отношений.

Примером ограничений значений атрибутов отношений является требование недопустимости пустых или повторяющихся значений в атрибутах, а также контроль принадлежности значений атрибутов заданному диапазону. Например: дата рождения не может превышать сегодняшней даты.

Структурные ограничения определяют требования целостности сущностей и целостности ссылок. Каждому экземпляру сущности, представленному в отношении, соотв-ет только один его кортеж. Требование целостности сущностей состоит в том, что любой кортеж отношения должен быть отличим от любого другого кортежа этого отношения, т.е. любое отношение должно обладать первичным ключом.

Формулировка требования целостности ссылок тесно связана с понятием внешнего ключа. Внешние ключи служат для связи отношений (таблиц БД) между собой. При этом атрибут одного отношения (родительского) называется внешним ключом данного отношения, если он явл-ся первичным ключом другого отношения (дочернего).

Требование целостности ссылок состоит в том, что для каждого значения внешнего ключа родительской таблицы должна найтись строка в дочерней таблице с таким же значением первичного ключа.}}

 

14. Сетевая модель данных. Сеть, вершины, дуги.(направление, ненаправленные), циклы, петли.

Слово "данные''' происходит от латинского "datum" означающего "факт". Будем называть данными описание любого явления (или идеи), которое представляется достаточно ценным для того, чтобы его определить и точно зафиксировать.

Модель данных - это средство абстракции, которое дает возможность увидеть информационное содержание данных, а не конкретные значения данных. Существует множество моделей, отражающих различные стороны реального мира. Модели данных дают возможность представить частичную семантику данных, что в свою очередь обеспечивает нас частичными знаниями о реальном мире. Система знаний о мире - открытая система. Главное, чтобы объем знаний и семантика данных, представленные в модели, соответствовали желаемому использованию данных.

Часть реального мира, подлежащую изучению с целью организации управления и в дальнейшем автоматизации, принято называть предметной областью.

Совокупность данных конкретной предметной области будем называть базой данных (БД). Данные, представленные в виде базы данных, имеют следующую характерную особенность: эти данные организованы по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования, и не зависят от программ обработки.

Сетевые модели данных базируются на табличных и графовых представлениях. Вершинам графа соответствуют некоторые типы сущности (объекты), которые представляются таблицами, а дугам соответствуют типы связей, причем связи должны быть функциональными. Ограниченность сетевой модели состоит в невозможности непосредственного представления связей между вершинами типа М:N.

В сетевой модели данных понятия главного и подчиненных объектов несколько расширены. Любой объект может быть и главным и подчиненным (в сетевой модели главный объект обозначается термином «владелец набора», а подчинен­ный — термином «член набора»). Один и тот же объект может одновременно выступать и в роли владельца, и в роли члена набора. Это означает, что каждый объект может участвовать в любом числе взаимосвязей. В реляционной модели данных объекты и взаимосвязи между ними представляются с помощью таблиц. Взаимосвязи также рассматриваются в качестве объектов. Каждая таблица представляет один объект и состоит из строк и столбцов.

Сетевая модель – это направленный граф, отличающийся от дерева наличием нескольких исходящих узлов (вершин).

Семантическая сеть – граф, представляющий мн-во вершин и дуг, предназначенный для изображения и систематизации знаний общего хар-ра. Вершина графа – это экземпляр сущности, а дуга между вершинами – это утверждения относительно этих экземпляров. Вершины и дуги бывают в семантической сети 4-х категорий: * концепты (понятия) *события * хар-ки (как правило вершины)– свойства концептов * значения хар-к. Типы вершин: *вершины-концепты, представленные экземплярами; *вершины-классы – это обобщения экземпляров; *вершины-метаклассы – это обобщение классов. Типы дуг: *дуга между двумя концептами – утверждение; * дуга между концептом и классом – порождение экземпляра; * дуга между классами – бинарное отношение.

Соответствия понятий:

Моделирование данных Сетевая модель Граф
Интенсионал БД Стр-рная диаграмма данных 2. Тип записи 1. Граф 2. Вершина
Тип сущности Тип записи владельца Тип записи члена 3. Тип набора 1. Исходящая вершина 2. Порожденная вершина
Тип связи Тип множества Дуга
Атрибут Единица данных _______-----------

 

 

15. Иерархическая модель данных. Отношение «исходный - порожденный». Дерево, корень, листья, узлы(исходные, порожденные), дуги, путь..

Слово "данные''' происходит от латинского "datum" означающего "факт". Будем называть данными описание любого явления (или идеи), которое представляется достаточно ценным для того, чтобы его определить и точно зафиксировать.

Модель данных - это средство абстракции, которое дает возможность увидеть информационное содержание данных, а не конкретные значения данных. Существует множество моделей, отражающих различные стороны реального мира. Модели данных дают возможность представить частичную семантику данных, что в свою очередь обеспечивает нас частичными знаниями о реальном мире. Система знаний о мире - открытая система. Главное, чтобы объем знаний и семантика данных, представленные в модели, соответствовали желаемому использованию данных.

Часть реального мира, подлежащую изучению с целью организации управления и в дальнейшем автоматизации, принято называть предметной областью.

Совокупность данных конкретной предметной области будем называть базой данных (БД). Данные, представленные в виде базы данных, имеют следующую характерную особенность: эти данные организованы по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования, и не зависят от программ обработки.

Иерархическая модель данных представляется упорядоченным деревом.

Дерево – множество Т, состоящее из одного и более узлов, таких что: *Имеется один специально обозначенный узел, называемый корнем дерева *Отальные узлы содержатся в М>=0 попарно непересекающихся множествах каждое из которых также является деревом.

Дерево называется упорядоченным, если относительный порядок поддеревьев значим, т.е. важно относительное расположение вершин. Кроме того, дуги, соответствующие функциональным связям, всегда направлены от корня к листьям дерева. Такая структурная диаграмма называется иерархическим деревом определения данных. Часто объекты находятся в отношениях, которые принято называть иерархическими: например, отношение часть - целая (например, автомобиль состоит из кузова, двигателя, колес и т.д.); родовидовое отношение (например, автомобили бывают грузовые, легковые и др.); отношения подчиненности (например, ректор — декан и многие другие).

Объекты, связанные иерархическими отношениями, образуют дерево «ориентированный граф», у которого имеется только одна вершина, не подчиненная никакой другой вершине (эту вершину принято называть корнем дерева ); любая другая вершина графа подчинена лишь только одной другой вершине. Дуга – связь м/д 2 узлами. Лист – узел, не имеющий порождаемых узлов. Степень узла – число порожденных узлов. Уровень – длина пути от корня. Исходный узел – узел, связанный хотя бы с одним нижележащим узлом. Путь – последовательность узлов от корня до листа. Семейство – узлы порожденные из одного исход узла. Высота дерева – число уровней. Момент дерева – число узлов в целом. Вес дерева - число листьев. Момент дерева – число узлов в целом.

Концептуальная схема иерархической модели представляет собой совокупность типов записей, связанных типами связей в одно или несколько деревьев. Все типы связей этой модели принадлежат к виду «один ко многим» и изображаются в виде стрелок. Такой тип связи означает, что одна запись (на ее тип указывает одно острие) соединена со многими подчиненными записями (на их тип указываетдвойное острие). В силуединственности пути к любой вершине дерева необходимость в наименовании типов связей в иерархической модели отпадает. Основное достоинство иерархических баз данных состоит в экономичном использовании ресурсов памяти и соответственно высоком быстродействии системы. Недостатком является жесткие связи и при изменении модели возникает необходимость в перепрограммировании БД.

Таблица соотв-вия понятий: моделирования данных, иерархической модели, дерева:

Моделирование данных Иерархическая модель Дерево
Интенсионал БД 1. Иерархическое дерево 2. Тип записи 3. Тип корневой записи 1. Дерево 2. Узел 3. Корень
Тип сущности 1. Тип исходящей записи 2. Тип порожденной записи 1. Исходящий узел 2. Порожденный узел 3. Лист
Тип связи Связь: исходный - порожденный Дуга
Атрибут Единица (элемент) записи _--------------------

 

16. Реляционная модель данных. Таблица, заголовок, столбцы, строки. Способы логической реализации связей в реляционной модели.

Слово "данные''' происходит от латинского "datum" означающего "факт". Будем называть данными описание любого явления (или идеи), которое представляется достаточно ценным для того, чтобы его определить и точно зафиксировать.

Модель данных - это средство абстракции, которое дает возможность увидеть информационное содержание данных, а не конкретные значения данных. Существует множество моделей, отражающих различные стороны реального мира. Модели данных дают возможность представить частичную семантику данных, что в свою очередь обеспечивает нас частичными знаниями о реальном мире. Система знаний о мире - открытая система. Главное, чтобы объем знаний и семантика данных, представленные в модели, соответствовали желаемому использованию данных.

Часть реального мира, подлежащую изучению с целью организации управления и в дальнейшем автоматизации, принято называть предметной областью.

Совокупность данных конкретной предметной области будем называть базой данных (БД). Данные, представленные в виде базы данных, имеют следующую характерную особенность: эти данные организованы по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования, и не зависят от программ обработки.

Реляционная модель данных – это модель, представленная таблично, в которой выделяются элементы: домен (столбец), кортеж (запись), шапка (схема отношения). Она базируется на отношениях и их представлении таблицами. Реляционная модель данных впервые была предложена Коддом. Единственным средством структуризации данных в реляционной модели является отношение. Отношения обладают всеми свойствами множеств. Baжнейшеe свойство языков данных реляционной модели - возможность определять новые отношения, основываясь на существующих отношениях и используя реляционную алгебру или реляционное исчисление. Таблица – осн тип структуры данных. Стр-ра опр-ся совокупностью столбцов. В кажд строке содержится по одному значению в соотв столбце. В табл не м б 2-х одинак строк. Кажд столбец табл д иметь имя.

В реляционной базе данных каждая таблица должна иметь первичный ключ (ключевой элемент) — поле или комбинацию полей, которые единственным образом идентифицируют каждую строку в таблице. Благодаря своей простоте и естественности представления реляционная модель получила наибольшее распространение в СУБД для персональных компьютеров

Таблица соответствия понятий:

Моделирование данных Реляционная модель Таблица
Интенсионал БД Реляционная схема Совокупность таблиц
Тип сущности Схема отношения Заголовок (шапка)
Атрибут Атрибут Название столбца

 

 

17. Понятия физической организации: файл, набор, запись, поле записи, ключ. Организация файлов. Проблемы физического представления.

Физ организ данных опред способ размещ данных непосредств на маш носителе. В современных прикладный программных средствах этот уровень организации обеспечивается автоматически без вмешательства пользователя. Основные типы структур данных файловой модели – поле, запись, файл. Запись является основной структурной единицей обмена м/д ОП и внешней памятью. Поле – элемент единица логич организации данных, кот соотв. отдельной, неделимой единице инф-ции – реквизиту. Запись – совокупность полей, соотв. логич связанным реквизитам. Стр-ра записи опр-ся составом и последовательностью входящих в нее полей, каждое из кот содержит элемент данное. Файл - множество одинаковых по стр-ре экземпляров записей со значениями в отдельных полях. Экземпляр записи представляет собой реализацию записи, содержащую конкретные значения полей. Стр-ра записи файла – линейная, т.е. поля имеют единственное значение и отсутствуют групповые данные.каждый экземпляр записи однозначно идентифицируется уникальным ключом записи.

Среди элементов данных (полей) выделяются одно или несколько ключевых полей. Значения ключевых полей позволяют классифицировать объект, к которому относится конкретная запись. Ключи с уникальными значениями называются потенциальными. Каждый ключ может представлять собой агрегат данных. Один из ключей является первичным, остальные – вторичными. Первичный ключ идентифицирует экземпляр записи и его значение должно быть уникальным в пределах записей одного типа.

Иногда термин "запись" заменяют термином "группа".

Набор (или групповое отношение) – поименованная совокупность записей, образующих двухуровневую иерархическую структуру. Каждый тип набора представляет собой отношение (связь) между двумя или несколькими типами записей. Для каждого типа набора один тип записи может быть объявлен владельцем набора, остальные типы записи объявляются членами набора. Каждый экземпляр набора должен содержать только один экземпляр записи типа владельца и столько экземпляров записей типа членов набора, сколько их связано с владельцем. Для группового отношения также различают тип и экземпляр.

Проблемы физ представления: 1. выбор тип носителей. 2. способ организации данных. 3. метод доступа. 4. опред размеров физ блока. 5. упр-е размещ данных на технич носителе. 6. упр-е свободной памятью. 7. опред целесообразности сжатия данных и исп-я методов сжатия. 8. оценка физ модели данных. 9. опред числа и размеров сист буферов. 10. закрепление файлов за буферами.

 

18. Способы адресации и поиска: двоичный, блочный, индексации и сортировка, индексно-последовательный, рандомизированный.

19. Способы представления связей, типы указателей, цепи, кольца. Представление древовидных структур.

20. Жизненныйцикл БД. Фаза анализа и проектирования. Инфологическое и даталогическое проектирование. Концептуальное, логическое и физическое проектирование.

Процесс проектирования, реализации и поддержания системы базы данных называется жизненным циклом базы данных. Процедура создания системы называется жизненным циклом систем.

ЖЦБД состоит из следующих этапов:

1. Предварительное планирование – планирование БД, выполняемое в процессе разработки стратегического плана БД. В процессе планирования собирается следующая информация:

· какие прикладные программы используются, и какие функции они выполняют;

· какие файлы связаны с каждым из этих приложений;

· какие новые приложения и файлы находятся в процессе работы.

Информация этого этапа - обобщенная модель данных.

2. Проверка осуществимости. Здесь определяется технологическая, операционная и экономическая осуществимость плана создания БД, т. е.:

· технологическая осуществимость

· операционная осуществимость

· экономическая целесообразность

3. Определение требований - выбор целей БД, выяснение информационных требований к системе и требований к оборудованию и программному обеспечению. Таким образом, на данном этапе сбора данных и определения требований создаётся общая информационная модель, выражающаяся в следующих задачах:

· Определяются цели системы путём анализа информационных потребностей. обязательно указывается - БД распределённая или целостная, какие коммуникационные средства необходимы.

· Определение пользовательских требований: документация в виде обобщённой информации; фиксация функций системы и определение прикладных систем, которые будут выполнять эти требования.

· Определение общих требований к оборудованию и программному обеспечению

· Разработка плана поэтапного создания системы, включающий выбор исходных приложений.

4. Концептуальное проектирование – создание концептуальной схемы БД. Выходной документ - единая инфологическая модель. На данном этапе желательно определить: 1) правила для данных; 2) правила для процессов; 3) правила для интерфейса.

5. Реализация процесс превращения концептуальной модели в функциональную БД. Этапы: 1) Выбор и приобретение необходимой СУБД. 2) Преобразование концептуальной (инфологической) модели БД в логическую и физическую модель данных.3) Построение словаря данных, который определяет хранение определений структуры данных БД. 4) Заполнение базы данных. 5) Создание прикладных программ, контроль управления. 6) Обучение пользователей.

6. Оценка и усовершенствование схемы БД. Включает опрос пользователей с целью выяснения функциональных неучтенных потребностей. При необходимости вносятся изменения, добавление новых программ и элементов данных по мере изменения и расширения потребностей.

Т о, ЖЦБД включает в себя:

Изучение предметной области и представление соответствующей документации (1-3).

Построение инфологической модели (4).

Реализация (5).

Оценка работы и поддержка БД (6).

Проектирование БД – одна из наиболее сложных и ответственных задач, связанных с созданием информационной системы. В результате решения этой задачи должны быть определены содержание БД, эффективный для всех её будущих пользователей способ организации данных и инструментальные средства управления данными.

В крупных системах проектирование БД требует особой тщательности, поскольку цена допущенных на этой стадии просчётов и ошибок особенно велика. Некоторые ошибки проектирования можно скорректировать позже в процессе эксплуатации с помощью средств реструктуризации и реорганизации БД, но такие операции являются весьма трудоемкими и дорогостоящими.

Основная цель процесса проектирования БД состоит в получении такого проекта, который удовлетворяет следующим требованиям:

1. Корректность схемы БД, т.е. база должна быть гомоморфным образом моделируемой ПО, где каждому объекту ПО соответствуют данные в памяти ЭВМ, а каждому процессу – адекватные процедуры обработки данных.

2. Обеспечение ограничений (на объёмы внешней и оперативной памяти и другие ресурсы вычислительной системы).

3. Эффективность функционирования (соблюдение ограничений на время реакции системы на запрос и обновление данных).

4. Защита данных (от сбоев и несанкционированного доступа).

5. Простота и удобство эксплуатации.

6. Гибкость, т.е. возможность развития и адаптации к изменениям ПО и/или требований пользователей.

Удовлетворение первых 4-х требований обязательно для принятия проекта.

В настоящее время создан ряд систем автоматизации проектирования БД, но эти системы обладают многими недостатками и поэтому не стали пока массовым инструментом разработчиков.

Процесс проектирования БД включает в себя следующие этапы:

1. Информационно-логическое (инфологическое) проектирование.

2. Определение требований к операционной обстановке, в которой будет функционировать информационная система.

3. Выбор СУБД и других инструментальных программных средств.

4. Логическое проектирование БД.

5. Физическое проектирование БД.




Поделиться с друзьями:


Дата добавления: 2015-05-09; Просмотров: 1016; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.01 сек.