Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Структуры и модели данных

Компоненты информационной системы.

Моделирование информационных потоков

 

Анализ информационных потоков позволяет решить задачи двух первых этапов стадии концептуального проектирования информационной системы: анализа и структурирования информационного пространства ИС; выявления, анализа и спецификации пользовательских требований к информационной системе. Следующим этапом является концептуальное проектирование информационных моделей или моделирование информационных потоков. Действительно, в любой модели (физической, математической, логической, семиотической н т. д.) используется информация о моделируемом объекте, а целью реализации модели является формирование новой информации относительно каких-либо свойств, поведения,развития моделируемого объекта при некоторых заданных условиях. В этом смысле любая модель является информационной. Однако далеко не любая модельпоназначениюи, прежде всего, по возможностям позволяет описать информационную среду, промоделировать информационные потоки.

Работы по моделированию информационной среды ведутся уже более двадцати лет. За это время для моделирования информационных потоков было предложено значительное число подходов. Это методы:

ü функционально-операционного анализа;

ü анализа норм выработки решений;

ü модуль-метод;

ü семиотический анализ и моделирование;

ü построение «схем информационных связей»;

ü матричное моделирование.

Последнее получило довольно широкое распространение при разработке информационного обеспечения АСУП.

Матричная информационная модель предназначена для:

1. отображения процесса формирования и движения показателей и документов;

2. отображения вединой унифицированной форме данных о деятельности различных по организации и задачам подразделений предприятия или организации;

3. описания (в информационном аспекте) структуры и функций производственной системы, процессов управления и особенностей функционирования ее элементов;

4. совершенствования информационной структуры (информационных связей, потоков и т. д.) моделируемойсистемы.

 


 

Компоненты информационной системы, образующие вместе систему хранения и манипулирования данными, – это:

1. база данных;

2. концептуальная схема;

3. информационный процессор.

База данных (БД) – это набор сообщений, которые являются истинными для соответствующей материальной системы, а также непротиворечивы по отношению друг к другу и к концептуальной схеме.

Концептуальная схема (от слова concert - понятие) представляет собой описание структуры всех единиц информации, хранящихся в БД. Под структурой понимается вхождение одних единиц информации в состав других единиц информации.

Информационный процессор – это механизм, который в ответ на получение команды выполняет операции с БД и концептуальной схемой. Информационный процессор состоит из вычислительной системы и системы управления базой данных (СУБД).

Под вычислительной системой будем понимать ЭВМ либо несколько ЭВМ, соединенных каналами связи в вычислительную сеть.

Системой управления базой данных (СУБД) называется комплекс программ, обеспечивающий централизованное хранение, накопление, модификацию и выдачу данных, входящих в БД.

Пользователей информационной системы можно подразделить на 5 типов:

ü случайные пользователи, взаимодействие которых с ЭИС не обусловлено их служебными обязанностями;

ü параметрические пользователи, которые работают с ЭИС по­вседневно, в соответствии с четко определенной областью деятель­ности, по регламентированным процедурам;

ü аналитики и исследователи, информационные потребности ко­торых непредсказуемы (в отличие от параметрических пользова­телей);

ü прикладные программисты, которые разрабатывают програм­мы для реализации запросов к базе данных. Эти программы затем используются в основном параметрическими пользователями;

ü системные программисты, которые разрабатывают служебные программы, расширяющие возможности операционной системы и СУБД, например программы разграничения доступа к данным, проверки достоверности данных, восстановления базы данных пос­ле сбоя в работе ЭВМ, программы печати документов, не преду­смотренные стандартными средствами СУБД, и др.

Администратор базы данных – это специалист или группа спе­циалистов, занятых обслуживанием пользователей базы данных. Администратор должен координировать процессы сбора информа­ции, проектирования и эксплуатации базы данных, обеспечения защиты и целостности данных. Администратор обязан учитывать текущие, перспективные и информационные потребности пользова­телей.

Проблема представления информации сегодняпоправу можетсчитаться одной из основных проблем информатики. Это вызвано тем, что эффективность использования вычислительной техники практически вовсех областях ее применения определяется в настоящее время ужене только скоростью обработки информации (быстродействием ЭВМ), а тем, какие объемы информационных ресурсов могут храниться, перерабатываться и представляться пользователям для удовлетворенияих информационных потребностей. На начальных этапах внедрения ЭВМ в практику инженерных и научных расчетов в центре внимания специалистов (системотехников и программистов) находился вопрос разработки программы, реализующей ту или иную процедуру вычислений, алгоритм моделирования и т.д., а организация информации была, по сути дела, вторичной. В памяти ЭВМ формировались простейшие массивы данных, используемых для решения только этой конкретной задачи.

Объемы таких массивов были, как правило, невелики, размещение их как во внешней, так и в оперативной памяти не вызывало особых трудностей. Однако уже на первых этапах внедрения вычислительной техники в управление производством, использования ЭВМ в финансовых расчетах, построения информационных систем для поиска научно-технической информации стало ясно, что здесь приходится иметь дело с существенно более сложными информационными структурами, для представления которых в памяти ЭВМ необходимы принципиально новые методы. Уже при разработке АСУП предусматривалось создание информационного обеспечения таких систем, как совокупности последовательных (линейных) файлов, которые представляли собой линейную последовательность записей на магнитных лентах. Доступ к информации при такой ее организации был только последовательным – для того, чтобы считать какую-либо запись требовалось предварительно считать все предшествующие записи содержащего ее файла. Время поиска одной записи в последовательном файле достигало 5 – 7 мин. Работа осуществлялась только с предварительно отсортированными файлами, записи в которых должны были быть упорядочены по ключевым признакам. Использование файла в разных программах требовало его пересортировки. Так как длина файлов в АСУП крупных предприятий могла достигать 200 – 300 тысяч записей, то время его сортировки для решения сложных задач (например, в подсистемах производственного планирования) составляло от нескольких часов (4 – 5) до суток. Если учесть, что в подобных автоматизированных системах управления производством число файлов только нормативно-справочной информации составляло от 50 до 200, то становится совершенно очевидной неэффективность такой организации информационных ресурсов, еще более усугублявшейся необходимостью дублирования 20 – 30 % всей используемой информации и практической невозможностью оперативного обновления устаревшей информации.

Эти обстоятельства, а также недостаточность принятого в наиболее распространенных языках программирования методов представления данных явились основными причинами интенсивного развития в последние десятилетия работ по созданию и развитию баз данных (БД) и систем управления базами данных (СУБД).

В основе построения систем управления данными лежит понятие структуризации данных. Различают три основных уровня структуризации:

1. концептуальный – описание информационных потребностей на уровне понятий экономической информационной системы с позиций руководителей служб, деятельность которых автоматизируется в рассматриваемой системе;

2. реализации – описание информационных потребностей конечного пользователя с позиций пользователя информационных систем;

3. физический – описание способа хранения информации в памяти ЭВМ и методов доступа к ней с позиций разработчиков внутрисистемного информационного и программного обеспечения.

Для описания и представления данных на этих уровнях применяются следующие основные понятия и определения.

На концептуальном уровне используются понятия:

- предметная область,

- атрибут,

- структурная связь,

- концептуальная схема.

Предметная область – совокупность объектов, изучаемых при построении информационного обеспечения, характеризующих процессы создания, эксплуатации и развития информационной системы (элементы материальной системы, информация о которых хранится и обрабатывается в экономической информационной системе).

Объектом называется любой элемент некоторой системы. Следует различать отдельный физический объект (отдельный предмет) и объект – понятие, которое охватывает множество физических объектов.

Свойством объекта называется некоторая величина, которая характеризует состояние объекта в любой момент времени. Отдельный экземпляр объекта можно точно описать, если указать достаточное количество значений его свойств. Два экземпляра объектов являются различными, если они отличаются по значению хотя бы одного свойства.

Атрибутом называется характеристика объекта. Для него свойственны идентифицирующие его значение, имя, которое этот атрибут может принимать, и диапазон значений. Понятие атрибут, используемое в системах управления данными, как правило, соответствует понятию реквизита признака, применяемому при разработке внесистемного информационного обеспечения.

Структурной связью называется отношение между двумя объектами или двумя множествами объектов. Первый из этих объектов называют главным объектом структурной связи, второй объект (второе множество объектов) – детальными объектами структурной связи.

Различают три основных типа структурных связей:

1) один – к одному (1: 1), т. е. свойство единственности для данной связи имеет место в обоих направлениях (одному главному объекту соответствует один детальный объект);

2) один – ко многим (1: n), т. е. одному главному объекту соответствуют n детальных;

3) многие – ко многим (m: n), т. е. каждому объекту из множества главных объектов могут соответствовать все n объектов множества детальных объектов.

Результатом, получаемым на концептуальном уровне структуризации данных, является концептуальная схема (структура), которая должна поддерживать согласованность связей в пределах уровня детализации и накладываемых временных ограничений, т. е. сохранения структурных связей в течение заданных временных дискретов.

На уровне реализации в качестве основных используются следующие понятия:

- элемент данных,

- сегмент данных,

- логическая запись,

- файл данных,

- физическая запись,

- набор данных.

На физическом уровне основными компонентами выступают физические записи, указатели, блоки и т. п. Взаимосвязи между физическими записями, возникающие в результате их группирования или использования индексных структур, также могут рассматриваться как структурирование данных на физическом уровне.

Моделью данных называется формализованное описание информационных структур и операций над ними. Любая модель данных должна обеспечивать представление объектов предметной области, их атрибутов и структурных связей.

Различают три модели данных:

­ реляционная;

­ сетевая;

­ иерархическая.

Иерархическая и сетевая модели данных являются частными случаями графовой модели. Здесь база данных описывается графом, вершины которого соответствуют логическим записям, а ребра – адресным указателям, обеспечивающим связи между записями. Основным способом манипулирования данными в таких моделях выступает «навигация», осуществляемая с помощью специальных программных средств на процедурных языках.

Сетевая модель данных базируется на табличных и графовых представлениях: вершины графа обычно сопоставляют с некоторыми типами сущностей, которые представляются таблицами, а ребра – с типами связей. При использовании сетевой модели данных должны выполняться следующие требования, предъявляемые к допустимым взаимосвязанным типам данных:

ü каждая связь включает два типа данных (два типа объектов)— главный (основной) и зависимый (детальный);

ü один и тот же тип данных (один и тот же объект) не может быть одновременно и основным, и зависимым;

ü данные основного типа (главные объекты) могут не иметь структурных связей с зависимыми данными (детальными объектами);

ü данные зависимого типа (детальные объекты) должны иметь структурную связь хотя бы с одним главным объектом (основным типом данных).

Графическое изображение сетевой модели носит название диаграммы связей. На такой диаграмме основные типы данных показываются прямоугольниками, зависимые типы данных – кругами, структурные связи – ребрами. Сетевая модель данных является в настоящее время наиболее эффективным способом отображения информационных представлений, формируемых на концептуальном уровне. Основным ее ограничением выступает невозможность непосредственного представления связей «многие – ко многим». Выполнение этого ограничения приводит к сведению этой связи к структурной связи «один – ко многим», а следовательно, к необходимости дублирования хранимой информации.

Иерархическая модель данных, которую, в принципе, можно рассматривать как частный случай сетевой модели, состоит из нескольких типов записей, один из которых определен как корневой или исходный. Каждый тип записей может состоять из нескольких элементарных типов (полей). Ряд полей может представлять собой ключи, однозначно идентифицирующие соответствующие записи. Между типами записей в иерархической модели должны быть определены структурные связи «один – ко многим» или «один – к одному». При этом корневая запись, соответствующая элементу «один» структурной связи, определяется как исходная, а соответствующие элементам «много» - как порожденные. Для каждой порожденной записи допускается существование только одной исходной записи. Но любая исходная запись может участвовать в нескольких структурных связях. Ограничения на связи в этом случае еще более жесткие. Диаграмма структурных связей иерархической модели данных должна описываться деревом, в котором значим относительный порядок поддеревьев. Другими словами, в иерархической модели значимо относительное расположение вершин, т. е. их расположение слева или справа относительно друг друга. Кроме того, ребра, соответствующие структурным связям, всегда должны быть направлены от корня к листьям дерева. Такая структурная диаграмма получила название иерархического дерева определения или просто дерева определения.

Реляционная модель данных представляет собой совокупность формально описанных отношений между атрибутами объектов, из которых могут быть образованы требуемые производные отношения. Для каждого атрибута в реляционной модели задается область определения, называемая доменом. По определению любой домен включает два дополнительных параметра: j – «значение в данный момент не известно» и y– «значение для данного объекта не имеет смысла». Один и тот же домен может служить областью определения различных атрибутов.

Каждому домену и атрибуту в реляционной модели присваивается имя, которое должно быть уникальным среди имен доменов одной модели. Аналогично вводятся и имена атрибутов. В общем случае способ конструирования и мои произвольный. Допускается совпадение имен атрибута и соответствующего ему домена. Если на одном домене определено несколько атрибутов, то их имена могут конструироваться из имени данного домена с помощью специальных уточнений, которые должны отражать различные роли домена в этом отношении.

Каждому классу объектов в реляционной модели ставится в соответствие некоторая совокупность атрибутов. Это соответствие формально описывается выражением

R(A1; A2; …; An).

Тогда любой объект класса может быть описан кортежем <a1, a2, ai, …, an>, где ai – значение атрибута Аi для данного объекта. Множество таких кортежей называется отношением, выражение R(A1; A2; …; An) – схемой отношения, R – именем отношения, n – степенью отношения.

Для каждой компоненты кортежа должна быть определена ее связь с тем или иным атрибутом. Такая связь может быть задана либо упорядочением компонент кортежа в соответствии с порядком имен атрибутов в схеме отношения, либо введением специальных позиционных индексов. Каждое отношение определяет состояние класса объектов в некоторый момент времени. Очевидно, что одной схеме отношения в реальные моменты времени могут соответствовать разные отношения, поэтому ее часто называют типом отношений, а само отношение экземпляром отношения. Экземпляр отношения может быть представлен в виде таблицы, в которой заголовок соответствует схеме отношений, а имя таблицы совпадает с именем отношения; каждая строка является элементом отношения; все строки различны; каждый столбец содержит совокупность значений одного атрибута, имеет имя, совпадающее с именем атрибута, и представляет собой срез отношения по соответствующему атрибуту; порядок строк и столбцов произвольный.

Домены реляционной модели данных можно разделить на простые и составные. Простой домен – множество значений атрибута, каждое из которых на используемом уровне рассмотрения является информационно неделимым (атомарным). Составной домен – множество, элементами которого являются экземпляры отношений одного типа. Составные домены используются для описания тех характеристик моделируемого объекта, которые представляются взаимосвязью более простых свойств этого объекта.

Формальный аппарат, позволяющий описывать отношения, а также осуществлять преобразования отношений для построения новых требуемых отношений, называют реляционной алгеброй или алгеброй Кодда. К числу основных операций реляционной алгебры относятся: проектирование, объединение, соединение, пересечение, вычитание, произведение ограничение, деление и выборка.

При построении реляционных моделей обеспечивается выполнение двух основных требований:

1. информационное содержание данных рассматривается независимо от способов их представления в памяти;

2. модель данных представляется в виде набора изменяющихся во времени отношений, которые задаются на множествах значений свойств, отображаемых в базе данных объектов и их атрибутов.

Реализация второго требования позволяет наряду с другими преимуществами обеспечить более комфортные средства для обращения с базами данных и создать основу для развития информационных систем различного назначения и информационного обеспечения систем интегральной автоматизации производства. Следует отметить, что интенсивное развитие реляционного подхода в последние годы позволяет надеяться, что на этом пути в ближайшее время будут созданы не только мощные и эффективные в различных приложениях реляционные системы управления базами данных, но и разработаны основы общей теории проектирования баз данных и информационных систем, необходимость появления которой весьма остро ощущается на практике.

При кратком рассмотрении основных моделей данных целесообразно упомянуть о четырех моделях данных: типа «сущность—связь», бинарных, семантических, сетевых и инфологических.

Разработкой (проектированием) экономической информационной системы называется процесс составления описания еще не существующей системы на разных языках и с различной степенью детализации, в ходе которого осуществляется оптимизация проектных решений.

Этапами проектирования являются:

1. формулирование и анализ требований к системе;

2. концептуальное проектирование;

3. проектирование реализации;

4. физическое проектирование.

Основной целью формулирования и анализа требований к системе является фиксация требований к процессам обработки данных в системе со стороны ее пользователей. Анализ требований позволяет согласовать информационные потребности пользователей и обеспечить единое понимание содержимого базы данных.

Концептуальное проектирование позволяет создать структуру базы данных, не зависимую от конфигурации вычислительной системы, СУБД и системного программного обеспечения, которые выбираются после этапа концептуального проектирования.

Проектирование реализации предполагает проектирование структуры базы данных применительно к выбранной СУБД и проектирование структуры основных прикладных программ.

На этапе физического проектирования происходит определение параметров БД, связанных с хранением данных в памяти ЭВМ и процедурами доступа к данным, а также происходит отладка прикладных программ. С этого момента возможно заполнение БД реальными данными (актуализация) и функционирование системы в рабочем режиме.

Период эксплуатации можно охарактеризовать как процесс стабильного функционирования экономической информационной системы, не требующий изменения ранее принятых проектных решений.

 

<== предыдущая лекция | следующая лекция ==>
Этапы разработки систем кодирования | Основные задачи РСЧС
Поделиться с друзьями:


Дата добавления: 2014-01-07; Просмотров: 1291; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.062 сек.