КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Многомерная модель
Информация, накопленная в базах данных, является чрезвычайно ценным материалом, и в настоящий момент широко распространяются методы обработки баз данных с точки зрения извлечения из них дополнительных знаний, методов, которые связаны с обобщением и различными дополнительными способами обработки данных (содержание данного пункта скопировано из работы [19]). Базы данных в данной концепции выступают как хранилища информации, это направление называется «Хранилища данных» (Data Warehouse). Для работы с «Хранилищами данных» наиболее значимым становится так называемый интеллектуальный анализ данных (ИАД), или data mining. На рынке программных продуктов стали появляться соответствующие инструментальные средства. Особенно широко методы ИАД применяются в бизнес-приложениях аналитиками и руководителями компаний. Для этих категорий пользователей разрабатываются инструментальные средства высокого уровня, позволяющие решать достаточно сложные практические задачи без специальной математической подготовки. В бизнес-приложениях наибольший интерес представляет интеграция методов интеллектуального анализа данных с технологией оперативной аналитической обработки данных (On-Line Analytical Processing, OLAP). OLAP использует многомерное представление агрегированных данных для быстрого доступа к важной информации и дальнейшего ее анализа. Системы OLAP обеспечивают аналитикам и руководителям быстрый последовательный интерактивный доступ к внутренней структуре данных и возможность преобразования исходных данных с тем, чтобы они позволяли отразить структуру системы нужным для пользователя способом. OLAP-системы позволяют просматривать данные и выявлять имеющиеся в них закономерности либо визуально, либо простейшими методами (такими как линейная регрессия), а включение в их арсенал нейросетевых методов обеспечивает существенное расширение аналитических возможностей. В основе концепции оперативной аналитической обработки (OLAP) лежит многомерное представление данных. Термин OLAP ввел Кодд (Е. F. Codd) в 1993 году. Одновременный анализ по нескольким измерениям данных определяется как многомерный анализ. Каждое измерение включает направления интеграции данных, состоящие из серии последовательных уровней обобщения, где каждый вышестоящий уровень соответствует большей степени агрегации данных по соответствующему измерению. Так, измерение Исполнитель может определяться направлением консолидации, состоящим из уровней обобщения «предприятие–подразделение–отдел-служащий». Измерение Время может даже включать два направления консолидации – «год–квартал–месяц–день» и «неделя–день», поскольку счет времени по месяцам и по неделям несовместим. В этом случае становится возможным произвольный выбор желаемого уровня детализации информации по каждому из измерений. Операция спуска (drilling down) соответствует движению от высших ступеней консолидации к низшим; напротив, операция подъема (rolling up) означает движение от низших уровней к высшим. Многомерная модель ‑ узкоспециализированная модель, предназначенная для хранения данных в виде многомерного массива (гиперкуба), используемых системами оперативной аналитической обработки типа OLAPили систем поддержки принятия решений DSS(Decision Support. System, пример MS DSS). Пример. Объем продаж автомобилей по маркам автомобилей, годам и городам можно представить в виде трехмерной модели (куба со сторонами: марки автомобилей, годы, города и с ячейками ‑ количество проданных автомобилей) вместо реляционной (таблицы с полями: марка автомобиля, год продажи, город и количество проданных автомобилей). Куб более нагляден, чем таблица, и с ним удобнее и быстрее работать. Рассмотрим ряд терминов этой модели. Агрегируемость данных означает наличие различных уровней обобщения информации (аналитик, пользователь, руководители различных рангов). Историчность данных подразумевает привязку данных ко времени (наличие временных рядов). Прогнозируемость данных предполагает их использование в процедурах прогнозирования на различные временные периоды. Срез(Slice) ‑ подмножество гиперкуба, полученное в результате фиксации одного или нескольких измерений. Пример. Если ограничить значения измерения “Марка автомобиля” маркой “ВАЗ 2105”, то получим двухмерную таблицу продажи автомобилей этой марки по городам и годам. Вращение(Rotate) ‑ вращение гиперкуба (местоположение отдельных осей меняются местами). Агрегация/детализация(Drill Up/Down) ‑ переход к более общему/детальному представлению информации пользователю из гиперкуба. Пример. Можно сформировать итоговую таблицу продаж автомобилей (независимо от их марок) по городам и годам. Достоинства: удобство и эффективность аналитической обработки больших объемов данных. Недостаток: громоздкость и не эффективность для простой оперативной обработки небольших объемов данных. Примеры СУБД: Essbase (Arbor Software), Media Multi‑matrix и Media/MR (Speedware), Oracle Express Server (Oracle), Cache. 1.3.11. Объектно‑ориентированная модель В объектно-ориентированной модели предметная область моделируется как множество классов взаимодействующих объектов (содержание данного пункта скопировано из работы [19]). Каждый объект характеризуется набором свойств, которые являются как бы его пассивными характеристиками и набором методов работы с этим объектом. Работать с объектом можно только с использованием его методов. Атрибуты объекта могут принимать определенное множество допустимых значений, набор конкретных значений атрибутов объекта определяет его состояние. Используя методы работы с объектом, можно изменять значение его атрибутов и тем самым как бы изменять состояние самого объекта. Множество объектов с одним и тем же набором атрибутов и методов образует класс объектов. Объект должен принадлежать только одному классу (если не учитывать возможности наследования). Допускается наличие примитивных предопределенных классов, объекты-экземпляры которых не имеют атрибутов: целые, строки и т. д. Класс, объекты которого могут служить значениями атрибута объектов другого класса, называется доменом этого атрибута. Одной из наиболее перспективных черт объектно-ориентированной парадигмы является принцип наследования. Допускается порождение нового класса на основе уже существующего класса, и этот процесс называется наследованием. В этом случае новый класс, называемый подклассом существующего класса (суперкласса), наследует все атрибуты и методы суперкласса. В подклассе, кроме того, могут быть определены дополнительные атрибуты и методы. Различаются случаи простого и множественного наследования. В первом случае подкласс может определяться только на основе одного суперкласса, во втором случае суперклассов может быть несколько. Если в языке или системе поддерживается единичное наследование классов, набор классов образует древовидную иерархию. При поддержании множественного наследования классы связаны в ориентированный граф с корнем, называемый решеткой классов. Объект подкласса считается принадлежащим любому суперклассу этого класса. Можно считать, что наиболее важным качеством ООБД (объектно-ориентированной базы данных), которое позволяет реализовать объектно-ориентированный подход, является учет поведенческого аспекта объектов. В прикладных информационных системах, основывавшихся на БД с традиционной организацией (вплоть до тех, которые базировались на семантических моделях данных), существовал принципиальный разрыв между структурной и поведенческой частями. Структурная часть системы поддерживалась всем аппаратом БД, ее можно было моделировать, верифицировать и т. д., а поведенческая часть создавалась изолированно. В частности, отсутствовали формальный аппарат и системная поддержка совместного моделирования и гарантий согласованности структурной (статической) и поведенческой (динамической) частей. В среде ООБД проектирование, разработка и сопровождение прикладной системы становятся процессом, в котором интегрируются структурный и поведенческий аспекты. Конечно, для этого нужны специальные языки, позволяющие определять объекты и создавать на их основе прикладную систему. Специфика применения объектно-ориентированного подхода для организации и управления БД потребовала уточненного толкования классических концепций и некоторого их расширения. Прежде всего, возникло направление, которое предполагает возможность хранения объектов внутри реляционной БД, тогда дополнительно необходимо предусмотреть хранение и использование специфических методов работы с этими объектами. Для перехода к объектно-ориентированным БД стандарт объектного проектирования был дополнен стандартизованными средствами доступа к базам данных (стандарт ODMG93). Многие фирмы обратилась к объектным технологиям и продуктивно сотрудничает с разработчиками объектно-ориентированных СУБД. IBM и Oracle доработали свои СУБД (соответственно, DB2 и ORACLE), добавив объектную надстройку над реляционным ядром системы. Другой путь выбрал Informix, который приобрел серьезную объектно-реляционную СУБД Illustra и встроил ее в свою СУБД. В результате получился продукт, именующийся универсальным сервером. Другой лидер рынка СУБД – Computer Associates, поступил иначе. Он сделал ставку на чисто объектную базу Jasmine, активно пропагандируя ее достоинства. Объектно‑ориентированную модель можно представить в виде дерева объектов‑классов. У каждого объекта имеется набор свойств. Свойство типа “класс” есть экземпляр соответствующего класса, который является потомком объекта, в котором он определен как свойство. Пример базы данных учета товаров на складе. База состоит из объектов (атрибуты‑объекты выделены прописными буквами) (рисунок 1.3.11.1):
Рисунок 1.3.11.1. Объектно‑ориентированная модель базы учета товаров на складе
СКЛАД (Наименование склада, ПОТРЕБИТЕЛЬ, НОМЕНКЛАТУРА, ВЫДАЧА, телефон). ПОТРЕБИТЕЛЬ (Код потребителя, наименование потребителя, телефон). ВЫДАЧА (Код потребителя, код товара, дата выдачи, количество, единица измерения). ТОВАР (Код товара, наименование товара, количество на складе, единица измерения). Объект “СКЛАД” является родительским для объектов‑экземпляров классов “ПОТРЕБИТЕЛЬ”, “НОМЕНКЛАТУРА”, “ВЫДАЧА”. Достоинства: возможность отображения более сложных связей объектов и определения для каждой отдельной записи базы функций их обработки. Недостатки: сложность и низкая скорость обработки. Примеры СУБД: POET (POET Software), Jasmine (Computer Associates), Versant (Versant Technologies), O2 (Ardent Software), ODB‑Jupiter (НПЦ “Интеллект Плюс”), Iris, Orion, Postgres.
Дата добавления: 2014-12-10; Просмотров: 713; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |