Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Информационные хранилища. Основы OLAP-технологии




ИХ позволяется обеспечить: 1)хранение разнородных данных из различных источников в течение больших периодов времени; 2)быстрый доступ к данным и поиск релевантной запросу информации. Причины появления ИХ: 1)осознание руководством предприятий того, что в данных содержатся скрытые закономерности (знания), характеризующие процесс управления в целом, способные повысить его эффективность; 2)снижение стоимости средств хранения информации, дающее возможность хранить данные, накопленные за длительные интервалы времени; 3)снижение стоимости элементной базы сложных архитектур; 4)переход от массового обслуживания к индивидуальному (учет разнообразных требований заказчика).

Концепция информационных хранилищ позволяет решить следующие проблемы: хранение разнородных данных из различных источников в течение больших периодов времени; быстрый доступ к данным и поиск релевантной запросу информации. Концепция информационных хранилищ подразумевает использование систем интеграции данных. Источники могут использовать различные модели данных и предоставлять различные интерфейсы для доступа к своим данным (реляционные, объектные или унаследованные СУБД).

ИХ: 1.Хранилища данных – данные из различных источников поступают в хранилище, все запросы к системе интеграции обрабатыаются с использованием этих данных. 2.Виртуальные хранилища – данные хранятся в источниках, а запросы к системе интеграции транслируются в запросы или операции, понятные источнику. Данные полученные в ответ на эти запросы к источниками, объединяются и предоставляются пользователю.

В настоящее время под хранилищем данных понимается предметно-ориентированный, интегрированный, поддерживающий хронологию набор данных, являющийся единственным источником информации, необходимой для анализа и принятия управленческих решений.

Хранилища данных – это информационный фундамент, на котором строятся OLAP-приложения. (системы оперативной аналитической обработки - Online Analytical Processing). Главной особенностью программных средств OLAP-систем является обеспечение оперативного анализа данных, содержащихся в хранилище, причем они ориентированы на их использование любыми специалистами по управлению – непрофессионалами в области компьютерных технологий: руководителями различных служб и отделов.

OLAP - обобщенный термин, характеризующий принципы построения систем поддержки принятия решений (Decision Support System - DSS), хранилищ данных (Data Warehouse), систем интеллектуального анализа данных (Data Mining). Такие системы предназначены для нахождения зависимостей между данными (например, можно попытаться определить, как связан объем продаж товаров с характеристиками потенциальных покупателей), для проведения анализа "что если…". OLAP-приложения оперируют с большими массивами данных, уже накопленными в OLTP-приложениях (системы оперативной обработки транзакций - Online Transaction Processing), взятыми их электронных таблиц или из других источников данных. Такие системы характеризуются следующими признаками: 1)Добавление в систему новых данных происходит относительно редко крупными блоками (например, раз в квартал загружаются данные по итогам квартальных продаж из OLTP-приложения). 2)Данные, добавленные в систему, обычно никогда не удаляются. 3)Перед загрузкой данные проходят различные процедуры "очистки", связанные с тем, что в одну систему могут поступать данные из многих источников, имеющих различные форматы представления для одних и тех же понятий, данные могут быть некорректны, ошибочны. 4)Запросы к системе являются нерегламентированными и, как правило, достаточно сложными. 5)Скорость выполнения запросов важна, но не критична.

OLAP-структура, созданная из рабочих данных, называется OLAP-куб. OLAP-куб содержит в себе базовые данные и информацию об измерениях (агрегатах). Куб потенциально содержит всю информацию, которая может потребоваться для ответов на любые запросы.

Вместе с базовой концепцией существуют три типа OLAP: (1)OLAP со многими измерениями (Multidimensional OLAP — MOLAP) - классическая форма OLAP, так что её часто называют просто OLAP. Она использует суммирующую БД, специальный вариант процессора пространственных БД и создаёт требуемую пространственную схему данных с сохранением как базовых данных, так и агрегатов. (2)реляционный OLAP (Relational OLAP — ROLAP) - работает напрямую с реляционным хранилищем, факты и таблицы с измерениями хранятся в реляционных таблицах, и для хранения агрегатов создаются дополнительные реляционные таблицы. (3)гибридный OLAP (Hybrid OLAP — HOLAP) - использует реляционные таблицы для хранения базовых данных и многомерные таблицы для агрегатов.

MOLAP лучше всего подходит для небольших наборов данных, он быстро рассчитывает агрегаты и возвращает ответы, но при этом генерируются огромные объёмы данных. ROLAP оценивается как более масштабируемое решение, использующее к тому же наименьшее возможное пространство. При этом скорость обработки значительно снижается. HOLAP находится посреди этих двух подходов, он достаточно хорошо масштабируется и быстро обрабатывается. Архитектура R-ROLAP позволяет производить многомерный анализ OLTP-данных в режиме реального времени.


Вопросы. «Базы данных»

1.Данные и ЭВМ. Концепция баз данных. Архитектура СУБД.

2.Уровни моделей данных и основные типы поддерживающих их СУБД. Примеры.

3.CALS-технологии. Понятие. Жизненный цикл и этапы проектирования базы данных.

4.Методологии и средства проектирования БД.

5.Метод (методология) IDEF1X.

6.Основные понятия: сущность, атрибут, ключ, связь.

7.Характеристика связей в ER-диаграммах. Примеры.

8.Инфологическое моделирование, ЯИМ. Классификация сущностей. О первичных и внешних ключах.

9.Реляционная структура данных. Реляционная база данных. Манипулирование реляционными данными.

10.Цели проектирования БД и универсальное отношение. Нормализация, функциональные и многозначные зависимости.

11.Нормальные формы. Процедура нормализации. Пример.

12.Процедура проектирования даталогической модели БД.

13.Язык SQL: общие сведения, основные операторы.

14.Определение данных в SQL (операторы DDL). Примеры.

15.Манипулирование данными в SQL (операторы INSERT, UPDATE, DELETE). Примеры.

16.Оператор SELECT: отбор данных из таблиц. Примеры.

17.Оператор SELECT: использование имен корреляции и агрегатных функций. Примеры.

18.Оператор SELECT: использование подзапросов. Примеры.

19.Оператор SELECT: использование объединения, пересечения и разности для реализации реляционной алгебры. Примеры.

20.Понятие и необходимость транзакций. Ограничения целостности. Транзакции и восстановление данных.

21.Гипертекстовые и мультимедийные БД.

22.Объектно-ориентированные БД.

23.Распределенные БД.

24.Организация процессов обработки данных в БД. OLTP-системы.

25.Информационные хранилища. Основы OLAP-технологии.

 




Поделиться с друзьями:


Дата добавления: 2015-05-09; Просмотров: 3266; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.007 сек.