Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Модели данных, используемые для ХД.

Задачи, решаемые OLTP и аналитическими системами, различаются, поэтому их БД тоже построены на разных принципах. Кри­терием эффективности для OLTP-систем служит число транзакций в 1 времени. Для ХД важнее скорость выполнения сложных запросов и прозрачность структуры хранения информации для пользователей. В настоящее время существуют два подхода к построению ХД: использование многомерной модели БД (MOLAP), и использование реляцион­ной модели БД (ROLAP).При использовании этой MOLAP данные хранятся не в виде плоских таблиц, как в реляционных БД, а в виде гиперкубов - упорядоченных многомерных массивов. То есть многомерное представление данных здесь реализуется физически. Такой подход требует большего объе­ма памяти, при его использовании сложно модифицировать структуру данных. Например, добавление еще одного изме­рения приводит к необходимости полной перестройки гиперкуба. Одна­ко многомерные СУБД обеспечивают более быстрый поиск и чтение данных, избавляют от необходимости многократно соединять таблицы. Среднее время ответа на сложный аналитический запрос при использовании многомерных СУБД обычно в 10-100 раз меньше, чем в случае реляционной СУБД с нормализованной структурой.

При использовании РСУБД для организации хранилища данные орга­низуются специальным образом. Чаще всего используется так называемая радиальная схема. Другое ее название - "звезда". В этой схеме ис­пользуются два типа таблиц: таблица фактов (фактологическая таблица) и несколько справочных таблиц (таблицы измерений). Подход реляционной модели данных предполагает возможность хранения огромного объема данных, но всегда проигрывают по скорости выполнения запросов. Комбинация многомерного и реляционного подходов: киоски/витрины данных

Киоск данных - это специализированное тематическое хранилище, обслуживающее одно из направлений деятельности организации. Такая схема позволяет эффективно использовать возможности реляци­онных СУБД по хранению огромных объемов информации и способность многомерных СУБД обеспечивать высокую скорость выполнения анали­тических запросов. Витрины позволяют сравнительно легко обеспечить приемлемую производительность, так как содержат меньший объем данных, заблаговременно их агрегируют и востребованы ограниченным кругом пользователей.

Метаданные ХД: Их можно разделить на два класса: технические и бизнес-метаданные; последние представляют собой описание данных на языке бизнес-пользователей. Технические метаданные включают в себя статистику загрузки данных в хранилище и их использования, описание моделей данных, структуры источников и реципиентов, а также метаданные приложений. Системы, использующие хранилища, строятся на архитектуре клиент-сервер обычно. В качестве СУБД – те, что поддерживают параллельную обработку запросов (Oracle, Informix).

Хранилища делятся на:

1. маленькие (< 3Гб) несколько млн. строк

2. средние (<25Гб) до 100 млн. строк,

3. большие (<200Гб) несколько100 млн. строк

4. сверхбольшие (>200Гб) млрд. строк.

Реализации хранилищ данных. Для размещения и совместного использования больших объемов информации применяются системы хранения данных (storage) трех основных типов: 1.- Direct Attached Storage (DAS) - система, присоединенная к серверу,2- Network Attached Storage (NAS) - система, присоединенная к сети, 3- Storage Area Network (SAN) - сеть хранения данных. Среда реализации распределенных хранилищ данных SAN - актуальная технология для тех корпоративных заказчиков, которые уже имеют большой парк инсталлированных систем хранения данных.

<== предыдущая лекция | следующая лекция ==>
Приготовление теста. | 
Поделиться с друзьями:


Дата добавления: 2017-02-01; Просмотров: 75; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.008 сек.