КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Хранилища данных и OLAP-технология
Представляет собой способ получения и анализа данных. 1. Его суть заключается в том, что информация представляется в виде не плоских таблиц, как в реляционной М, а в виде многомерного куба с возможностью произвольного манипулирования ею. Каждая грань «куба» соответствует какому-либо атрибуту сущности. В этом случае, выполняя преобразования над этим кубом (повороты, группировки и т.д.), можно выполнять все возможные запросы, но в случае обработки многих атрибутов куб быстро увеличивается в размерах, и отображать его на экране монитора становится не совсем удобно. Для того, чтобы получить хороший результат, необходимо, чтобы на экран выводился не весь куб, а только нужная его часть. Для этого нужно: 1) Иметь возможность выбирать только интересующие пользователя измерения; 2) Иметь возможность отсекать ненужные значения. 2. Работа с OLAP-системой должна быть простой и очевидной для пользователя. С учетом этого требования OLAP имеет свои недостатки: 1) OLAP рассчитана на анализ процессов (действий): поступление, отгрузка, оплата товара. Но если требуется анализировать состояние объекта, то желательно выбрать другую технологию обработки. 2) OLAP – это инструмент получения информации, поэтому пользователь должен четко представлять информацию, о чем он хочет получить из БД. В случае нечетко сформулированных запросов OLAPработать не будет, т.к. в ее основе лежат SQL-запросы. 3) OLAP предназначена для работы с большими массивами данных, поэтому она может загрузить сразу все ресурсы. Поэтому при использовании OLAP целесообразно большой банк данных разбивать на отдельные хранилища данных и использовать OLAP для анализа какого-либо из них. В настоящее время применяется 4 подхода к использованию OLAP при анализе данных. 1. M- OLAP (Multidimensional) – реализация механизма при помощи многомерной БД на стороне сервера. 2. R- OLAP (Relational) – построение кубов на основе SQL-запросов к реляционной СУБД. Общая схема работы настольной OLAP-системы состоит из следующих этапов: 1) Получение данных в виде плоской таблицы или результата выполнения SQL-запроса. 2) Кэширование данных к преобразованию их к многомерному кубу. 3) Отображение построенного куба при помощи кросс-таблицы или диаграммы (к одному кубу при этом может быть подключено произвольное количество отображений). В кросс-таблице можно выделить следующие элементы: 1) Заголовки столбцов; 2) Заголовки строк; 3) Матрица фактов. Матрица фактов содержит ключевые факты, по которым делаются запросы. Множественные таблицы с измерениями (данными) присоединяются к таблице фактов (так, что получается схема звезды или снежинки. Множественные таблицы показывают, как могут анализироваться агрегированные реляционные данные. Количество возможных агрегирований (уровней иерархии) определяется количеством способов, которыми первоначальные данные могут быть иерархически отображены. При заполнении таблицы фактов поступают следующим образом: 1) На основании даны об измерениях определяют координаты добавляемого элемента в матрице; 2) Определяют координаты столбцов и строк, содержащих итоги, на которые влияет добавляемый элемент; 3) Добавляют элемент в матрицу и соответствующие столбцы и строки итогов. Матрица фактов получается разреженной (не все ее ячейки оказываются заполненными), поэтому для работы с ней применяются специальные механизмы (алгоритмы). 3. H-OLAP (Hibrit) – гибридный. Он использует реляционные таблицы для хранения базовых данных и многомерные таблицы для хранения агрегатов. 4. RR-OLAP (Real Time - OLAP) – OLAP реального времени. Если в R- OLAP для хранения агрегатов создаются дополнительные реляционные таблицы, то в RR- OLAP этого не происходит, а агрегаты рассчитываются непосредственно в момент запроса. При этом многомерный запрос к OLAP-системе автоматически преобразовывается в SQL-запросы к реляционным данным. Каждый тип OLAP имеет определенные преимущества: · M- OLAPлучше всего подходит для небольших наборов данных, он быстро рассчитывает агрегаты, но при этом генерируются большие объемы данных. · R- OLAP использует наименьшие возможные пространства, но при этом скорость обработки данных снижается. · H- OLAP достаточно хорошо масштабируется и при этом быстро обрабатывается. · RR- OLAP позволяет проводить многомерную обработку данных, называемую OLTP-обработкой в реальном времени. Общими преимуществами OLAP-технологии являются: 1) Обеспечивается при разработке OLAP-средств интуитивно понятный пользовательский интерфейс для просмотра данных. 2) Гарантируется высокая производительность выполнения запросов (она оценивается как 1/10 запроса) за счет интеллектуальной навигации по сводным таблицам и разделам. 3) Реализация многомерных структур со связями типа «родитель-потомок» проста и интуитивно понятна.
Дата добавления: 2015-05-09; Просмотров: 2171; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |