Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Данные для анализа подготовки спортсменов




Место дислокации Время Вид спорта Объем (тыс.$) финанс-ния Колич-во спортс-ов
Сочи   Бобслей    
Сочи   Бобслей    
Сочи   Коньки    
Сочи   Коньки    
Сочи   Лыжи    
Сочи   Лыжи    
Москва   Бобслей    
Москва   Коньки    
Москва   Коньки    
Москва   Лыжи    
Томск   Бобслей    
Томск   Бобслей    
Томск   Коньки    
Томск   Коньки    
Томск   Лыжи    
Томск   Лыжи    

Таким образом, в основе OLAP лежит идея многомерной модели данных, обычно представляемая в виде гиперкуба (рис. 2). И это очень удобно для проведения анализа потому, что человеческое мышление многомерно по определению. Когда человек задает вопросы, он налагает ограничения, тем самым, формулируя вопросы во многих измерениях, поэтому процесс анализа в многомерной модели приближен к реальности человеческого мышления.

Рис. 2 - Трехмерное представление таблицы 1.

 

В OLAP должны использоваться агрегированные данные. Дело в том, что пользователя, занимающегося анализом, редко интересуют детализированные данные. Чем выше уровень пользователя (руководителя, управляющего, аналитика), тем выше уровень агрегации данных, используемых им для принятия решения. Например, коммерческого директора фирмы по продаже автомобилей мало интересует вопрос: "Какого цвета "Жигули" успешнее всего продает один из ее менеджеров - Петров: белого или красного?" Для него важно, какие модели, и какие цвета предпочитают в данном регионе. Его также мало интересует детализация на уровне контракта, часа или даже дня. Для правильного формирования запасов на складе ему важна и необходима информация на уровне декады, месяца или даже квартала.

Важнейшим свойством данных в аналитических задачах является их Исторический характер. После того как зафиксировано, что в Сочи в 2007 году проходили подготовку 314 лыжников, данные об этом событии становятся историческим (свершившимся) фактом. Информация об этом факте может многократно считываться из БД, но уже не может и не должна быть изменена.

Другим неотъемлемым свойством Исторических данных является обязательная спецификация Времени, которому эти данные соответствуют. Причем Время является не только наиболее часто используемым критерием выборки, но и одним из основных критериев, по которому данные упорядочиваются в процессе обработки и представления пользователю. Кроме этого, время является стандартным параметром практически любой аналитической, статистической или финансовой функции (прогноз, нарастающий итог, переходящий запас, скользящее среднее и т.д.). Наличие Исторических данных в системе обеспечивает выполнение такой важной функции как прогнозирование данных, то есть данных о событии, которое еще не происходило

Если сравнить данные из Таблицы 1 и куба на рис. 2, то легко заметить, что OLAP не дает никаких новых данных, которых не было у пользователей при работе с реляционной БД. Аналитики могли заказать у IT-специалистов какой-то новый отчет и из него получить любую цифру. Весь вопрос в том, додумались ли бы они до формулировки задачи и, за какое время этот отчет был бы сделан. То есть OLAP предоставляет больше возможностей по работе с данными, но сами данные для его работы нужны те же, с которыми работают и не OLAP-системы.

Комплексный взгляд на собранную в хранилище данных информацию, ее обобщение и агрегация, гиперкубическое представление и многомерный анализ являются задачами систем оперативной аналитической обработки данных (OLAP).

 

2. Многомерное представление при описании структур данных

 

Основными понятиями, с которыми оперирует пользователь и проектировщик в многомерной модели данных, являются:

• измерение (Dimension);

• ячейка (Cell).

Иногда вместо термина «Ячейка» использует­ся термин «Показатель».

Измерение — это множество однотипных дан­ных, образующих одну из граней гиперкуба. На­пример, Дни, Месяцы, Кварталы, Годы — это наиболее часто используемые в анализе времен­ные Измерения. Примером географических измерений являются: Районы, Города, Регионы, Страны.

В многомерной модели данных Измерения иг­рают роль индексов, используемых для идентификации конкретных значений (Показате­лей), находящихся в Ячейках гиперкуба (рис. 3).

Рисунок 3 - Измерения и Показатели гиперкуба

 

В свою очередь, Показатель — это поле (обыч­но количественное), значения которого однозначно оп­ределяются фиксированным набором Измерений. В Oracle Express Server, в зависимости от того, как формируются его значения, Показатель может быть определен, как:

• переменная (Variable) — значения таких По­казателей один раз вводятся из какого-либо внеш­него источника или формируются программно, а затем в явном виде хранятся в многомерной базе данных (МБД);

• формула (Formula) — значения таких Пока­зателей вычисляются по некоторой заранее специ­фицированной формуле, то есть для Показателя, имеющего тип Формула. В этом случае в БД хранятся не его значения, а формула, по которой эти значения вычисляются при каждом обращении.

Это различие существует только на этапе проектирования и полностью скрыто от конечных пользователей. На рисунке 3 каждое значение показателя Объем продаж однозначно определяется комбинацией полей (значениями Измерений):

• модель автомобиля; • менеджер; • время (например, Год).

Поэтому в терминах многомерной модели речь будет идти уже не о двумерной таблице, а о трехмерном гиперкубе:

• первое Измерение - Модель автомобиля;

• второе Измерение - Менеджер, продавший автомобиль;

• третье Измерение - Время (Год).

На пересечении граней куба находятся значения Показателя – «Объем продаж».

В отличие от Измерений, не все значения Показателей должны иметь, и имеют реальные значения. Например, менеджер Синицын в 2009 году мог уже не работать в фирме, и в этом случае все значения Показателя «Объем продаж» за этот год будут иметь для него неопределенные значения. В различных многомерных СУБД используются два основных варианта организации данных: гиперкубическая модель; поликубическая модель.

Системы, поддерживающие поликубическую модель (примером является Oracle Express Server), предполагают, что в МБД может быть определено несколько гиперкубов с различной размерностью и с различными Измерениями в качестве их граней. Например, значение Показателя «Рабочее время менеджера», скорее всего, не зависит от Измерения «Модель Автомобиля» и однозначно определяется двумя Измерениями: «День» и «Менеджер». В поликубической модели в этом случае может быть объявлено два различных гиперкуба:

Двумерный - дляПоказателя «Рабочее время менеджера»;

Трехмерный - для Показателя «Объем прода ж».

В случае же гиперкубической модели предполагается, что все Показатели должны определяться одним и тем же набором Измерений. То есть только из-за того, что «Объем продаж»определяется тремя Измерениями, при описании Показателя «Рабочее время менеджера» пришлось бы также использовать три Измерения и вводить избыточное для этого Показателя Измерение «Модель автомобиля».

 




Поделиться с друзьями:


Дата добавления: 2014-01-04; Просмотров: 372; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.045 сек.