КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Технології аналітичного моделювання
Компоненти бази знань База знань, що належить до інтерфейсу користувача, містить всю інформацію про систему, котру користувач мусить знати, щоб використовувати її ефективно. Ці знання стосуються того, які є команди для виконання операцій системи, щоб включити одне, ввести інше, вибрати опції чи змінити їх. Крім користувацького інтерфейсу фундаментальним компонентом СППР є бази даних та системи управління базами даних. Бази даних у СППР грунтуютьься на використанні мов опису даних та мов маніпулювання даними. Розрізнять бази внутрішніх та зовнішніх даних, які в свою чергу діляться на бази публічних (загальнодоступних) даних та бази приватних (закритих) даних. Основними моделями баз даних є ієрархічна (деревоподібна), сітьова (мережева), реляційна, семантична OLAP (абревіатура від On-line Analytical Processing -інтерактивне аналітичне оброблення) фактично означає не окремі конкретні програмні продукти, а технологію багатовимірного аналізу даних, основу якої започаткувала опублікована 1993 року праця Е.Ф. Кода (Е. F. Codd) "OLAP для користувачів-аналітиків: яким воно має бути", у котрій він запропонував 12 правил, які виражали концепцію оперативного аналітичного оброблення даних і фактично послужили стандартом інструментальних засобів оперативного аналітичного оброблення: 1. Багатовимірне концептуальне зображення (Multidimensional conceptual view). Уможливлює користувачу перегляд даних, які можна аналізувати за регіонами, часом тощо. 2. Прозорість (Transparency). Робить базову (що є основою) аналітичну здатність цілком прозорою для користувача. 3. Доступність (Accessibility). Дає змогу створювати власну логічну схему для запам’ятовування неоднорідних фізичних даних. 4. Узгоджена продуктивність щодо створення повідомлень (Consistent reporting performance). Забезпечує надійну продуктивність підготовки звітів для будь-якої кількості вимірів, яку обирає користувач. 5. Архітектура клієнт/сервер (Client/server architecture). Забезпечує мінімум зусиль для використання цієї архітектури. 6. Генерування вимірів (Generic dimensionality). Має тільки одну логічну структуру для подання всіх вимірів. 7. Динамічне оброблення розріджених матриць (Dinamic sparse matrix handling). Ефективно поводиться з пустими або порожніми пропусками в матриці, що роблять матрицю розрідженою. 8. Багатокористувацька підтримка (Multiuser support). Уможливлює одночасний доступ, захист і цілісність для багатьох користувачів. 9. Необмежені перехресно-вимірні операції (Unrestricted cross-dimensional operations). Виконує обчислення і інші операції над вимірами без втручання користувача. 10.Інтуїтивне маніпулювання даними (Intuitive data manipulation). Уможливлює оброблення з деталізацією (drilling down), наближення/віддалення об’єкта, переорієнтацію і консолідоване подання даних і аналізів. 11.Гнучка організація створення звітів (Flexible reporting). Дає змогу користувачам легко і ефективно маніпулювати звітами даних. 12.Необмеженість вимірів і рівнів агрегації (Unlimited dimensoins and aggregation levels). Містить щонайменше 15, а то і 20 вимірів даних. 1995 року до них було додано ще кілька правил, що у своїй сукупності визначили основні сучасні вимоги до OLAP-систем. Ці правила опісля були поділені на чотири групи. 1. Базові характеристики: багатовимірність моделі даних; інтуїтивні механізми маніпулювання даними; доступність; пакетне отримання даних; клієнт-серверна архітектура; прозорість (для користувача); багатокористувацька робота. 2. Спеціальні характеристики: оброблення неформалізованих даних; зберігання результатів окремо від вхідних даних; виокремлення даних, яких бракує (тобто вони мусять відрізнятися від нульового значення); оброблення значень, яких бракує (всі значення, яких бракує, мають бути проігноровані в разі аналізу). 3. Характеристики побудови звітів: гнучкі можливості одержання звітів; стабільна продуктивність за підготовки звітів; автоматичне регулювання фізичного рівня. 4. Керування розмірністю: загальна функціональність; необмежена кількість вимірів і рівнів агрегування; необмежена кількість операцій над даними різних вимірів. Ці концепції покладені в основу технології OLAP, хоча реально наявні OLAP-системи мають далеко не повний перелік описаних характеристик. OLAP-технологія, котру можна назвати також інтерактивним (діалоговим) аналітичним обробленням, дає змогу на основі багатовимірної (гіперкубічної) моделі даних (на відміну від плоскої реляційної моделі даних) моделювати реальні структури і зв’язки, що є виключно важливими для аналітичних систем. Вона призначена для створення багатопараметричних моделей з метою адекватнішого відображення реальних бізнес-процесів. Технологія OLAP дає змогу швидко змінювати погляди на дані залежно від вибраних параметрів і забезпечувати особу, що приймає рішення, повною картиною щодо ситуацій, які аналізуються. Усі OLAP-системи побудовані на двох базових принципах: 1) дані, необхідні для прийняття рішень, слід попередньо агрегувати на всіх відповідних рівнях і організувати так, щоб забезпечити максимально швидкий доступ до них; 2) мова маніпулювання даними основана на бізнес-поняттях. Дані параметруються кількома рівноправними вимірами, наприклад, дані стосовно продажу у великій торговельній компанії можна аналізувати в таких вимірах: "час" (день, тиждень, місяць, квартал, рік), "географія" (місто, область, країна), "товар" (фірма-виробник, вид товару), "покупець" (стать, вік). Засобами користувацького інтерфейсу OLAP-системи можна здійснювати такі базові операції над гіперкубом моделі даних: 1) поворот, щоб змінювати вимірну орієнтацію звіту або сторінку показу на екрані; 2) проекція (при проекції значення в комірках, що лежать на осі проекції, підсумовуються відповідно до визначеної ознаки); 3) розкриття (drill-down), тобто коли одне із значень виміру замінюється сукупністю значень із наступного рівня ієрархії виміру, в такому разі замінюються значення в комірках гіперкуба; 4) згортка (roll-up/drill-up) є операцією, протилежною до операції розкриття; 5) перетин (slice-and-dice) – ініційований користувачем процес навігації за допомогою інтерактивного показу сторінки у вигляді зрізу, використовуючи операції повороту і розкриття. Незважаючи на те, що екран комп’ютера плоский, користувач має змогу спостерігати гіперкуб моделі даних за допомогою відповідних плоских зрізів, використовуючи вищезазначені операції. Оскільки в основі OLAP-технології лежить концепція гіперкуба моделі даних, то залежно від відповіді на запитання, чи існує гіперкуб як окрема фізична структура? чи це є лише віртуальна модель даних? розрізняють два основних типи аналітичного оброблення даних: MOLAP і ROLAP. MOLAP (Multidimensional OLAP) – це багатовимірна OLAP-система, в котрій гіперкуб реалізується як окрема база даних нереляційної структури, яка забезпечує багатовимірне зберігання, оброблення і подання даних. Програмні продукти, що належать до цього типу OLAP-технології, як правило, мають сервер багатовимірних баз даних. Ця структура забезпечує максимально ефективний щодо швидкості доступ до даних, проте потребує додаткового ресурсу пам’яті. Крім того, велика розмірність моделі даних і розрідженість гіперкубів приводить до необхідності витрат великих апаратних ресурсів, що не завжди може бути доцільним. Є чотири провідні продавці серверів MOLAP: Arbor Software (Essbase), Kenan Technologies (Acumate Enterprise), Oracle/IRI (Express), D& B/Pilot Software (Lightship). Крім того, недавно були розроблені нова версія сервера Cognos PowerPlay і новий мультивимірний сервер інституту SAS. У ROLAP (Relational OLAP) багатовимірна структура реалізується реляційними таблицями, тобто гіперкуб – це лише користувацький інтерфейс, котрий емулюється на звичайній реляційній СКБД. Така структура забезпечує зберігання великих обсягів інформації, проте є менш продуктивною з погляду ефективності OLAP-операцій. Незважаючи на те, що продавці ROLAP увійшли в ринок програмних продуктів тільки протягом останніх кількох років, чотири з них стали досить відомими. Два з них знаходяться серед найшвидше зростаючих корпорацій у Сполучених Штатах. Цими чотирма компаніями є: Microstrategy, Information Advantage, Stanford Technology Group (недавно придбаний Informix), IQ Software. Нині відкриті сайти ROLAP, що містять аналітичні механізми сервера, створення звітів і інструментальні засоби аналізу, інструментальні засоби проектування системи та програмне забезпечення. Певні недоліки, характерні основним типам OLAP-технологій, привели до появи нового типу аналітичних інструментів – HOLAP-систем, що являють собою гібридне (hybrid) оперативне аналітичне оброблення даних, де реалізуються обидва підходи, тобто доступ може надаватися як до багатовимірних баз даних, так і до даних реляційного типу. На даний час розроблено досить багато систем підтримки прийняття рішень, сконструйованих з використанням OLAP-технології (Hyperion OLAP, Elite OLAP, Oracle Express та багато інших). Ринок програмних OLAP-продуктів постійно розширюється. Сучасні системи оперативного аналітичного оброблення надають користувачам можливості розв’язувати ключові завдання управління бізнес-процесом, зокрема додатки Hyperion OLAP дають змогу користувачам виконувати такі завдання: аналіз прибутковості; аналіз напрямів розвитку продукції; аналіз продажу; аналіз стану на ринку; аналіз асортименту продуктів; аналіз ризику; аналіз конкурентоспроможності; складання звітів з продуктивності; моделювання сценарію; аналіз бюджету і прогнозів тощо. Слід іще раз підкреслити, що згідно із сучасними поглядами на створення інформаційних систем OLAP-системи мають базуватися на спеціальній базі даних – сховищі даних, але можуть використовуватися і автономно.
Дата добавления: 2014-01-04; Просмотров: 1277; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |