Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Хранилища данных




После изучения этого раздела вы должны иметь представление о хранилищах данных, их назначении, структуре хранения информации в хранилищах.

В последнее время информационная структура современных ИС, предоставляющих своим пользователям помимо автоматизации повседневной деятельности предприятий, банков и т.д., еще и аналитические возможности, планирование и прогнозирование их состояния, строится на основе хранилищ данных (Data Warehouse).

Хранилища данных представляют собой логически интегрированную базу данных, обеспечивающую максимально быстрый и удобный доступ к информации, необходимой для анализа и поддержки принятия решений.

Хранилища данных характеризуются следующими основными особенностями:

  1. Ориентация на предметную область, то есть в хранилище помещается информация, полезная для работы систем поддержки принятия решений, и ее структура должна быть понятна пользователям.
  2. Защищенность, предусматривающая неизменность и немодифицируемость данных, помещенных в хранилище, и доступность только в режиме чтения.
  3. Поддержка хронологических данных, определяющая тот факт, что для анализа требуется информация, накопленная за длительный период времени.
  4. Интеграция в едином хранилище ранее разъединенных данных, поступающих как из внутренних, так и внешних источников, а также их проверку, согласование и структурирование.
  5. Агрегация, предусматривающая хранение не оперативных данных, а сортируемую, фильтруемую и определенным образом обработанную информацию (суммарную информацию).
  6. Разделение наборов данных, используемых для оперативной обработки, и тех, которые применяются для решения аналитических задач.

Основными источниками наполнения хранилища данных являются традиционные оперативные системы обработки данных (OLTP-системы) и различные внешние источники, например, публичные отчеты предприятий, исторические архивы, результаты биржевых торгов, Интернет и т.п.

Хранилище данных имеет структуру в виде «гиперкуба» - многомерного куба пространства агрегированных множеств (или значений). Величины, хранящиеся в ячейках этого куба и называемые фактами, представляют собой количественные показатели, характеризующие деятельность предприятия. Измерения куба представляют собой множество однотипных данных, предназначенных для описания фактов. В качестве примеров детализации измерений могут выступать филиалы, объединенные по территориальному признаку; поставщики или потребители продукции; даты (или интервалы), на которые производились вычисления и т.п. Каждая ячейка данного куба "отвечает" за конкретный набор значений по его измерениям.

Анализ информации представляет собой выполнение различных математических и логических операций над этим кубом: формирование плоскостных срезов, детализация и выделение блоков данных, проекция, агрегация.

Отличительной особенностью хранилища данных является наличие метаданных, то есть данные о данных. Они играют роль справочников, содержащих сведения об источниках первичных данных, о методах загрузки информации из них, об алгоритмах обработки, которым были подвергнуты исходные данные, описание структуры этих данных и их взаимосвязей, периодичность их обновления и т.д.

Одним из вариантов реализации на практике хранилища данных является построение витрин данных (Data Marts). Витрина данных представляет собой относительно небольшие и специализированные хранилища данных, содержащие только тематически ориентированные (объединенные) данные и предназначенные для использования конкретным функциональным подразделением.

Структура витрин данных также ориентирована на многомерную организацию данных в виде куба. Однако их построение в силу ограниченности информационного диапазона, обеспечивающего потребности одного бизнес-процесса, значительно проще и выгоднее.

Контрольные вопросы к главе 4

Попробуйте ответить на эти вопросы, не обращаясь к материалу учебника. Если у вас возникают затруднения, следуйте по ссылкам, указанным после вопроса.

  1. Дайте определение понятия «информационное обеспечение». см. 4.1
  2. Из каких частей состоит информационное обеспечение? см. 4.1
  3. В чем состоит основное назначение информационного обеспечения? см. 4.1
  4. Чем вызвана необходимость в классификации и кодировании информации? см. 4.2
  5. Дайте определение понятия «классификация». см. 4.2.1
  6. Каким целям служит классификация? см. 4.2.1
  7. Что такое классификатор? см. 4.2.1
  8. Какие классификаторы, применяемые в экономике, вы знаете? см. 4.2.1
  9. Каковы основные системы классификации? см. 4.2.1
  10. Каковы достоинства и недостатки иерархической системы классификации? см. 4.2.1.1
  11. Назовите пример иерархической классификации. см. 4.2.1.1
  12. Опишите основные принципы фасетной классификации. см. 4.2.1.2
  13. Приведите пример фасетной классификации. см. 4.2.1.2
  14. В чем состоит сущность дескрипторной системы классификации? см. 4.2.1.3
  15. Определите понятие «кодирование». см. 4.2.2
  16. Что такое код? см. 4.2.2
  17. Какие основные системы кодирования вы знаете? см. 4.2.2
  18. Каковы достоинства и недостатки поразрядной системы кодирования? см. 4.2.2.1
  19. Опишите сущность системы повторения и ее особенности. см. 4.2.2.1
  20. В чем различия порядковой и серийной системы кодирования? см. 4.2.2.2
  21. Каковы преимущества серийной системы кодирования? Где она применяется? см. 4.2.2.2
  22. Какие требования необходимо учесть при выборе системы классификации и кодирования? см. 4.2.3
  23. Что такое унифицированная система документации? см. 4.3
  24. Какие основные группы документов включает система документации? см. 4.3
  25. Назовите основные информационные потоки документооборота. см. 4.4
  26. Что такое внутримашинное обеспечение? см. 4.5
  27. Какие основные требования необходимо учитывать при организации информационного фонда? см. 4.5
  28. В чем состоит сущность файловой организации данных? см. 4.6.1
  29. Каковы недостатки файловой организации данных? см. 4.6.1
  30. Определите понятие «база данных»? см. 4.6.2
  31. Дайте определение понятия «элемент данных». см. 4.6.2.1
  32. Назовите основные структурные элементы базы данных. см. 4.6.2.1
  33. Определите соответствие между понятиями "атрибут", "запись", "файл БД" и "массив", "показатель", "реквизит". см. 4.6.2.1
  34. Какие модели данных, лежащие в основе баз данных, вы знаете?. см. 4.6.2.2
  35. Какова структура реляционной базы данных? см. 4.6.2.2
  36. С чем связано широкое распространение баз данных реляционного типа? см. 4.6.2.2
  37. Что такое первичный ключ? см. 4.6.2.2
  38. Какой первичный ключ называются составным? см. 4.6.2.2
  39. Что такое внешний ключ? см. 4.6.2.2
  40. Каким образом осуществляется связь между двумя таблицами реляционной базы данных? см. 4.6.2.2
  41. Каким образом поддерживается целостность связей в реляционной базе данных? см. 4.6.2.2
  42. Чем реляционные базы данных отличаются от постреляционных? см. 4.6.2.3
  43. Какие недостатки реляционной базы данных снимаются в постреляционной модели? см. 4.6.2.3
  44. В чем преимущество постреляционных баз данных? см. 4.6.2.3
  45. Что такое хранилище данных? см. 4.7
  46. Каковы основные особенности хранилищ данных? см. 4.7
  47. Каковы источники наполнения хранилищ данных? см. 4.7
  48. Как организована информация в хранилищах данных? см. 4.7
  49. Для каких целей предназначены хранилища данных? см. 4.7
  50. Дайте определения витрины данных. см. 4.7

Глава 5. Технологическое обеспечение




Поделиться с друзьями:


Дата добавления: 2014-12-27; Просмотров: 1240; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.008 сек.