Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Применение готовых хранилищ данных

ETL-средства

ETL-средства (extraction, transformation, loading) - средства извлечения, преобразования и загрузки данных) обеспечивают три основных процесса, используемые при переносе данных из одного приложения или системы в другие. ETL-средства извлекают информацию из исходной БД, преобразуют ее в формат, поддерживаемый базой данных назначения, а затем загружают в нее преобразованную информацию. Эти средства обычно входят в состав функциональности реляционных и многомерных СУБД или Студий для построения ХД. Однако существуют и специализированные системы, реализующие только ETL-функции. Классической ETL-системой является, например, продукт Ascential DataStage компании Ascential Software.
Это самый надежный способ построить ХД в сжатые сроки. Готовые к эксплуатации ХД характеризуются наличием в них механизмов средств построения Хранилищ/Витрин данных, взаимосвязанных посредством единого словаря метаданных. К ним относятся - процедуры извлечения, преобразования, очистки и загрузки данных, функции генерации БД и процедур обработки, механизмы построения выборок данных, интерфейсы просмотра и анализа данных. Ограничением в применении готовых ХДявляется их предметная ориентация. Например, финансовое ХД невозможно применить для решения задач оптимизации химического производства. Ниже описаны подходы и продукты ведущих поставщиков, имеющие связь с технологией ХД. IBM - A Data Warehouse Plus - ХД Решение компании IBM называется A Data Warehouse Plus. Целью компании является обеспечение интегрированного набора программных продуктов и сервисов, основанных на единой архитектуре. Основой ХД является семейство СУБД DB2. Преимуществом IBM является то, что данные, которые нужно извлечь из оперативной БД и поместить в ХД, находятся в системах IBM. Поэтому естественная тесная интеграция программных продуктов. Предлагаются три решения для хранилищ данных:
  • изолированный рынок данных - для решения отдельных задач вне связи с общим ХДм корпорации.
  • зависимый рынок данных - а налогичен изолированному рынку данных, но источники данных находятся под централизованным контролем.
  • глобальный ХД. Корпоративное ХД, которое полностью централизовано, контролируется и управляется. Глобальное ХД может храниться централизовано или состоять из нескольких распределенных в сети рынков данных.
Oracle - Warehouse Technology Initiative - хранилище данных Решение компании Oracle в области ХД основывается на двух факторах: широкий ассортимент продуктов самой компании и деятельность партнеров в рамках программы Warehouse Technology Initiative. Возможности Oracle в области ХД базируются на следующих составляющих:
  • наличие реляционной СУБД Oracle 7, которая постоянно совершенствуется для лучшего удовлетворения потребностей ХД;
  • существование набора готовых приложений, обеспечивающих возможности разработки ХД;
  • высокий технологический потенциал компании в области анализа данных;
  • доступность ряда продуктов, производимых другими компаниями.
Hewlett Packard - Open Warehouse - хранилище данных Работы, связанные со складами данных, выполняются в рамках программы Open Warehouse. Выполнение этой программы должно обеспечить возможность построения ХД на основе мощных компьютеров HP, аппаратуры других производителей и программных компонентов. Основой подхода HP являются Unix-платформы и программный продукт Intelligent Warehouse, который предназначен для управления складами данных. Основа построения ХД, предлагаемая HP, оставляет свободу выбора реляционной СУБД, средств реинжиниринга и т.д. Sybase - Warehouse WORKS - хранилище данных Стратегия компании в области ХД основывается на разработанной ей архитектуре Warehouse WORKS. В основе подхода находится реляционная СУБД Sybase System 11, средство для подключения и доступа к базам данных Omni CONNECT и средство разработки приложений PowerBuilder. Компания продолжает совершенствовать свою СУБД для лучшего удовлетворения потребностей ХД (например, введена побитная индексация). Informix Software - On-Line Dynamic Parallel Server - ХД Стратегия компании в отношение ХД направлена на расширение рынка для ее продукта On - Line Dynamic Parallel Server. Предлагаемая архитектура ХД базируется на четырех технологиях: реляционные БД, программном обеспечении для управления ХД, средствах доступа к данным и платформе открытых систем. Три последних компонента разрабатываются партнерами компании. После выхода Универсального Сервера, основанного на объектно-реляционном подходе, можно ожидать, что и он будет использоваться для построения ХД. AT&T GIS - Enterprise Information Factory - хранилище данных Решение компании направлено на решение проблем корпораций, у которых одинаково сильны потребности и в системах поддержки принятия решений, и в системах оперативной аналитической обработки данных. Предлагаемая архитектура называется Enterprise Information Factory и основывается на опыте использования системы управления базами данных Teradata и связанных с ней методах параллельной обработки. SAS Institute Компания считает себя поставщиком полного решения для организации ХД. Подход основан на следующем:
  • обеспечение доступа к данным с возможностью их извлечения из самых разнообразных ХД(и реляционных, и не реляционных);
  • преобразование данных и манипулирование ими с использованием 4GL;
  • наличие сервера многомерных БД;
  • большой набор методов и средств для аналитической обработки и статистического анализа.
Software AG - Open Data Warehouse Initiative - хранилище данных Деятельность компании в области ХД происходит в рамках программы Open Data Warehouse Initiative. Программа базируется на основных продуктах компании ADABAS и Natural 4GL, собственных и приобретенных средствах извлечения и анализа данных, средстве управления ХД SourcePoint. SourcePoint позволяет автоматизировать процесс извлечения и пересылки данных, а также их загрузки в ХД.
<== предыдущая лекция | следующая лекция ==>
Средства и методы построения ХД - хранилищ данных | Студии для построения ХД - хранилищ данных
Поделиться с друзьями:


Дата добавления: 2014-01-15; Просмотров: 288; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.012 сек.