ETL-средства (extraction, transformation, loading) - средства извлечения, преобразования и загрузки данных) обеспечивают три основных процесса, используемые при переносе данных из одного приложения или системы в другие. ETL-средства извлекают информацию из исходной БД, преобразуют ее в формат, поддерживаемый базой данных назначения, а затем загружают в нее преобразованную информацию. Эти средства обычно входят в состав функциональности реляционных и многомерных СУБД или Студий для построения ХД. Однако существуют и специализированные системы, реализующие только ETL-функции. Классической ETL-системой является, например, продукт Ascential DataStage компании Ascential Software.
Это самый надежный способ построить ХД в сжатые сроки. Готовые к эксплуатации ХД характеризуются наличием в них механизмов средств построения Хранилищ/Витрин данных, взаимосвязанных посредством единого словаря метаданных. К ним относятся - процедуры извлечения, преобразования, очистки и загрузки данных, функции генерации БД и процедур обработки, механизмы построения выборок данных, интерфейсы просмотра и анализа данных. Ограничением в применении готовых ХДявляется их предметная ориентация. Например, финансовое ХД невозможно применить для решения задач оптимизации химического производства.
Ниже описаны подходы и продукты ведущих поставщиков, имеющие связь с технологией ХД.
IBM - A Data Warehouse Plus - ХД
Решение компании IBM называется A Data Warehouse Plus. Целью компании является обеспечение интегрированного набора программных продуктов и сервисов, основанных на единой архитектуре. Основой ХД является семейство СУБД DB2. Преимуществом IBM является то, что данные, которые нужно извлечь из оперативной БД и поместить в ХД, находятся в системах IBM. Поэтому естественная тесная интеграция программных продуктов.
Предлагаются три решения для хранилищ данных:
изолированный рынок данных - для решения отдельных задач вне связи с общим ХДм корпорации.
зависимый рынок данных - а налогичен изолированному рынку данных, но источники данных находятся под централизованным контролем.
глобальный ХД. Корпоративное ХД, которое полностью централизовано, контролируется и управляется. Глобальное ХД может храниться централизовано или состоять из нескольких распределенных в сети рынков данных.
Oracle - Warehouse Technology Initiative - хранилище данных
Решение компании Oracle в области ХД основывается на двух факторах: широкий ассортимент продуктов самой компании и деятельность партнеров в рамках программы Warehouse Technology Initiative. Возможности Oracle в области ХД базируются на следующих составляющих:
наличие реляционной СУБД Oracle 7, которая постоянно совершенствуется для лучшего удовлетворения потребностей ХД;
существование набора готовых приложений, обеспечивающих возможности разработки ХД;
высокий технологический потенциал компании в области анализа данных;
доступность ряда продуктов, производимых другими компаниями.
Hewlett Packard - Open Warehouse - хранилище данных
Работы, связанные со складами данных, выполняются в рамках программы Open Warehouse. Выполнение этой программы должно обеспечить возможность построения ХД на основе мощных компьютеров HP, аппаратуры других производителей и программных компонентов. Основой подхода HP являются Unix-платформы и программный продукт Intelligent Warehouse, который предназначен для управления складами данных. Основа построения ХД, предлагаемая HP, оставляет свободу выбора реляционной СУБД, средств реинжиниринга и т.д.
Sybase - Warehouse WORKS - хранилище данных
Стратегия компании в области ХД основывается на разработанной ей архитектуре Warehouse WORKS. В основе подхода находится реляционная СУБД Sybase System 11, средство для подключения и доступа к базам данных Omni CONNECT и средство разработки приложений PowerBuilder. Компания продолжает совершенствовать свою СУБД для лучшего удовлетворения потребностей ХД (например, введена побитная индексация).
Informix Software - On-Line Dynamic Parallel Server - ХД
Стратегия компании в отношение ХД направлена на расширение рынка для ее продукта On - Line Dynamic Parallel Server. Предлагаемая архитектура ХД базируется на четырех технологиях: реляционные БД, программном обеспечении для управления ХД, средствах доступа к данным и платформе открытых систем. Три последних компонента разрабатываются партнерами компании. После выхода Универсального Сервера, основанного на объектно-реляционном подходе, можно ожидать, что и он будет использоваться для построения ХД.
AT&T GIS - Enterprise Information Factory - хранилище данных
Решение компании направлено на решение проблем корпораций, у которых одинаково сильны потребности и в системах поддержки принятия решений, и в системах оперативной аналитической обработки данных. Предлагаемая архитектура называется Enterprise Information Factory и основывается на опыте использования системы управления базами данных Teradata и связанных с ней методах параллельной обработки.
SAS Institute
Компания считает себя поставщиком полного решения для организации ХД. Подход основан на следующем:
обеспечение доступа к данным с возможностью их извлечения из самых разнообразных ХД(и реляционных, и не реляционных);
преобразование данных и манипулирование ими с использованием 4GL;
наличие сервера многомерных БД;
большой набор методов и средств для аналитической обработки и статистического анализа.
Software AG - Open Data Warehouse Initiative - хранилище данных
Деятельность компании в области ХД происходит в рамках программы Open Data Warehouse Initiative. Программа базируется на основных продуктах компании ADABAS и Natural 4GL, собственных и приобретенных средствах извлечения и анализа данных, средстве управления ХД SourcePoint. SourcePoint позволяет автоматизировать процесс извлечения и пересылки данных, а также их загрузки в ХД.
Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет
studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав!Последнее добавление