Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Возможность обработки данных во время загрузки




Высокая производительность загрузки данных

СУБД для хранилища данных

СУБД для хранилищ данных очень редко бывает источником проблем интеграции. Благодаря относительной зрелости таких программных продуктов, большинство реля­ционных баз данных интегрируется с другими типами программного обеспечение впол­не предсказуемым образом. Однако потенциальным источником проблем может послу­жить большой размер базы данных хранилища. При работе с подобной базой данных становится особенно важным обеспечение параллельности, а также таких традиционно важных параметров, как высокая производительность, масштабируемость, готовность и управляемость, что обязательно следует принимать во внимание при выборе СУБД.

Сначала мы рассмотрим основные требования, предъявляемые к СУБД для хра­нилища данных, а затем кратко обсудим, как можно организовать в хранилищах данных параллельное выполнение вычислений.

Требования к СУБД для хранилища данных

Специализированные требования к реляционной СУБД (РСУБД), предназначенной для хранилища данных, были опубликованы в документе White Paper (Red Brick Systems, 1996). Вот эти требования.

– Высокая производительность загрузки данных.

– Возможность обработки данных во время загрузки.

– Наличие средств управления качеством данных.

– Высокая производительность запросов.

– Широкая масштабируемость по размеру (до терабайт).

– Масштабируемость по количеству пользователей.

– Возможность организации сети хранилищ данных.

– Наличие средств администрирования хранилища.

– Поддержка интегрированного многомерного анализа.

– Расширенный набор функциональных средств запросов

В хранилищах данных требуется периодически выполнять загрузку порций но­вых данных, причем в ограниченных временных рамках. Производительность про­цесса загрузки в подобных случаях должна измеряться в сотнях миллионов строк или гигабайтах данных в час. Со стороны бизнес - задач не существует никаких огра­ничений в отношении максимально допустимого уровня производительности.

При загрузке в хранилище новых или обновленных данных обычно требуется вы­полнение нескольких последовательных этапов, включающих преобразование дан­ных, фильтрование, переформатирование, проверку целостности, физическое сохра­нение, индексирование и обновление метаданных. На практике каждый такой этап может выполняться по отдельности, однако в общем, процесс загрузки должен вы­глядеть как единая неразрывная процедура.




Поделиться с друзьями:


Дата добавления: 2015-05-09; Просмотров: 499; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.006 сек.