Архитектуры и комплексы для хранилищ данных

Введение

В связи с массовым развитием реляционных хранилищ данных на базе SQL Server, наличием более тысяч реализаций терабайтных хранилищ и большим разнообразием вариантов внедрения Microsoft совместно с поставщиками серверов и систем хранения разработали линейку программно-аппаратных комплексов и ссылочных архитектур для хранилищ данных.

Эти архитектуры и комплексы несут в себе лучшие практики организации хранилищ данных, а также сбалансированы по используемым компонентам (а, следовательно, имеют минимальную стоимость при имеющемся уровне производительности).

С точки зрения базы данных они оптимизированы для сложных аналитических запросов и массивных вставок данных, а с точки зрения системы хранения – на операциях чтения больших объемов путем последовательного сканирования.

Справочные архитектуры (FastTrack DW) представлены как:

  • методы построения эффективной по затратам, сбалансированной системы для загрузки, типично для хранилищ данных;
  • эталонные аппаратные конфигурации разработаны с поставщиками оборудования;
  • рекомендации размещения, загрузки и управления  данными.

Программно-аппаратные комплексы (Business DW Appliance и Enterprise DW Appliance – PDW) являются полностью собранными и настроенными решениями. Они построены под определенный тип нагрузки (в нашем случае это хранилища данных), на базе выверенной архитектуры, с использованием необходимого программного и аппаратного обеспечения.

Сравнение архитектур и комплексов

Предлагаемые архитектуры и комплексы представлены в таблице ниже (подробнее поговорим о них в следующих заметках).

Следует обратить внимание, что особенностью программно-аппаратных комплексов являются малые усилия для их внедрения, в отличие от ссылочных архитектур, по которым нужно отдельно настраивать аппаратное и программное обеспечение по имеющимся руководствам (средние усилия). Тем не менее, вариант самостоятельного построения систем, оптимизированных для задач хранилищ данных, является очень трудоемким.

Подход к построению BI-решений «Hub and Spoke»

Для реальных задач, связанных с созданием аналитических систем и использованием хранилищ данных перечисленные выше комплексы и архитектуры можно и нужно комбинировать, используя подход «Hub and Spoke» (дословно – «центр и спицы»).

Пример такого подхода приведен на следующем рисунке, где в качестве центрального хранилища с полным набором данных о деятельности предприятия используется PDW, в правой части отдельный экземпляр PDW используется для максимально быстрого формирования отчетности (в данном случае важна именно скорость, а не объемы данных), зона выгрузки центрального PDW используется как источник для отдельной базы SS 2008 EE, отдельные два экземпляра FastTrack DW используются, соответственно, для региональной отчетности и отчетности конкретного подразделения.

Дополнительные материалы:

Добавить комментарий

Заполните поля или щелкните по значку, чтобы оставить свой комментарий:

Логотип WordPress.com

Для комментария используется ваша учётная запись WordPress.com. Выход / Изменить )

Фотография Twitter

Для комментария используется ваша учётная запись Twitter. Выход / Изменить )

Фотография Facebook

Для комментария используется ваша учётная запись Facebook. Выход / Изменить )

Google+ photo

Для комментария используется ваша учётная запись Google+. Выход / Изменить )

Connecting to %s

%d такие блоггеры, как: