Последнее обновление: 16.02.2016
Желательно, чтобы хранилище данных организации содержало в себе всю информацию за все время ее существования. С точки зрения структуры хранилища данных — это может быть реляционная схема, либо «звезда», либо «снежинка» – в зависимости от выбранной методологии.
При необходимости, на основании хранилища данных могут быть построены более мелкие базы данных в схеме «звезда» (витрины данных) для хранения информации по более узким темам и оптимизации извлечения данных аналитическими запросами.

Для создания хранилищ используются следующие технологии:
- реляционная база данных Azure SQL DB или SQL Server (традиционно – в собственном центре обработки данных компании; желательно на базе рекомендованных архитектур FastTrack DW для десятков терабайт информации);
- линейно масштабируемая многоузловая база Azure SQL DW или программно-аппаратный комплекс для задач создания хранилищ данных APS = SQL Server Parallel Data Warehouse (PDW).
- виртуальные машины с SQL Server для хранения данных в «облаке» (SQL Server for Data Warehousing Azure VM);
- в качестве промежуточного хранилища — линейно масштабируемые хранилища полу-структурированных и неструктурированных данных («большие данные» — петабайты информации) в решении HDInsight (Hadoop для Windows) и средства построения отчетности на основании этой информации.
Для повышения скорости обработки аналитических запросов к базам данных рекомендуется использовать колоночные индексы (ColumnStore Indexes).
Дополнительная информация:
- Articles on ColumnStore Indexes by Niko Neugebauer


Добавить комментарий