Предсказательный анализ данных по здравоохранению

Начинаю публиковать сценарии, которые не удалось показать в полном объеме на «Дне платформы Microsoft».

В этой демонстрации показано использование движка интеллектуального анализа данных SQL Server (SSAS Data Mining) и надстройку интеллектуального анализа для Excel с целью анализа некоторых данных статистического сборника Росстата по здравоохранению. Анализируется влияние различных факторов на низкий и высокий уровень смертности в регионах (субъектах РФ).

В настоящее время ведутся работы по расширению представленной модели данных. Буду благодарен за любые идеи по ее расширению.

Следует также обратить внимание, что потенциально возможны неточности при сборке и интерпретации данных. Буду благодарен за любые исправления.

Анализ «больших данных» для финансового сектора

Публикую демонстрационный сценарий анализа «больших данных» (Big Data) для компаний финансового сектора. В сценарии будут проанализированы полу-структурированные данные по стоимости акций и дивидендам в разрезе соответствующих отраслей экономики за 30 лет (на основании данных Нью-Йоркской фондовой биржи). Аналогичные задачи могут быть актуальны для участников рынка ценных бумаг включая частных и институциональных инвесторов, таких как пенсионные фонды, банки, страховые компании, а также корпорации, размещающие на рынке собственные ценные бумаги.

В этой демонстрации команда компании, торгующей ценными бумагами, совместно производит анализ данных из Hadoop:

  1. Архитектор данных собирает информацию и делает ее доступной для других участников. Он использует Hadoop в Windows Azure и запросы Hive для агрегирования (укрупнения) стоимости акций и дивидендов по годам.
  2. Финансовый аналитик анализирует данные по стоимости акций и готовит отчеты для поддержки задач торговли и управления. Она использует надстройку Power Query для Excel для объединения данных из Hadoop с дополнительным набором данных по 500 наиболее крупным компаниям из Azure Marketplace Datamarket. Дополнительно она формирует модель данных Power Pivot и создает примеры отчетов Power View.
  3. Начальник управления ценных бумаг отвечает за формирование предложения по составу портфелей ценных бумаг для клиентов. Он самостоятельно производит изменения в отчеты Power View, полученные от финансового аналитика.

Ниже приведены некоторые снимки экрана из демонстрационного сценария.

role1-rus

role1-1

role1-2

role2-rus

role2-1

role2-2

role3-rus

role3-1

role3-2

 

 

Примеры внедрений Microsoft BI в России

Спешу поделиться списком некоторых внедрений Microsoft BI в России (спасибо Жанне Кривозубовой).

  1. ЗАО «Кредит Европа Банк»
  2. «Л’Этуаль»
  3. «Ренессанс Капитал»
  4. ОАО «Мосэнерго»
  5. ФГУ «Объединение «Росинформресурс»
  6. «Ассорти»
  7. ООО «ПрессХаус»
  8. Торговая сеть «Планета ЭЛЕКТРИКА»
  9. Медком-МП
  10. ООО «Мультикарта»
  11. Триколор ТВ
  12. Высший Арбитражный Суд РФ
  13. OZON.ru
  14. Сбербанк России
  15. Logitech
  16. ВСК

При этом нужно понимать, что если в организации закуплен Excel 2013, наверняка кто-нибудь его использует как минимум для персональной аналитики в составе PowerPivot для Excel и Power View.

Виртуальная машина «Demo Image XII: SQL 2012» доступна для скачивания

Виртуальная машина «Demo Image XII: SQL 2012» может быть развернута в среде Hyper-V (Windows Server, Windows 8 public preview), что позволит пользователям протестировать новые функции Microsoft BI в SQL Server 2012, в частности: отчеты Power View, модели в PowerPivot, отраслевые примеры.

Размер архива — 21,6 Гбайт.

Hy-Vee внедрили хранилище данных на базе PDW

Hy-Vee (сеть супермаркетов в США) внедрили хранилище данных на базе PDW (официальная информация доступна на сайте Microsoft).

Характеристики проекта:

  • до внедрения — 11 Тбайт данных в хранилище данных (данные за 7 лет, объемы постоянно растут; после внедрения объемы данных были увеличены в несколько раз)
  • ежедневная загрузка более 800 тысяч строк (после внедрения, очевидно, в разы больше)
  • OLAP-кубы
  • регламентированная отчетность Reporting Services

Результаты:

  • увеличение производительности до 100 раз
  • возможность просмотра данных за вчерашний день для реагирования на тренды (до внедрения PDW могли лишь посмотреть данные двухнедельной давности)
  • стало возможным выполнять значительно более сложные запросы к данным.

Примеры использования Power View в открытом доступе

Если вам интересно самостоятельно попробовать Power View в действии, вы можете использовать общедоступный BI портал. На портале в настоящий момент доступны модели BISM по нефтегазу, школе, а также по продаже вертолетов, продуктов питания и автомобилей. Ссылки на модели доступны на странице «More demos of Power View available» (в таблице сценариев нажмите на соответствующую ссылку в правой колонке).

Виртуальная машина SQL Server 2012 CTP3

Виртуальная машина SQL Server 2012 CTP3 («Denali» CTP3) содержит полностью сконфигурированные сервисы и интеграцию с SharePoint 2010 и Office 2010. Судя по дате публикации, ей можно будет пользоваться до середины апреля 2012 года.

На виртуальной машине, в том числе, доступы такие компоненты как DQS и новый MDS. Можно посмотреть 2 примера модели BISM  и соответствующих отчетов Power View (Crescent).

Ссылка для скачивания: http://www.microsoft.com/download/en/details.aspx?id=27740

Дополнительная информация:

  1. MicrosoftBI.ru. Новые возможности в SQL Server 2012 CTP3 для бизнес-аналитики (Microsoft BI)
  2. One Click BI Blog. Getting Started with the SQL Server “Denali” CTP3 Image