Apache Hadoop встала на коммерческие открытые рельсы
22 мая 2010 года, 18:53 |
Текст: Юрий Стрельченко
Pentaho, провайдер решений бизнес-аналитики (business intelligence, BI) с открытыми исходными кодами, стал первой открытой BI-компанией, которая приступила к поддержке Apache Hadoop.
Интеграция Hadoop в экосистему Pentaho.
Напомним: проект Hadoop, курируемый некоммерческой организацией Apache Software Foundation, является открытой реализацией Google MapReduce, программного фреймворка распределённых кластерных вычислений над гигантскими объёмами данных. Hadoop наделяет распределённые приложения возможностью работы в кластерах с тысячами узлов и петабайтами данных.
Ещё несколько лет назад отрасль сомневалась в необходимости BI-обработки терабайтов данных, но сейчас, когда этот порог пройден, вендоры обернулись к Hadoop. К примеру, на днях IBM выпустила InfoSphere BigInsights, базирующийся на Hadoop пакет решений и сервисов для помощи корпорациям в анализе объёмных массивов данных.
Pentaho не только интегрирует технологию Hadoop в свой продуктовый BI-портфель, но и внедрит такие её компоненты, как инфраструктура хранилищ данных Hive и база данных Hbase. Первая волна готовых изделий увидит свет уже в июле.
Среди обилия BI-игроков Pentaho следует отнести к развивающимся провайдерам, которые характеризуются выводом новаций и ультраактуальных инструментов: к примеру, компания QlikView делает акцент на BI-обработке данных, целиком находящихся в оперативной памяти. Pentaho предлагает широкий спектр решений, включая интеграцию данных, их извлечение, преобразование и загрузку, а также моделирование, добычу, анализ, отчётность и мониторинг.