オープンソースBI「Pentaho」とは | 第一線で活躍するオープンソースエキスパートが綴るスペシャルコラム。

オープンソースBI「Pentaho」とは

[2016年08月24日 ]
株式会社KSKアナリティクス

Pentahoとは
Pentahoは、プロフェッショナル向けに作られたオープンソースのBI(Business Intelligence)ツールです。オープンソースでありながらベンダーによるサポートを受けられるのが大きな特徴です。
PentahoはBIスイートであり、レポーティング、インタラクティブ(対話型)分析、ダッシュボード、データ統合/ETL(Extract /Transform/Load)、データ・マイニング、その他、BIプラットフォームとBIに必要なすべての機能が用意されています。

Pentahoはまた、オープンソース・コミュニティによる度重なる開発・再配布によって、先進技術と柔軟性を備えています。
ユーザー数無制限でご使用できますので、大規模なエンタープライズで の利用はもちろん、現場レベルでの簡易分析といった中小規模の導入にも向いています。 また、年間サブスクリプションモデルのため、導入費用を削減する事ができます。
BIスイートに含まれるすべての機能を利用する使い方のほか、ビジネス条件に合わせて必要な機能のみを利用する使い方も可能です。
エディションとしては、無償版の「コミュニティ・エディション」(CE)、有償版の「エンタープライズ・エディション」(EE)があり、EEではソフトウ エアが保証され、ベンダーによるプロフェッショナル・サポートを受けることができます。
また、ダッシュボード・デザイナやアナライザーレポートなど、EE 独自の機能を備えています。


なぜオープンソースなのか
Pentaho BIプロジェクトでは、オープンソース・コミュニティの中から生まれた各種のBIソフト群を提供しています。商用BIツールと違い、世界中の何百人単位にもなるオープンソース・コミュニティから生まれているため、素早く先進技術を取り入れることができます。
また、個々の機能ごとにプロジェクトが独立しているため、システムを一括して導入する必要はなく、既存システムの状況や予算に応じて段階的にBIシステムを導入することが容易です。これにより、「導入しても使い切れない」というリスクを大幅に減らすことができます。

もちろん、オープンソースであるため、同種のBIツールに比べ高額なライセンス料もかかりません。特に、初めてBIを導入する場合、オープンソースを利用するメリットは大きいと言えます。


Pentaho BIスイートの特徴
Pentahoの特徴は、まず第1に、個々のBIソフトウエアを束ねたスイートであることです。レポーティング、インタラクティブ分析、ダッシュボード、データ統合/ETL、データ・マイニングなどの機能モジュールを備え、販売動向分析/顧客分析/営業レポート/財務分析/KPI(重要業績評価指標)ダッシュボードなど、さまざまな目的に対応できます。
以下では、それぞれのモジュールの特徴を解説します。

(1)レポーティング
RDBやOLAP(オンライン分析)、XMLベースのデータソースを含む、幅広いデータソースをサポートし、Adobe PDF、HTML、Microsoft Excelやリッチ・テキスト、プレーン・テキストなどポピュラーなフォーマットで出力します。 また、ビジネス・ユーザーのための、Webベースでのレ ポート作成が可能です。

(2)インタラクティブ分析
多次元分析が可能な高速ROLAP(リレーショナルOLAP)エンジン「Mondrian」を搭載し、クロス・タブ・データやビジネス情報キューブを自由 にドリリング(ドリル・ダウンおよびドリル・アップ)/ダイシング(集計軸の入れ替え)することで、スピーディに見たい結果を表示できます。

(3)ダッシュボード
Adobe Flashベースのチャート・グラフを含むリッチでインタラクティブなダッシュボードを作成できます。特に有償版のEEは、ビジネス・ユーザーが自ら簡単にダッシュボードを作成できる、セルフサービス型のダッシュボード・デザイナ機能を備えています。

(4)データ統合/ETL
ドラッグ&ドロップ形式の直感的なデザインで、100個以上のオブジェクトを組み合わせて複雑なデータ変換とジョブを作成し、DWH(データ・ウエアハウ ス)を構築できます。
商用やオープンソースのデータベースなど30種類以上のデータソースを幅広くサポートしています。

(5)データ・マイニング
膨大なデータから法則性を分析する、高度なデータ・マイニングをグラフィカルなインタフェースで操作可能です。データ・マイニング・エンジン「Weka」を搭載し、豊富なマイニング・スキームを用いて隠れたパターンや相関関係を発見できます。

BIスイートでは、このほかにも、セキュリティ機能やスケジューリング機能など各種の機能を提供します。Webインタフェースによって、Webブラウザに対して、レポート、OLAP分析、ダッシュボードの配布/管理を行います。

次のページへ続く

【次ページ】Pentahoの入手、インストールと起動

著者プロフィール

株式会社KSKアナリティクス

KSKアナリティクスのビジョンは、
優れたアナリティクスの「オープンソース・ソフトウェア」と、
現場と協働する「アナリティクス・サービス」で、
誰もが当たり前にデータを分析・活用できる社会を作ることです。

最新TOPICS

【ビッグデータ】日本におけるデータサイエンティスト人材不足問題---将来25万人も不足?(2017年03月30日 10:03)

日本における「データ分析」人材不足の現状について解説。 【テーマ】 ・日本の企業は何をするべきなのか ・ビッグデータを真の意味で活用できている日本企業はまだまだ少ない ・データサイエンティストは将来25万人も不足する?

関連タグ

相関関係()

  • 用語集

一方の値が変化すれば、他方の値も変化するという、2つの値の関連性を指す。

重回帰分析()

  • 用語集

多変量解析のひとつであり、あるデータをほかの複数のデータによって予測する分析手法である。

インメモリデータベース()

  • 用語集

データをストレージではなく、メインメモリ上に格納するよう設計されたデータベース。また、そのようなデータベースを構築・運用できるデータベース管理システム(DBMS)。「メインメモリデータベース(MMDB)」とも言う。

RFM分析()

  • 用語集

「RFM分析」とは、Recency、Frequency、Monetaryという3つの指標で顧客を並べ替え、グループ化した顧客の性質を明らかにする顧客分析の手法のひとつ。

ニューラルネットワーク(Neural Network)

  • 用語集

脳機能の特性を表現することを目指した数学モデルである。人工ニューラルネットワークとも言う。

関連記事

  • KSKサイド002

facebook

twitter