オープンソースBI「Pentaho」とは | 第一線で活躍するオープンソースエキスパートが綴るスペシャルコラム。

オープンソースBI「Pentaho」とは

[2016年08月24日 ]
株式会社KSKアナリティクス

Pentahoとは
Pentahoは、プロフェッショナル向けに作られたオープンソースのBI(Business Intelligence)ツールです。オープンソースでありながらベンダーによるサポートを受けられるのが大きな特徴です。
PentahoはBIスイートであり、レポーティング、インタラクティブ(対話型)分析、ダッシュボード、データ統合/ETL(Extract /Transform/Load)、データ・マイニング、その他、BIプラットフォームとBIに必要なすべての機能が用意されています。

Pentahoはまた、オープンソース・コミュニティによる度重なる開発・再配布によって、先進技術と柔軟性を備えています。
ユーザー数無制限でご使用できますので、大規模なエンタープライズで の利用はもちろん、現場レベルでの簡易分析といった中小規模の導入にも向いています。 また、年間サブスクリプションモデルのため、導入費用を削減する事ができます。
BIスイートに含まれるすべての機能を利用する使い方のほか、ビジネス条件に合わせて必要な機能のみを利用する使い方も可能です。
エディションとしては、無償版の「コミュニティ・エディション」(CE)、有償版の「エンタープライズ・エディション」(EE)があり、EEではソフトウ エアが保証され、ベンダーによるプロフェッショナル・サポートを受けることができます。
また、ダッシュボード・デザイナやアナライザーレポートなど、EE 独自の機能を備えています。


なぜオープンソースなのか
Pentaho BIプロジェクトでは、オープンソース・コミュニティの中から生まれた各種のBIソフト群を提供しています。商用BIツールと違い、世界中の何百人単位にもなるオープンソース・コミュニティから生まれているため、素早く先進技術を取り入れることができます。
また、個々の機能ごとにプロジェクトが独立しているため、システムを一括して導入する必要はなく、既存システムの状況や予算に応じて段階的にBIシステムを導入することが容易です。これにより、「導入しても使い切れない」というリスクを大幅に減らすことができます。

もちろん、オープンソースであるため、同種のBIツールに比べ高額なライセンス料もかかりません。特に、初めてBIを導入する場合、オープンソースを利用するメリットは大きいと言えます。


Pentaho BIスイートの特徴
Pentahoの特徴は、まず第1に、個々のBIソフトウエアを束ねたスイートであることです。レポーティング、インタラクティブ分析、ダッシュボード、データ統合/ETL、データ・マイニングなどの機能モジュールを備え、販売動向分析/顧客分析/営業レポート/財務分析/KPI(重要業績評価指標)ダッシュボードなど、さまざまな目的に対応できます。
以下では、それぞれのモジュールの特徴を解説します。

(1)レポーティング
RDBやOLAP(オンライン分析)、XMLベースのデータソースを含む、幅広いデータソースをサポートし、Adobe PDF、HTML、Microsoft Excelやリッチ・テキスト、プレーン・テキストなどポピュラーなフォーマットで出力します。 また、ビジネス・ユーザーのための、Webベースでのレ ポート作成が可能です。

(2)インタラクティブ分析
多次元分析が可能な高速ROLAP(リレーショナルOLAP)エンジン「Mondrian」を搭載し、クロス・タブ・データやビジネス情報キューブを自由 にドリリング(ドリル・ダウンおよびドリル・アップ)/ダイシング(集計軸の入れ替え)することで、スピーディに見たい結果を表示できます。

(3)ダッシュボード
Adobe Flashベースのチャート・グラフを含むリッチでインタラクティブなダッシュボードを作成できます。特に有償版のEEは、ビジネス・ユーザーが自ら簡単にダッシュボードを作成できる、セルフサービス型のダッシュボード・デザイナ機能を備えています。

(4)データ統合/ETL
ドラッグ&ドロップ形式の直感的なデザインで、100個以上のオブジェクトを組み合わせて複雑なデータ変換とジョブを作成し、DWH(データ・ウエアハウ ス)を構築できます。
商用やオープンソースのデータベースなど30種類以上のデータソースを幅広くサポートしています。

(5)データ・マイニング
膨大なデータから法則性を分析する、高度なデータ・マイニングをグラフィカルなインタフェースで操作可能です。データ・マイニング・エンジン「Weka」を搭載し、豊富なマイニング・スキームを用いて隠れたパターンや相関関係を発見できます。

BIスイートでは、このほかにも、セキュリティ機能やスケジューリング機能など各種の機能を提供します。Webインタフェースによって、Webブラウザに対して、レポート、OLAP分析、ダッシュボードの配布/管理を行います。

次のページへ続く

【次ページ】Pentahoの入手、インストールと起動

著者プロフィール

株式会社KSKアナリティクス

KSKアナリティクスのビジョンは、
優れたアナリティクスの「オープンソース・ソフトウェア」と、
現場と協働する「アナリティクス・サービス」で、
誰もが当たり前にデータを分析・活用できる社会を作ることです。

最新TOPICS

【AI】AI国内市場予測---「AI導入検討中=17.9%」「年平均20.4%で成長」「米独市場と比べて高い成長率を維持」(2017年05月25日 10:03)

MM総研がAI国内市場予測を発表した。 【ポイント】 日本企業 ・人工知能(AI)をビジネスに導入している=1.8% ・導入検討中=17.9% AIの国内市場規模 ・2016年度=2220億円(前年度比約2倍) AIの国内市場規模成長予測 ・年平均20.4%で成長 ・2021年には5610億円に達する予測 ・米独市場と比べて高い成長率を維持

関連タグ

AI(artificial intelligence)

  • 用語集

「人工知能(AI)」とは、コンピュータ上などで人工的に人間と同様の知能を実現させようという試み、或いはそのための一連の基礎技術。

データマネージメント(Data Management)

  • 用語集

データを蓄積する仕組みの構築や運用、データ構造の可視化やデータの意味管理などを行いながらデータを適切に管理することで、データの信頼性・整合性を確保すること。

クリックストリームデータ()

  • 用語集

Web サイトやオンライン・ショップにおける訪問者のアクセス・ログである。Web サイトやオンライン・ショップにアクセスした訪問者が、どのような順番に従ってWebサイト内を移動したのかという一連の履歴がわかる。来訪者はリンクをクリックしてサイト内を移動するため、「クリックの流れ」とも呼ばれる。

機械学習()

「機械学習」とは、人間が自然に行っている学習能力と同等の機能をコンピュータで実現しようとする技術や手法。データから反復的に学習しそこに潜むパターンを見つけ出す。

Apache Hadoop(アパッチ ハドゥープ)

  • 用語集

「Apache Hadoop(アパッチ ハドゥープ)」とは、 ビッグデータを複数のマシンに分散して処理できる、オープンソースのプラットフォームである。

関連記事

  • KSKサイド001

facebook

twitter