Pentaho(ペンタホ)とは、データ統合分析基盤であり、BI/BAツール群の総称。多種多様なデータを統合し、さまざまな観点での分析を行える。

Pentaho

Pentaho(ペンタホ)とは、データ統合分析基盤であり、BI/BAツール群の総称。多種多様なデータを統合し、さまざまな観点での分析を行える。

目次

Pentahoとは

■概要
・基本説明
・経緯

■主な特徴
・ワールドワイドでの豊富な実績
・アナリティクス
・多次元分析(OLAP)
・高速処理
・レポート出力
・ダッシュボード
・データパイプライン(ワークフロー)のプログラムレス開発
・オープンアーキテクチャ
・データ接続
・管理機能

■活用用途
・ビッグデータ分析
・データ統合
・ビジネスアナリティクス
・データマイニング

■オフィシャルサイト情報(オープンソースBIのPentaho日本正規代理店-KSK Analytics, Pentaho Japan Partner-)
・トップページ
・導入事例

Pentahoとは

Pentaho(ペンタホ)とは、データ統合分析基盤であり、BI/BAツール群の総称。多種多様なデータを統合し、さまざまな観点での分析を行える。

■概要

基本説明

Pentahoビジネスアナリティクスは、世界で最も人気のあるオープンソースBIスイートであり、データの抽出/準備/ブレンドを行う「データ統合基盤」と、統合したデータの分析/可視化を行う「データ分析基盤」の2つの基盤により、データ収集から分析/活用までの一貫した環境を提供する。

「ETL」「OLAP」「クエリ」「レポーティング」「インタラクティブ分析」「ダッシュボード」「データマイニング」など、データ統合とビジネスインテリジェンス(BI)ツールとしてのあらゆる機能を提供する。

「Hadoop連携をはじめとする高速/分散処理アーキテクチャ」や「ビッグデータ統合のための接続部品」を豊富に備えており、大規模データも短時間で処理できる。

経緯

2017年9月、「Pentaho Corporation(米国)」は、「Hitachi Data Systems Corporation(米国)」と統合し、新会社「Hitachi Vantara Corporation(米国)」を発足した。

■主な特徴

ワールドワイドでの豊富な実績

Pentahoソフトウェアは、世界で500万回以上ダウンロードされているOSSベースのトップクラス製品であり、ワールドワイドで利用されている。

アナリティクス

Pentahoを使用することで、企業内に存在するあらゆるデータを活用し、そこから価値ある情報を導き出せる。ビジネスユーザーやアナリストは、IT部門やITエンジニアに依存することなく、さまざまな角度から簡単にデータの可視化/分析/レポートが可能になる。

「データの準備/ブレンド機能」だけではなく、「分析」「可視化」「探索」「レポート」「予測」を容易に行うための多様なツールが用意されている。豊富な基本機能を備えているが、カスタマイズや機能拡張にも対応できる。開発者からビジネスユーザーに至るチームの全メンバーが、データから価値ある情報を簡単に引き出すことができる。

その他のポイント
・メタデータモデル自動生成機能
・迅速なパブリッシュによる分析結果の提供
・データセットのステージング/生成なしで変換を仮想化するデータサービス
・データセットについて即座にレポートやアプリケーションで利用可能
・予測インテリジェンスの運用
・「R」「Python」「Weka」などの高度な分析モデル統合
・さまざまな種類のビジネスアナリティクスと柔軟なデータ統合 など

多次元分析(OLAP)

Pentahoでは、統合データやDWH(データウエアハウス)に対して、対話的操作で多次元分析を行える。

データ項目のドラッグ&ドロップでOLAP(Online Analytical Processing)分析対象を指定でき、「スライス」「ドリルダウン」「ダイス」などの分析軸の変更も容易に行える。

また、「Weka」「R」などのデータマイニングツールとの連携もサポートされており、ビッグデータから隠れたパターンや関係性を発見することも可能となっている。

その他のポイント
・ドリル/クロス集計によるビジネス情報検索
・基準と属性による多次元情報表示
・詳細なソートとフィルタリング機能
・Webベースでのドラッグ&ドロップでレポート作成
・ドリルスルーレポート
・条件付き書式を含むチャートの視覚化 など

高速処理

Pentahoには、高速化のためのさまざまな仕組みが組み込まれており、ビッグデータに対しても高速処理を行える。

主なポイント
・インメモリデータキャッシング
・スケールアップ/スケールアウト機能
・パワフルなマルチスレッドのデータ統合エンジン
・複数ノードでの並列分散処理サポート
・クラスタ化されたクラウド環境へのデプロイに対応
・「Hadoop」「NoSQL」「分析データベース」に対するネイティブ接続
・「in-Hadoop」実行
・キャッシュによる複雑な分析クエリの応答時間軽減 など

レポート出力

データアナリティクスにおいて、レポーティングも重要な機能であり、Pentahoには強力なレポーティング機能が搭載されている。

Pentahoが提供している「レポートデザイナー」は、パワーユーザーにも対応可能なリッチグラフィックのエンタープライズレポートデザイナーであり、レポート作成者に高い生産性と柔軟性を提供する。Webベースのレポートツールであり、レポートフォーマット定義画面に対するドラッグ&ドロップ操作により、直感的なレイアウト定義を行える。

統合したデータの分析結果をレポートとして出力できる。「インタラクティブ分析」「ドリルスルー」「ラッソフィルタリング」「ズーム」「属性の強調表示」などが可能で、重要な部分にフォーカスした分かりやすいレポートを作成できる。「シンプルなレポート」「セルフサービスのインタラクティブなレポート」「細かい書式設定が必要なエンタープライズレポート」など、さまざまな種類に対応できる。

HTML/Excel/CSV/PDF/RTF/プレーンテキストなど主要な出力形式に対応しており、NoSQLに直接接続したレポート出力も可能となっている。

ダッシュボード

Pentahoは、個人/部門/企業全体の業務状況を素早く理解できるグラフィカルで応答性に優れたダッシュボードを提供している。

「エンタープライズレベルのデータソースを含むあらゆるビッグデータソース」「他のビネスアナリティクスツール」「各種アプリケーション」などとのシームレス接続が可能で、参照したい各種モニタリング情報について、対話的な操作で、ドラッグ&ドロップによって自由に配置できる。ダッシュボードテンプレートを利用することで、簡単に作成できる。

「ナビゲーション」「ドリルスルー」「フィルタコントロール」などのライブラリを搭載し、個々のビジネスに合わせてオーダーメイドされたインタラクティブなカスタムビルドダッシュボードを作成できる。ビジネスユーザーは、インタラクティブなダッシュボードの持つ高度なグラフィカルビジュアルインターフェイスにより、ダッシュボードの1画面で、リアルタイムのビジネス状況を把握できる。

データパイプライン(ワークフロー)のプログラムレス開発

PentahoのグラフィカルなETLデザイナーを使うことで、コーディングやスクリプト作成を行うことなく、データ分析用データパイプライン(ワークフロー)デザインを行える。

「データ取り込み処理」「データ加工処理」「データ統合処理」「データブレンド処理」「データ出力処理」などの部品(アイコン)をドラッグ&ドロップにより配置し、配置した部品を矢印でつなぐことで、処理の流れを視覚的に定義できる。100種類以上の豊富な部品が用意されており、必要とする処理定義を行える。

その他のポイント
・動的なデータ統合テンプレート
・さまざまなデータ変換連携をサポートする強力なオーケストレーション機能
・アジャイルビュー(データ準備処理時にデータのモデリングと可視化)
・ワークフローを調整するためのエンタープライズスケジューラー
・標準ETLを超えた拡張性/柔軟性の高い管理機能
・ジョブ実行のテスト/チューニング用デバッガー など

オープンアーキテクチャ

Pentahoは、オープンソースソフトウェアとして開発されている製品であり、オープンアーキテクチャと標準準拠によって、柔軟な機能拡張が可能となっている。

ポイント
・100%Javaプラットフォーム
・業界標準Webサービスインターフェース(RESTful API)
・あらゆる標準Webアプリケーションとの統合が可能
・エンタープライズセキュリティフレームワークとシームレスに連携
・モバイルアプリケーションやタブレットアプリケーションに簡単に組み込み可能
・新技術との連携にいち早く対応できる
・エンドユーザー要件や将来ニーズにも対応しやすい

データ接続

Pentahoは、高度な統合とアダプティブビッグデータレイヤにより、幅広いデータソースをサポートしている。

主な接続可能データソース
・Hadoop
・Hadoopディストリビューション(Cloudera、Hortonworks、MapR)
・NoSQLデータストア(MongoDB、Cassandra、HBase)
・分析データベース(Amazon Redshift、SAP HANA)
・各種クラウドサービス
・主要データベースプラットフォーム
・Excelドキュメント
・XMLベースデータソース
・フラットファイル など

管理機能

Pentahoは、管理効率を向上させるための各種管理機能を備えている。

主な管理機能
・アクセス制御機能
・認証機能(LDAP、Active Directory)連携
・パフォーマンス監視機能
・使用状況監査機能
・ジョブ管理機能(再開、ロールバック)
・バージョン管理機能
・バックアップ/リカバリ機能 など

■活用用途

ビッグデータ分析

Pentahoは、データ統合基盤とデータ分析基盤の統合により、ブレンドされたビッグデータを素早く柔軟に分析可能で、「Hadoop」「NoSQL」「分析データベース」などに格納されているさまざまなビッグデータを価値ある情報に変えることができる。

Pentahoインスタビュー」を利用すると、シンプルなステップ操作で素早いビッグデータ分析が可能で、複雑で大量なデータへの接続や準備のための時間を大幅に削減できる。

データ統合

Pentahoでは、ビジネスの全体像を把握して実用的な分析情報を得られるように、データを整えてブレンドし、分析向けに整えられ、正確なデータをエンドユーザーに提供する。

Pentahoのビジュアルツールを使うことで、コーディング作業と複雑さがなくなり、ビジネスユーザーとIT部門がビッグデータとすべてのデータソースを自由に扱えるようになる。

ビジネスアナリティクス

Pentahoのシンプルでインタラクティブなアプローチにより、ビジネスユーザーはあらゆる種類やサイズのデータにアクセスでき、データの発見やブレンドを実現できる。

ビジネスユーザーは、基本的なレポートから予測モデリングまで、IT部門に頼らずさまざまな角度からデータを分析して可視化を行うことで、ビジネスの要因を見抜くことができ、意思決定に必要な重要な情報を得ることができる。

データマイニング

Pentaho は、データ統合/OLAP/レポーティング/分析機能に加えて、最新の「データマイニング」や「統計解析機能」も提供する。データマイニングは、標準的分析では発見できない重要なパターンや相関関係について、最新のアルゴリズムによって発見するためのサポートを行う。

ビジネスユーザーは、データマイニングにより、さらにビジネスを理解することができ、予測を活用することでパフォーマンスの向上につなげることが可能となる。

■オフィシャルサイト情報(オープンソースBIのPentaho日本正規代理店-KSK Analytics, Pentaho Japan Partner-)

トップページ

→KSK Analytics, Pentaho Japan Partner

導入事例

→KSK Analytics, Pentaho Japan Partner →導入事例

 

参考元サイト

Pentaho最新TOPICS

最新情報はありません。

Pentaho最新CLOSEUPコラム

イベント情報

  • KSKサイド001
  • OSSNEWSに広告を掲載しませんか?

facebook

twitter