オープンソースデータ分析ソフト「RapidMiner」とは~RapidMiner Serverでより高度な分析を(前編) | 第一線で活躍するオープンソースエキスパートが綴るスペシャルコラム。

オープンソースデータ分析ソフト「RapidMiner」とは~RapidMiner Serverでより高度な分析を(前編)

オープンソースのデータ分析ソフト「RapidMiner」をフル活用する方法を連載!ソフトの特徴や分析チュートリアルを紹介します。

[2016年08月01日 ]
株式会社KSKアナリティクス
データアナリスト 足立 悠

 前回は、RapidMiner Studioに焦点をあて簡単・手軽にデータ分析できることを、機械の故障予測を例に挙げてご紹介しました。
 今回は、複数人(チーム)で分析・共有を得意とし、RapidMiner Studioの拡張利用が可能な「RapidMiner Server」(※1)(※2)の特徴についてお伝えしていきます。

 RapidMiner Serverでは、RapidMiner Studioをインストールしたデスクトップ機で作成した分析プロセスを実行させることが可能です(下図は利用イメージ)。RapidMiner Serverは、分析データ量と分析に必要なプロセスから処理時間を計算し最適化を行うため、RapidMiner Studio単体よりも速く分析を完了できます。

 また、RapidMiner Serverを活用するメリットを以下に挙げます。
1.分析作業を共有化できる
2.分析を定期的に(スケジュール化)実行できる
3.分析結果をダッシュボード機能で共有できる
4.安心・安全なセキュリティ機能

それぞれに焦点をあて、詳しく紹介していきます。

1.分析作業を共有化できる
 複数人(チーム)で分析する場合、いつ・誰が作成した分析プロセスファイルが最新か・運用可能なものか、の管理が重要になってきます。例えば、バージョンの古い分析プロセスを修正・更新し実行してしまうと、間違った結果の共有につながってしまう可能性があります。そのため、最新版の分析プロセスをサーバーに保管し、チーム内の誰でも実行できる環境が必要です。
 RapidMiner Serverでは以下のように分析プロセスを共有し実行します。

次のページへ続く

【次ページ】複数人で分析作業を共有するには?(続き)

著者プロフィール

株式会社KSKアナリティクス
データアナリスト 足立 悠(あだち はるか)

 大手電機メーカー、事業会社を経てKSKアナリティクスへ入社。社内のデータ活用推進者としてマーケティング戦略、業務改善に関するデータ分析業務に携わる。テキストマイニング、レコメンデーション手法を得意とし、現在はIoTデータの活用も推進中。
 また、大学院(博士後期課程)にて複雑ネットワーク、トピックモデルに関する研究に従事。

最新TOPICS

【ビッグデータ】日立+東大+産総研、移動体ビッグデータアクセス仕様「Moving Features Access」が国際標準採択(2017年03月27日 10:03)

日立製作所、東京大学、国立研究開発法人産業技術総合研究所(産総研)は、3月13日、 データアクセス仕様「Moving Features Access」が、地理空間情報国際標準化団体「Open Geospatial Consortium」の国際標準として採択されたと発表した。 【ポイント】 ・「Moving Features Access」=位置情報へのデータアクセス仕様 ・移動体(人/...

関連タグ

サポートベクターマシン(Support Vector Machine)

  • 用語集

「サポートベクターマシン(SVM:Support Vector Machine)」は、 画像・音声などの情報データから、意味を持つ対象を選別して取り出すパターン認識手法のひとつ。

決定木分析()

  • 用語集

樹木状のモデルを使って要因を分析しその分析結果から境界線を探して予測を行う、データマイニングの手法のひとつ。

Apache Hadoop(アパッチ ハドゥープ)

  • 用語集

「Apache Hadoop(アパッチ ハドゥープ)」とは、 ビッグデータを複数のマシンに分散して処理できる、オープンソースのプラットフォームである。

関連記事

  • KSKサイド005

facebook

twitter