オープンソースデータ分析ソフト「RapidMiner」とは~RapidMiner Serverでより高度な分析を(前編) | 第一線で活躍するオープンソースエキスパートが綴るスペシャルコラム。

オープンソースデータ分析ソフト「RapidMiner」とは~RapidMiner Serverでより高度な分析を(前編)

オープンソースのデータ分析ソフト「RapidMiner」をフル活用する方法を連載!ソフトの特徴や分析チュートリアルを紹介します。

[2016年08月01日 ]
株式会社KSKアナリティクス
データアナリスト 足立 悠

 前回は、RapidMiner Studioに焦点をあて簡単・手軽にデータ分析できることを、機械の故障予測を例に挙げてご紹介しました。
 今回は、複数人(チーム)で分析・共有を得意とし、RapidMiner Studioの拡張利用が可能な「RapidMiner Server」(※1)(※2)の特徴についてお伝えしていきます。

 RapidMiner Serverでは、RapidMiner Studioをインストールしたデスクトップ機で作成した分析プロセスを実行させることが可能です(下図は利用イメージ)。RapidMiner Serverは、分析データ量と分析に必要なプロセスから処理時間を計算し最適化を行うため、RapidMiner Studio単体よりも速く分析を完了できます。

 また、RapidMiner Serverを活用するメリットを以下に挙げます。
1.分析作業を共有化できる
2.分析を定期的に(スケジュール化)実行できる
3.分析結果をダッシュボード機能で共有できる
4.安心・安全なセキュリティ機能

それぞれに焦点をあて、詳しく紹介していきます。

1.分析作業を共有化できる
 複数人(チーム)で分析する場合、いつ・誰が作成した分析プロセスファイルが最新か・運用可能なものか、の管理が重要になってきます。例えば、バージョンの古い分析プロセスを修正・更新し実行してしまうと、間違った結果の共有につながってしまう可能性があります。そのため、最新版の分析プロセスをサーバーに保管し、チーム内の誰でも実行できる環境が必要です。
 RapidMiner Serverでは以下のように分析プロセスを共有し実行します。

次のページへ続く

【次ページ】複数人で分析作業を共有するには?(続き)

著者プロフィール

株式会社KSKアナリティクス
データアナリスト 足立 悠(あだち はるか)

 大手電機メーカー、事業会社を経てKSKアナリティクスへ入社。社内のデータ活用推進者としてマーケティング戦略、業務改善に関するデータ分析業務に携わる。テキストマイニング、レコメンデーション手法を得意とし、現在はIoTデータの活用も推進中。
 また、大学院(博士後期課程)にて複雑ネットワーク、トピックモデルに関する研究に従事。

最新TOPICS

【PICKUP】大阪市、「人工知能(AI)を活用した職員の業務支援」を開始へ---国際結婚や養子縁組などの問い合わせをサポート(2017年02月20日 10:03)

大阪市は、2月16日、 今秋から試験的に「人工知能(AI)を活用した職員の業務支援」を開始すると発表した。 【ポイント】 ・当面、戸籍関連事務が対象 ・市民からの申請や問い合わせに素早く正確に対応できるよう、チェック項目や回答案を示す ・国際結婚や養子縁組に伴う申請などの専門性が高い問い合わせ対応をサポートする (出所:http://www.sankei.com/west/ne...

関連タグ

Apache Spark(アパッチ スパーク)

  • 用語集

「Apache Spark(アパッチ スパーク)」は、ビッグデータを複数のマシンに分散して高速に処理できる、オープンソースの分散処理プラットフォームである。

営業()

  • タグ

機械学習()

「機械学習」とは、人間が自然に行っている学習能力と同等の機能をコンピュータで実現しようとする技術や手法。データから反復的に学習しそこに潜むパターンを見つけ出す。

ロボット(Robot)

組み込みシステムの一種。人間と同等、またはそれ以上の作業を自律的に行う装置、もしくは機械。

コンジョイント分析(Conjoint Analysis)

  • 用語集

商品やサービスを構成する要素の最適な組み合わせを探るために多変量解析を用いた分析方法。

関連記事

  • KSKサイド005

facebook

twitter