オープンソースデータ分析ソフト「RapidMiner」とは~RapidMiner Serverでより高度な分析を(後編) | 第一線で活躍するオープンソースエキスパートが綴るスペシャルコラム。

オープンソースデータ分析ソフト「RapidMiner」とは~RapidMiner Serverでより高度な分析を(後編)

オープンソースのデータ分析ソフト「RapidMiner」をフル活用する方法を連載!ソフトの特徴や分析チュートリアルを紹介します。

[2016年08月23日 ]
株式会社KSKアナリティクス
データアナリスト 足立 悠

 前回は「1.分析作業を共有化できる」「2.分析を定期的に(スケジュール化)実行できる」機能についてご紹介しました。今回も引き続き便利な機能をご紹介します!

3.分析結果をダッシュボード機能で共有できる
 分析者は、RapidMiner Serverの管理画面、またはRapidMiner Studioの結果画面から分析結果を確認できます。しかし、分析者以外の関係者(プロジェクトの意思決定権者や現場管理者)と分析結果を共有したい場合はどうすればよいでしょうか?ここで、便利なダッシュボード機能についてご紹介します。

 RapidMiner Serverを使えば、分析結果をレポートとして作成でき、ウェブブラウザ上で表示することができます。マウス操作で簡単に表やグラフを作成し、

お好みのスタイルでダッシュボードを公開できます。BIのダッシュボードと同じ感覚で、例えば予測分析結果を見ることができるため、今後の方針に活かせそうな知見を発見しやすくなります。

では続けて・・・、

4.安心・安全なセキュリティ機能
 誰でもかれでもServerにアクセスできてはたまったものではありません。情報漏えいにつながり危険です。RapidMiner Serverでは、他のシステムと同様に、サーバにアクセスできるメンバーとその権限を設定できます。特に権限は、ユーザー単位/グループ単位で設定できるなど柔軟に対応できます。

 また、ログからシステムの異常を検知しメールでアラートを出す、といった使い方も可能です。分析をスケジュール化して実行する際、何らかの原因で分析を実行できなかったことを通知できるため、早期に手を打つことができます。

 前回と今回で簡単に、RapidMiner Serverの特徴をご紹介しました。最後に、RapidMiner Serverを使うメリットを挙げてみます。

・分析データやプロセスを共有することで、
⇒リソースが重複しない分析環境を実現できる
・時間やリソースを多く要する負荷の高い計算処理を実行することで、
⇒ローカルマシンの負担を軽減できる
・結果をダッシュボードやレポートで表現することで、
⇒分析者以外のユーザーも使い易い環境を提供できる

 いかがでしょうか?まずはRapidMiner Studioを使ってデータ分析をスモールスタートさせ、次はRapidMiner Serverを使ってデータ活用をより拡大させていく。このように、RapidMinerシリーズを使い分けて、上手く使いこなしていただければと思います。

 RapidMinerシリーズには他に、ビッグデータの処理基盤「RapidMiner Radoop」と、どこでも容量を気にせずデータ分析「RapidMiner Cloud」があります。こちらも折を見て紹介していきます。

----*----*RapidMiner Server 推奨動作環境----*----*----*
◆マシンスペック
・4コア
・3GHz以上
・32GB~1TB
・100GB以上の空き容量

◆OS
・Windows Server 2008 R2
・Windows Server 2012
・Windows Server 2012 R2
・Linux
※64bit推奨

◆Javaプラットフォーム
・Oracle Java 7 または 8
※64bit推奨,OpenJDK非推奨

◆データベース
・Microsoft SQL Server
・Oracle
・MySQL
・PostgreSQL>
----*----*----*----*----*----*----*----*----*----*----*

著者プロフィール

株式会社KSKアナリティクス
データアナリスト 足立 悠(あだち はるか)

 大手電機メーカー、事業会社を経てKSKアナリティクスへ入社。社内のデータ活用推進者としてマーケティング戦略、業務改善に関するデータ分析業務に携わる。テキストマイニング、レコメンデーション手法を得意とし、現在はIoTデータの活用も推進中。
 また、大学院(博士後期課程)にて複雑ネットワーク、トピックモデルに関する研究に従事。

最新TOPICS

【AI】パナソニックのR&D戦略---AI技術者を「5年後には1000人体制」に拡大、新卒採用ではAI特別枠(2017年04月21日 10:03)

パナソニックは、同社グループのR&D戦略について説明した。 【ポイント】 ・AI技術者を「3年後には300人体制」「5年後には1000人体制」に拡大する計画 ・大阪大学と共同講座を開設して、社内のデジタル系技術者を育成 ・新卒採用においては、AIを特別枠として設置し、4月からその1期生が入社している 【テーマ】 ・パナソニックは約100年前にアントレプレナーが起業した ・AI...

関連タグ

ロジスティック回帰分析(Logistic regression)

  • 用語集

多変量解析の一種である。線形回帰分析が量的変数を予測するのに対して、ロジスティック回帰分析は質的確率を予測する。

非構造化データ()

  • 用語集

「非構造化データ」とは、企業の基幹システムに保管されている構造化データに対し、日常業務で増える電子文書や紙文書、写真、動画、音声、Webコンテンツなど構造化されていないデータを指す。

データサイエンス(Data Science)

  • 用語集

「データサイエンス」とは情報学の一種であり、データを重視する学問である。

医療()

  • タグ

コレスポンデンス分析()

  • 用語集

「コレスポンデンス分析」(Correspondence Analysis)とは、類似した項目を明らかにするため、各項目を数値化する分析手法である。

関連記事

  • KSKサイド003

facebook

twitter