オープンソースデータ分析ソフト「RapidMiner」とは~分析ソフトの動向とRapidMinerの優位性 | 第一線で活躍するオープンソースエキスパートが綴るスペシャルコラム。

オープンソースデータ分析ソフト「RapidMiner」とは~分析ソフトの動向とRapidMinerの優位性

オープンソースのデータ分析ソフト「RapidMiner」をフル活用する方法を連載!ソフトの特徴や分析チュートリアルを紹介します。

[2016年06月10日 ]
株式会社KSKアナリティクス
データアナリスト 足立 悠

 ビッグデータ・IoTブームの到来により、自社に蓄積されたデータを活用しビジネス価値を生み出したいと考え、実行する企業が増えています。
 例えば、センサデータを分析すれば機械や設備の故障予測・異常検知を行うことができる、購買履歴データを分析すれば顧客の離反予測・商品推薦を行うことができる、消費者の声を分析すればクレーム要因を見える化し特定できる、・・・など、売上拡大やコスト削減につなげられるため、多くの企業がデータの活用に期待を寄せています。

 データ分析には分析ソフトが必要であり、自社に適したものを選定する必要があります。選定のポイントとしては、価格、操作性、アルゴリズムの豊富さ、学習コスト、・・・などが挙げられます。データ分析を始めるにあたり、一番のネックは「価格」と考える企業が多く存在するでしょう。
 なぜなら、分析は初期の段階で費用対効果の算出が難しく、予算取りが困難を極めるからです。「価格」の壁があるため、思うように分析を始められないという悩みもよく耳にします。

 以上のような理由もあり、ここ数年はオープンソースのデータ分析ソフトを使って分析を始める企業が増えてきました。世界的に有名なデータマイニングの情報サイト「KDnuggets」による、「過去1年間でどのデータ分析ソフトを使用したか?(2015年版)」の調査結果を見てみると・・・

上位のほとんどを、オープンソースの分析ソフト(RやRapidMiner)とプログラミング言語(SQLやPython)が占めています(※1)。数年前の調査では、商用の分析ソフトが上位を占めていましたが、ここ数年は立場が逆転しています。国内外を問わず、オープンソースの分析ソフトを活用したいと考える企業または分析者が増えているようです。

次のページへ続く

【次ページ】世界中で使用されている「RapidMiner」

著者プロフィール

株式会社KSKアナリティクス
データアナリスト 足立 悠(あだち はるか)

 大手電機メーカー、事業会社を経てKSKアナリティクスへ入社。社内のデータ活用推進者としてマーケティング戦略、業務改善に関するデータ分析業務に携わる。特にテキストマイニング、オープンデータの活用、GISによる可視化を得意とする。最近は、IoT分野でのデータ活用に意欲を持つ。
 もう一つの姿は社会人大学院生(博士後期課程)。ソーシャルネットワーク解析に関する研究に従事。

最新TOPICS

【AI】パナソニックのR&D戦略---AI技術者を「5年後には1000人体制」に拡大、新卒採用ではAI特別枠(2017年04月21日 10:03)

パナソニックは、同社グループのR&D戦略について説明した。 【ポイント】 ・AI技術者を「3年後には300人体制」「5年後には1000人体制」に拡大する計画 ・大阪大学と共同講座を開設して、社内のデジタル系技術者を育成 ・新卒採用においては、AIを特別枠として設置し、4月からその1期生が入社している 【テーマ】 ・パナソニックは約100年前にアントレプレナーが起業した ・AI...

関連タグ

コンジョイント分析(Conjoint Analysis)

  • 用語集

商品やサービスを構成する要素の最適な組み合わせを探るために多変量解析を用いた分析方法。

ETL(イーティーエル)

  • 用語集

「ETL(Extract Transform Load)」とは、外部の情報源からデータを抽出(Extract)し、データウェアハウスなどで利用しやすい形に変換・加工(Transform)し、データベースに書き出す(Load)までの一連の工程である。これらの処理を支援するツールを「ETLツール」と呼ぶ。

医療()

  • タグ

シンギュラリティ(Technological Singularity)

  • 用語集

シンギュラリティ(Technological Singularity:技術的特異点)とは、未来研究において、過去の歴史から今後の人類の技術開発の推測して得られる未来の正確かつ信頼できる限界点を指す。

関連記事

  • KSKサイド001

facebook

twitter