オープンソースデータ分析ソフト「RapidMiner」とは~分析ソフトの動向とRapidMinerの優位性 | 第一線で活躍するオープンソースエキスパートが綴るスペシャルコラム。

オープンソースデータ分析ソフト「RapidMiner」とは~分析ソフトの動向とRapidMinerの優位性

オープンソースのデータ分析ソフト「RapidMiner」をフル活用する方法を連載!ソフトの特徴や分析チュートリアルを紹介します。

[2016年06月10日 ]
株式会社KSKアナリティクス
データアナリスト 足立 悠

 ビッグデータ・IoTブームの到来により、自社に蓄積されたデータを活用しビジネス価値を生み出したいと考え、実行する企業が増えています。
 例えば、センサデータを分析すれば機械や設備の故障予測・異常検知を行うことができる、購買履歴データを分析すれば顧客の離反予測・商品推薦を行うことができる、消費者の声を分析すればクレーム要因を見える化し特定できる、・・・など、売上拡大やコスト削減につなげられるため、多くの企業がデータの活用に期待を寄せています。

 データ分析には分析ソフトが必要であり、自社に適したものを選定する必要があります。選定のポイントとしては、価格、操作性、アルゴリズムの豊富さ、学習コスト、・・・などが挙げられます。データ分析を始めるにあたり、一番のネックは「価格」と考える企業が多く存在するでしょう。
 なぜなら、分析は初期の段階で費用対効果の算出が難しく、予算取りが困難を極めるからです。「価格」の壁があるため、思うように分析を始められないという悩みもよく耳にします。

 以上のような理由もあり、ここ数年はオープンソースのデータ分析ソフトを使って分析を始める企業が増えてきました。世界的に有名なデータマイニングの情報サイト「KDnuggets」による、「過去1年間でどのデータ分析ソフトを使用したか?(2015年版)」の調査結果を見てみると・・・

上位のほとんどを、オープンソースの分析ソフト(RやRapidMiner)とプログラミング言語(SQLやPython)が占めています(※1)。数年前の調査では、商用の分析ソフトが上位を占めていましたが、ここ数年は立場が逆転しています。国内外を問わず、オープンソースの分析ソフトを活用したいと考える企業または分析者が増えているようです。

次のページへ続く

【次ページ】世界中で使用されている「RapidMiner」

著者プロフィール

株式会社KSKアナリティクス
データアナリスト 足立 悠(あだち はるか)

 大手電機メーカー、事業会社を経てKSKアナリティクスへ入社。社内のデータ活用推進者としてマーケティング戦略、業務改善に関するデータ分析業務に携わる。特にテキストマイニング、オープンデータの活用、GISによる可視化を得意とする。最近は、IoT分野でのデータ活用に意欲を持つ。
 もう一つの姿は社会人大学院生(博士後期課程)。ソーシャルネットワーク解析に関する研究に従事。

最新TOPICS

【AI】AI国内市場予測---「AI導入検討中=17.9%」「年平均20.4%で成長」「米独市場と比べて高い成長率を維持」(2017年05月25日 10:03)

MM総研がAI国内市場予測を発表した。 【ポイント】 日本企業 ・人工知能(AI)をビジネスに導入している=1.8% ・導入検討中=17.9% AIの国内市場規模 ・2016年度=2220億円(前年度比約2倍) AIの国内市場規模成長予測 ・年平均20.4%で成長 ・2021年には5610億円に達する予測 ・米独市場と比べて高い成長率を維持

関連タグ

分散分析(Analysis of Variance: ANOVA)

  • 用語集

観測データにおける変動を誤差変動と各要因およびそれらの交互作用による変動に分解することによって、要因および交互作用の効果を判定する、統計的仮説検定の手法のひとつ。

RFM分析()

  • 用語集

「RFM分析」とは、Recency、Frequency、Monetaryという3つの指標で顧客を並べ替え、グループ化した顧客の性質を明らかにする顧客分析の手法のひとつ。

クラウド・コンピューティング(Cloud Computing)

  • 用語集

「クラウド・コンピューティング」とは、データを、パソコンや携帯端末ではなく、インターネット上に保存する使い方やサービス。

NoSQL(ノーエスキューエル)

  • 用語集

「NoSQL(ノーエスキューエル)」とは、膨大なデータ量を高速かつ動的に整理し分析する、非リレーショナルな分散データベースシステムである。スケーラビリティ、可用性、耐障害性において、従来のRDB(リレーショナルデータベース)を凌駕するデータベースとしてNoSQLが、注目を集めている。

アソシエーション分析(Association Analytics)

  • 用語集

データ間の相関関係を発見する場合に用いられる、データマイニングの手法のひとつ。

関連記事

  • KSKサイド003

facebook

twitter