無料で利用できるオープンソースデータマイニングツールを紹介。
Orangeはコンポーネントベースのデータマイニングツール。
データに関する「視覚化」「調査」「前処理」「モデリング」についてのさまざまな手法が含まれている。
大きなツールボックスを備えたインタラクティブなデータ分析ワークフロー機能により、初心者でも直感的なデータマイニングを実施できる。
Orangeは「GNU[GPL-3.0]+ライセンス」で提供されている。
→GitHub →biolab/orange3 →LICENSE
Orangeは、以下のデータ視覚化機能を提供する。
・統計分布
・箱ひげ図
・散布図
・決定木
・階層的クラスタリング
・ヒートマップ
・MDS
・線形投影 など
多次元データにも対応でき、属性ランキングと選択により2Dで表現できる。
Orangeが提供するグラフィックユーザーインターフェースを使用することで、コーディングをすることなく、クリーンな視覚化によるインタラクティブなデータ探索により、迅速な定性分析を実施できる。
Orangeではビジュアルプログラミングによるデータ分析も実施できる。
キャンバスにウィジェットを配置し、それらを接続してデータセットをロードすることで洞察を獲得できる。
このビジュアルプログラミングにより、データ分析ワークフローの高速プロトタイピングを実施できる。
より高度なユーザーは、OrangeをPythonプログラミング言語用モジュールとして使用できる。
Orangeを他の豊富なモジュールと連携させることで、高度な機械学習機能やデータ視覚化機能を活用したデータマイニングが可能となる。
Orangeには各種用途で利用できるアドオンが用意されている。
・外部データソースからのデータマイニング
・自然言語処理とテキストマイニングの実行
・ネットワーク分析の実施
・頻繁なアイテムセットの推測
・関連付けルールマイニング
・遺伝子ランク付けによる濃縮分析 など
KNIMEでは、データサイエンスプロセスのすべてをカバーできるデータマイニング環境を構築できるプラットフォーム。
KNIMEは「GNU General Public Licenseバージョン3」の下でリリースされている。
→knime.com →KNIME Open Source Story
「KNIME Analytics Platform」は、データサイエンスアプリケーションおよびサービスを作成するためのオープンソースソフトウェア。
直感的かつオープンかつ継続的に新しい開発を統合することで、データサイエンスワークフローと再利用可能コンポーネントに誰でもアクセスできるように設計されている。
「KNIME Server」は、データサイエンスワークフローを展開するのためのエンタープライズソフトウェア。
「分析アプリケーションおよびサービス」を構築するために、「チームベースのコラボレーション機能」「自動化機能」「各種管理機能」などの運用関連機能を提供する。
利用者は「KNIME WebPortal」や「REST API」を利用してKNIME Serverに接続し、KNIME Serverが提供している各種データサイエンスにアクセスできる。
参考元サイト
※定期的にメンテナンスを実施しておりますが、一部情報が古い場合がございます。ご了承ください。
データ分析でビジネス課題をどのように解決できるか、業界・ケース別にニーズの高いものを例に紹介します。
Analytics News ACCESS RANKING