無料で利用できるオープンソースデータマイニングツールとして、「Orange」「KNIME」について紹介。

無料で利用できるオープンソースデータマイニングツール

無料で利用できるオープンソースデータマイニングツールとして、「Orange」「KNIME」について紹介。

無料で利用できるオープンソースデータマイニングツールを紹介。

Orange

■概要

Orangeはコンポーネントベースのデータマイニングツール。

データに関する「視覚化」「調査」「前処理」「モデリング」についてのさまざまな手法が含まれている。

大きなツールボックスを備えたインタラクティブなデータ分析ワークフロー機能により、初心者でも直感的なデータマイニングを実施できる。

→orange.biolab.si

■ライセンス

Orangeは「GNU[GPL-3.0]+ライセンス」で提供されている。

→GitHub →biolab/orange3 →LICENSE

■主な特徴

データ可視化機能

Orangeは、以下のデータ視覚化機能を提供する。
・統計分布
・箱ひげ図
・散布図
・決定木
・階層的クラスタリング
・ヒートマップ
・MDS
・線形投影 など

多次元データにも対応でき、属性ランキングと選択により2Dで表現できる。

データ探索機能

Orangeが提供するグラフィックユーザーインターフェースを使用することで、コーディングをすることなく、クリーンな視覚化によるインタラクティブなデータ探索により、迅速な定性分析を実施できる。

ビジュアルプログラミング

Orangeではビジュアルプログラミングによるデータ分析も実施できる。

キャンバスにウィジェットを配置し、それらを接続してデータセットをロードすることで洞察を獲得できる。

このビジュアルプログラミングにより、データ分析ワークフローの高速プロトタイピングを実施できる。

Pythonモジュールとして使用

より高度なユーザーは、OrangeをPythonプログラミング言語用モジュールとして使用できる。

Orangeを他の豊富なモジュールと連携させることで、高度な機械学習機能やデータ視覚化機能を活用したデータマイニングが可能となる。

アドオンによる機能拡張

Orangeには各種用途で利用できるアドオンが用意されている。

・外部データソースからのデータマイニング
・自然言語処理とテキストマイニングの実行
・ネットワーク分析の実施
・頻繁なアイテムセットの推測
・関連付けルールマイニング
・遺伝子ランク付けによる濃縮分析 など

KNIME

■概要

KNIMEでは、データサイエンスプロセスのすべてをカバーできるデータマイニング環境を構築できるプラットフォーム。

→knime.com

■ライセンス

KNIMEは「GNU General Public Licenseバージョン3」の下でリリースされている。

→knime.com →KNIME Open Source Story

■主な特徴

KNIME Analytics Platform

「KNIME Analytics Platform」は、データサイエンスアプリケーションおよびサービスを作成するためのオープンソースソフトウェア。

直感的かつオープンかつ継続的に新しい開発を統合することで、データサイエンスワークフローと再利用可能コンポーネントに誰でもアクセスできるように設計されている。

KNIME Server

「KNIME Server」は、データサイエンスワークフローを展開するのためのエンタープライズソフトウェア。

「分析アプリケーションおよびサービス」を構築するために、「チームベースのコラボレーション機能」「自動化機能」「各種管理機能」などの運用関連機能を提供する。

利用者は「KNIME WebPortal」や「REST API」を利用してKNIME Serverに接続し、KNIME Serverが提供している各種データサイエンスにアクセスできる。

 

参考元サイト

※定期的にメンテナンスを実施しておりますが、一部情報が古い場合がございます。ご了承ください。

データマイニング最新CLOSEUPコラム

イベント情報

セミナー講演資料

無料資料プレゼント

2021/03/04 セキュリティDAYS Keyspider資料

講演資料を見るには、 プライバシーポリシーに同意して、送付先メールアドレスをご入力しご請求ください。

またご入力いただきました情報は、当該資料の作成・提供企業とも共有させていただき、当社及び各社のサービス、製品、セミナー、イベントなどのご案内に使用させていただきます。

本資料を見るには次の画面でアンケートに回答していただく必要があります。



セミナー講演資料公開中

世界最高峰のリアルハッカー集団を活用した脆弱性対策 ~米国政府も採用、脆弱性診断・ペネトレーションテストを大胆に変革する方法~

正社員・非正規社員の離職率を下げるためには? ~主観的な定性評価から、定量的なジョブ型評価への転換の重要性~

文書を作る過程における情報(Slack/Teamsでのコメントなど)をどう管理、共有するべきか? ~新しい文書情報管理の考え方~

  • 書籍

Analytics News ACCESS RANKING

  • OSSNEWSに広告を掲載しませんか?

facebook

twitter