無料で利用できるオープンソースデータマイニングツールとして、「Orange」「KNIME」について紹介。

無料で利用できるオープンソースデータマイニングツール

無料で利用できるオープンソースデータマイニングツールとして、「Orange」「KNIME」について紹介。

無料で利用できるオープンソースデータマイニングツールを紹介。

Orange

■概要

Orangeはコンポーネントベースのデータマイニングツール。

データに関する「視覚化」「調査」「前処理」「モデリング」についてのさまざまな手法が含まれている。

大きなツールボックスを備えたインタラクティブなデータ分析ワークフロー機能により、初心者でも直感的なデータマイニングを実施できる。

→orange.biolab.si

■ライセンス

Orangeは「GNU[GPL-3.0]+ライセンス」で提供されている。

→GitHub →biolab/orange3 →LICENSE

■主な特徴

データ可視化機能

Orangeは、以下のデータ視覚化機能を提供する。
・統計分布
・箱ひげ図
・散布図
・決定木
・階層的クラスタリング
・ヒートマップ
・MDS
・線形投影 など

多次元データにも対応でき、属性ランキングと選択により2Dで表現できる。

データ探索機能

Orangeが提供するグラフィックユーザーインターフェースを使用することで、コーディングをすることなく、クリーンな視覚化によるインタラクティブなデータ探索により、迅速な定性分析を実施できる。

ビジュアルプログラミング

Orangeではビジュアルプログラミングによるデータ分析も実施できる。

キャンバスにウィジェットを配置し、それらを接続してデータセットをロードすることで洞察を獲得できる。

このビジュアルプログラミングにより、データ分析ワークフローの高速プロトタイピングを実施できる。

Pythonモジュールとして使用

より高度なユーザーは、OrangeをPythonプログラミング言語用モジュールとして使用できる。

Orangeを他の豊富なモジュールと連携させることで、高度な機械学習機能やデータ視覚化機能を活用したデータマイニングが可能となる。

アドオンによる機能拡張

Orangeには各種用途で利用できるアドオンが用意されている。

・外部データソースからのデータマイニング
・自然言語処理とテキストマイニングの実行
・ネットワーク分析の実施
・頻繁なアイテムセットの推測
・関連付けルールマイニング
・遺伝子ランク付けによる濃縮分析 など

KNIME

■概要

KNIMEでは、データサイエンスプロセスのすべてをカバーできるデータマイニング環境を構築できるプラットフォーム。

→knime.com

■ライセンス

KNIMEは「GNU General Public Licenseバージョン3」の下でリリースされている。

→knime.com →KNIME Open Source Story

■主な特徴

KNIME Analytics Platform

「KNIME Analytics Platform」は、データサイエンスアプリケーションおよびサービスを作成するためのオープンソースソフトウェア。

直感的かつオープンかつ継続的に新しい開発を統合することで、データサイエンスワークフローと再利用可能コンポーネントに誰でもアクセスできるように設計されている。

KNIME Server

「KNIME Server」は、データサイエンスワークフローを展開するのためのエンタープライズソフトウェア。

「分析アプリケーションおよびサービス」を構築するために、「チームベースのコラボレーション機能」「自動化機能」「各種管理機能」などの運用関連機能を提供する。

利用者は「KNIME WebPortal」や「REST API」を利用してKNIME Serverに接続し、KNIME Serverが提供している各種データサイエンスにアクセスできる。

 

参考元サイト

※定期的にメンテナンスを実施しておりますが、一部情報が古い場合がございます。ご了承ください。

データマイニング最新CLOSEUPコラム

イベント情報

セミナー講演資料

無料資料プレゼント

2021/03/04 セキュリティDAYS Keyspider資料

講演資料を見るには、 プライバシーポリシーに同意して、送付先メールアドレスをご入力しご請求ください。

またご入力いただきました情報は、当該資料の作成・提供企業とも共有させていただき、当社及び各社のサービス、製品、セミナー、イベントなどのご案内に使用させていただきます。

本資料を見るには次の画面でアンケートに回答していただく必要があります。



セミナー講演資料公開中

電帳法対応、Slack/Teamsやメールなど、電子文書の受領はどうするのか? ~バラバラな方法で受け取った電子文書をどのように保存、管理すればよいのか?~

最新の脅威動向から考える、今「サイバー・レジリエンス」が必要な理由 ~「完全防御不可能」な時代、組織に求められるセキュリティ強化と自動化~

【企業ネットワーク向け】ローカルブレイクアウト、適用できないSaaSはありませんか?通信速度や運用に課題はありませんか? 〜LBOに最適なネットワーク機器や管理ツールによる解決策をご提案〜

  • 書籍
  • OSSNEWSに広告を掲載しませんか?

facebook

twitter