CLOSE UP コラム | 人工知能プログラミングのためのライブラリ「TensorFlow」、「Cafee」、「Chainer」の紹介。

人工知能プログラミングのためのライブラリ「TensorFlow」、「Cafee」、「Chainer」の紹介。

CLOSE UP 事例

2016年09月15日
オープンソース活用研究所 所長 寺田雄一

ディープラーニングを含めた人工知能の活用が、急速に広がっている。画像を認識して文章化するアルゴリズム、各種数値計算、翻訳を含めた自然言語処理など、次々と新しい分野への開拓が進んでいるのだ。

今回は、人工知能プログラミングを牽引するライブラリ「TensorFlow」、「Caffe」、「Chainer」を紹介する。

柔軟性とスケーラビリティに優れた人工知能プログラミング・ライブラリ、TensorFlow。

TensorFlow(テンソルフロー)は、C++で実装され、Pythonのインターフェースが用意された人工知能プログラミングのためのライブラリである。「Tensor(テンソル)」とは線形の量を表す概念であり、TensorFlowは多次元データ構造を流れるように処理する。

もともとGoogleの機械学習/ディープラーニング/多層ニューラルネットワークのために開発されたライブラリで、複雑なネットワークを分かりやすく記述することを可能にしている。2011年、Googleが開発したディープラーニング基盤「DistBelief」が抱えていた課題を解決し、汎用性と性能を高めて開発されたのが「TensorFlow」である。「TensorFlow」の性能は、「DistBelief」の2倍と言われている。

TensorFlowの特長としては、「データフローグラフによる柔軟性」、「ローレベルオペレータも手書きできる汎用性」があるとともに、「高いパフォーマンス」、「スケーラビリティ」など研究レベルから実プロダクトまで扱える効率性がある。

したがってその応用分野も機械学習だけにはとどまらず、広い領域での活用が期待されている。

画像解析分野で注目されている人工知能プログラミング・ライブラリ、Caffe

人工知能プログラミングのなかでも、画像解析分野で注目されているフレームワークが、「Caffe(カフェ)」である。

画像解析には、物体認識という処理が求められる。「Caffe」は、この物体認識に必要な技術CNN(Convolutional Neural Net)を得意とする、C++で実装された、ディープラーニング用フレームワークである。

Caffeの特長としては「高速で動作」し、「GPUに対応」し、「Python/MATLABで利用するインターフェース」があり、「読みやすく改変しやすい実装」といった点が挙げられる。

また、人工知能プログラミング・ライブラリのなかでも特にコミュニティが活発であり、これまですでに1,000人以上の開発者がフォークしている。

"Define-by-Run"の枠組みがある人工知能プログラミング・ライブラリ、Chainer。

「Chainer」は、ニューラルネットワークを誤差伝播で学習する人工知能プログラミングのための直感的なライブラリである。

ニューラルネットのフレームワークであるChainerは、誤差逆伝播の計算を自動で行うのが特長だ。

人工知能プログラミングでは計算グラフの作り方がひとつのポイントとなるが、Chainerでは"Define-by-Run"の枠組みに適応している。

Cafeeなどの枠組みである"define-and-run"が計算グラフを構築し、そのグラフにデータを流すという2ステップから成り立っているのに対して、"Define-by-Run"を採用しているChainerは、通常の行列演算をする感覚で順伝播処理を行うと、逆伝播の計算グラフが構築されるという仕組みをもつ。

この仕組みによって、特殊なノードは不要で、グラフがデータごとに異なっていても問題はなくなる。つまり、構築と評価が同時になされるため、データを見ながら、違う処理をすることが可能となるのだ。

Chainerは、自然言語処理など、対象のデータの構造を生かしたネットワークを作る場合に応用できる。
http://d.hatena.ne.jp/shu223/20160105/1451952796
http://nonbiri-tereka.hatenablog.com/entry/2015/06/14/225706
http://www.atmarkit.co.jp/ait/articles/1511/09/news008.html
http://www.ossnews.jp/oss_info/TensorFlow


著者プロフィール

オープンソース活用研究所 所長 寺田雄一

1993年、株式会社野村総合研究所(NRI)入社。 インフラ系エンジニア、ITアーキテクトとして、証券会社基幹系システム、証券オンライントレードシステム、損保代理店システム、大手流通業基幹系システムなど、大規模システムのアーキテクチャ設計、基盤構築に従事。 2003年、NRI社内に、オープンソースの専門組織の設立を企画、10月に日本初となるオープンソース・ソリューションセンター設立。 2006年、社内ベンチャー制度にて、オープンソース・ワンストップサービス 「OpenStandia(オープンスタンディア)」事業を開始。オープンソースを活用した、企業情報ポータル、情報分析、シングルサインオン、統合ID管理、ドキュメント管理、統合業務システム(ERP)などの事業を次々と展開。 オープンソースビジネス推進協議会(OBCI),OpenAMコンソーシアムなどの業界団体も設立。同会の理事、会長や、NPO法人日本ADempiereの理事などを歴任。 2013年、NRIを退社し、株式会社オープンソース活用研究所を設立。

最新TOPICS

【ビッグデータ】日本におけるデータサイエンティスト人材不足問題---将来25万人も不足?(2017年03月30日 10:03)

日本における「データ分析」人材不足の現状について解説。 【テーマ】 ・日本の企業は何をするべきなのか ・ビッグデータを真の意味で活用できている日本企業はまだまだ少ない ・データサイエンティストは将来25万人も不足する?

関連タグ

IoT(モノのインターネット:Internet of Things)

「IoT」とは、従来はコンピュータやサーバなどの情報・通信機器だけに接続されていたインターネットを、世の中に存在する様々な物体(モノ)に接続して自動認識や自動制御、遠隔計測などを行う技術。

テキストマイニング()

  • 用語集

「テキストマイニング」とは、大量のテキストデータから情報や特長、傾向、相関関係などの知見を探し出す技術。文字列を対象としたデータマイニング

コレスポンデンス分析()

  • 用語集

「コレスポンデンス分析」(Correspondence Analysis)とは、類似した項目を明らかにするため、各項目を数値化する分析手法である。

多変量解析入門()

  • 用語集

複数の変数に関するデータをもとに、変数間の相互関連を分析する統計的技法の総称。

判別分析法()

  • 用語集

データを異なるグループに分ける際に、まだ分類されていない新しいデータがどちらのグループに入るのかを判別するための基準を得るための分類の手法。

バックナンバー

関連記事

  • KSKサイド003

facebook

twitter