2017年10月26日
オープンソース活用研究所 所長 寺田雄一
Googleは、10月19日(米国時間)、機械学習用動画データセット「AVA Dataset」を公開した。
「AVA Dataset」とは、人間のアクション動画を集めて、それぞれにラベルをつけたデータセット。
「AVA」は「Atomic Visual Actions」の頭文字で、「最小単位で不可分の視覚的アクション集」を意味している。
「AVA Dataset」は、他のデータセットとは異なり、アクションデータとして使えるシーンの中に複数の区切りを設けて、それぞれにラベルを付けられている点が特徴。
つまり、1つのシーンがマルチラベルとなっているため、機械学習において、複雑なシーンの細部を捕捉できるようにし、機械学習モデル精度の向上に寄与する。
一片の長さが3秒の動画が57000あり、人間に付けられたラベルが96000で、ラベルの総数は21万になる。
アクションタイプとしては、「歩く」「走る」「飛ぶ」「ハグする」など80種が用意されている。
オフィシャルサイトから、完全なデータセットをダウンロード可能となっている。
以上、下記URLからの要約
http://jp.techcrunch.com/2017/10/20/20171019googles-ava-dataset-raises-the-bar-for-identifying-human-actions-in-videos/
1993年、株式会社野村総合研究所(NRI)入社。 インフラ系エンジニア、ITアーキテクトとして、証券会社基幹系システム、証券オンライントレードシステム、損保代理店システム、大手流通業基幹系システムなど、大規模システムのアーキテクチャ設計、基盤構築に従事。 2003年、NRI社内に、オープンソースの専門組織の設立を企画、10月に日本初となるオープンソース・ソリューションセンター設立。 2006年、社内ベンチャー制度にて、オープンソース・ワンストップサービス「OpenStandia(オープンスタンディア)」事業を開始。オープンソースを活用した、企業情報ポータル、情報分析、シングルサインオン、統合ID管理、ドキュメント管理、統合業務システム(ERP)などの事業を次々と展開。 オープンソースビジネス推進協議会(OBCI),OpenAMコンソーシアムなどの業界団体も設立。同会の理事、会長や、NPO法人日本ADempiereの理事などを歴任。 2013年、NRIを退社し、株式会社オープンソース活用研究所を設立。
最新情報はありません。
「音声認識(Speech Recognition)」とは、人の音声(会話)をコンピュータに認識させることで、「話し言葉をテキストデータに変換」あるいは「音声の特徴を捉えて声を出している人を識別」などを行う機能を指す。音声認識技術は、生活の一部として一般的に普及してきている。
Computer Visionは、Azureが提供するクラウドベースのイメージ分析サービス。イメージを処理して情報を返す高度なアルゴリズムを利用できる。
「リアルタイムデータ処理」とは、すべてのデータをストレージに格納して処理していた従来手法に代わり、ビッグデータをリアルタイムで処理するための手法。「ストリームデータ処理技術」「複合イベント処理技術」「インメモリデータ処理技術」などの技術を利用することで、データをリアルタイム分析できる処理基盤が普及してきている。
IoT(Internet of Things)とは、従来インターネットに接続されていなかったさまざまなモノ(センサーデバイス、デジタルデバイス、工業機械、駆動装置、建物、車など)が、ネットワークを通じてサーバやクラウドサービスに接続されることで、相互情報交換や遠隔制御できる仕組みを指す。
「LPWA」とは、「Low Power=省電力」+「Wide Area=広域エリア」を意味しており、少ない消費電力で、km単位の距離で広範囲に通信できる無線通信技術の総称である。
Analytics News ACCESS RANKING