2017年10月26日
オープンソース活用研究所 所長 寺田雄一
Googleは、10月19日(米国時間)、機械学習用動画データセット「AVA Dataset」を公開した。
「AVA Dataset」とは、人間のアクション動画を集めて、それぞれにラベルをつけたデータセット。
「AVA」は「Atomic Visual Actions」の頭文字で、「最小単位で不可分の視覚的アクション集」を意味している。
「AVA Dataset」は、他のデータセットとは異なり、アクションデータとして使えるシーンの中に複数の区切りを設けて、それぞれにラベルを付けられている点が特徴。
つまり、1つのシーンがマルチラベルとなっているため、機械学習において、複雑なシーンの細部を捕捉できるようにし、機械学習モデル精度の向上に寄与する。
一片の長さが3秒の動画が57000あり、人間に付けられたラベルが96000で、ラベルの総数は21万になる。
アクションタイプとしては、「歩く」「走る」「飛ぶ」「ハグする」など80種が用意されている。
オフィシャルサイトから、完全なデータセットをダウンロード可能となっている。
以上、下記URLからの要約
http://jp.techcrunch.com/2017/10/20/20171019googles-ava-dataset-raises-the-bar-for-identifying-human-actions-in-videos/
1993年、株式会社野村総合研究所(NRI)入社。 インフラ系エンジニア、ITアーキテクトとして、証券会社基幹系システム、証券オンライントレードシステム、損保代理店システム、大手流通業基幹系システムなど、大規模システムのアーキテクチャ設計、基盤構築に従事。 2003年、NRI社内に、オープンソースの専門組織の設立を企画、10月に日本初となるオープンソース・ソリューションセンター設立。 2006年、社内ベンチャー制度にて、オープンソース・ワンストップサービス「OpenStandia(オープンスタンディア)」事業を開始。オープンソースを活用した、企業情報ポータル、情報分析、シングルサインオン、統合ID管理、ドキュメント管理、統合業務システム(ERP)などの事業を次々と展開。 オープンソースビジネス推進協議会(OBCI),OpenAMコンソーシアムなどの業界団体も設立。同会の理事、会長や、NPO法人日本ADempiereの理事などを歴任。 2013年、NRIを退社し、株式会社オープンソース活用研究所を設立。
最新情報はありません。
「音声認識(Speech Recognition)」とは、人の音声(会話)をコンピュータに認識させることで、「話し言葉をテキストデータに変換」あるいは「音声の特徴を捉えて声を出している人を識別」などを行う機能を指す。音声認識技術は、生活の一部として一般的に普及してきている。
Cloud IoT Core(クラウドアイオーティコア)は、Google Cloud PlatformのIoTフルマネージドサービス。端末管理機能とデータ取り込み機能を中心とした統合管理機能を提供する。
「BI(Business Intelligence)」とは、経営戦略などのビジネス上の意思決定をサポートするために、企業内に分散蓄積されている多様なデータを収集し、統合的に分析し活用するための手法。意思決定支援システム「DSS(Decision Support System)」の1つに該当するものとされている。
Analytics News ACCESS RANKING