CLOSE UP コラム | Google、機械学習用動画データセット「AVA Dataset」を公開---マルチラベル動画により機械学習モデル精度の向上へ

Google、機械学習用動画データセット「AVA Dataset」を公開---マルチラベル動画により機械学習モデル精度の向上へ

CLOSE UP ニュース

2017年10月26日
オープンソース活用研究所 所長 寺田雄一

Googleは、10月19日(米国時間)、機械学習用動画データセット「AVA Dataset」を公開した。

「AVA Dataset」とは

「AVA Dataset」とは、人間のアクション動画を集めて、それぞれにラベルをつけたデータセット。

「AVA」は「Atomic Visual Actions」の頭文字で、「最小単位で不可分の視覚的アクション集」を意味している。

「AVA Dataset」の特徴

「AVA Dataset」は、他のデータセットとは異なり、アクションデータとして使えるシーンの中に複数の区切りを設けて、それぞれにラベルを付けられている点が特徴。

つまり、1つのシーンがマルチラベルとなっているため、機械学習において、複雑なシーンの細部を捕捉できるようにし、機械学習モデル精度の向上に寄与する。

「AVA Dataset」のデータ分量

一片の長さが3秒の動画が57000あり、人間に付けられたラベルが96000で、ラベルの総数は21万になる。

アクションタイプとしては、「歩く」「走る」「飛ぶ」「ハグする」など80種が用意されている。

オフィシャルサイトから、完全なデータセットをダウンロード可能となっている。

以上、下記URLからの要約
http://jp.techcrunch.com/2017/10/20/20171019googles-ava-dataset-raises-the-bar-for-identifying-human-actions-in-videos/


著者プロフィール

オープンソース活用研究所 所長 寺田雄一

1993年、株式会社野村総合研究所(NRI)入社。 インフラ系エンジニア、ITアーキテクトとして、証券会社基幹系システム、証券オンライントレードシステム、損保代理店システム、大手流通業基幹系システムなど、大規模システムのアーキテクチャ設計、基盤構築に従事。 2003年、NRI社内に、オープンソースの専門組織の設立を企画、10月に日本初となるオープンソース・ソリューションセンター設立。 2006年、社内ベンチャー制度にて、オープンソース・ワンストップサービス 「OpenStandia(オープンスタンディア)」事業を開始。オープンソースを活用した、企業情報ポータル、情報分析、シングルサインオン、統合ID管理、ドキュメント管理、統合業務システム(ERP)などの事業を次々と展開。 オープンソースビジネス推進協議会(OBCI),OpenAMコンソーシアムなどの業界団体も設立。同会の理事、会長や、NPO法人日本ADempiereの理事などを歴任。 2013年、NRIを退社し、株式会社オープンソース活用研究所を設立。

最新TOPICS

最新情報はありません。

関連タグ

AWS IoT Core(AWS IoTコア)

  • IoT

AWS IoT Coreは、AWSが提供するマネージド型IoTクラウドサービス。

Zinrai(ジンライ)

  • AI

Zinraiとは、富士通が提供するAIプラットフォームサービスで、多様なAI機能やディープラーニング機能を利用できる。

ビッグデータ(Big Data)

「ビッグデータ(Big Data)」とは、一般的なソフトウェアの能力を超えたサイズのデータ集合であり、従来のデータベース管理システムでは「記録」「保管」「管理」「解析」などの処理が難しいほどの巨大で複雑なデータ群。「インターネット普及」「コンピュータの処理速度」「クラウド技術向上」などに伴い、日々大量に生成され溢れている大容量デジタルデータを指す。

スマートスピーカー(Smart Speaker)

  • 用語集

スマートスピーカー(Smart Speaker)とは、対話型の音声操作に対応したAIアシスタント機能を持つワイヤレススピーカーを指す。

ビジネスインテリジェンス(Business Intelligence)

「BI(Business Intelligence)」とは、経営戦略などのビジネス上の意思決定をサポートするために、企業内に分散蓄積されている多様なデータを収集し、統合的に分析し活用するための手法。意思決定支援システム「DSS(Decision Support System)」の1つに該当するものとされている。

バックナンバー

関連記事

無料資料プレゼント

2021/03/04 セキュリティDAYS Keyspider資料

講演資料を見るには、 プライバシーポリシーに同意して、送付先メールアドレスをご入力しご請求ください。

またご入力いただきました情報は、当該資料の作成・提供企業とも共有させていただき、当社及び各社のサービス、製品、セミナー、イベントなどのご案内に使用させていただきます。

本資料を見るには次の画面でアンケートに回答していただく必要があります。



セミナー講演資料公開中

注目のDB技術「HTAP」とは? ~手軽に、かつ高速に、リアルタイム分析を実現する方法~

ビッグデータ処理のデータベースとして MySQL HeatWave が最適な理由 〜AWS Aurora/Redshift、GCP BigQuery との性能&コスト比較〜

データ分析の課題をAWS Analyticsサービスで解決する方法

  • 書籍

Analytics News ACCESS RANKING

facebook

twitter