2017年10月26日
オープンソース活用研究所 所長 寺田雄一
Googleは、10月19日(米国時間)、機械学習用動画データセット「AVA Dataset」を公開した。
「AVA Dataset」とは、人間のアクション動画を集めて、それぞれにラベルをつけたデータセット。
「AVA」は「Atomic Visual Actions」の頭文字で、「最小単位で不可分の視覚的アクション集」を意味している。
「AVA Dataset」は、他のデータセットとは異なり、アクションデータとして使えるシーンの中に複数の区切りを設けて、それぞれにラベルを付けられている点が特徴。
つまり、1つのシーンがマルチラベルとなっているため、機械学習において、複雑なシーンの細部を捕捉できるようにし、機械学習モデル精度の向上に寄与する。
一片の長さが3秒の動画が57000あり、人間に付けられたラベルが96000で、ラベルの総数は21万になる。
アクションタイプとしては、「歩く」「走る」「飛ぶ」「ハグする」など80種が用意されている。
オフィシャルサイトから、完全なデータセットをダウンロード可能となっている。
以上、下記URLからの要約
http://jp.techcrunch.com/2017/10/20/20171019googles-ava-dataset-raises-the-bar-for-identifying-human-actions-in-videos/
1993年、株式会社野村総合研究所(NRI)入社。 インフラ系エンジニア、ITアーキテクトとして、証券会社基幹系システム、証券オンライントレードシステム、損保代理店システム、大手流通業基幹系システムなど、大規模システムのアーキテクチャ設計、基盤構築に従事。 2003年、NRI社内に、オープンソースの専門組織の設立を企画、10月に日本初となるオープンソース・ソリューションセンター設立。 2006年、社内ベンチャー制度にて、オープンソース・ワンストップサービス「OpenStandia(オープンスタンディア)」事業を開始。オープンソースを活用した、企業情報ポータル、情報分析、シングルサインオン、統合ID管理、ドキュメント管理、統合業務システム(ERP)などの事業を次々と展開。 オープンソースビジネス推進協議会(OBCI),OpenAMコンソーシアムなどの業界団体も設立。同会の理事、会長や、NPO法人日本ADempiereの理事などを歴任。 2013年、NRIを退社し、株式会社オープンソース活用研究所を設立。
最新情報はありません。
Azure Databricks(アジュールデータブリックス)は、Azureプラットフォームに最適化された「Apache Sparkベース」の分析プラットフォーム。
「ビッグデータ(Big Data)」とは、一般的なソフトウェアの能力を超えたサイズのデータ集合であり、従来のデータベース管理システムでは「記録」「保管」「管理」「解析」などの処理が難しいほどの巨大で複雑なデータ群。「インターネット普及」「コンピュータの処理速度」「クラウド技術向上」などに伴い、日々大量に生成され溢れている大容量デジタルデータを指す。
Analytics News ACCESS RANKING