CLOSE UP コラム | Googleの画像認識API「Cloud Vision API」

Googleの画像認識API「Cloud Vision API」

CLOSE UP 事例

2016年11月21日
オープンソース活用研究所 所長 寺田雄一

グーグルの画像認識API「Cloud Vision」は、開発者向けの画像認識と機械学習のための強力なツールだ。

グーグルは2015年終盤、開発者が画像を認識してパターンを学習するアプリケーションを作成するのに役立つ2つのシステムをリリースした。そのうちのひとつが「Cloud Vision」である。Cloud Vision APIは、機械学習のアルゴリズムを記述したりモデルの学習を行ったりする必要がない。機械学習に詳しくない開発者でも活用できる点が大きいポイントだ。

Cloud Vision APIが提供するのは、画像の認識、分類、グループ化を行うためのツール。このAPIが提供する機能の片鱗は、Google Photoにも存在する。Google Photoを使うと写真のなかから特定の人物や、一般的なモノ、有名なランドマークなどが写っている画像を検索することができる。また文字認識は、多数の言語に対応し、画像中のテキストを認識する。

Cloud Visionは、これらGoogle Photoで提供している最新の画像認識技術を含め、Google Brainチームが数年前から開発を続けてきたディープラーティング技術が惜しみなく投入されている。

画像認識API「Cloud Vision」は、グーグルブレインの叡智が結集。

Cloud Vision API には、画像分析のレイヤも用意されており、画像に暴力的な表現や不適切なコンテンツが含まれているかどうかを判別することもできる。さらに、このAPIには感情分析の機能も含まれており、人間の顔を表情(笑っている、泣いているなど)に基づいて分類することも可能だ。

Cloud Vision APIが提供する画像認識機能をまとめると、次のようなものとなる。

  • -顔検知:画像上の複数の顔を検知し、目鼻口の位置、感情、顔の向き(3D)を推測。
  • -物体検知:画像上の物体を検知。
  • -ロゴ検知:画像上の企業ロゴやブランドマークを検知。
  • -ランドマーク検知:画像上のランドマークを検知。
  • -OCR:多言語対応のOCRに対応。
  • -セーフサーチ検知:画像にアダルトコンテンツやバイオレントな要素が含まれていないか判定。

Google Cloud Vision APIを利用する場合、直接REST APIに問い合わせを行う方法とGoogle Cloud SDKを通して問い合わせを行う方法がある。また、事前に認証情報をSDKに登録する必要がある。

下記サイトからの要約。
http://japan.zdnet.com/article/35075445/
http://qiita.com/kazunori279/items/768c7fdf96cdf45a9d16


著者プロフィール

オープンソース活用研究所 所長 寺田雄一

1993年、株式会社野村総合研究所(NRI)入社。 インフラ系エンジニア、ITアーキテクトとして、証券会社基幹系システム、証券オンライントレードシステム、損保代理店システム、大手流通業基幹系システムなど、大規模システムのアーキテクチャ設計、基盤構築に従事。 2003年、NRI社内に、オープンソースの専門組織の設立を企画、10月に日本初となるオープンソース・ソリューションセンター設立。 2006年、社内ベンチャー制度にて、オープンソース・ワンストップサービス 「OpenStandia(オープンスタンディア)」事業を開始。オープンソースを活用した、企業情報ポータル、情報分析、シングルサインオン、統合ID管理、ドキュメント管理、統合業務システム(ERP)などの事業を次々と展開。 オープンソースビジネス推進協議会(OBCI),OpenAMコンソーシアムなどの業界団体も設立。同会の理事、会長や、NPO法人日本ADempiereの理事などを歴任。 2013年、NRIを退社し、株式会社オープンソース活用研究所を設立。

最新TOPICS

最新情報はありません。

関連タグ

デジタルトランスフォーメーション(Digital transformation)

  • 用語集

「デジタルトランスフォーメーション」(DX:Digital transformation)とは、「AIやIoTなどのICTを用いてビジネスや社会システムの基盤についてデジタルを前提とした仕組みに作り替える取り組み」を意味する。「ITの浸透により、企業/産業の事業活動や都市運営などを変革し、人々の生活をあらゆる面でより良い方向に変化させる」などの概念である。

CylancePROTECT(サイランスプロテクト)

  • AI

CylancePROTECT(サイランスプロテクト)は、人工知能を活用した次世代型のセキュリティソリューション。実行前マルウェア判定など高度な機能を備えている。

Pentaho(ペンタホ)

  • BI

Pentaho(ペンタホ)とは、データ統合分析基盤であり、BI/BAツール群の総称。多種多様なデータを統合し、さまざまな観点での分析を行える。

Cloud AutoML(クラウドオートエムエル)

  • AI

Cloud AutoML(クラウドオートエムエル)は、機械学習の専門知識がなくても、最小限の労力で、高品質のカスタム機械学習モデルをトレーニングできるサービス。

ビッグデータ(Big Data)

「ビッグデータ(Big Data)」とは、一般的なソフトウェアの能力を超えたサイズのデータ集合であり、従来のデータベース管理システムでは「記録」「保管」「管理」「解析」などの処理が難しいほどの巨大で複雑なデータ群。「インターネット普及」「コンピュータの処理速度」「クラウド技術向上」などに伴い、日々大量に生成され溢れている大容量デジタルデータを指す。

バックナンバー

関連記事

無料資料プレゼント

2021/03/04 セキュリティDAYS Keyspider資料

講演資料を見るには、 プライバシーポリシーに同意して、送付先メールアドレスをご入力しご請求ください。

またご入力いただきました情報は、当該資料の作成・提供企業とも共有させていただき、当社及び各社のサービス、製品、セミナー、イベントなどのご案内に使用させていただきます。

本資料を見るには次の画面でアンケートに回答していただく必要があります。



セミナー講演資料公開中

利用者が多いと問題に。セルフサービスBIの課題と多店舗・グループ経営企業でのレポート共有事例

DX時代のデータ活用とは? DataOpsを知り、メタデータ管理をはじめよう!

NLG(自然言語生成)で分析データを自動「言語化」 ~データに触れるすべての人にインサイトを~

  • 書籍

facebook

twitter