Googleの画像認識API「Cloud Vision API」

グーグルの画像認識API「Cloud Vision」は、開発者向けの画像認識と機械学習のための強力なツールだ。

グーグルは2015年終盤、開発者が画像を認識してパターンを学習するアプリケーションを作成するのに役立つ2つのシステムをリリースした。そのうちのひとつが「Cloud Vision」である。Cloud Vision APIは、機械学習のアルゴリズムを記述したりモデルの学習を行ったりする必要がない。機械学習に詳しくない開発者でも活用できる点が大きいポイントだ。

Cloud Vision APIが提供するのは、画像の認識、分類、グループ化を行うためのツール。このAPIが提供する機能の片鱗は、Google Photoにも存在する。Google Photoを使うと写真のなかから特定の人物や、一般的なモノ、有名なランドマークなどが写っている画像を検索することができる。また文字認識は、多数の言語に対応し、画像中のテキストを認識する。

Cloud Visionは、これらGoogle Photoで提供している最新の画像認識技術を含め、Google Brainチームが数年前から開発を続けてきたディープラーティング技術が惜しみなく投入されている。

画像認識API「Cloud Vision」は、グーグルブレインの叡智が結集。

Cloud Vision API には、画像分析のレイヤも用意されており、画像に暴力的な表現や不適切なコンテンツが含まれているかどうかを判別することもできる。さらに、このAPIには感情分析の機能も含まれており、人間の顔を表情（笑っている、泣いているなど）に基づいて分類することも可能だ。

Cloud Vision APIが提供する画像認識機能をまとめると、次のようなものとなる。

－顔検知：画像上の複数の顔を検知し、目鼻口の位置、感情、顔の向き（3D）を推測。
－物体検知：画像上の物体を検知。
－ロゴ検知：画像上の企業ロゴやブランドマークを検知。
－ランドマーク検知：画像上のランドマークを検知。
－OCR：多言語対応のOCRに対応。
－セーフサーチ検知：画像にアダルトコンテンツやバイオレントな要素が含まれていないか判定。

Google Cloud Vision APIを利用する場合、直接REST APIに問い合わせを行う方法とGoogle Cloud SDKを通して問い合わせを行う方法がある。また、事前に認証情報をSDKに登録する必要がある。

下記サイトからの要約。
http://japan.zdnet.com/article/35075445/
http://qiita.com/kazunori279/items/768c7fdf96cdf45a9d16

CLOSE UP 事例

画像認識API「Cloud Vision」は、グーグルブレインの叡智が結集。

著者プロフィール

オープンソース活用研究所所長寺田雄一

最新TOPICS

最新CLOSEUPコラム

2020年のデータ・BI領域の10のトレンドを解説（資料）(2020年02月10日 )

【セミナーレポート】VR/AR/MRの動向および活用事例紹介(2018年08月02日 )

【AI】成田国際空港、「AI自動装着機能付き旅客搭乗橋」を試験導入へ---AI画像認識で飛行機ドア位置を確認(2018年07月06日 )

【BigData】JR東日本、線路設備モニタリング装置を本格導入---ビッグデータ分析により線路保守作業を効率化(2018年07月06日 )

【IoT】総務省、重要インフラでの「脆弱IoT機器調査」を実施---脆弱IoT機器は150件検出、注意喚起できたのは36件のみ(2018年07月06日 )

関連タグ

Computer Vision(コンピュータビジョン)

スマートファクトリー(Smart Factory)

IoT(Internet of Things)

スマートスピーカー(Smart Speaker)

HPE Universal IoT Platform(HPEユニバーサルIoTプラットフォーム)

バックナンバー

関連記事

用語集とタグ一覧

Googleの画像認識API「Cloud Vision API」

CLOSE UP 事例

画像認識API「Cloud Vision」は、グーグルブレインの叡智が結集。

著者プロフィール

オープンソース活用研究所 所長 寺田雄一

最新TOPICS

最新CLOSEUPコラム

関連タグ

バックナンバー

関連記事

用語集とタグ一覧

オープンソース活用研究所所長寺田雄一