「スマートスピーカー」とは
■概要
■基本説明
■音声操作
・音声認識入力デバイス
・メリット
■マーケット拡大予測
AIアシスタント機能
■概要
・スマートフォン搭載のAIアシスタント
・スピーカーに搭載されたAIアシスタント
■AIアシスタントの種類
■ウェイクワード
■音声認識精度
・音声認識精度比較(英語)
・音声認識精度比較(日本語)
・ディープラーニングによる音声認識精度向上
■機能追加(強化)
主要スマートスピーカー製品
■概要
・マーケットシェア
・ハードウェアとしての音声認識精度
■Amazon Echo
■Google Home
■Apple HomePod
主な機能
■スマートスピーカーが提供する主な機能
■ホームオートメーション(スマート家電連携)
スマートスピーカー(Smart Speaker)とは、対話型の音声操作に対応したAIアシスタント機能を持つワイヤレススピーカーを指す。
スマートスピーカーとは、AIアシスタント機能を搭載した据え置き型のスピーカーの総称。
インターネットのクラウド上にあるAIアシスタントに対応し、内蔵されているマイクで音声を認識することで、さまざまな場面において人の暮らしをサポートする。
情報検索/音楽再生/スケジュール管理などを行え、スマート家電と連携することで音声による家電操作にも対応する。
日本では「AIスピーカー」とも呼ばれており、2010年代半ば以降、家電製品のカテゴリーとして定着しつつある。
スマートスピーカーはマイクを内蔵しており、音声認識による入力デバイスとして機能する。人が話す自然な言語を認識できる点が特徴で、スピーカーに話しかけることで、インターネット経由でAIアシスタントが指示内容を解析し応答する。各種インターネットサービスを利用したり、さまざまな機器を操作できる。
PC/タブレット/スマートフォンなどを利用して、インターネットを介して音楽鑑賞/調べ物/買い物などのサービスを利用できるが、スマートスピーカーではそのような各種サービスを音声のみで操作できる。従来のマウス操作/キーボード操作/タッチパネル操作など加えて、音声操作用インターフェースとして機能する。
音声だけで操作が完結し、スマートフォンのように画面操作で指示する必要がないため、作業中で手が離せない場合や、スマートスピーカーに手を伸ばせる位置にいない場合でも、操作できる。
また、文字が理解できない幼児や複雑な操作を苦手とするシニア層も利用しやすいというメリットがある
スマートスピーカーのマーケットは急拡大している。
アメリカのIT調査コンサルティング会社であるGartner社によると、スマートスピーカーの世界市場について、「2015年は約400億円」から「2020年には約2400億円」に成長すると予想している。さらに「2020年までに75%の世帯が最低1台はスマートスピーカーを所持する」という予測を出している。
スマートスピーカーは音声対話型のAIアシスタントに対応しており、人が自然な言葉で話しかけることでさまざまなアクションを実行できる。
AIアシスタントは、近年スマートフォンやPCにも搭載されはじめている。
画面をタッチしたり、キーボードを叩いたりするよりも速く手軽に目的を達成できるというメリットがあり、簡単な操作や調べ物などに利用できる。
スピーカーがAIアシスタント機能を搭載することで、リビングや寝室などの日常生活の場においてAIアシスタントの活用が広がっていくと予想されている。
スマート家電との連携により、従来ではリモコンやスイッチで行っていた操作から解放されて、音声のみで操作できる環境が整っていくと期待されている。
主要なAIアシスタントとしては次のようなものがある。
・Amazon「Alexa(アレクサ)」
・Google「Googleアシスタント」
・Apple「Siri(シリ)」
・Microsoft「Cortana(コルタナ)」
「ウェイクワード」とは、スマートスピーカー(AIアシスタント)に対する「指示の開始を知らせるためのワード」を指す。AIアシスタントはウェイクワードを認識すると、その時点からの音声を解析して指示内容を把握する。
対応するAIアシスタントごとにウェイクワードが設定されている。
・Alexaの場合:「Alexa」
・Googleアシスタントの場合:「OK,Google」または「ねぇグーグル」
・Siriの場合:「Hey、Siri」 など
スマートスピーカーに搭載されているAIアシスタントの場合、自然な音声で正しく認識されることが重要であり、音声認識精度は製品選定時における大きなポイントになる。
2017年に、米国のストーンテンプル・コンサルティングが「各社製品のスマートスピーカー音声認識精度に関する調査」を行った。それぞれのスマートスピーカーに対して5千種類の英語での質問を行い、それに対する反応と回答の正確性を調査した。
音声認識精度という点においては、「Google Home(Googleアシスタント)」が群を抜いた高い精度を出したという結果になった。
日本語の音声認識においても「Google Home(Googleアシスタント)」が優位とされている。
スマートスピーカーは、Wi-Fi/Bluetoothなどの無線通信を経由してAIアシスタントサーバとPeer to Peerネットワークを形成し接続する。
サーバ側では、自然言語処理された音声認識に関して、ディープラーニングによる機械学習を行うことにより音声認識精度を高めている。サーバ間高速通信技術などにより、多層ニューラルネットワークの学習効率が向上し続けている。
使用するユーザーが増えて学習データがより多く集積されることで、さらに音声認識精度を高めることが可能となる。
主要なAIアシスタントは、スマートフォンにおけるアプリと同様に、さまざまな企業/個人が独自アプリを開発できる仕組みを提供している。
AIアシスタントは、スマートフォンでの「アプリ」に該当する「スキル」や「アクション」を追加することで機能追加を行える。
スマートスピーカー購入時と比較して、「本体ファームウェアの更新」や「スキル/アクションの追加(強化)」により、AIアシスタントの機能は増強され、使い勝手は向上していく。
スマートスピーカーは、AmazonやGoogleなどAIアシスタントを提供するインターネット関連企業から発売されている。また、AIアシスタントを提供された家電メーカーからも発売されている。
2017年5月の調査によると、アメリカ合衆国でのスマートスピーカーの市場シェアは以下のようになっている。
・Amazon「Amazon Echo」 70.6%
・Google「Google Home」 23.8%
Amazon「Amazon Echo」が圧倒的シェアを獲得しており、Google「Google Home」が追い上げている。
AIアシスタントの高い音声認識精度を得るためには、入力デバイスとなるスマートスピーカーに搭載されたマイクの集音能力もポイントとなるため、ソフトウェア+ハードウェアでのトータルでの音声認識精度について注目する必要がある。
「Amazon Echo」はスマートスピーカーの先駆けであり、欧米では最も普及している。
AIアシスタントとして「Alexa」を搭載している。Alexa用機能拡張「スキル」は2万種類以上開発されており、非常に豊富な機能を利用できる。
「音声によるAmazonショッピングが可能」という特徴がある。
→Amazon →Amazon Echo、チャコール (ファブリック)
「Google Home」はGoogle製のスマートスピーカー。AIアシスタントとして「Googleアシスタント」を搭載している。
Alexaに対して後発製品ではあるが、「Googleが提供する各種サービスとの強力な連携」「音声認識精度が非常に高い」などの特徴があり、シェアを拡大している。
「HomePod」はApple製のスマートスピーカーで、AIアシスタントとして「Siri」を搭載している。
2018年2月に米国などの3ヵ国で発売された。「高品質な音を提供するためスピーカー機能を最重視している」という特徴がある。
スマートスピーカーではさまざまな機能を利用できる。今後の発展により、より多彩な機能追加が期待されている。
・音楽再生
・インターネットラジオ再生
・ニュース読み上げ
・情報検索
・ショッピング
・メッセージ(メール/SNS)読み上げ
・スケジュール管理
・メモ登録
・ジェスチャーコントロール など
・テレビ連携---動画再生、写真表示
・Bluetoothスピーカー
・スマートLED連携
・ロボット掃除機連携
・電源のON/OFF
・照明のON/OFF
・カーテンの開閉
・エアコンのON/OFF
・鍵の施錠 など
参考元サイト
スマートスピーカー市場シェアでの競合に加えて、GoogleとAmazonは、音声アプリケーションエコシステムにおける開発者のマインドシェアを競っている。 音声スキル数比較 AmazonのAlexaデバイスで利用可能な音声スキルの数は「約8万件」にまで増加した。 一方、GoogleはGoogle ...
Analytics News ACCESS RANKING