「人工知能」の領域の中に「機械学習」が含まれ、「機械学習」の領域の中に「ディープラーニング」が含まれる関係になっている。
つまり、「ディープラーニング」は、「人工知能(AI)」要素技術の1つという位置付けである。
人工知能要素技術の1つである「機械学習」の特徴は、「AI自身がデータを解析し、法則性/ルールを見つけ出す」機能にある。
開発者はすべての処理動作を詳細にプログラムする必要はなく、AIが自身で「トレーニング」を行うことにより特定のタスクを実行できるようになる。
AIに「色に注目すること」という指示を与え、1枚1枚に「赤い花」「青い花」「黄色い花」というタグをつけた、大量の花の画像を読み込ませてトレーニングを行う。
まだ解析していない花の画像をAIに解析させると、色に注目して、その画像は「赤い花」なのか「青い花」なのか「黄色い花」なのかについて区別できるようになる。
・迷惑メール自動識別
・顔認証 など
機械学習の場合、トレーニング用データに対して、人が1つずつタグを設定する必要があるため、データ準備段階に膨大な手間が発生するという問題がある。
機械学習では、既存のデータを用い、特徴エンジニアリングによって新しい変数を導き出し、適切と思われる分析モデルを選択した上で、最終的にそのモデルにおける未知の係数値を推定する。
このような手法で予測システムを構築することは可能だが、完全性/正確性は、モデルとクオリティに大きく依存するため、なかなかスマートに一般化できない。
例えば、数万の変数に依存するモデルが得られたとした場合、変数の選別などを通してモデルのシェイプアップが必要となる。また、新たなデータが追加されるたびに、各種調整が必要となる。
「ディープラーニング」は「機械学習」をさらに発展させたものである。機械学習とは異なるデータ分析手法「ニューラルネットワーク」をベースとしている。
機械学習で花の画像を分析する場合、特徴点(注目ポイント)である「色」をトレーニングさせるために、すべての画像に人がタグを設定する必要がある。
一方、ディープラーニングでは、AIが学習データから自動的に特徴を抽出できる。人が特徴点(色など)を教える必要はなく、AI自身で特徴点を抽出し、自動的に学習していく。大量のデータを与えることで性能を向上でき、より高い精度を得られる。
ディープラーニングによる新しいアプローチでは、人がトレーニングデータを用意する必要はなく、入力層と出力層の間の中間層にある多層レイヤー群を用いて、そこに見られる規則性から、データに潜む特徴を明らかにしていく方法を学習させる。
多層レイヤー群の調整を行うことにより、「情報伝達処理向上」「特徴量精度向上」「汎用性向上」「予測精度向上」などの効果を高めることが可能である。
ディープラーニングは「特徴エンジニアリング」から「特徴表現」へ移行させるパラダイムシフトをもたらしている。
ディープラーニングの登場により、データ分析/学習性能をより強力に押し上げることが可能となった。
「ディープラーニングでビジネスチャンスをつかむために必要なことは何か?」について、日本ディープラーニング協会理事長である東京大学の松尾豊特任准教授は、「やったもの勝ちだ」「必要なのは行動するための知識」であると提言する。 【解説テーマ】 ・薄く広くでは負けてしまう ・やったもの勝ち!高校生もできる
Analytics News ACCESS RANKING