ディープラーニングとは?(前編)~データサイエンスを支える人工知能(AI)技術~ | 第一線で活躍するオープンソースエキスパートが綴るスペシャルコラム。

ディープラーニングとは?(前編)~データサイエンスを支える人工知能(AI)技術~

データサイエンスの領域で使われる人工知能(AI)技術、機械学習やディープラーニング(深層学習)などを簡単に解りやすくお伝えします。

[2016年12月21日 ]
株式会社KSKアナリティクス
データアナリスト 足立 悠

 前回までは、「教師あり機械学習」と「教師なし機械学習」の考え方と活用イメージをご紹介しました。少し間が空いてしまったので再度復習しておくと、機械学習とは「機械にデータを解析させ、データに潜む規則性(ルール)やパターンを発見、アルゴリズムを発展させていくプロセス」を指します。

 

 そして、機械学習には次の4種類の手法が良く使われています。

 教師あり学習は、正解(目的変数、ラベル)を持つデータを使って学習モデルを作成する予測型の学習です。教師なし学習は、正解を持たないデータを使って学習モデルを作成する発見型の学習です。今回は、教師あり・予測型の学習に属する(教師なし学習も可)「ディープラーニング」をご紹介します。

 ディープラーニングは今や新聞の一面、ニュースのキーワードに挙がるほど社会に浸透しています。身近な代表例としては、ソフトバンク社のロボット「Pepper」、マイクロソフト社の女子高生AIボット「りんな」、Google社を始め自動車メーカーも研究開発を進めている「自動運転」などが挙げられます。では、この「ディープラーニング」とはそもそも何なのでしょうか?

 ディープラーニングを理解するためにはまず、「ニューラルネットワーク」について知る必要があります。ニューラルネットワークはディープラーニングのベースとなるアルゴリズムです。更に言うなら、ニューラルネットワークはパーセプトロンの考え方がベースとなっているのですが、ここでは扱わないことにします。ニューラルネットワーク、ディープラーニングの位置付けは以下のとおりです。ディープラーニングはニューラルネットワークの発展系なので、機械学習の一部に位置付けられますが、見方を変えれば新しいアルゴリズムであると捉えることもできます。

 ニューラルネットワークは教師あり学習アルゴリズムの一つで、数値データを使った回帰・分類を行い予測できるものです。例えば、機械・設備の故障予測を例に考えてみましょう。学習モデルのイメージは以下のとおりです。

 図の○はデータを格納する箱、→はデータを渡す道だと思ってください。
 一番左端の○は、入力データを格納する「入力層」です。各○には電圧センサ値、回転センサ値、・・・、など数値データが入ります。そして、入力層のデータをそのすぐ右の「中間層」へ重みを付けて渡します。中間層では受け取ったデータを「活性化関数」を使って変換します。例えばシグモイド関数などが用いられます。その次も同様にしてデータを渡し変換し、最終的に一番右の「出力層」で計算結果を出力します。この一連の処理を「順伝播」と呼びます。
 元データは正解(正常/故障)を持っているため、出力層の計算結果と比較し誤差を計算し、誤差を小さくするよう学習を続けます。この処理を「逆伝播」と呼びます。誤差の閾値を設けるか、指定した計算回数分だけ学習を継続します。

 以上がニューラルネットワークのアルゴリズムの概要です。このアルゴリズムは人間の脳の構造を模して考案されたものであり、複雑な問題に対応できる画期的な手法として期待されました。しかし、計算量の多さや計算時間の長さがネックとなり、当時のマシンスペックでは現実に使える手法ではありませんでした。また、中間層を増やして計算を複雑にすると精度は向上するが学習が適切に行われないなどの欠点もありました。その後、2006年にトロント大学のHinton博士が新たなアルゴリズムを考案するまで、ニューラルネットワークは日の目を見ない状態だったのです。

 今回はここまで。今回ご紹介した「ニューラルネットワーク」は以下のソフトウェアで実装可能です。ぜひお試しください!
RapidMiner:プログラミング不要、GUI操作で誰でも簡単に分析できる。
Revolution R:R言語でスケーラブルなハイパフォーマンス分析環境を構築できる。

 次回はいよいよディープラーニングについてご紹介します。

著者プロフィール

株式会社KSKアナリティクス
データアナリスト 足立 悠(あだち はるか)

 大手電機メーカーでエンジニア、事業会社でデータ分析者を経てKSKアナリティクスへ入社。社内のデータ活用推進者としてマーケティング戦略、業務改善に関するデータ分析業務に携わる。テキストマイニング、レコメンデーション手法が得意。
 また、大学院(博士後期課程)にて人の行動データを使った予兆検出(複雑ネットワーク、トピックモデル)に関する研究に従事。

最新TOPICS

【AI】「AIビジネス推進コンソーシアム」設立---グリッド/伊藤忠/TIS/富士通など11社、AIに取り組む企業間で「ノウハウや知見の共有」を目指す(2017年12月15日 10:03)

グリッド、伊藤忠テクノソリューションズ、TIS、富士通など11社は、12月13日、 「AIビジネス推進コンソーシアム」を設立したと発表した。 【「AIビジネス推進コンソーシアム」の目標】 ・AIに取り組む企業間で「ノウハウや知見の共有」を目指す ・参加企業間で、ソースコード/技術/ノウハウ/ケーススタディ/ユースケースなどを共有 ・「産業分野のAIの個別性の高さ」の解消を目指す ・...

関連タグ

テキストマイニング(Text Mining)

  • 用語集

「テキストマイニング」とは、自然言語解析などの手法を用いて、大量のテキストデータを分析するプロセスにより、付加価値の高い「知見」を探し出す技術である。

データウェアハウス(Data Warehouse)

  • 用語集

「データウェアハウス(data warehouse)」とは、企業の意志決定のため、目的別に編成、統合され、なおかつ時系列で削除や更新をしないデータの集合体を指す。具体的には、複数の基幹システムからトランザクションを抽出して、再構成・再蓄積したデータの集合体を意味する。

ボット(bot)

  • 用語集

「ボット (bot) 」とは、「ロボット」の略称であり、もともと人間がコンピュータを操作して行う処理を自動的に実行するアプリケーションを指す。

アソシエーション分析(Association Analytics)

  • 用語集

データ間の相関関係を発見する場合に用いられる、データマイニングの手法のひとつ。

多変量解析入門()

  • 用語集

複数の変数に関するデータをもとに、変数間の相互関連を分析する統計的技法の総称。

関連記事

無料資料プレゼント

Amazon Redshiftは企業に利益をもたらしているのか?8社を対象にしたIDCの調査レポート

講演資料を見るには、 プライバシーポリシーに同意して、送付先メールアドレスをご入力しご請求ください。

またご入力いただきました情報は、当該資料の作成・提供企業とも共有させていただき、当社及び各社のサービス、製品、セミナー、イベントなどのご案内に使用させていただきます。

本資料を見るには次の画面でアンケートに回答していただく必要があります。



  • 20171130-netapp サイド

facebook

twitter