CLOSE UP コラム | ディープラーニングと機械学習との違い

ディープラーニングと機械学習との違い

CLOSE UP 事例

2016年06月13日
オープンソース活用研究所 所長 寺田雄一

ディープラーニングは機械学習の「革命」。

世界中の注目を集める人工知能技術のなかでも「人工知能の革命」とも言われるのが、ディープラーニング(Deep Learning、深層学習)。機械学習の一種の手法であるディープラーニングが「革命」と言われるゆえんは、その精度の高さだ。ディープラーニングは、他の機械学習技術では達成できないレベルの精度を実現できる新機軸として期待されている。

そもそも機械学習はデータの背景にある傾向や法則を探り、現象の解析や予測をすることを目標としている。人間がルールを明示的に与えるのではなく、データから機械自身に法則を学習させるのが特徴だ。ルールで記述しきれない複雑な現象や、季節や時間などで傾向が変わる現象の解析に強みを発揮する。

第三次人工知能(AI)ブームが、メディアなどでクローズアップされ始めたのは2011年頃から。その中心にあったのが、IBMのワトソンとディープラーニング(深層学習)と呼ばれる新技術である。ワトソンが人工知能が商用で利用できることを世間に広め、ディープラーニングは、画像分野で精度を上げた。ディープラーニングの応用としては、グーグルの「AlphaGo」が囲碁の世界王者にも勝ち、話題となった。

従来の機械学習とディープラーニングとの違いは、その精度。

機械学習の一種とみなされる一方、ディープラーニングが「革命的」と言われるのは、従来の機械学習と比べて圧倒的な違いがあるからだ。

たとえば、従来型の機械学習で色を認識するには、「色情報」を特徴にして識別させていた。この特徴は、人間が定義する必要があった。

ディープラーニングでは、学習データからマシン側が自動的に特徴を抽出する。この点が大きな違いとなる。つまり何に着目すればよいかを教える必要がなく、どんな特徴を利用すれば識別できるのかを自動的に学んでいくことが可能だ。

複雑な画像識別では、特徴を抽出していくことが難しくなり、実際に人が、猫とライオンの子供を識別する特徴を知ることは難しい。その点、ディープラーニングでは、非常に細かい部分まで特徴を抽出できるため、画像認識や音声認識の分野で幅広く活用されるようになっている。

ディープラーニングは、特定の課題を精度よく解くことを得意とするため、現在、3つの方向性で実用化が進んでいる。

1つ目は自社が提供するサービスの精度を高めること。米アップルの音声認識システム「Siri」、グーグルやバイドゥの画像検索エンジンなどが典型例である。2つ目はデータ解析のシステムやサービスの事業者にディープラーニング技術を提供する形態である。3つ目はディープラーニングを始めとする機械学習ベースのデータ解析インフラを提供する事業者である。

http://www.sbbit.jp/article/cont1/32033
https://thinkit.co.jp/story/2015/08/31/6364


著者プロフィール

オープンソース活用研究所 所長 寺田雄一

1993年、株式会社野村総合研究所(NRI)入社。 インフラ系エンジニア、ITアーキテクトとして、証券会社基幹系システム、証券オンライントレードシステム、損保代理店システム、大手流通業基幹系システムなど、大規模システムのアーキテクチャ設計、基盤構築に従事。 2003年、NRI社内に、オープンソースの専門組織の設立を企画、10月に日本初となるオープンソース・ソリューションセンター設立。 2006年、社内ベンチャー制度にて、オープンソース・ワンストップサービス 「OpenStandia(オープンスタンディア)」事業を開始。オープンソースを活用した、企業情報ポータル、情報分析、シングルサインオン、統合ID管理、ドキュメント管理、統合業務システム(ERP)などの事業を次々と展開。 オープンソースビジネス推進協議会(OBCI),OpenAMコンソーシアムなどの業界団体も設立。同会の理事、会長や、NPO法人日本ADempiereの理事などを歴任。 2013年、NRIを退社し、株式会社オープンソース活用研究所を設立。

関連タグ

主成分分析(Principal Component Analysis)

  • 用語集

「主成分分析」とは、ビッグデータをはじめとした多変量データを統合し新たな総合指標を作り出し、多くの変数にウェイトをつけて少数の合成変数を作る統計手法である。ビッグデータ分析の現場などにおいて、多変量の情報をできるだけ損なわずに低次元空間に縮約する。多変量データを二次元や三次元データに縮約することで、データ全体の視覚化が可能となり、データのもつ情報を解釈しやすくなる。

クロス集計()

  • 用語集

2~3種類の情報に限定してデータの分析や集計を行なう手法。縦軸と横軸に項目を割り振り、特定の項目の相互関係を明らかにすることができる。

ロジスティック回帰分析(Logistic regression)

  • 用語集

「ロジスティック回帰分析」とは多変量解析の一種。線形回帰分析が量的変数を予測するのに対して、ロジスティック回帰分析は質的確率を予測する。「キャンペーン反応率」「特定商品の普及率」などマーケティングの現場で活用されるほか、「土砂災害発生危険基準線の確率」を求めたり、理学療法現場でも活用される。

相関分析(Correlation Analysis)

  • 用語集

2つないし2つ以上の変量の間で、一方の変量が変化すると他方もそれに応じて変化する相関関係を統計的に分析する分析手法である。

決定木分析()

  • 用語集

樹木状のモデルを使って要因を分析しその分析結果から境界線を探して予測を行う、データマイニングの手法のひとつ。

バックナンバー

関連記事

無料資料プレゼント

2021/03/04 セキュリティDAYS Keyspider資料

講演資料を見るには、 プライバシーポリシーに同意して、送付先メールアドレスをご入力しご請求ください。

またご入力いただきました情報は、当該資料の作成・提供企業とも共有させていただき、当社及び各社のサービス、製品、セミナー、イベントなどのご案内に使用させていただきます。

本資料を見るには次の画面でアンケートに回答していただく必要があります。



セミナー講演資料公開中

大きな改修やリスクなしでAWSのランニングコストを削減する方法 〜ビジネスイノベーションのためのAWSコスト最適化〜

サイバー攻撃の主要な標的となった中小企業 ~顧客企業が望むセキュリティ/データ保護サービスを実現する最適解~

ITシステムの異常予兆が察知できない、24時間365日対応するリソースがない 〜AIOpsを取り入れたサーバー運用自動化〜

  • 書籍

facebook

twitter