機械学習とは?~データサイエンスを支える人工知能(AI)技術~ | 第一線で活躍するオープンソースエキスパートが綴るスペシャルコラム。

機械学習とは?~データサイエンスを支える人工知能(AI)技術~

データサイエンスの領域で使われる人工知能(AI)技術、機械学習やディープラーニング(深層学習)などを簡単に解りやすくお伝えします。

[2016年08月09日 ]
株式会社KSKアナリティクス
データアナリスト 足立 悠

 人工知能(AI)といえば、どのようなものを想像されるでしょうか?

 具体的に、ロボットが頭に浮かんだ方もいらっしゃるかもしれません。マンガやSFから挙げるなら、ドラえもんやコロ助、R2-D2とC-3POですね!もう少し現実的に挙げるなら、ソフトバンク社の「Pepper」やHanson Robotics社の「ソフィア」などです。
 また、ロボットのようにボディを持たないものとしては、マイクロソフト社のAI女子高生「りんな」やApple社の「Siri」などのアプリケーションが挙げられます。

 

 これらのシステムの中で、AIが膨大な量のデータを解析・学習する「機械学習」が行われ、その結果、自律的な行動や人間との対話などを実現しています(他に制御の技術も使用)。
 ここまではロボット・アプリの分野を例に挙げました。現在多くの企業・団体で必要とされているデータサイエンスの分野でも、先ほどと類似したプロセスでAI技術が使われています。以降はデータサイエンスの分野で、実際のビジネスケースを紹介しながらAI技術「機械学習」についてお伝えしていきます。


 皆さまが所属される企業・団体で、以下のような課題をお持ちではありませんか?
・機械/設備の故障を予測・異常を検出し、予防保全計画に役立てたい。
・自社サービスを解約する顧客を特定し、離反を防ぐ対策を立てたい。
・顧客ごとに適切な商品/サービスを推薦し、販売戦略に活かしたい。
・新商品の売れ行き(需要)を予測し、安全在庫を設定したい。
・コールセンターに寄せられる顧客クレームの要因を特定し、品質向上につなげたい。

 上記の課題はデータ分析(データマイニング)により解決できるとご存知の方も多いと思います。データマイニングでは、データに対して統計学やAI技術「機械学習」を適用し、有用な知識を取り出し活用します。では、このプロセスに含まれる機械学習について考えてみましょう。


 機械学習とは「機械にデータを解析させ、データに潜む規則性(ルール)やパターンを発見、アルゴリズムを発展させていくプロセス」を指します(冒頭でも紹介)。
 人手でルールやパターン発見を行うことはデータ量が少なければ実現できるかもしれません(例えば100行のデータを1行ずつ目視する)。しかし、センサログやコールログなど現実のデータは大規模かつ複雑になりつつあり、人間が処理できるレベルを超えています。機械に処理させることで、データから効率よく・効果的な知識発見が可能となります。


 センサログのような数値形式、アンケートの自由記述のようなテキスト形式など様々な種類のデータが存在します。そして、分析目的と入力データ形式に応じた「機械学習の手法」を選択・適用(解析)し、ルールやパターンを表現するモデルを作成、更により精度を高めるために学習させます。
 ここで、機械学習には次の4種類の手法が良く使われています。

 回帰分析は数値データの予測、クラス分類はデータのカテゴリを予測します。クラスタリングはデータをグループ化、パターン抽出は頻出するアイテムのセットを取り出します。各手法で使用する詳細なアルゴリズムは下記の表をご覧ください(一部、統計の手法も含みます)。

 いかがでしょう?なかなか堅苦しい・難しそうな名前が並んでいて、使ってみたいけど気後れされる方もいらっしゃるかもしれません。しかしご安心ください!上記のアルゴリズムを簡単に実装し、機械学習を実践できるオープンソース・無料のデータ分析ソフトがあります。
RapidMiner:プログラミング不要、GUI操作で誰でも簡単に分析できる。
NYSOL:コマンドを記述して高速に分析できる。データ加工処理が得意。
Revolution R:R言語でスケーラブルなハイパフォーマンス分析環境を構築できる。
 ソフト名のリンク先から入手できますので、ぜひお試しください!

 次回は、上の表中に記載している「教師あり学習」「教師なし学習」と、ニーズが高い「予測分析」の考え方についてご紹介します。

著者プロフィール

株式会社KSKアナリティクス
データアナリスト 足立 悠(あだち はるか)

 大手電機メーカーでエンジニア、事業会社でデータ分析者を経てKSKアナリティクスへ入社。機械学習・ディープラーニングを用いたレコメンデーション、異常検知を得意とする。また、分析セミナー講師や技術雑誌への記事執筆も行う。

最新TOPICS

【IoTで空港を快適に】スイスのジュネーブ空港「乗客が行列に並ぶ時間を半減」「業績を前年度の5倍以上にアップ」に成功---BluetoothとWi-Fiセンサーを活用(2016年06月21日 10:03)

スイス国内で2番目に利用者数の多いジュネーブ空港は、 「乗客が行列に並ぶ時間を半減」「業績を前年度の5倍以上にアップ」に成功している。 【改善方法】 ・施設内でBluetoothとWi-Fiセンサーを活用 ・乗客のリアルタイム計測/高度データ分析 ・空港スタッフ数の最適化 ・セキュリティチェックの可視化 ・Wi-Fiセンサーは空港内各所に設置  →行列に並んでいる人数/待ち時間...

最新CLOSEUPコラム

関連タグ

関連記事

無料資料プレゼント

2021/03/04 セキュリティDAYS Keyspider資料

講演資料を見るには、 プライバシーポリシーに同意して、送付先メールアドレスをご入力しご請求ください。

またご入力いただきました情報は、当該資料の作成・提供企業とも共有させていただき、当社及び各社のサービス、製品、セミナー、イベントなどのご案内に使用させていただきます。

本資料を見るには次の画面でアンケートに回答していただく必要があります。



セミナー講演資料公開中

文書を作る過程における情報(Slack/Teamsでのコメントなど)をどう管理、共有するべきか? ~新しい文書情報管理の考え方~

【Microsoft365ユーザー向け】クラウドメールサービスの保護に向いていない、ゲートウェイ方式メールセキュリティの課題 ~API連携・AI技術により、セキュリティ強化と運用効率化を実現~

世界最高峰のリアルハッカー集団を活用した脆弱性対策 ~米国政府も採用、脆弱性診断・ペネトレーションテストを大胆に変革する方法~

  • 書籍

Analytics News ACCESS RANKING

facebook

twitter