[2017年04月17日 ]
株式会社KSKアナリティクス
データアナリスト 足立 悠
前回までは、データサイエンスの領域で使われる人工知能(AI)技術、機械学習やディープラーニング(深層学習)などの仕組みとその活用例を中心にお伝えしてきました。今回からは、業界・ケース別にデータ分析をどのように活かして課題を解決できるのか、具体例を挙げてお伝えします。 まず第1回目は、製造業の皆さまに共通の課題、時系列センサデータから異常を検出する方法について。 次のような状況を想定してください。ある半導体の検査装置では、製造した半導体が出荷OKの良品か出荷NGの不良品かをチェックしています。製造した半導体の多くは出荷可能な良品ですが、まれに出荷不可な不良品が混じっています。今回のテーマは、この不良品を自動的に検出することです。
検査装置にはいくつものセンサが取り付けられており、半導体が良品か不良品かをチェックするタイミングでセンサ値を収集、データベースに蓄積し、データとして蓄積されているとします。
※状態が-1のときは良品、状態が1のときは不良品です。 ※本データはUCI Machine Learning RepositoryのSECOMデータセットを基に作成しました。 数値を眺めていも目が痛いので、グラフで可視化してみましょう。
横軸が時間(ID)、縦軸がセンサ値です。データセットには全体で約1500行×約600種類のセンサ値が存在しますが、ここではデータセットの最初の200レコード、センサは5種類に絞って可視化しています。赤色矢印が不良品が発生したタイミングです。 不良品が発生する時に各センサはどのような挙動を示すのか、センサ値から異常のパターンを見付けていく必要があります。しかし、このままではパターンを見つけることは困難です。さらに、本来のデータセットは1500×600のサイズのため、パターンの発見は非常に困難なものになります。 機械的に、効率よく、時系列データから異常を検出するための作業には大きく2つあります。 ステップ1:データを分析に適切した形式へ加工・整形(前処理) ステップ2:前処理済みのデータを使って異常検知モデルを作成 それでは早速、ステップ1から始めていきましょう! ※本記事では全体的な分析の流れを説明します。具体的にデータを使って同じ分析をしたい方は、以下のサイトにコードや設定を載せていますので参考にしてください。 ステップ1:https://goo.gl/iipNYi ステップ2:https://goo.gl/e9a1Of
次のページへ続く
大手電機メーカーでエンジニア、事業会社でデータ分析者を経てKSKアナリティクスへ入社。機械学習・ディープラーニングを用いたレコメンデーション、異常検知を得意とする。また、分析セミナー講師や技術雑誌への記事執筆も行う。
スイス国内で2番目に利用者数の多いジュネーブ空港は、 「乗客が行列に並ぶ時間を半減」「業績を前年度の5倍以上にアップ」に成功している。 【改善方法】 ・施設内でBluetoothとWi-Fiセンサーを活用 ・乗客のリアルタイム計測/高度データ分析 ・空港スタッフ数の最適化 ・セキュリティチェックの可視化 ・Wi-Fiセンサーは空港内各所に設置 →行列に並んでいる人数/待ち時間...
Analytics News ACCESS RANKING