時系列センサデータから異常を検出するには?(製造業向け) | 第一線で活躍するオープンソースエキスパートが綴るスペシャルコラム。

時系列センサデータから異常を検出するには?(製造業向け)

データ分析でビジネス課題をどのように解決できるか、業界・ケース別にニーズの高いものを例に紹介します。

[2017年04月17日 ]
株式会社KSKアナリティクス
データアナリスト 足立 悠

 前回までは、データサイエンスの領域で使われる人工知能(AI)技術、機械学習やディープラーニング(深層学習)などの仕組みとその活用例を中心にお伝えしてきました。今回からは、業界・ケース別にデータ分析をどのように活かして課題を解決できるのか、具体例を挙げてお伝えします。
 まず第1回目は、製造業の皆さまに共通の課題、時系列センサデータから異常を検出する方法について。

 次のような状況を想定してください。ある半導体の検査装置では、製造した半導体が出荷OKの良品か出荷NGの不良品かをチェックしています。製造した半導体の多くは出荷可能な良品ですが、まれに出荷不可な不良品が混じっています。今回のテーマは、この不良品を自動的に検出することです。

 検査装置にはいくつものセンサが取り付けられており、半導体が良品か不良品かをチェックするタイミングでセンサ値を収集、データベースに蓄積し、データとして蓄積されているとします。

※状態が-1のときは良品、状態が1のときは不良品です。
※本データはUCI Machine Learning RepositoryのSECOMデータセットを基に作成しました。

 数値を眺めていも目が痛いので、グラフで可視化してみましょう。

 横軸が時間(ID)、縦軸がセンサ値です。データセットには全体で約1500行×約600種類のセンサ値が存在しますが、ここではデータセットの最初の200レコード、センサは5種類に絞って可視化しています。赤色矢印が不良品が発生したタイミングです。
 不良品が発生する時に各センサはどのような挙動を示すのか、センサ値から異常のパターンを見付けていく必要があります。しかし、このままではパターンを見つけることは困難です。さらに、本来のデータセットは1500×600のサイズのため、パターンの発見は非常に困難なものになります。

 機械的に、効率よく、時系列データから異常を検出するための作業には大きく2つあります。
ステップ1:データを分析に適切した形式へ加工・整形(前処理)
ステップ2:前処理済みのデータを使って異常検知モデルを作成

 それでは早速、ステップ1から始めていきましょう!
※本記事では全体的な分析の流れを説明します。具体的にデータを使って同じ分析をしたい方は、以下のサイトにコードや設定を載せていますので参考にしてください。
ステップ1:https://goo.gl/iipNYi
ステップ2:https://goo.gl/e9a1Of

次のページへ続く

【次ページ】時系列データの前処理と異常検出モデル作成

著者プロフィール

株式会社KSKアナリティクス
データアナリスト 足立 悠(あだち はるか)

 大手電機メーカーでエンジニア、事業会社でデータ分析者を経てKSKアナリティクスへ入社。社内のデータ活用推進者としてマーケティング戦略、業務改善に関するデータ分析業務に携わる。テキストマイニング、レコメンデーション手法が得意。
 また、分析講座の講師やIT技術者向け雑誌にて記事執筆も行う。

最新TOPICS

【AI】AI国内市場予測---「AI導入検討中=17.9%」「年平均20.4%で成長」「米独市場と比べて高い成長率を維持」(2017年05月25日 10:03)

MM総研がAI国内市場予測を発表した。 【ポイント】 日本企業 ・人工知能(AI)をビジネスに導入している=1.8% ・導入検討中=17.9% AIの国内市場規模 ・2016年度=2220億円(前年度比約2倍) AIの国内市場規模成長予測 ・年平均20.4%で成長 ・2021年には5610億円に達する予測 ・米独市場と比べて高い成長率を維持

関連タグ

ベイズ理論()

  • 用語集

18世紀のイギリスの数学者であるトーマス・ベイズによって示された条件付き確率に関して成り立つ定理に基づく理論。

重回帰分析()

  • 用語集

多変量解析のひとつであり、あるデータをほかの複数のデータによって予測する分析手法である。

データウェアハウス(Data Warehouse)

  • 用語集

「データウェアハウス(data warehouse)」とは、企業の意志決定のため、目的別に編成、統合され、なおかつ時系列で削除や更新をしないデータの集合体を指す。具体的には、複数の基幹システムからトランザクションを抽出して、再構成・再蓄積したデータの集合体を意味する。

データマネージメント(Data Management)

  • 用語集

データを蓄積する仕組みの構築や運用、データ構造の可視化やデータの意味管理などを行いながらデータを適切に管理することで、データの信頼性・整合性を確保すること。

関連記事

  • KSKサイド001

facebook

twitter