[2017年04月17日 ]
株式会社KSKアナリティクス
データアナリスト 足立 悠
【ステップ1:時系列データの前処理】 時系列データの前処理では、スライド窓の考え方を使ってデータから特徴量を抽出します。窓とは、データを一定区間で区切るフレームのようなものです。区切られたデータから、平均値や標準偏差などの統計量を計算し特徴量とします。
要件によっては、センサ値をそのままに分析する場合もありますが、ここでは窓の考え方を用いることにします。 ここでは、NYSOLのMCMDを使って、スライド窓の特徴量(合計、平均、標準偏差)を抽出してみます。
WIDは時系列データのIDではなく、窓作成後のIDです。1つの窓につき1つのIDを割り当てています。そして、WIDごとに窓の特徴量を列挙しています。このデータをもとに、異常検出モデルを作成してみます。 ※本ステップのコードや設定はこちらで紹介しています。 --------------------------------------------------- 【ステップ2:時系列データの異常検出モデル作成】 ステップ1で得られた前処理データを、分類モデルのアルゴリズムであり、結果を解釈しやすい決定木(Decision Tree)に当てはめて、異常検出モデルを作成してみます。ここではGUIで簡単に分析できるRapidMinerを使うことにします。
左上の緑枠内の部分で異常検知モデルを作成しています。ReadCSVでステップ1で作成したデータを読み込み、決定木アルゴリズムでパターンを抽出します。右下オレンジ枠内の部分はその結果です。異常のパターンは、期間内のセンサ1の合計値、センサ9の標準偏差に着目すればよいことが分かります。作成したこのパターンの集まり(モデル)を新規データに当てはめれば、異常を検出することができます。 ※本ステップのコードや設定はこちらで紹介しています。 ケース別データ分析事例その1として、今回は時系列センサデータから異常を検出する方法の全体像をお伝えしました。時系列データの処理の方法はこれ一つだけではなく、異常部位の抽出、変化点検出などの手法もあります。目的に応じて使い分けることが大切です。
大手電機メーカーでエンジニア、事業会社でデータ分析者を経てKSKアナリティクスへ入社。機械学習・ディープラーニングを用いたレコメンデーション、異常検知を得意とする。また、分析セミナー講師や技術雑誌への記事執筆も行う。
スイス国内で2番目に利用者数の多いジュネーブ空港は、 「乗客が行列に並ぶ時間を半減」「業績を前年度の5倍以上にアップ」に成功している。 【改善方法】 ・施設内でBluetoothとWi-Fiセンサーを活用 ・乗客のリアルタイム計測/高度データ分析 ・空港スタッフ数の最適化 ・セキュリティチェックの可視化 ・Wi-Fiセンサーは空港内各所に設置 →行列に並んでいる人数/待ち時間...
Analytics News ACCESS RANKING