[2016年04月06日 ]
株式会社KSKアナリティクス
データアナリスト 足立 悠
ここからは、CRISP-DM(※2)の各プロセスについて触れていきます。
1.Business Understanding(ビジネスへの理解)
ここでは「分析の目的と価値」を定義します。ビジネス課題を解決したいか、そのためにはどのような分析を行うか、そして課題解決の判定基準をどのように設定するか、を明らかにする必要があります。
2.Data Understanding(データへの理解)
ここでは「データが利用できるものかどうか」を吟味します。そのために、データ項目(例:顧客データにおける年齢など)、データ量、データ品質(例:欠損値や外れ値など)に着目します。項目や量が少ない、欠損値や外れ値が多すぎるなどの場合は、フェーズ1へ戻って課題を見直す必要があります。
3.Data Preparation(データの準備)
ここでは次のフェーズのための「データの前処理」を行います。具体的には、使用するデータ項目の選択、新規項目の作成、欠損値の処理、外れ値の除去などを実施します。
このフェーズはプロセス全体の「7~8」割を占め、課題解決の成功の鍵を握っています。
4.Modeling(モデル作成)
ここでは、データ分析の手法を用いて「データからパターンや分類などのモデルを作成」します。目的に応じて様々な分析手法があります(例:回帰分析、時系列分析、クラスタリング、アソシエーション分析)が、「あらゆる問題に対応できる万能なモデル」は作成できません。いくつかの分析手法を試したり、モデルのパラメータを変更したいするなど試行錯誤が必要です。
5.Evaluation(評価)
ここでは「作成したモデルとビジネス目的」の両方の面から評価を行います。必ずしも精度の高いモデルを適用すればビジネス課題が解決するわけではありません。精度がそれほど高くなくても理解しやすいモデルを適用すれば良い場合もあります。両者はトレードオフの関係にあり、充分に吟味しなければなりません。
6.Deployment(展開/共有)
ここでは、フェーズ5で得られた結果をビジネスへ展開するための計画を立てて共有します。例えば、得られた結果から対象となる顧客にクーポンを発行する、そのためにどのような手順が必要かも含まれます。
-----------------------------
以上からお分かりいただけるように、BAを成功させるためには「ビジネスの意思決定者とデータ分析者」が相互に意見を出し合い、吟味し、進めていかなければなりません。また、これからデータ活用を始めようとされる方で、まずフェーズ4に目が行く方もいらっしゃると思いますが、これは間違いです。必ず、フェーズ1と2を明らかにした上で、進めていくことをお勧めします。分析手法、モデルありきで進めてしまうと、プロジェクトそのものが失敗に終わってしまう可能性が高くなります。
次は、CRISP-DMにおける「3.Data Preparation」「4.Modeling」「5.Evaluation(モデル精度の面)」フェーズの実施に役立つ、データ分析ソフトをご紹介します。
次のページへ続く
大手電機メーカーでエンジニア、事業会社でデータ分析者を経てKSKアナリティクスへ入社。機械学習・ディープラーニングを用いたレコメンデーション、異常検知を得意とする。また、分析セミナー講師や技術雑誌への記事執筆も行う。
スイス国内で2番目に利用者数の多いジュネーブ空港は、 「乗客が行列に並ぶ時間を半減」「業績を前年度の5倍以上にアップ」に成功している。 【改善方法】 ・施設内でBluetoothとWi-Fiセンサーを活用 ・乗客のリアルタイム計測/高度データ分析 ・空港スタッフ数の最適化 ・セキュリティチェックの可視化 ・Wi-Fiセンサーは空港内各所に設置 →行列に並んでいる人数/待ち時間...
Analytics News ACCESS RANKING