■主成分分析の概要とは
「主成分分析」とは、ビッグデータをはじめとした多変量データを統合し新たな総合指標を作り出し、多くの変数にウェイトをつけて少数の合成変数を作る統計手法である。
ビッグデータ分析の現場などにおいて多変量の情報をできるだけ損なわずに、低次元空間に縮約する。多変量データを二次元・三次元データに縮約することで、データ全体の視覚化が可能となり、データのもつ情報を解釈しやすくなる。
概要としては、データを視覚化することで、データの全体像を見渡すことができるのが主成分分析であるといえる。主成分分析とは、どの角度から見れば、もっとも良好に全体像が見渡せるのかを調べる分析手法である。
他の分析手法と比べると、クラスター分析はデータ数が多い場合に有効なのに対して、主成分分析は変数が多い場合に有効である。主成分分析は、できるだけ少ない変数に置き換えて知見を得ることができる。
主成分分析では、分析共分散行列から分析を行う場合と、相関行列から行う場合で結果が異なる。またデータが異なる単位で測定されている場合には、変数を基準化して分析を行う必要がある。
http://www.macromill.com/landing/words/b007.html
■エクセル(EXCEL)による主成分分析の例
エクセル(EXCEL)を用いた主成分分析の例は、次のとおり。
オープンソースのデータ分析ソフト「RapidMiner」をフル活用する方法を連載!ソフトの特徴や分析チュートリアルを紹介します。
Analytics News ACCESS RANKING