主成分分析の例

作成者:
Bunryu Kamimura

数学と英語10点満点の成績を分析する。赤線は共分散行列の固有ベクトルの分散の最大の方向で、青線は分散の最小の方向。赤線は総合力を表わし、青線は系別の能力を表わす。例えばGとIを比べてみよう。

散布図の見方

例えばGとIを比べた時、どちらの方が総合的な点数が上と考えたらいいだろうか。 先のシートでやったように、分散が最大になる方向が「分散共分散行列」の固有ベクトルである。 分散が最大になるということは、そのデータの特徴が一番出ることであり、GとIの違いをはっきりさせる。 そして、このベクトルを座標軸として新しい座標の値が主成分である。 この赤のベクトルの方向で並べて第一主成分で見ると、より右にあるGの方が総合的な点数が上と考えられる。 でも、最小の方向である青の軸(第二主成分)で見ると、数学と英語の点数の違いが出てくる。 Gは総合的にはIよりも上だけど、・・・ BとAを比べるとどうなるのだろうか?