相関係数
相関係数 は、相関関係の強さ を数値化したものです。
相関係数 は、-1 ~ 1 までの値をとります。
相関係数が 正(プラス)の時は正の相関 があることになり、負(マイナス)の時は負の相関関係 があることになります。
相関の強弱の目安を以下の一覧にまとめます。
相関係数(絶対値) | 相関の強さ |
---|---|
~0.3未満 | ほとんど相関なし |
0.3~0.5未満 | 弱い相関がある |
0.5~0.7未満 | 相関がある |
0.7以上 | 強い相関がある |
サンプルコード
Numpy には相関関数を算出する corrcoef関数 があります。
csvファイルをデータフレームに読み込み、気温と売り上げ数の 相関係数 を算出します。
[Google Colaboratory]
1 | import pandas as pd |
読み込むCSVファイルは以下の通りです。
30日間の最高気温とその日の売上数がまとめられています。
1 | 最高気温,売上数 |
[実行結果]
相関係数は 0.97024837 と表示され、相関の強弱の一覧によると 強い相関 があることになります。
つまり、気温と売上の関係には十分に 強い相関関係 があることが分かりました。