相関を調べる
説明変数 として考えられる要因それぞれが 目的変数 とどれくらいの 相関があるかを調べます。
読み込むCSVファイルは以下の通りです。
20店舗について、各店舗ごとの売上額と競合店(近隣の競合店の数)、満足度(5段階評価)、品揃え充実度(5段階評価)のデータになります。
1 | 店舗,売上額,競合店,満足度,品揃え充実度 |
相関関係を調べるにはNumPyの corrcoef関数 を使用します。
corrcoef関数 の引数には、相関を調べる2つのデータフレーム(列)を指定します。
[Google Colaboratory]
1 | # 3項目の要因の相関係数を調べる |
[実行結果]
競合店と売上額の相関 は -0.6692 と 負の相関 になっていて、値が少ないほど売上が伸びる関係になっていることが分かります。
満足度と売上額の相関 は 0.7756、品揃え充実度と売上額の相関 は 0.7803 と 正の相関になっていて、値が増えるほど売上が伸びる関係になっています。