SHAP値の散布図
dependence_plotは、特定の説明変数とSHAP値の散布図で、相関関係を確認する場合に便利です。
前回記事で上位に表示された、LSTATをdependence_plotで表示してみます。
[Google Colaboratory]
1 | shap.dependence_plot(ind="LSTAT", |
indオプションで確認したい説明変数(LSTAT)を指定しています。(1行目)
[実行結果]
横軸に説明変数、縦軸に同じ説明変数のSHAP値をプロットしています。
説明変数のSHAP値と、相関関係がみられるほど、予測への影響も高くなります。
上のグラフからはLSTATが低いほどSHAP値が高く、予測の結果に大きく影響を与えることが確認できます。
またinteraction_indexを指定することで、色に対して別の説明変数を指定することができます。
interaction_indexにRMを指定して実行してみます。(2行目)
[Google Colaboratory]
1 | shap.dependence_plot(ind="LSTAT", |
[実行結果]
LSTATが高くなると、RMが低くなる傾向が確認できます。
各説明変数の関係性や、どのように予測に影響しているかを確認する場合にdependence_plotはとても有効です。