説明可能なAI④(SHAP値の散布図)

SHAP値の散布図

dependence_plotは、特定の説明変数とSHAP値の散布図で、相関関係を確認する場合に便利です。

前回記事で上位に表示された、LSTATをdependence_plotで表示してみます。

[Google Colaboratory]

1
2
3
4
shap.dependence_plot(ind="LSTAT",
interaction_index=None,
shap_values=shap_values,
features=X_test)

indオプションで確認したい説明変数(LSTAT)を指定しています。(1行目)

[実行結果]

横軸に説明変数、縦軸に同じ説明変数のSHAP値をプロットしています。

説明変数のSHAP値と、相関関係がみられるほど、予測への影響も高くなります。

上のグラフからはLSTATが低いほどSHAP値が高く、予測の結果に大きく影響を与えることが確認できます。


またinteraction_indexを指定することで、色に対して別の説明変数を指定することができます。

interaction_indexRMを指定して実行してみます。(2行目)

[Google Colaboratory]

1
2
3
4
shap.dependence_plot(ind="LSTAT",
interaction_index="RM",
shap_values=shap_values,
features=X_test)

[実行結果]

LSTATが高くなると、RMが低くなる傾向が確認できます。

各説明変数の関係性や、どのように予測に影響しているかを確認する場合にdependence_plotはとても有効です。