機械学習モデル、特にXGBoostやLightGBMといった勾配ブースティング決定木(GBDT)は極めて高い予測精度を誇ります。しかし、その内部構造は複雑で、「なぜその予測に至ったのか」を説明するのは容易ではありません。
SHAP(SHapley Additive exPlanations)は、この「ブラックボックス」をこじ開け、各変数が予測に与えた影響をゲーム理論に基づいて定量化する手法です。統計学における「回帰係数」の概念を、非線形な機械学習モデルにまで拡張したものと捉えると、その強力さが理解しやすいでしょう。
