新的SHAP图表:小提琴图和热力图

New SHAP Charts Violin Plot and Heatmap

SHAP版本0.42.1中的图表可以告诉您有关模型的信息

(来源:作者)

关于SHAP的最大关注点之一与该软件包本身有关。它已经有一段时间没有更新了,而且GitHub上的问题越来越多。让许多用户松了一口气的是,贡献者们更加活跃了。事实上,他们给我们带来了新的图表——小提琴图和热力图。我们将:

  • 提供这些图表的代码
  • 讨论我们可以从中获得的新见解

您还可以观看关于此主题的介绍视频:

现有的SHAP图表

我们将继续之前的一个SHAP教程。您可以在下面的文章中找到它。您还可以在GitHub上找到完整的项目。要使用新的图表,您需要更新SHAP软件包。我正在使用版本0.42.1。

使用Python介绍SHAP

如何创建和解释SHAP图表:瀑布图、力图、平均SHAP值、蜜蜂图和依赖图

towardsdatascience.com

总结一下,我们使用SHAP解释了使用鲍鱼数据集构建的模型。该数据集有4,177个实例,您可以在下面看到一些特征的示例。我们使用这8个特征来预测y——鲍鱼壳中的环数

教程继续计算SHAP值并显示各种SHAP图表。了解其中一些对于理解新的SHAP图表很有用。我们将看到它们提供了类似的信息。

首先是平均SHAP图表,如图1所示。对于每个特征,它给出了所有实例中绝对平均SHAP值。对预测作出重要贡献的特征将具有较高的平均SHAP值。换句话说,该图表告诉我们哪些特征在一般情况下最重要。