在Spotify学到的SHAP特征重要性分析

SHAP特征重要性分析学习自Spotify

使用SHAP识别顶级特征并理解它们如何影响机器学习模型的预测结果

本文是我在Spotify进行机器学习论文时所学到的一部分知识的记录之一。请务必查看第二篇文章(即将推出!),了解我如何成功地优化了这项研究的模型。

两年前,在Spotify进行硕士论文时,我进行了一项引人入胜的研究项目。我学到了几种有用的机器学习技术,我相信任何数据科学家在他们的工具包中都应该掌握这些技术。今天,我将带你了解其中之一。

在那段时间里,我花了6个月的时间构建一个预测模型,然后解析其内部工作原理。我的目标是理解是什么使用户对他们的音乐体验感到满意。

这与预测用户是否快乐(或不快乐)并不那么相关,而是理解导致他们快乐(或不快乐)的潜在因素。

听起来很令人兴奋,对吧?确实如此!我喜欢其中的每一个环节,因为我学到了关于如何在音乐和用户行为的背景下应用机器学习的很多东西。

(如果你对机器学习在音乐行业的应用感兴趣,我强烈推荐阅读这篇由Spotify的顶级专家领导的有趣研究。这是一篇必读的文章!)

机器学习与技术中的行为心理学

作者(Midjourney)的图片

在技术领域,像我这样的研究项目非常常见,因为很多工作都围绕着为用户/客户提供最佳个性化体验。

这通常意味着深入研究人类的心理,而机器学习可以成为实现不可能的任务的有力工具——理解人类。

当我们将机器学习与心理学和行为科学结合在一起,我们离完整了解人类行为的画面更近了一步。

如何实现?

我们构建模型来尝试预测人们的反应方式。