检查数据科学预测:个体+负面案例分析
数据科学预测检查:个体+负面案例分析
如何检查特定预测并进行负案例分析
当我向新学习者展示如何使用 .predict()
方法时,大约有40%到43%的时间我会得到以下问题:
预测在哪里?
我希望学习者经常提出这个问题。这是一个富有洞察力的问题,特别是对于那些对Python、数据科学还不熟悉,并且可能是第一次接触 .predict()
方法的人来说。
当然,提出这个问题的人数少于一半,但可能比例低于30%或20%。我没有精确统计。
在本深入解析的第一部分中,本文首先将展示如何构建一个简单的预测模型,其次是如何生成预测结果,然后介绍如何更详细地检查预测结果。
在本深入解析的第二部分中,本文还将展示为什么了解如何检查单个预测结果很有用,以及为什么有必要检查单个预测结果。能够检查单个预测结果开辟了一系列分析途径,例如负案例分析。
第一部分:预测方法
如果您还不熟悉构建预测模型,建议您阅读一篇或多篇涉及此主题的其他文章。《自信的数据科学:发现数据科学的基本技能》(作者:我)的第11章介绍了如何构建预测模型。
例如,在《虚假鸟类与机器学习:使用流行的鸟类品种数据演示最近邻分类》中,我分享了一个训练了一个机器学习模型的代码,该模型可以根据鸟的重量、长度、位置和颜色预测鸟类的品种。这个虚假鸟类的例子演示了使用虚假鸟类数据进行预测建模。
一个简单的预测模型
为了帮助我们专注于检查特定的个别预测结果,本小节将快速介绍预测模型的创建过程。为了节省时间,本小节跳过了优化超参数和一些数据准备步骤。
此外,为了加快速度,我们将通过其他方法进行评估…