机器学习,插图版:增量学习
机器学习,插图版:增量学习
模型如何随时间学习新信息,保持和积累先前的知识
欢迎回到《机器学习图解系列》。如果您已经阅读了系列中的其他文章,您就知道了。我们通过插图的方式使(听起来无聊的)机器学习概念变得有趣!本文将介绍一个称为增量学习的概念,即机器学习模型随时间学习新信息,保持和积累先前的知识。但在深入讨论之前,让我们先谈谈今天的模型构建过程是什么样的。
在构建模型时,我们通常遵循一种称为静态学习的过程。在这个过程中,我们使用最新可用的数据来训练模型。我们在训练过程中进行微调和调整模型。一旦我们对其性能感到满意,我们就将其部署。这个模型在生产中使用一段时间后,我们注意到模型的性能随时间变差。这时我们会丢弃现有的模型,并使用最新可用的数据构建一个新模型。然后我们重复这个过程。
让我们用一个具体的例子来说明这一点。考虑这种假设情景。我们在2023年1月底开始构建一个欺诈模型。该模型用于检测信用卡交易是否欺诈。我们使用过去一年(2022年1月到2022年12月)的所有信用卡交易数据来训练模型,并使用本月(2023年1月)的交易数据来测试模型。
在下个月底,我们注意到模型在新数据上表现不佳。因此,我们建立了另一个模型,但这次是使用过去一年(2022年2月到2023年1月)的数据来训练它,然后使用当前月份的数据(2023年2月)来测试它。而这些训练和测试期间之外的数据都被丢弃。