将生成任务转化为分类任务
将生成任务转化为分类任务' can be condensed to '将生成任务转为分类任务'.
机器学习系统变得越来越强大,应用范围广泛。此外,机器学习和自然语言处理系统被用于改进信息检索系统的质量,使用户更容易找到所需的信息。这使我们能够更轻松地访问和理解来自各种来源的信息。例如:
- 对话式人工智能可用于创建能够与人类进行自然对话的聊天机器人。
- 推荐系统可以使用自然语言处理来推荐与用户兴趣相关的产品。
- 情感分析可用于识别文本的情感色彩。
训练许多深度学习模型需要大量的计算资源,例如GPU和TPU。对推断的成本也可能阻碍在高性能环境中应用这些模型。
提高性能的方法
有三种主要方法可以扩展机器学习模型的性能。
- 我们可以以创造性的方式简化任务本身。
- 接下来,我们可以在可能的情况下考虑更简单、更小的模型。
- 最后,我们可以使用创新技术来减少一些精度降低的计算复杂度。
其中,通过创造性地重新定义手头的任务,往往能够获得最大的收益。例如,如果任务定义明确且非生成性,我们可以设计更小、更高效的模型以达到类似的性能。
虽然较大的模型有助于生成性任务和任务之间的泛化(即迁移学习),但很多时候,生成性问题可以被转化为BERT风格模型可以处理的分类问题。换句话说,如果我们可以缩小模型所需完成的任务范围,我们就不需要一个大模型来完成它。一个较小的模型可以同样准确,而且训练和运行速度更快、更便宜。然而,如果我们希望模型执行多种不同的任务,那么可能需要一个较大的模型。这是因为较大的模型可能能够更好地泛化(即迁移学习)。在某些情况下,我们甚至可以将生成性问题转化为检索问题。
案例研究:客户支持模板
例如,在支持聊天互动的情况下,可以使用多个模板回答几个互动。在这种情况下,将问题设计为找到最能满足用户需求的模板的检索问题更容易、更便宜。
收集训练数据
第一步是将客户服务日志拆分为问题和回复的列表。这意味着将对话中的每个转折点分解为其个别部分,例如客户的问题和客服人员的回复。完成这一步后,下一步是将问题和回复与现有的模板库进行匹配。模板库是一个包含预先编写的回复的集合,可用于回答常见的客户问题。通过将客户服务日志中的问题和回复与模板库进行匹配,系统可以确定哪些预先编写的回复最有可能有助于解决客户的问题。这个过程可以节省时间并提高客户服务的效率。
阶段1:收集训练数据集
或者,可以使用LLMs使此步骤更加容易。使用少量样本提示,可以将每个客户服务互动与正确的模板回复进行匹配。通过为LLMs提供一些客户服务互动的示例和相应的模板回复,LLMs将能够学习将新的客户服务互动与正确的模板回复进行匹配。这可以节省客户服务代表大量的时间和精力,因为他们将不再需要手动搜索每个互动的正确模板回复。
以这种方式收集的训练数据具有以下几个优点:
- 它是离线的,这意味着可以在训练时完成,无需访问用户请求。
- 它的大小较小,这意味着可以轻松存储和处理。这对于在存储或处理能力有限的设备上训练机器学习模型非常重要。
- 它可以用于具有高准确度的分类任务。这是因为数据是在受控环境中收集的,减少了数据中的噪声和错误。
训练分类模型
我们可以通过三个步骤来训练一个分类模型:
- 通过拆分检索到的模板响应来设置任务。这意味着将模板响应拆分为其各个组成部分,如单词、短语和实体。在拆分检索到的模板响应时,您需要小心避免选择不相关的模板。
- 使用SentenceBERT、Word2Vec等对交互和模板进行编码。这意味着将交互和模板表示为数字向量。在对交互和模板进行编码时,您需要选择一种保留语义含义的编码技术。
- 使用简单、廉价的机器学习模型来预测最佳模板。该模型甚至可以是一个简单的深度神经网络(DNN)。在使用简单、廉价的DNN来预测最佳模板时,您需要选择一个合适的DNN。例如,对于复杂分类,您可能希望使用在大量文本语料库上训练过的DNN。
该分类模型的优点是训练成本低、服务成本低。重新训练模型也非常容易,并且比使用更深更大的模型更易于解释。
实际上,学习到的模型不一定是DNN,也可以是随机森林(基于XGBoost的分类器),在执行速度和训练简易性方面具有更多优势。该分类模型的优点包括:
-
训练成本低:与深度神经网络等其他模型相比,该模型的训练成本相对较低。
-
服务成本低:一旦训练完成,该模型的服务成本也相对较低。
-
易于重新训练:如果有新数据可用,该模型很容易重新训练。
-
比更深更大的模型更易解释:该模型比更深更大的模型更容易解释,这对于理解模型的工作原理以及为什么会做出特定预测非常有帮助。
实际上,学习到的模型不一定是DNN,还可以是以执行速度和准确性而闻名的随机森林(基于XGBoost的分类器),该分类器在训练速度和服务速度方面具有更多优势。每个决策树都在不同的数据子集上进行训练,然后将各个树的预测结果组合以进行最终预测。这种方法对于分类任务非常有效,而且训练和服务速度也非常快。
总的来说,该分类模型的优势使其成为各种应用的良好选择。它的训练和服务成本相对较低,易于重新训练,并且比更深更大的模型更易于解释。




