将生成任务转化为分类任务

将生成任务转化为分类任务' can be condensed to '将生成任务转为分类任务'.

机器学习系统变得越来越强大，应用范围广泛。此外，机器学习和自然语言处理系统被用于改进信息检索系统的质量，使用户更容易找到所需的信息。这使我们能够更轻松地访问和理解来自各种来源的信息。例如：

对话式人工智能可用于创建能够与人类进行自然对话的聊天机器人。
推荐系统可以使用自然语言处理来推荐与用户兴趣相关的产品。
情感分析可用于识别文本的情感色彩。

训练许多深度学习模型需要大量的计算资源，例如GPU和TPU。对推断的成本也可能阻碍在高性能环境中应用这些模型。

提高性能的方法

有三种主要方法可以扩展机器学习模型的性能。

我们可以以创造性的方式简化任务本身。
接下来，我们可以在可能的情况下考虑更简单、更小的模型。
最后，我们可以使用创新技术来减少一些精度降低的计算复杂度。

其中，通过创造性地重新定义手头的任务，往往能够获得最大的收益。例如，如果任务定义明确且非生成性，我们可以设计更小、更高效的模型以达到类似的性能。

虽然较大的模型有助于生成性任务和任务之间的泛化（即迁移学习），但很多时候，生成性问题可以被转化为BERT风格模型可以处理的分类问题。换句话说，如果我们可以缩小模型所需完成的任务范围，我们就不需要一个大模型来完成它。一个较小的模型可以同样准确，而且训练和运行速度更快、更便宜。然而，如果我们希望模型执行多种不同的任务，那么可能需要一个较大的模型。这是因为较大的模型可能能够更好地泛化（即迁移学习）。在某些情况下，我们甚至可以将生成性问题转化为检索问题。

案例研究：客户支持模板

例如，在支持聊天互动的情况下，可以使用多个模板回答几个互动。在这种情况下，将问题设计为找到最能满足用户需求的模板的检索问题更容易、更便宜。

收集训练数据

第一步是将客户服务日志拆分为问题和回复的列表。这意味着将对话中的每个转折点分解为其个别部分，例如客户的问题和客服人员的回复。完成这一步后，下一步是将问题和回复与现有的模板库进行匹配。模板库是一个包含预先编写的回复的集合，可用于回答常见的客户问题。通过将客户服务日志中的问题和回复与模板库进行匹配，系统可以确定哪些预先编写的回复最有可能有助于解决客户的问题。这个过程可以节省时间并提高客户服务的效率。

阶段1：收集训练数据集

或者，可以使用LLMs使此步骤更加容易。使用少量样本提示，可以将每个客户服务互动与正确的模板回复进行匹配。通过为LLMs提供一些客户服务互动的示例和相应的模板回复，LLMs将能够学习将新的客户服务互动与正确的模板回复进行匹配。这可以节省客户服务代表大量的时间和精力，因为他们将不再需要手动搜索每个互动的正确模板回复。

以这种方式收集的训练数据具有以下几个优点：

它是离线的，这意味着可以在训练时完成，无需访问用户请求。
它的大小较小，这意味着可以轻松存储和处理。这对于在存储或处理能力有限的设备上训练机器学习模型非常重要。
它可以用于具有高准确度的分类任务。这是因为数据是在受控环境中收集的，减少了数据中的噪声和错误。

训练分类模型

我们可以通过三个步骤来训练一个分类模型：

通过拆分检索到的模板响应来设置任务。这意味着将模板响应拆分为其各个组成部分，如单词、短语和实体。在拆分检索到的模板响应时，您需要小心避免选择不相关的模板。
使用SentenceBERT、Word2Vec等对交互和模板进行编码。这意味着将交互和模板表示为数字向量。在对交互和模板进行编码时，您需要选择一种保留语义含义的编码技术。
使用简单、廉价的机器学习模型来预测最佳模板。该模型甚至可以是一个简单的深度神经网络（DNN）。在使用简单、廉价的DNN来预测最佳模板时，您需要选择一个合适的DNN。例如，对于复杂分类，您可能希望使用在大量文本语料库上训练过的DNN。

该分类模型的优点是训练成本低、服务成本低。重新训练模型也非常容易，并且比使用更深更大的模型更易于解释。

实际上，学习到的模型不一定是DNN，也可以是随机森林（基于XGBoost的分类器），在执行速度和训练简易性方面具有更多优势。该分类模型的优点包括：

训练成本低：与深度神经网络等其他模型相比，该模型的训练成本相对较低。
服务成本低：一旦训练完成，该模型的服务成本也相对较低。
易于重新训练：如果有新数据可用，该模型很容易重新训练。
比更深更大的模型更易解释：该模型比更深更大的模型更容易解释，这对于理解模型的工作原理以及为什么会做出特定预测非常有帮助。

实际上，学习到的模型不一定是DNN，还可以是以执行速度和准确性而闻名的随机森林（基于XGBoost的分类器），该分类器在训练速度和服务速度方面具有更多优势。每个决策树都在不同的数据子集上进行训练，然后将各个树的预测结果组合以进行最终预测。这种方法对于分类任务非常有效，而且训练和服务速度也非常快。

总的来说，该分类模型的优势使其成为各种应用的良好选择。它的训练和服务成本相对较低，易于重新训练，并且比更深更大的模型更易于解释。

DNN (software),language model,Machine learning

将生成任务转化为分类任务