使用提示和技巧对文本分类任务进行即时工程

实时工程化:提升文本分类任务的使用技巧和提示

为什么在文本分类任务中要对模型进行微调,当我们有提示工程时,它可以胜任这个任务呢?最近我意识到,虽然用LLM进行微调可以解决问题,但这当然需要一些费用,但是当我们有了拯救者提示工程时,并不是唯一的解决方案。我正在做一个文本分类任务。起初,我尝试了提示,但由于分类的挑战,感觉效果不佳。我本来打算对LLM进行微调,但却暂停下来,先进行了一些更多的提示实验,这些实验绝对是值得的。在本文中,我将尝试解释在为文本分类问题提示LLM时可以使用的不同技巧。

首先,让我们从典型分类问题中遇到的挑战开始,看看提示如何帮助我们解决这些问题,然后我们再专注于一些提示技巧。

1. 数据混乱吗?那就整理一下。

无论问题是什么,数据都是关键。同样地,确保数据是干净的,即使已知LLM可以理解自然语言,分析数据并删除任何您认为对分类没有任何价值的不必要字符或字符串也是一个好的实践。这样做不仅可以清理数据,还可以减少发给LLM的标记数量,从而降低成本。

2. 精细化类别名称。

花些时间审查和优化需要对文本进行分类的各种类别名称(或者类别名称)。确保优化后的类别名称是有意义、易于理解和自解释的。例如,如果任何一个类别的名称是“喜欢房子”(这个名称不够描述性)表示一组文本,其中客户喜欢经纪公司展示的房子,那么将其重命名为“客户喜欢的房子”。这样LLM就可以轻松选择正确的类别并将其分配给文本。然而,分类完成后,您可以通过将原始类别名称和优化后的类别名称存储在主字典中的方式来恢复原始类别名称。这个技巧肯定可以提高准确性。

3. 解决密切相关的类别,避免错误分类。

那么,如果你有两个密切相关的类别,例如“喜欢房子”和“客户积极反馈”,那么情况会如何…