教授语言模型使用工具

教授语言模型使用工具' can be condensed to '教授使用语言模型工具'.

使用工具使我们作为人类变得更有能力。 LLMs也是如此吗?

(图片来自Unsplash上的Barn Images)

随着我们对它们的了解越来越深入,大型语言模型(LLMs)变得越来越有趣。这些模型能够准确解决各种复杂任务。然而,与此同时,它们在我们人类看来基本的某些功能上仍然存在困难!例如,LLMs常常会犯算术错误,无法获得当前信息,甚至难以理解时间的推移。鉴于这些局限性,我们可能会想知道如何使LLMs更有能力。LLMs是否注定永远会受到这些限制的困扰?

人类的许多进步都是通过接触新的创新工具(例如印刷机或计算机)催生的。同样的发现是否适用于LLMs?在本概述中,我们将研究一种最近的研究方向,旨在教导LLMs如何使用外部工具,这些工具通过简单的文本到文本APIs提供。使用这些工具,LLMs可以将执行算术或查找当前信息等任务委派给专门的工具。然后,LLM在生成输出时可以使用这个工具返回的信息作为上下文,从而产生更准确和有根据的响应。

(来自[1]和ChatGPT Plus)

使LLMs更有能力

给LLM访问外部工具是解决这些模型面临的一些限制的可靠方法。然而,LLMs并不会自然地知道如何使用工具,这就引出了一个问题:我们如何教导我们的模型利用外部工具?在本节中,我们将探讨一些我们可以选择的选项,并列举对构建LLM应用程序有用的各种工具。

不同类型的学习

LLMs的不同学习形式(作者创建)

教导LLM利用工具与教导LLM解决任何其他任务没有什么区别。由于这些模型以几种不同的方式进行学习,我们将介绍…