教授语言模型使用工具
教授语言模型使用工具' can be condensed to '教授使用语言模型工具'.
使用工具使我们作为人类变得更有能力。 LLMs也是如此吗?

随着我们对它们的了解越来越深入,大型语言模型(LLMs)变得越来越有趣。这些模型能够准确解决各种复杂任务。然而,与此同时,它们在我们人类看来基本的某些功能上仍然存在困难!例如,LLMs常常会犯算术错误,无法获得当前信息,甚至难以理解时间的推移。鉴于这些局限性,我们可能会想知道如何使LLMs更有能力。LLMs是否注定永远会受到这些限制的困扰?
人类的许多进步都是通过接触新的创新工具(例如印刷机或计算机)催生的。同样的发现是否适用于LLMs?在本概述中,我们将研究一种最近的研究方向,旨在教导LLMs如何使用外部工具,这些工具通过简单的文本到文本APIs提供。使用这些工具,LLMs可以将执行算术或查找当前信息等任务委派给专门的工具。然后,LLM在生成输出时可以使用这个工具返回的信息作为上下文,从而产生更准确和有根据的响应。
![(来自[1]和ChatGPT Plus)](https://miro.medium.com/v2/resize:fit:640/format:webp/0*R2NjIxyxXQCJQMtg.png)
使LLMs更有能力
给LLM访问外部工具是解决这些模型面临的一些限制的可靠方法。然而,LLMs并不会自然地知道如何使用工具,这就引出了一个问题:我们如何教导我们的模型利用外部工具?在本节中,我们将探讨一些我们可以选择的选项,并列举对构建LLM应用程序有用的各种工具。
不同类型的学习

教导LLM利用工具与教导LLM解决任何其他任务没有什么区别。由于这些模型以几种不同的方式进行学习,我们将介绍…