语言模型能够制造自己的工具吗?

语言模型能制造工具吗?

LaTM、CREATOR和其他封闭循环框架用于LLM工具使用…

(摄影:Todd Quackenbush,来自Unsplash)

在最近的概述中,我们探讨了将大型语言模型(LLMs)与外部工具相结合的效用。这些模型可以以各种方式利用工具进行教导。然而,我们应该意识到,现有的工具跟随的LLMs只利用了有限的一组潜在工具[3],而我们想要用LLMs解决的问题的范围几乎是无限的!考虑到这一点,很明显这样的范式是有限制的-我们将始终能够找到需要尚不存在的工具的情景。在本概述中,我们将探讨最近的研究,旨在通过为LLMs提供创建自己工具的能力来解决这个问题。这种方法在某种程度上与人类生活有着有趣的类比,因为制造工具的能力导致了重大的技术进步。现在,我们来探讨类似技术对LLMs演化的影响。

“根据从人类进化里学到的经验教训,一个关键的转折点是人类获得了制造自己工具的能力来应对新兴挑战。我们开始对将这个进化概念应用到LLMs领域进行初步探索。” — 来自[1]

(来自[1, 2])

背景

在了解有关制造工具的LLMs的更多信息之前,我们需要恢复一些背景概念。我们在最近的概述中已经涵盖了许多这些概念,但现在我们将简要回顾它们,以使我们对最近出版物的讨论更全面和易于理解。

为什么我们应该使用工具?

(来自[3, 8, 9])

在之前的概述中,我们了解了一些可以与LLMs集成以提高其性能的不同类型的工具,例如:

  • 基本工具(计算器、搜索引擎等)[链接]
  • 深度学习模型API[链接]