大规模语言模型真的可以表演和推理吗?来自伊利诺伊大学厄巴纳-香槟分校的研究人员推出了LATS以提升决策能力

大规模语言模型的表演和推理能力:伊利诺伊大学厄巴纳-香槟分校研究人员发布的LATS引领决策能力提升

LLM(Language model)已经证明在推理和决策任务中具有重要价值。它们擅长将复杂的问题分解为顺序步骤,但通过自一致性和多步骤分解等方法可以提高其性能。LLM对于各个领域的决策制定也非常有效,但它们常常难以适应动态环境。借助基于树的搜索方法(如蒙特卡洛树搜索(MCTS)),LATS增强了LLM在探索和利用替代方案方面的能力,消除了单独进行值函数训练的需求。

具备推理和决策能力的自主智能体是人工智能的重要关注点。传统的强化学习一直是主要方法,但LLM提供了另一种选择。LLM在推理和适应性任务中表现出色,包括自然语言处理和复杂环境。虽然有促进技术来增强它们的能力,但它们通常缺少深思熟虑的决策能力。

伊利诺伊大学厄巴纳—香槟分校的研究人员引入了LATS,这是一个利用LLM的决策制定、规划和推理能力的框架。LATS将LLM重新定位为智能体、值函数和优化器。它采用MCTS来探索不同的决策路径,并整合外部反馈来进行适应性问题解决。实验评估表明LATS在各种领域的广泛适用性,在编程和网页浏览等领域中,与GPT-4和GPT-3.5等LLM实现了高分数。

LATS通过广泛的实验评估在编程、HotPotQA和WebShop等多样领域展示了其多样性和有效性。在HumanEval中,LATS在具有GPT-4的编程中展现了94.4%的成功率。在WebShop中进行网页浏览时,它在GPT-3.5上实现了75.9的平均分数,展示了其广泛适用性。他们的结果强调LATS作为一个有前途的框架,通过使用LLM提升自主决策制定的能力。现有的来源主要关注框架的引入和评估其有效性,还需要更多关于潜在缺陷的信息。

总之,这项研究介绍了LATS,这是一个整合LLM各个方面以增强决策制定能力的框架。LATS通过结合搜索算法、外部反馈和经验学习克服了以往的限制。在多个领域的实验评估中,展示了LATS的有效性,凸显了它在自主决策制定中的多样性而无需额外培训。LATS提出的各个方面之间的协同作用有望推动多才多艺、全面化智能体的发展。需要进一步的研究和分析,以揭示LATS框架在自主推理和决策制定中的潜在限制和改进领域。