遇见 Flows:一种用于建模复杂的人工智能与人类交互的革命性人工智能框架

Introducing Flows A revolutionary AI framework for modeling complex AI and human interaction.

最近人工智能的进展为结构化推理创造了多种机会,因为它们可以在其上下文中非常适应信息。多个人工智能系统和人类之间的合作至关重要。战略性的内容设计可以使LLMs执行复杂推理以增强其能力。我们需要一种主要和有组织的方式来设计和研究这样的模型。EPFL和PSL大学的研究人员提出了一个“控制流”框架来模拟复杂的交互。

这些控制流是为解决越来越复杂的任务而设计的工具。简而言之,它们是自包含的计算构建块。这些流可以递归地组合成任意嵌套的交互,并且复杂度大大降低。流代表任何包括任何人工智能-人工智能和人类-人工智能交互的合作。流引入了一种更高级的抽象,隔离了各个流的状态,并指定了基于消息的通信作为唯一的交互方式。这样的控制流示例包括ReAct、AutoGPT和BabyAGI。

为了展示控制流的潜力,研究人员选择了竞技编码的任务,其中用户试图解决由规范定义的问题。他们设计了特定的构建块(流),包括计划流,允许人工智能代理策划他们的方法;反思流,允许人工智能代理分析和改进他们之前的答案;合作流,其中一个人工智能代理从另一个人那里寻求反馈;代码测试流,涉及执行代码并根据结果进行优化。

他们将这些构建块组合起来创建多个编码流,并评估了来自CodeForces和LeetCode的问题。即使对于像GPT-4这样的先进模型,执行此任务也具有挑战性。他们发现GPT-4的解决率下降到72%。而他们的复杂交互策略改善了性能,人工智能-人工智能交互的截断后解决率提高了20%,人类-人工智能交互提高了54%。

研究人员声称这个框架使任意复杂交互的设计直观简单。为了使这种方法对所有人都可用,研究人员开源了名为Flow Verse的Flow库,其中包含一系列的流,可以轻松使用、扩展和组合成更复杂的流;工具;一个详细的日志记录基础设施,以实现透明的调试和分析;一个可视化工具包来检查流的执行。他们还提供了详细的文档和教程文件来使人熟悉。

虽然精心设计的复杂交互改善了泛化能力,但也带来了额外的计算和延迟成本。他们的框架将为支持AI的实际和理论创新提供坚实的基础,使人工通用智能更近一步。他们表示,他们未来的工作包括构建一个能够有效提高我们解决问题能力的AI系统。