点燃认知燃烧:融合认知架构和LLMs构建下一代计算机
Fusing Cognitive Architecture and LLMs to Build the Next Generation of Computers
“系统从不是其部分之和,而是它们相互作用的产物。” Russell Ackoff。
我们倾向于专注于最新的小工具和算法,然而单纯的技术并不能推动现实世界的变革。真正的进步取决于将技术整合到解决方案中的系统。单独的工具只是达到目的的一种手段;而系统本身则是目的。
让我们考虑一个例子。几个世纪以来,人类一直在利用燃烧的力量,但却没有完全发挥其潜力。我们点燃火焰,挥舞火把,居住在偏远的地区。但是要提取其潜力需要设计一个复杂的舞蹈-内燃机-来产生旋转曲柄和驱动活塞的爆炸。尽管引擎部件取得了巨大的进步,但是这种概念设计仍然存在,因为它产生的结果远远超出了单个部件的能力。
同样,在计算机领域,进步很大程度上归功于系统思维。1945年,数学家冯·诺依曼将存储器、输入、输出、控制和处理器组合成一个集成的架构,用于解决计算问题。这个系统-而不是任何一个组件-催生了现代计算机。78年后,虽然技术已经大不相同,但冯·诺依曼的原则基本上保持不变。今天更加强大的计算机在结构上与20世纪40年代的祖先非常相似,因为架构而不仅仅是组件决定了如何解决现实世界的问题。
我们正处在另一次重新思考的边缘,这一次是由于语言模型的崛起驱动的。但在此之前,让我们看看我们正在使用的东西。
符号与非符号
对于我们大多数人来说,技术意味着基于代码、数字和语言等符号的逻辑、可解释的系统。我们给计算机明确的符号指令,它们按照我们的配方确定性地执行,产生预期的输出。这些基于规则的系统是混乱、非结构化的非符号系统的阳性对应。
认知的通用模型
谢天谢地,我们不必解析所有这些模型。在2017年,约翰·莱尔德(John Laird)和同事提出了一个“心智标准模型”,为讨论这些架构提供了一个共同的框架。他们的模型综合了三个开创性架构的关键概念:
- ACT-R,由约翰·安德森(John Anderson)自1976年以来开发,通过交互式过程性和陈述性记忆来建模认知。过程性记忆编码了技能和例行程序,而陈述性记忆存储事实。通过按照程序访问和应用陈述性知识,ACT-R演示了“知道”和“知道如何”之间的相互作用如何实现智能行为。
- Soar,由约翰·莱尔德(John Laird)于20世纪80年代创建,提供了一个统一的基于规则的系统,涵盖感知、学习、规划、问题解决和决策。 “Productions” 将知识表示为作用于工作内存的条件-动作规则。Soar通过动态地遵循规则来模拟心智的灵活、目标导向的能力。
- Sigma,由波尔克(Polk)和纽厄尔(Newell)于1988年构思,将心智视为一个异步的行为社会。心智模块传递消息,触发其他行为,持续到满足或放弃欲望。这种“行为生成和管理”循环产生了复杂而适应性的行为。
心智的标准模型包括三个交互式的记忆系统:
陈述性记忆是我们的知识库,存储我们可以有意识地陈述的事实和概念。它保留类似于您最喜欢的颜色、历史事件、交通标志或词汇等信息。陈述性记忆为思考提供了原材料,其他系统依赖于它。
过程性记忆编码了技能和例行程序,即“如何”知识,使行为成为可能。它使我们能够骑车、系鞋带或演奏乐器。过程性记忆将知识转化为行动。
工作内存是我们的心智工作空间,临时保留和操作信息,以实现规划、问题解决和决策。解决一个数学问题时,工作内存保存数字、运算和中间步骤,直到得出解决方案。它整合了对陈述性和过程性记忆中知识的访问和应用。
在这个模型中,没有控制器;相反,它由“认知循环”驱动。就像计算机中的时钟周期一样,这个“认知循环”通过执行程序来驱动系统的运行,以实现目标。
例如,驾驶汽车需要:
- 对标志、控制和路线的陈述性知识
- 驾驶的过程性技能
- 在当下监视条件并做出反应的工作内存
将语言模型整合到心智的标准模型中
在当前的语言模型繁荣之前,标准模型已经明确了一些关键能力。虽然现在还为时尚早,但今天的代理框架(AutoGPT、BabyAGI等)已经具备了一些这些能力。
这些框架不是使用独立的记忆模块,而是通过向量搜索访问外部知识源。感知和运动模块以API调用和插件的形式实现。语言模型的上下文窗口成为临时的工作内存。
仍然存在一个关键差距:健壮的学习。现今的系统缺乏一种从经验中持续积累知识和技能的机制。它们依赖于提示和模型调整。下一个突破将是整合一种能够实现持续学习的机制,通过与环境的交互不断积累知识和技能,就像人类思维一样!
一个新的进步之路?打造认知架构
今天,我们拥有了新的元素——语言模型、向量搜索、API等,以及来自认知架构的智能的旧配方。这些是否能够被搅拌进一个新系统中,具备超越任何单个部分的能力,尚不清楚。历史提供了经受住考验的配方的例子,如冯·诺伊曼的计算框架或内燃机。但对于每一个有远见的配方,都有许多失败的混合物。
有一件事是明确的。当我们弄清楚这个新的“认知引擎”时,它将比以往任何技术更深刻地推动进步。