一个惊人的突破:开放式人工智能代理 Voyager 自主地玩『我的世界』
突破尘封的禁区:开放AI代理——自由驰骋『我的世界』
对于NVIDIA高级AI科学家Jim Fan来说,视频游戏Minecraft是他对开放式AI代理研究的“完美元始汤”。
在最新一期的AI播客中,主持人Noah Kravitz与Fan一起讨论了使用大型语言模型创建AI代理的方法,特别是使用Chat GPT-4创建了Voyager,这是一个使用Chat GPT-4构建的自主玩Minecraft的AI机器人。
AI代理模型可以“主动采取行动,感知世界,看到行动后果,并改善自己,”Fan表示。许多当前的AI代理都被程序设计用于实现特定目标,例如尽快打败游戏或回答问题。它们可以独立工作以实现特定输出,但缺乏更广泛的决策能力。
Fan想知道是否可能拥有一个“真正开放式的代理,通过任意自然语言来做开放式、甚至创造性的事情。”
但他需要一个灵活的测试场所来验证这个可能性。
“这就是为什么我们发现Minecraft几乎是开放式代理涌现的完美元始汤,因为它设定了环境。”他说。毕竟,Minecraft在核心上并没有给玩家设定特定的目标,除了生存和自由探索开放的世界。
这成为Fan项目MineDojo的起点,最终导致了AI机器人Voyager的诞生。
“Voyager利用Chat GPT-4的力量,用Javascript编写并在游戏中执行代码。”Fan解释道。 “然后GPT-4检查输出,如果有来自JavaScript的错误或来自环境的反馈,GPT-4会进行自我反思并尝试调试代码。”
机器人从自身的错误中学习,并将正确实施的程序存储在技能库中以供将来使用,实现“终身学习”。
在游戏中,Voyager可以自主探索数小时,根据环境调整决策,并在需要时开发与怪物战斗和寻找食物的技能。
“我们看到所有这些行为都来自Voyager的设置、技能库和编码机制。”Fan解释道。“我们没有预先编程任何这些行为。”
然后他更一般地谈到了LLM的崛起和发展轨迹。他预见LLM在软件、游戏和机器人领域的广泛应用,并且随之而来的是与AI安全相关的日益紧迫的讨论。
Fan鼓励那些希望参与LLM工作的人“去做些什么”,无论是使用在线资源还是尝试使用初学者友好的基于CPU的AI模型。
AI播客NVIDIA的Jim Fan详述大型语言模型及其对行业的影响-Ep.204
您可能还会喜欢
Jules Anh Tuan Nguyen解释了人工智能如何让截肢者通过视频游戏控制假肢手-明尼苏达大学的一名博士后研究员讨论了他通过使用思维来使截肢者能够控制他们的假肢,甚至是手指的运动。
Overjet的Ai Wardah Inam谈论将人工智能引入牙科-Overjet是NVIDIA Inception的成员,正在迅速将人工智能引入牙科医生的诊所中。公司的首席执行官Wardah Inam博士讨论了使用人工智能来改善患者护理。
Immunai首席技术官和联合创始人Luis Voloch谈论使用深度学习开发新药-Luis Voloch讨论了如何通过机器学习和数据科学思维解决免疫系统的挑战。
订阅AI播客:现在可在亚马逊音乐上使用
此外,还可通过iTunes、Google Podcasts、Google Play、Castbox、DoggCatcher、Overcast、PlayerFM、Pocket Casts、Podbay、PodBean、PodCruncher、PodKicker、Soundcloud、Spotify、Stitcher和TuneIn获取AI播客。
让AI播客更好。有几分钟时间吗?填写此听众调查问卷。