机器人如何做出更好的决策?MIT和斯坦福研究人员推出了Diffusion-CCSP,用于先进的机器人推理和规划

MIT和斯坦福研究人员推出了Diffusion-CCSP,用于先进的机器人推理和规划

选择连续值的能力(例如握持和物体放置),以满足复杂的几何和物理约束条件(如稳定性和避免碰撞),对于机器人操作规划至关重要。传统方法中,针对每种类型的约束都会单独学习或优化采样器。然而,对于复杂问题,需要一个通用的求解器来生成同时满足各种约束条件的值。

由于数据稀缺,构建或训练一个能够满足所有潜在要求的单一模型可能很困难。因此,通用的机器人规划器必须能够回收和构建用于解决更大问题的求解器。

作为一个统一的框架,最近麻省理工学院和斯坦福大学的研究建议使用约束图来表示约束满足问题,作为学习约束类型的新组合。然后,他们可以使用基于扩散模型的约束求解器来识别共同满足约束条件的解决方案。决策变量的一个示例是握持姿势,但放置姿势或机器人轨迹也是约束图中的节点示例。

为了解决新问题,组合扩散约束求解器(Diffusion-CCSP)学习了一组不同约束的扩散模型。然后,通过扩散过程结合导师来寻找满足的分配样本,从可行区域生成不同的样本。具体来说,每个扩散模型都被训练成为单一类约束(如避免碰撞的位置)的可行解。在推理时,研究人员可以对任何变量子集进行条件和求解剩余部分,因为扩散模型是解集的生成模型。每个扩散模型都经过训练以最小化隐式能量函数,使得满足全局约束的任务等价于最小化整体解决方案的能量(此处仅为各个解决方案的能量函数之和)。这两个添加项在训练和推理中提供了重要的自定义余地。

组合问题和解决方案对可以用于训练组件扩散模型。即使约束图包含了训练过程中未涉及的更多变量,Diffusion-CCSP也可以在性能时间内推广到已知约束的新组合。

研究人员在四个困难领域对Diffusion-CCSP进行了测试,包括二维三角形密集堆放、受限定性要求的二维形状布局、受稳定性约束的三维形状堆叠和使用机器人的三维物品堆放。研究结果表明,该方法在推理速度和对新约束组合以及更多受限问题的泛化方面优于基准方法。

团队强调,我们在这项工作中研究的所有约束都具有固定的元数。考虑到约束和变元元数是一条有趣的研究路线。他们还认为,如果他们的模型能够接受自然语言指令将会非常有帮助。此外,目前用于任务的标签和解决方案的方法受到限制,特别是在处理类似“摆放餐桌”的定性限制时。他们建议未来的发展使用更复杂的形状编码器和从现实世界数据(如在线照片)中派生的学习约束,以扩大当前和未来应用的范围。