谷歌的DeepMind正在改革机器人技术 (Gǔgē de DeepMind zhèngzài gǎigé jīqìrén jìshù)
谷歌的DeepMind正在革新机器人技术 (Gǔgē de DeepMind zhèngzài gémìng jīqìrén jìshù)
多亏了谷歌Deepmind与33个学术实验室的合作,机器人世界可能会翻天覆地改变。这个项目的目标是打破机器人受限于特定任务数据集的刻板范式。
根据他们的博客,如果成功,开放性 X-体系结构数据集和 RT-X 模型可能会诞生出一个能够在不同类型的机器人之间学习和适应的通用型机器人。在项目的这篇论文中,这个庞大的团队共同为来自22种机器人的广泛数据汇集了数据。
在这个巨大的努力中,超过500种技能和150,000个任务在惊人的100万个情景中得以展示。这个数据集是迄今为止最广泛和最多样化的机器人数据集合。
- Mistral AI的Mistral 7B基础模型现在可在Amazon SageMaker JumpStart上使用
- 通过CPR-Coach革新CPR培训:利用人工智能进行错误识别和评估
- UC Berkeley和UCSF研究人员革命性改变神经视频生成:引入LLM-Grounded视频扩散(LVD)以改善时空动态
没有适当的硬件,软件无法进行操作,这就是 RT-X 模型发挥作用的地方。这个模型是由谷歌DeepMind的机器人转换模型RT-1和RT-2衍生而来的。它是在开放性 X-体系结构数据集上进行训练的,并且在各种机器人中展示了卓越的性能。
在与合作伙伴学术机构的评估中,RT-1-X 在性能方面始终优于针对特定任务的模型,平均改进率达到50%。这个成功标志着向更为多功能、适应性更强的机器人的发展迈出了重要的一步。
现在,RT-X 的真正的奇迹在于它通过从不同的机器人中汲取知识来获得新兴技能。对 RT-2-X 的实验显示,它在以前超出其能力范围的任务上有着三倍的改进。
其中包括更好的空间理解,如“将苹果移近布料”和“将苹果放在布料上”指令之间微妙的差别。RT-2-X的扩展技能集凸显了多样化数据的巨大潜力,尤其是与高容量体系结构相结合时。
正如这项工作所展示的,能够跨延伸体系结构进行泛化的模型不仅是可行的,而且非常有前途。这些可能性是巨大的,从整合自我改进机制到探索不同数据集混合对跨体系结构泛化的影响。这些进展正在推动机器人研究进入未知领域。
随着此类进展,通用型机器人的日子可能比以前预期的更近。而且,如果被证明在大规模建设方面是具有成本效益的,那么它有可能以类似蒸汽机的方式革新这个行业。
谷歌DeepMind还发布了RT-X的有趣动画,您可以在下面看到: