普林斯顿的研究人员推出Infinigen:一种自然界照片级3D场景的程序生成器
普林斯顿大学的研究团队在最近的一篇论文中介绍了 Infinigen,这是一款划时代的程序生成器,可用于生成逼真的三维场景,论文标题为“使用程序生成的无限逼真世界”。该工作解决了现有合成数据集的局限性,这些数据集提供有限的多样性,无法捕捉真实世界对象的复杂性。
Infinigen 是一个完全的程序化系统,可从头开始生成无限数量的形状、纹理、材料和场景组合。其关键特点在于能够通过程序生成粗略和精细的几何和纹理细节,从而产生高水平的逼真效果。Infinigen 独特的地方在于所有它生成的几何信息都基于真实世界的参考,提高了合成场景的真实性。
Infinigen 的架构基于广泛使用的图形系统 Blender,该系统以其程序生成的能力而闻名。研究团队设计并实现了一系列程序规则库,以扩展自然对象和场景的覆盖范围。这些规则利用了 Blender 中提供的有用基元。此外,该团队还开发了一些实用工具,简化了程序规则的创建,包括将 Blender 节点图转换为 Python 代码的自动转换工具。此外,还开发了实用程序来呈现合成图像与地面真值标签,提供深度、遮挡边界、包围盒、光流、表面法线、对象类别和实例分割等信息。
- 来自 Allen Institute for AI 的研究人员介绍了 VISPROG:一种神经符号化方法,用于根据自然语言指令解决复杂和组合的视觉任务
- AI课程的日子迎来了时刻
- 研究人员开发了新的量子光源
为了评估 Infinigen 生成的合成数据的质量,研究团队进行了广泛的实验,并与现有的合成数据集和生成器进行了比较。这些实验的结果表明,Infinigen 具有出色的能力,可以生成逼真和原始的资产和场景,而不依赖于外部资源。这展示了它在生成更准确地反映真实世界复杂性的多样化和广泛的训练数据集方面的潜力。
Infinigen 是一个开源项目,研究人员打算与更广泛的社区合作,持续发展和增长,以扩展其覆盖范围,包括所有真实世界元素。通过提供 Infinigen 作为免费资源,研究团队希望促进合作,并激发程序生成的进一步发展。
总体而言,Infinigen 的引入标志着为计算机视觉任务生成合成数据的显着进步。其程序化方法,加上其产生逼真场景的能力,承诺弥合现有合成数据集和真实世界对象复杂性之间的差距,使其成为各种计算机视觉应用程序中训练模型的宝贵工具。