米开朗基罗的AI表兄弟:Neuralangelo是一个能够实现高保真度3D表面重建的AI模型[代码已包含]
Neuralangelo is an AI model developed by Michelangelo, capable of achieving high-fidelity 3D surface reconstruction. [Code included]
神经网络在近年来取得了显著的进展,并在几乎所有应用中找到了用武之地。其中最有趣的用例之一就是对现实世界进行三维建模。我们已经看到了可以使用普通摄像机通过使用法线来准确捕捉场景的三维几何的神经辐射场(NeRFs)。这些进展在三维表面重建方面打开了全新的一页。
三维表面重建的目标是通过分析从不同视角拍摄的多幅图像来恢复场景的详细几何结构。这些重建的表面包含有价值的结构信息,可以应用于各种应用,包括为增强/虚拟/混合现实生成三维资源以及为自主机器人导航映射环境。一种特别有趣的方法是使用单个RGB摄像机进行摄影测量表面重建,因为它使用户能够使用普通移动设备轻松创建现实世界的数字副本。
三维表面重建在从多个图像生成密集几何结构方面发挥着关键作用,可以实现广泛的应用,如增强/虚拟/混合现实和机器人技术。虽然经典方法(如多视图立体算法)在稀疏三维重建方面很受欢迎,但它们常常在模糊的观察结果中遇到困难,产生不准确或不完整的结果。神经表面重建方法通过利用基于坐标的多层感知器(MLP)将场景表示为隐式函数,已经成为一种有前途的解决方案。然而,目前的方法的保真度无法很好地与MLP容量相适应。
如果我们能够有一个解决缩放问题的方法呢?如果我们只使用RGB输入就能真正精确生成三维表面模型呢?是时候来认识一下Neuralangelo了。
Neuralangelo是一个结合了Instant NGP(神经图形原语)和神经SDF表示的框架,以实现高保真度表面重建。
Neuralangelo采用Instant NGP作为底层3D场景的神经有符号距离函数(SDF)表示。Instant NGP引入了一个混合3D网格结构,具有多分辨率哈希编码,以及一个轻量级的MLP,增强了表达能力,同时保持了对数线性的内存占用。这种混合表示显著提高了神经场的表征能力,并在捕捉细粒度细节方面表现出色。
为了进一步提高哈希编码表面重建的质量,Neuralangelo引入了两个关键技术。首先,使用数值梯度来计算高阶导数,如表面法线,有助于稳定优化过程。其次,实施渐进优化时间表以恢复不同细节级别的结构,实现了一种全面的重建方法。这些技术相互协作,显著提高了重建精度和视图合成质量。
Neuralangelo自然地将多分辨率哈希编码的强大功能融入神经SDF表示中,从而增强了重建能力。其次,使用数值梯度和调和正则化有助于通过稳定优化过程提高哈希编码表面重建的质量。最后,在标准基准和实际场景上进行了大量实验,证明了Neuralangelo的有效性,展示了与先前基于图像的神经表面重建方法相比在重建精度和视图合成质量方面的显着改进。