这项人工智能研究提出了可驾驶的三维高斯头像(D3GA):首个使用高斯喷点渲染人体的可控三维模型
通向未来的突破!三维高斯头像(D3GA)可驾驶:革新时尚界的可控人体渲染模型
印象派艺术运动是由19世纪的无名画家、雕塑家、版画家等创立的,其特点是“短小、断续的笔触,几乎无法传达形式”。最近的研究以尽可能真实地在照片中呈现人物主体,这是印象派所避免的挑战。
由于单眼技术的缺乏准确性,目前创建可驱动(即可动画生成新内容)逼真人物需要大量的多视角数据。此外,目前的方法需要精细的预处理,例如准确的3D注册。但是,要获得这些注册,您必须使用难以纳入端到端工作流的迭代过程。不需要准确注册的其他方法基于神经放射状场(NeRFs)。它们要么在渲染服装动画时存在问题(某些例外情况除外),要么速度太慢无法进行实时渲染。
来自Meta Reality Labs Research,Darmstadt理工大学和Max Planck智能系统研究所的研究人员使用3D高斯而不是辐射场将3D人物外观和变形表示为一个规范空间。高斯斑点用作这些快速笔触的现代替代品,以便符合虚拟形象的解剖学和美学与真实可调整人物的相同。高斯斑点无需涉及摄像机光线采样的任何技巧。可驱动NeRF中的点通常通过线性混合蒙皮(LBS)将其从规范空间转换到观察空间。另一方面,D3GA使用3D高斯体作为体积基元对人体进行建模,因此需要将体积映射到规范空间。
- NVIDIA AI研究人员提出了Tied-Lora:一种新的人工智能方法,旨在提高低秩适应(LoRA)方法的参数效率
- 饥渴的游戏者:18款新游戏加入GeForce NOW
- 在Python中实现空间移动的动画
研究人员使用笼子代替LBS,这是另一种适合体积变换的成熟变形模型。在规范空间中通过变形笼子生成的变形梯度直接应用于3D高斯表示。该方法建立在一种组合结构的基础上,可以分别使用笼子来代表躯干、面部和服装。仍然存在的谜团是确定导致这些笼子畸变发生的线索。目前在可驱动虚拟形象领域的最新技术要求输入密集的信号,如RGB-D图像或甚至多摄像机设置,这在远程会议应用中可能不可接受。该团队使用基于人的姿势的更紧凑的输入,其中包括骨骼关节角度和3D面部关键点的四元数表示。他们使用了九个高质量的多视角序列来训练可以根据任何主体的新姿势驱动的个人专用模型。他们涵盖了许多身体形态、动作和服装(不仅限于贴身服装)。
该方法产生了高质量的输出,在测试中表现优于具有等效输入的最新技术,并与使用更多信息的方法(如FFD网格或图像)竞争。作为额外的好处,所提出的技术在几何和外观建模的动态序列中不需要地理信息几何来实现有希望的结果,从而减少了处理数据所需的处理时间。