这篇人工智能论文的目标是基于每个角色的手部模型,在角色之间传递手部动作语义
这篇论文的目标是使用手部模型传递角色之间的动作语义
在各种虚拟化头像的背景下,包括共同言语和手势合成,产生逼真的手势已经显示出潜力。人的手作为主要的非语言交流方式,可以在进行某些手势时表达微小的细节。人们对手部动作非常敏感。因此,即使是小的错误也会极大地影响用户与虚拟头像应用的交互方式。因此,保持不同虚拟头像手部运动语义的一致性非常重要。然而,直接复制关节旋转会严重损害手势的微妙语义,原因是人手的高度关节化结构具有许多自由度和不同虚拟头像的各种手型和比例,如图1所示。
因此,建立一个能够保持手势语义并将其应用于不同虚拟头像的系统至关重要。动作重新定向和手物交互是早期研究的主要课题。Gleicher发明的动作重新定向的目标是识别源运动的特性,并将其应用于不同角色的目标运动。早期的研究强调基于优化的方法。最近,研究人员提出了使用各种网络设计和语义度量的数据驱动策略。这些策略对于灵巧的手部运动重定向无效,但可以成功地重定向逼真的身体运动。研究人员提出了一种基于规则的策略来重定向手语手势;然而,他们的方法受限于一定数量的预定义手势,并需要充分的测试。
在手物交互领域,包括静态抓取合成和操作动作合成,目标是在与物体交互时模拟逼真的手部动作。然而,这些技术需要保持与交流相关的手势语义。它们也不能适用于不同大小和形状的手模型。尽管有可用的技术,但在保持复杂的动作语义的同时,仍然很难将高精度、逼真的手部动作重定向到许多手模型上。清华大学的研究人员在这项研究中专注于在保持原始手部动作语义的同时,将灵巧的手部动作重定向到多个手模型上。这个概念是创新的,因为手部动作重定向需要比身体动作重定向更高的语义测量精度。
由于手部关节在一个小区域内密集分布,导致手指关节与手掌之间存在强烈的空间相互作用,因此以前在运动重新定向中使用的语义度量,如循环一致性和距离矩阵,需要进行修订。因此,他们的关键发现是,保持手部灵活性的语义依赖于手指关节与手掌之间的空间联系。因此,他们创建了一个全新的基于解剖学的语义矩阵(ASM)来表示空间相关性。对于精确的手部动作重定向,他们使用ASM作为语义测量。他们首先为几个手模型的手指关节构建解剖学的本地坐标系。然后,他们以解剖学的本地坐标系为基础创建ASM。ASM通过测量特定手指关节的局部坐标系中手掌和其他关节的位置来量化。
接下来,他们使用基于解剖学的语义重建网络(ASRN)从源动作ASM获得到目标动作旋转的映射函数。他们使用两个异构手部运动数据集来训练ASRN。与基于模板网格的方法相比,他们的解决方案可以与不同的手模型一起使用,并且不依赖于模板网格,而是基于语义对应关系。他们进行了大量测试来评估ASRN产生的手势的有效性。这些调查包括复杂的手部动作序列和不同手型的域内和跨域手部动作重定向场景。定性和定量的研究结果表明,他们的ASRN明显优于现有的运动重定向技术。
他们的三项贡献简要如下:
• 他们提出了一个新的任务:在保持语义的同时,将灵巧的手势重新定位到多个手模型上。
• 他们提供了一种基于解剖学的语义矩阵(ASM),可以与不同的手模型配合使用,并量化手部运动的语义,而无需使用模板网格。
• 通过使用ASM,他们提供了一个保持语义的先进架构,用于手部运动的重新定位。在域内和跨域手部运动重新定位任务上的实验结果证实,他们的系统表现优于当前方法。