字节跳动和沙特阿卜杜拉国王科技大学的人工智能研究员提出了一种新颖的框架,可以为静态肖像照片中的头发增加逼真的风吹效果
「字节跳动与沙特阿卜杜拉国王科技大学人工智能研究员共同提出创新框架,为静态肖像照片增添逼真风吹效果」
头发是人体最引人注目的特征之一,以其动态的特质给场景注入生机。研究一直表明,动态元素比静态图像更具吸引力和迷人。社交媒体平台如TikTok和Instagram每天都在分享大量的人像照片,人们渴望使自己的照片既吸引人又具有艺术感。这种动力推动着研究人员对在静止图像中使人类头发动画化的探索,旨在提供生动、美观和令人愉悦的观赏体验。
该领域的最新进展引入了一些方法,可以使静止图像中的液体物质(如水、烟和火)动画化。然而,这些方法很大程度上忽视了现实生活照片中人类头发的复杂性。本文重点讨论的是肖像摄影中人类头发的艺术变革,包括将照片转化为“活图”(cinemagraph)。
活图是一种创新的短视频格式,受到专业摄影师、广告商和艺术家的喜爱。它在各种数字声像信息(VoAGI)中有用途,包括数字广告、社交媒体帖子和落地页。活图的吸引力在于它能够结合静态图像和视频的优势。活图中的某些区域在短循环中呈现出微妙而重复的动作,而其余部分保持静止。这种静止和移动元素之间的对比能够有效地引起观众的注意。
通过将肖像照片转化为带有细微头发动作的活图,旨在增强照片的吸引力,同时不减弱静态内容,创造一个更有吸引力和参与度的视觉体验。
现有的技术和商业软件已经开发出了从输入视频生成高度逼真的活图的方法,通过有选择地冻结某些视频区域。不幸的是,这些工具不适用于处理静态图像。相比之下,人们对静态图像动画化的兴趣越来越浓厚。其中大部分方法都专注于动画化的流体元素,如云、水和烟。然而,由于由纤维材料组成,头发的动态行为与流体元素相比具有独特的挑战。与流体元素动画不同,对真实肖像照片中的人类头发进行动画化研究相对较少。
在静态肖像照片中为头发添加动画是一项具有挑战性的任务,因为头发结构和动态非常复杂。与人体或脸部的光滑表面不同,头发由成千上万个个体组成,形成复杂而不均匀的结构。这种复杂性导致头发内部产生复杂的运动模式,包括与头部的互动。虽然有专门用于建模头发的技术,例如使用密集相机阵列和高速摄像机,但它们往往昂贵且耗时,限制了在实际头发动画中的实用性。
本文介绍了一种用于静态肖像照片中的自动头发动画的新型人工智能方法,并省去了用户干预或复杂的硬件设置的需求。这种方法的灵感来自于人类视觉系统对真实肖像视频中单根头发丝及其运动的较低敏感性,与虚拟环境中数字化人类的合成头发的敏感性不同。所提出的解决方案是动画化“头发细丝”,而不是单个头发细节,从而创造出一个视觉愉悦的观看体验。为了实现这一目标,本文介绍了一个头发细丝动画模块,实现了高效和自动化的解决方案。下面是该框架的概述。
这一背景下的关键挑战在于如何提取这些头发细丝。虽然与之相关的工作,如头发建模,主要关注头发分割,但这些方法主要针对整个头发区域的提取,与本文的目标不同。为了提取有意义的头发细丝,研究人员创新地将头发细丝的提取框架化为一个实例分割问题,其中静态图像中的一个单独分割区域对应一个头发细丝。通过采用这个问题定义,研究人员利用实例分割网络来促进头发细丝的提取。这不仅简化了头发细丝提取问题,还使得可以使用先进的网络进行有效的提取。此外,本文还介绍了一个包含真实肖像照片的头发细丝数据集,用于训练网络,并采用半注释方案为识别出的头发细丝生成地面真值标注。下图是本文与最先进技术相比的一些样本结果。
这是一个小说AI框架的摘要,旨在通过给头发勾线带来令人愉悦的动作,而不会产生明显的伪像,实现将静态人像转化为电影画面。如果你对此感兴趣,并想了解更多信息,请随意参考下面引用的链接。