纽约大学的研究人员开发了一种新的人工智能技术,可以在图片中改变一个人的视觉年龄,同时保持他们独特的识别特征
NYU researchers developed a new AI technology that can change a person's visual age in images while preserving their unique identifying features.


越来越多的人工智能系统被用于通过图像分析准确估计和修改个体的年龄。构建对年龄变化具有鲁棒性的模型需要大量数据和高质量的纵向数据集,即包含了多年来大量个人图像的数据集。
已经设计了许多人工智能模型来执行这些任务;然而,许多模型在有效修改年龄属性的同时保留个体面部特征时遇到了挑战。这些系统面临着组合训练数据集的典型挑战,该数据集包含多年来显示个人的图像。
纽约大学塔顿工程学院的研究人员开发了一种新的人工智能技术,可以在图像中改变一个人的表观年龄,同时确保保留个体的唯一生物特征身份。
研究人员用每个个体的一小组图像对模型进行了训练。此外,他们还使用了另一个包含说明人的年龄类别(儿童、青少年、年轻成年人、中年人、老年人或老人)的图像集合。该图像集包括了名人在一生中的图像,而带标题的照片则向模型解释了图像与年龄之间的关系。随后,经过训练的模型可以模拟衰老或返老还童的情况,通过文本提示指定所需的目标年龄。这些文本提示指导模型进行图像生成过程。
研究人员使用了预训练的潜在扩散模式,一个由20个个体的训练脸部图像组成的小数据集(用于学习个体特定信息),以及一个小型辅助集,包含600个图像-标题对(用于理解图像与其标题之间的关联)。
他们使用适当的损失函数对模型进行了微调。他们还在图像中添加和删除了随机变化或干扰。此外,研究人员使用了“DreamBooth”技术,通过神经网络组件的融合来逐渐和受控地变换人脸图像。
他们与其他年龄修改技术进行了对比,评估了该模型的准确性。为了进行这项评估,26名志愿者被要求将生成的图像与同一人的实际照片关联起来。此外,他们还将比较范围扩展到使用了一种著名的面部识别算法ArcFace。结果显示,他们的方法表现出卓越的性能,超过了其他技术的性能,导致错误拒绝频率降低了高达44%。
研究人员发现,当训练数据集中包含中年人的图像时,生成的图像有效地代表了各种不同年龄组的范围。而如果训练集中的图像主要来自老年人的图像,则模型在生成属于相反极端的图像(如儿童类别)时遇到了挑战。此外,生成的图像在将训练图像转换为更高年龄组方面表现出良好的能力,特别是对男性而言,相比之下,女性的能力较差。这种差异可能来自于训练图像中的化妆品的使用。相反,在生成的输出中,种族或种族的变化并没有产生明显和可区分的影响。



