当前,人工智能和深度学习技术正在成为文本图像生成、超分辨率等应用的重要基础。现在,可以输入图像的高细节描述以获得与给定文本相对应的逼真图像。还可以将图像从低分辨率转换为高分辨率,从而为图片生成一系列生动的细节。神经网络似乎具有无限的能力。那么,这些方法能否用于时间旅行呢?例如,你有没有想过如果你的照片是五十或一百年前拍的,会是什么样子?如果你最喜欢的演员出生在一个完全不同的时代,他们会是什么样子?时间旅行第一步:解决数据集挑战鉴于StyleGAN最近在高质量人脸合成和编辑方面取得的成功,许多工作都集中在使用预训练的StyleGAN模型进行人像编辑。然而,现有技术通常处理定义明确的语义属性。例如,添加或删除微笑或更改图片中人物的年龄。这部作品背后的逻辑是,将构成一个人身份的这些属性原封不动地保留下来,同时,用这辆人工智能越野车将它们送回过去或未来。在这种情况下,人们面临的主要问题是缺乏合适的数据集。我们都知道,即??使有了完美的神经网络模型,数据集仍然是每个AI研究人员的噩梦。数据不平衡、不足或不可用是深度学习领域的普遍问题,会导致数据有偏或结果不准确。为了克服这个问题,康奈尔大学华裔科学家陈明明(左二)领导的研究团队创建了FTT(FaceThroughTime)数据集。Chen与佐治亚大学华裔科学家JinSun等人共同发表论文,详细解释了“FacesThroughTime”数据集的工作原理。此数据集中的图像来自维基共享资源。该平台拥有5000万张众包和开放许可的图像。FTT分析了19世纪至21世纪的26,247幅肖像画,平均每十年约1,900张图像。GANs父子层级的变化、化身AI“时光机”是如何实现的?研究团队依赖于StyleGAN(生成对抗网络)亲子层次结构。特别的是,他们没有选择训练覆盖所有epoch的单一模型,而是为每十年的图像集添加一个子模型,通过训练模型集更好地综合每个时期的数据分布。同时,为了保留被描述人的身份和姿势,研究团队采用父模型将这些信息映射到潜在空间向量中。首先训练一个StyleGAN模型集,每一代一个,使用adversarialloss和identityloss训练混合人脸图。此面部贴图是子模型的输出,经过修改后混合贴图在颜色上与父模型相似。研究团队建议,在此过程中,有必要避免由于流行的面部识别模型ArcFace中的特征计算而导致身份丢失的不一致。由于ArcFace模型仅在现代图像上进行训练,研究人员发现它在历史图像上表现不佳。之后,每个真实图像被投影到十年流形(下图中的1960)上的向量w上。在这个向量上,生成器G'被训练为将精细细节传输到所有子模型。最后,在输入图像上应用蒙版以鼓励模型保留肖像的面部细节。研究团队在对所有子模型进行微调后发现,FTT不同年龄段的子模型(下图中橙色)都成功捕捉到了母模型中每张图片的人像(下图中蓝色)而他们的发型和妆容则发生了变化。这种新的合成图像框架有两个好处:一是实现了穿越时空的人像愿望;其次,时移人脸时,该技术可以保留人像的大部分细节。尽管它在数据集中仍然存在小偏差(例如,20世纪初的图像中出现了几个短发女性),导致输出图像不一致,但与之前的工作相比,该模型在真实感方面有所提高。很大的进步。《一张穿越时空的脸》开启了穿越时空的第一步。如此之高的准确度让人不禁疑惑:这次是跨越时间的人像,那么下次呢?参考资料:https://www.marktechpost.com/2022/11/09/latest-artificial-intelligence-ai-research-proposes-a-method-to-transform-faces-through-time/https://facesthroughtime。github.io/
