当前位置: 首页 > 科技观察

MDFR-AFaceRecognitionMethodBasedonthejointmodelofFaceImageRestorationandFaceNormalization

时间:2023-03-12 04:33:12 科技观察

在现实生活中,很多因素都可能影响人脸识别系统的识别性能,例如大姿态、光线不好、分辨率低、模糊和噪声等。为了应对这些挑战,以往的人脸识别方法通常是先将低质量的人脸图像还原为高质量的人脸图像,然后再进行人脸识别。然而,这些方法大多是阶段性的,并不是人脸识别的最优解。AITechnologyReview今天介绍了一篇论文,对此有很好的解决方案。在这篇论文中,作者提出了一种多退化因素人脸恢复模型(Multi-DegradationFaceRestoration,MDFR)一次性解决所有问题。的这些影响因素。原标题:《Joint Face Image Restoration and Frontalization For Recognition》论文地址:https://ieeexplore.ieee.org/document/9427073/MDFR可以从给定的受多个姿势和多个低质量因素影响的人脸图像中恢复出高质量的正面人脸图像。MDFR是一个精心设计的编码器-解码器网络结构。在模型的构建中,作者引入了姿态残差学习策略和基于3D的姿态归一化模块(3D-basedPoseNormalizationModule,PNM),可以感知输入人脸姿态和正面姿态的差异。它们之间的差异用于指导人脸的归一化学习。实验表明,经过训练,MDFR可以一次性通过单个网络从受多种低质量因素影响的侧脸图像中恢复出高清的正面图像,有效提高人脸算法的识别率。1.背景和介绍非限制条件下的人脸识别方法是计算机视觉任务中的一项重要工作。在实际应用中,采集到的人脸图像可能存在姿势大、光照差、分辨率低、模糊和噪声等问题,这些影响人脸成像质量的因素可能会导致人脸识别应用失败。为了解决这些问题,已经有很多方法使用分阶段模型来处理相应的受低质量因素影响的人脸图像,即先将低质量人脸恢复为高质量人脸图像,然后进行人脸校正并使用人脸识别。但是,这些方法都只考虑了人脸识别的单一因素,很少有方法能够同时解决影响人脸识别的多个因素。因此,这种基于单一因素的人脸处理方法不能很好地应用于无限制条件下的人脸识别。在本文中,作者提出了一种人脸恢复模型(MDFR),该模型解决了多种退化因素,可以在给定任意姿势的情况下从低质量人脸图像中恢复出高质量的正面人脸。文章的贡献如下:提出了一种多退化因素人脸恢复模型(Multi-DegradationFaceRestoration,MDFR),将给定的任意姿态和受多个低质量因素影响的人脸图像恢复到正的和高的-质量图像;在人脸矫正过程中,采用姿态残差学习策略,提出了基于3D的姿态归一化模块;提出了一种有效的集成训练策略,将人脸重建和矫正任务集成到一个统一的网络中,该方法可以进一步提高输出人脸的质量和后续的人脸识别效果;2.方法描述MDFR结构如图1所示。在训练过程中,MDFR主要包括两个模块,即Dual-AgentGenerator和Dual-AgentDiscriminator。网络中嵌入姿态归一化模块(PoseNormalizationModule,PNM),对人脸的姿态进行归一化处理。图1.MDFR模型的结构,包括一个双主体生成器、一个姿势归一化模型和一个双主体鉴别器。(1)DualAgentGenerator双代理生成器包括一个人脸恢复子网(FRN)和一个人脸正面化子网(FFN)。FRN网络的作用是将低质量的人脸图像重构为高质量的人脸图像,FFN网络对FRN生成的侧脸图像进行校正。每个子网络包含一个编码器和一个解码器,前者用于将输入映射到特征空间,后者主要将编码后的特征重构为对应的目标人脸图像。两个子网络具有相同的网络结构,但具有不同的输入。FRN的编码器对输入的人脸图像进行编码,然后解码器对编码器的特征进行解码。FFN解码器的输入除了人脸的编码特征外,还包括人脸两个pose的编码残差,如图2所示。图2生成网络的网络结构(2)Posenormalizationmodule作者设计了一个姿势归一化模块(PNM)来归一化姿势。PNM提供了一个标准的、统一尺度的真实正面姿势来引导人脸朝向前方。基于3D可变形模型(3DMorphableModel,3DMM),通过人脸正交基的线性加权求和可以得到2D人脸图像对应的3D顶点:3D人脸顶点通过尺度正交映射到2D图像mapping平面、二维剖面人脸图像可以表示为:其中,参数MDFR:基于人脸图像复原和人脸归一化联合模型的人脸识别方法是对应的旋转矩阵,t是平移向量。当去掉旋转矩阵和平移向量后,归一化后的真实归一化人脸的稠密二维坐标可以表示为:文章中,作者使用3D人脸归一化方法2DAL从给定的二维人脸图像中得到人脸的稠密坐标,最后选取18个常用的关键点生成对应的高斯热图(GaussianHeatmaps)。(3)双代理先验引导鉴别器在人脸超分辨率领域使用的鉴别损失可以很好地提高重建人脸的真实感。因此,在这篇论文中,作者在判别器中加入了两种额外的先验信息:目标人脸的landmarks和正面人脸的identityfeaturemap,这样生成的人脸不仅可以得到目标pose,还可以有真实的身份信息。对应的判别器是PCD(PoseConditionedDiscriminator)和ICD(IdentityConditionedDiscriminator)。在实现过程中,作者将两种先验信息应用到输入的判别器中来指导人脸的生成,然后再输入到对应的判别器中解决判别损失。PCD和ICD不仅可以区分真实人脸和生成人脸,还可以学习真实人脸和生成人脸之间的姿势和身份差异。(4)网络训练网络的训练主要分为两个阶段:SeparateTraining和TITraining。SeparateTraining:文章首先分别训练FRN和FFN这两个子网络,两个训练过程分别简写为FRN-S和FFN-S。FRN-S训练过程中使用的损失函数如下:identityinformationloss:reconstructedpixelloss:totalloss:FFN-S训练过程中使用的损失函数如下:positiveconversionloss:conditionalconstagingloss:totalloss:Task-Integrated(TI)training:FRN和FFN完成相应的单独训练后,作者在预训练模型的基础上进行了集成训练。在这个阶段,作者使用FFN模型的输出作为ground-truth来训练FRN。同时,使用PNM归一化的归一化人脸landmarks来指导FFN中人脸的归一化。为了生成更好的人脸效果,作者在这个阶段还使用了FeatureAlignmentLoss(FA)。具体定义如下:整体训练损失函数为:3.实验结果作者首先探索了不同的网络结构和损失函数的结合,观察FFN-S和FRN-TI对应部分对面世代。实验结果如图3所示。图3.Multi-PIE数据库上消融实验对比结果。同时,表1显示了MDFR的不同变体对不同姿势的人脸的rank-1识别率。在所有实验模型中,FFN-S和FRN-TI的准确率最高。表2列出了FFN-S和FRN-TI与其他方法在Multi-PIE数据集上的人脸识别率对比。FFN-S在所有姿势中取得了最好的结果,其次是FFN-TI。当姿态角在±45°以内时,FFN-S和FFN-TI实现了与CAPG-GAN相似的识别效果。但当姿态角大于±45°时,FFN-S和FFN_TI的效果明显优于CAPG-GAN。图4多种低质量因素影响下不同方法的人脸修复效果作者对受多种低质量因素影响的人脸图像进行了相应的验证,包括分辨率低、光照差、噪声和模糊等。实验表明,文中提到的方法不仅可以充分应对各种低质量因素,而且可以生成相应的高质量人脸图像。图4给出了多种低质量因素影响下不同方法的人脸修复效果。可以看出,不同于以往只能处理单一任务的方法,本文提出的方法不仅可以对人脸进行矫正,还可以进行高质量的复原,达到最佳的视觉效果。