【简介】人脸识别是计算机视觉中最大的研究领域之一。许多公司都在投资面部识别技术的研发。面部识别是计算机视觉中最大的研究领域之一。我们现在可以使用面部识别来解锁我们的手机,在安全门验证我们的身份,并且在某些国家/地区还可以使用我们的面部进行支付。许多公司都在投资面部识别技术的研发,本文重点介绍了其中的一些研究,并介绍了五篇关于面部识别的机器学习论文。1.大规模多模式人脸反欺骗的数据集和基准随着大量的实际应用,人脸识别技术变得越来越重要。面部识别可以通过多种方式提高安全性和监控,从解锁智能手机到面部验证支付方式。然而,该技术也存在一些风险。有多种面部欺骗方法可用于欺骗这些系统。因此,面部欺骗预防对于防止安全漏洞至关重要。为了支持人脸反欺骗研究,本文作者介绍了一个名为CASIASURF的多模态人脸反欺骗数据集。在撰写本文时,它是最大的人脸反欺骗开放数据集。具体来说,该数据集包括从1000个主题中拍摄的21000个视频的RGB、深度和IR。除了数据集,作者还提出了一种新的多模态融合模型作为人脸反欺骗的基准。发布/上次更新–2019年4月1日,JunWan(NLPR,CASIA,UCAS,China),SergioEscalera(UniversityofBarcelona),HailinShi(JDAIResearch),ZezhengWang(JDFinance),StanZ.Li(NLPR,CASIA,UCAS,China).https://arxiv.org/pdf/1812.00408v3.pdf2。FaceNet:用于人脸识别和聚类的统一嵌入在本文中,作者提出了一种名为FaceNet的人脸识别系统。该系统使用深度卷积神经网络来优化嵌入,而不是使用中间瓶颈层。作者指出,该方法最重要的方面是系统的端到端学习。该团队在CPU集群上对卷积神经网络进行了1,000到2,000小时的训练。然后,他们在四个数据集上评估了他们的方法。值得注意的是,FaceNet在著名的LabeledFacesintheWild(LFW)数据集上达到了99.63%的准确率,在YoutubeFaces数据库上达到了95.12%的准确率。发布/上次更新–2015年6月17日作者和贡献者–FlorianSchroff、DmitryKalenichenko和JamesPhilbin,来自GoogleInc.https://arxiv.org/pdf/1503.03832v3.pdf3.概率人脸嵌入当前的嵌入方法面部识别,可在受控环境中实现高性能。这些方法的工作原理是拍摄人脸图像并将有关该人脸的数据存储在潜在语义空间中。然而,当前的方法在完全不受控制的环境中进行测试时表现不佳。这是由于图像中面部特征的缺失或模糊造成的。这方面的一个例子是监控视频中的面部识别,其中视频的质量可能很低。为了帮助解决这个问题,本文的作者提出了概率人脸嵌入(PFE)。作者提出了一种将现有确定性嵌入转换为PFE的方法。最重要的是,作者指出这种方法有效地提高了人脸识别模型的性能。发布/上次更新–2019年8月7日作者和贡献者–来自密歇根州立大学的YichunShi和AnilK.Jain。https://arxiv.org/pdf/1904.09658.pdf4.人脸识别噪声中的魔鬼商汤科技、加州大学圣地亚哥分校和南洋理工大学的研究人员调查了大规模数据集中噪声的影响的面部图像。由于其规模和成本效益,许多大型数据集容易出现标签噪声。本文旨在提供有关标签噪声来源及其在人脸识别模型中的后果的知识。此外,他们的目标是构建并发布一个名为IMDb-Face的干净人脸识别数据集。这项研究的两个主要目标是发现噪声对最终性能的影响,并确定注释人脸身份的策略。为此,该团队手动清理了两个流行的开放式面部图像数据集,MegaFace和MS-Celeb-1M。他们的实验表明,仅在32%的已清理MegaFace数据集和20%的MS-Celeb-1M已清理数据集上训练的模型与在整个原始未清理数据集上训练的模型表现相似。发布/上次更新–2018年7月31日SenseTime)和ChenChangLoy(南洋理工大学)。https://arxiv.org/pdf/1807.11649v1.pdf5。VGGFace2:用于跨姿势和年龄深度卷积识别人脸的数据集关于使用神经网络进行人脸识别的研究很多。反过来,已经创建了许多大规模的面部图像数据集来训练这些模型。然而,这篇论文的作者指出,之前发布的数据集并不包含大量关于面部姿势和年龄变化的数据。在这篇论文中,牛津大学的研究人员介绍了VGGFace2数据集。该数据集包含具有各种年龄、种族、光照和姿势变化的图像。数据集总共包含331万张图像和9,131个对象。
