本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。而且,在人脸分析任务中,准确率不亚于真实数据。这是微软团队最近的一项研究,论文的标题说明了一切。假装它直到你成功。文章介绍了程序生成的3D人脸模型结合合成数据库来训练图像。结果,结果与面部分析等任务中的真实数据相当。研究人员表示,他们为一些无法进行人工标记的地方开辟了新方法。以后真的要和人工标注说再见了吗?!如何实现?为了使人脸数据集更加多样化和丰富,通过采集和标注来实现变得越来越困难。更不用说网络抓取等收集可能会带来严重的隐私和版权问题。然而,人工贴标签很容易导致错误或标签不一致。因此,研究团队考虑使用合成数据来增强或替代真实数据。然而,由于人脸模型本身的复杂性,实现起来很困难。那么这次是如何运作的呢?第一步是以编程方式生成一张合成人脸,包括身份、表情、面部纹理、发型和服装,以及不同光照环境下的效果。所有这些数据都是独立采样的,并提前“手动”去除了噪音,以确保创造出更多样化的个体。比如人脸模型上,是这样的~还有衣服,都是服装设计师和仿真软件设计师手工制作的。各种衣服一共30套。还包括头饰(36件)、面具(7件)和眼镜(11件)。除此之外,标签也被合成。接下来是训练阶段,研究人员创建了一个包含100,000张分辨率为512×512的图像的数据集,并进行了数据增强处理,共享150个NVIDIAM60GPU渲染48小时。此外,该团队还训练了一个人脸解析网络(仅使用合成数据)和一个标签适应网络,以解决合成标签和人工注释标签之间的系统差异。最后,在人脸分析和地标定位等任务上的性能与使用真实数据的其他模型相当。然而,研究人员承认该技术仍有一些局限性。比如人脸模型只有头部和颈部,无法模拟真实的皱纹,随机匹配人脸时会得到一些不合理的人脸,比如留胡须的女性。在未来的工作中,他们计划解决这些限制。好了,有兴趣的朋友可以点击下方论文链接~论文链接:https://www.arxiv-vanity.com/papers/2109.15102/
