不久前,一则新闻引起了巨大的震动。三年前杀母案的嫌疑人吴谢宇在重庆江北机场落网。有人透露,吴谢宇进入机场不到十分钟就被警察找到了。是“天眼系统”带领我们抓捕嫌疑人,走进真相。目前,中国已安装了2000万个搭载人工智能技术的摄像头,形成了全球最大的监控系统——“天眼系统”。我们用这个系统高精度匹配人脸,锁定了肇事逃逸的司机,抓住了正在看演唱会的通缉犯,逮捕了吴谢宇。在这个体系下,人脸识别成为重要的技术基础。不仅在公安和公共交通方面,人脸识别技术的应用场景越来越多,我们在享受科技带来便利的同时,也有不少风险和担忧的声音。人脸识别技术发展迅猛据前瞻产业研究院数据显示,到2020年全球人脸识别市场规模将达到75.95亿美元。在这个技术飞速发展的轨道上,人脸识别真正深刻地改变了我们的生活。无论是消费支付,还是安检找人,这场“刷脸”革命正在慢慢渗透到我们的生活中。2015年,招商银行宣布推出“ATM刷脸取款”服务。三年后,工行已在215家网点采用人脸识别技术;2017年,推出iPhoneXFaceID解锁功能。到2017年,全球拥有人脸识别功能的银行智能手机总数已达14.62亿部;2017年,首都国际机场建成智能机场,刷脸登机。该系统将在1分钟内完成安全识别和处置,查放效率较之前提升66%。2017年支付宝宣布商用刷脸支付,2018年推出刷脸支付产品——“蜻蜓”,直接将刷脸支付接入成本降低80%;2017年,北京所有公租房实行“人身识别”;2018年,张学友4场演唱会借用人脸识别技术抓获5名逃犯;2018年,相关警务识别和智能化业务应用越来越广泛;事实上,研究关于人脸识别早在1960年代就开始了,如今经过50多年的发展,人脸识别技术取得了重大突破,许多经典算法和人脸数据库相继出现。人脸识别系统可以达到99.5%,而人眼在同等条件下的准确率只有97.52%。而国内的发展速度也不逊色。在2018年全球人脸识别算法测试(FRVT)中,中国人工智能企业包揽了前十名中的五家。据2018年11月16日发布的报告显示,全球人脸识别算法可实现千万分之一的误报率,漏报率降至1%以下,这意味着数十人下的识别百万误报准确率已超过99%。与去年同期相比,全球人脸识别性能提升了80%。发展背后有很多风险。然而,在快速发展的背后,也存在不少令人担忧的问题。数据来源存在争议。首先是用于训练的数据集。人脸技术的繁荣发展背后有一个重要的基础——大量的数据训练。如果说人工智能是疾驰的豪华跑车,那么数据就是提供强劲动力的“燃料”。为了保证“燃料”的质量,我们对数据清洗的要求越来越高;但更重要的是可用于训练的数据量。目前,研究人员使用的数据主要来自“开源数据集”。除了早期专业邀请志愿者拍照的实验团队外,大部分数据主要来自网络采集和公开数据。例如雅虎旗下的图片分享网站Flicker,通过“知识共享”政策,将用户上传的图片等信息整合到众多开源数据集中。早在2014年,雅虎就发布了1亿张基于Flicker数据的图片和视频,其中包含9930张图片和70万个视频URL及相关元数据。也有很多开源数据集收集了大量的电影、电视剧、体育比赛等公众形象。许多公共监控数据也被政府和相关公司用于安全研究和培训。这引起了很多争议和担忧。一方面,每个人都对使用他们的面部信息进行训练有一些不满。另一方面,不同的企业和政府对此也有不同的看法和立场。2018年4月,Facebook利用生物识别数据,在未经用户同意的情况下,非法对用户照片进行人脸识别并存储相关信息。今年4月,亚马逊此前曾向警方提供其面部识别工具Rekognition,引发侵犯公众隐私的争议。当时,包括亚马逊员工、用户、非政府组织在内的超过15万人联合抗议。图灵奖获得者还呼吁暂停向执法机构销售。同样面对数据收集和使用,微软基于人权考虑,拒绝向警方提供面部识别技术。信息泄露风险2019年2月,海外博主VictorGevers在其个人社交网站推特上透露,国内一家名为“SenseNet”的人工智能安全公司发生大规模数据库泄露——超过250万条个人数据可能被泄露。获得,680万条记录泄露。这次信息泄露引起了不小的震动。该公司主要从事将深度学习用于人脸识别技术和人群分析,并开放数据接口,方便使用和匹配。其录音地点还包括派出所、酒店、旅游景点、公园、网吧等。也就是说,当你走在路上时,面部信息很有可能被提取、分析,甚至泄露。信息泄露风险的背后是我们对人脸与其他数据标签关联的担忧。目前,人脸识别支付普及率较低,与人脸相关的数据标签非常少。但随着未来人脸识别技术的应用越来越广泛,这种相关性势必会越来越大。这种相关性的提高将为企业带来机遇。比如分析人脸信息等社交平台信息,把我们的人脸和相关的兴趣标签卖给商场。也许下一次走进商场,你就会实现全智能化购物,各种精准推送都基于此。目前,许多公司已经在有意无意地做着改善这种相关性的事情。BlipparApp是一款基于AR技术的探索与发现应用。我们可以通过这款APP扫描感兴趣的物体,不仅可以看到相关的产品信息,了解城市街道的介绍,甚至可以直接获取社会信息。单纯的信息泄露和缺乏相关性所造成的危害似乎并没有那么直接。但如果这些信息也被黑产利用,那损失就不可估量了。从本质上讲,这仍然是一种矛盾的对抗。今天像微软这样的科技巨头在人脸识别方面的发展处于领先地位,很大程度上是因为他们拥有庞大的人脸数据库,而这个数据库是由每天走在路上、上传自拍等信息的你我组成的。技术的发展需要我们为它的学习“贡献”大量的数据,但有没有可能这些数据也可以被黑产用来训练呢?这正在发生。今年的央视315指出了人脸识别的风险。2016年底,湖北省公安厅还捣毁了一个专门贩卖市民动态认证视频(抬头、低头、眨眼、朗读一段文字)的团伙。他们查获的1800G信息,不仅包括正反面,还有手持自拍、侧拍、看报,更有抬头、点头、左转、右转、阅读文字等精彩视频。而这些都是在帮助黑产形成3D建模,训练如何躲避活体检测。我们担心什么?其实,面对人脸识别技术的发展,我们的情绪是复杂的。正如此次,重庆江北机场通过“天眼”将犯罪嫌疑人吴谢宇抓获,精准快速保障安全,民众成为受益者。但另一方面,当我们看到不合理的人脸数据采集、信息泄露的风险甚至冒用身份的可能时,我们又有些害怕。我们到底在怕什么?首先,我们害怕在没有意识到的情况下丢失我们的卡。因为人脸是无需用户主动配合即可采集的生物特征信息。与指纹、掌纹、虹膜、静脉、视网膜等其他生物特征的采集过程相比,需要用户的主动配合为前提,即如果用户拒绝采集,则无法获得高质量的特征信息。获得。同时,人脸自然暴露,难以掩饰伪装。这张脸已经成为一种自然的识别特征。也就是说,面对周而复始的“索伦之眼”,我们收集的时候毫无察觉,分析的时候完全没有察觉,直到泄露或暴露,我们才没有了战斗力后退。其次,我们害怕无法挽回的事情。人脸识别技术会增加识别准确率的训练,以防黑;黑人为了牟利,会投入更多的精力在伪装活人脸上;普通用户呢?我们只有一张脸,被曝光、被泄露、被冒用。我们能改变我们的“面子”吗?不能。还有信息关联的问题。纵然目前看来,从社交照片中提取信息进行训练是非常独立的,但真正落地到应用场景中时,无论我们是“刷脸支付”,还是做推荐系统,都是必然会发生的。,关联更多个人信息。一旦特征信息泄露,我们无法估计其背后的风险。所以,这件事情最可怕的地方在于,什么时候交“面子”我们都无法控制,更不能预知风险,甚至连后果都无法承担。当然,我们也是矛盾的。目前,关于人脸识别数据的收集和使用,国际上也存在争议。许多人对他们的照片未经许可被用于培训感到不寒而栗;没有生长的土壤,我们更应该宽容一些,给科技发展更多的时间。争议之下,我们并没有就此止步,相关征收政策也在逐步完善。2015年以来,国家密集出台《安全防范视频监控人脸识别系统技术要求》、《信息安全技术网络人脸识别认证系统安全技术要求》等法律法规,为人脸识别在金融、安防、医疗等领域的普及打下坚实基础,政策出台障碍。国外也是如此。比如旧金山出台了《停止秘密监视》规定,变成了禁止人脸识别的城市。SanFrancisco提出了《停止秘密监视》条例。由于企业也在尽可能地确保隐私,微软成立了一个名为“以太委员会”的内部咨询小组来研究人工智能的应用,并发布了一套人工智能技术发展的伦理原则。无论如何,此刻的我们并非束手无策,更不会因为噎到而放弃进食。提出担忧和质疑是为了改进。至于如何在技术发展和隐私伦理之间找到平衡点,如何建立完善的征集机制,需要我们在未来很长一段时间内去思考和努力。
