当前位置: 首页 > 科技观察

微软旷视人脸识别100%失灵!照片“隐形斗篷”帮你保护照片隐私数据

时间:2023-03-20 02:04:36 科技观察

本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。左图,右图,你能看出区别吗?事实上,该算法已经悄悄地对右边的照片进行了细微的修改。但就是这样一个肉眼看不见的干扰,却能100%骗过微软、亚马逊、旷视等全球最先进的人脸识别模型!那么有什么意义呢?这意味着你再也不用担心po的网上照片被一些软件扒出来,打包,分类,卖几毛钱养AI了。这是芝加哥大学的最新研究:对肉眼看不见的照片稍加修饰,就能让你的脸成功“隐形”。这样一来,即使你在网上的照片是非法抓拍的,用这些数据训练出来的人脸模型也无法真正成功地识别出你的脸。此次为照片穿上“隐形衣”的研究,旨在帮助网友在分享照片的同时有效保护自己的隐私。因此,“隐形斗篷”本身就得“隐形”,以免影响照片的视觉效果。换句话说,这个“隐形斗篷”实际上是对照片进行像素级的小修改,以欺骗AI的审视。事实上,对于深度神经网络,一些带有特定标签的小扰动可以改变模型的“认知”。例如,在图像中添加一点噪声会将熊猫变成长臂猿:Fawkes利用了此功能。设x指的是原图,xT是另一种/其他人脸照片,φ是人脸识别模型的特征提取器。Fawkes具体设计如下:步骤1:选择目标类型T指定用户U,Fawkes的输入是用户U的照片集,记为XU。从包含许多特定类标签的公共人脸数据集中,随机选择K个候选对象类型的机器图像。使用特征提取器φ计算每个类k=1…K的特征空间的中心点,表示为Ck。然后,Fawkes会在K个候选集中选择特征表示中心点与XU中所有图像的特征表示差异最大的类,作为目标类型T。第二步:计算每个的“隐形斗篷”image在T中随机选取一张图像,对x计算“隐形斗篷”δ(x,xT),根据公式进行优化。其中|δ(x,xT)|<ρ。研究人员使用了DDSIM(结构差异指数)方法。在此基础上,隐身斗篷的生成可以保证隐身后的图像在视觉效果上与原图像高度一致。实验结果表明,无论人脸识别模型训练得多么棘手,福克斯都能提供95%以上的有效防护率,确保用户的人脸不被识别。即使在人脸识别模型的训练集中加入一些不小心泄露的未遮挡照片,通过进一步扩展设计,Fawkes也能提供80%以上的反识别成功率。在MicrosoftAzureFaceAPI、AmazonRekognition和MegviiFaceSearchAPI等最先进的人脸识别服务面前,Fawkes的“隐身”效果达到了100%。目前,Fawkes是开源的,可用于Mac、Windows和Linux。安装简单方便这里以Mac系统为例,简单介绍一下软件的使用方法。使用的笔记本是配备1.1GHz双核IntelCorei3处理器的MacBookAir。首先,我们从GitHub上下载压缩安装包并解压。接下来,将所有要修改的照片放入一个文件夹中,记住路径。以桌面上一个名为test_person的图片文件夹为例,里面放了三张图片,其中一张是两个人。这里的图片路径是~/Desktop/test_person,这个是根据你的图片保存的位置来决定的。接下来,在启动板中打开一个终端并转到tarball所在的文件夹。注意,如果MacOS是Catalina,需要先修改权限,以管理员身份运行,sudospctl--master-disable即可。这里我们的压缩包直接放在下载的文件夹下,直接cd下载即可。进入下载文件夹后,进入./protection-d文件路径(文件路径为图片文件夹所在位置,这里输入~/Desktop/test_person),运行生成图片的“隐形斗篷”。嗯?嗯,看起来它可以识别一张图片中的2张面孔。慢跑……据笔者了解,生成一件“隐形斗篷”的平均速度在40秒左右,算是比较快的了。如果电脑配置足够好,应该会更快。不过,双核也不奢侈……大家耐心等待。从时间上来看,处理速度还是可以接受的。完毕!从图上看,电脑生成3张图的“隐形斗篷”大概用了7分钟(肯定是我电脑太慢了)。让我们看一下生成的结果。可以看到文件夹中的3张图片都是生成后缀名为_low_cloaked的图片。虽然介绍说生成的后缀是_mid_cloaked图片,但是软件提供的模式有“low”、“mid”、“high”、“ultra”和“custom”,所以不同的模式会有不同的后缀。以为例,看看实际效果。两张照片几乎没有区别,并没有变丑,而且脸上的皱纹看起来更光滑了。这样,我们就可以放心地将处理后的人脸照片放到网上了。即使被恶意利用,窃取的数据也不是我们的人脸数据,不用担心隐私被泄露。不仅如此,这款软件还可以“修复”你在社交网站上发布的各种人脸数据。比如,你曾经是一个很棒的冲浪者,你曾经在社交网站上发布过很多你的生活照片——这些照片可能已经被软件剥离干净了……不用担心。如果你把这些处理过的图片放上去,这些自动人脸识别模型就会想加入更多的训练数据来提高准确率。这时候,穿着“隐形斗篷”的图片在AI眼中就更加“优秀”了,原图会被当做离群点丢弃。第一篇中文论文是毕业于北京十一中,刚刚获得芝加哥大学学士学位的中国学生单思雄。将于9月入学攻读博士学位,师从赵彦斌教授和HeatherZheng教授。作为芝加哥大学SAND实验室的成员,他的研究重点是机器学习和安全交互,例如如何通过使用未检测到的轻微数据扰动来保护用户隐私。从Shan的推文来看,他一直致力于为我们在这个“透明”世界中的小小隐私而战。该论文的共同作者EmilyWenger也来自芝加哥大学SAND实验室。她正在攻读CS博士学位。她的研究方向是机器学习与隐私的交互。她目前正在研究神经网络对隐私的弱点、局限性和可能的??影响。项目链接:https://github.com/Shawn-Shan/fawkes/tree/master/fawkes论文链接:http://people.cs.uchicago.edu/~ravenben/publications/pdf/fawkes-usenix20.pdf