本文转载自公众号《核心阅读》(ID:AI_Discovery)。十年前,一些最基本的AI算法(例如图像识别)需要数据中心通常具有的计算能力才能使用。如今,这些工具可以在智能手机上使用,而且功能更强大、更先进。与核能或火箭推进一样,人工智能被认为是一种“两用”技术,即它既可以带来好处,也可以造成伤害。不久前,Vice报道了人工智能危害的最新例子:编码人员正在用性虐待图像训练算法来制作色情内容。该报告详细介绍了这位匿名博士生如何编制非自愿图像数据集,并将其与现有算法相结合以生成自定义视频。利用人工智能生成色情作品的创作者将这些作品发布在Pornhub和OnlyFans等平台上。他向Vice透露,他使用了StyleGAN2,这是一种由Nvidia构建的开源算法。如果你曾经在网上看到过极其逼真的假人脸(比如ThisPersonDoesNotExist.com),那么它们很有可能是由StyleGAN2生成的。这项技术不是一夜之间出现的。从一些最早的现代图像生成算法的出现,到人工智能生成色情这种现象的出现,都有迹可循。来源:GettyImages飞跃生成对抗网络(GAN)2014年,图像生成算法的能力突飞猛进,生成对抗网络(GAN)应运而生。一位名叫伊恩·古德费洛(IanGoodfellow)的AI研究人员在酒吧里争论时想到了这样的话:让算法相互竞争以产生最佳结果。生成图像需要“生成器”和“鉴别器”。生成器生成图像,鉴别器将根据其在训练期间接触到的真实图像来判断图像是真实的还是假的。鉴别器只接受最真实的图像,确保最终结果是AI生成图像中最好的。让技术变得有用Goodfellow对GAN的原始研究在行业基准测试中表现良好,但他创建的许多图像仍然看起来一团糟(以抽象和不人道的方式),令人无法接受。表达创作者想法的方式)。2016年,其他研究人员开始试验该技术,并找到了生成逼真图像的方法,尽管分辨率较低。当时,有一篇优秀的论文描述了研究人员如何生成逼真的卧室图像,以及他们首次尝试生成人脸。这项研究再次表明,GAN可以根据训练期间接触到的数据进行调整。这种技术能够生成逼真的卧室图像以及人脸图像,这意味着GAN实际上可以识别各种不同类型图像中的模式。Deepfakes正变得越来越流行。基于生成对抗网络架构,目前有几种免费和开源的人脸合成方法。随着亚马逊网络服务(AWS)和谷歌云(GoogleCloud)等云服务变得更容易获得,训练这些算法的能力也变得更容易获得。在人工智能研究领域,最著名的是英伟达团队开发的StyleGAN。它于2018年12月发布,虽然它能够生成令人难以置信的高质量假脸图像,但这些图像上仍然出现奇怪的模糊和数字伪影。不到一年后,Nvidia团队发布了StyleGAN2。为了防止这些模糊和伪影,并提高图像保真度,此版本修复了适应不同领域的算法架构。通过用色情图像(不仅仅是面部图像)训练算法,系统能够生成它可能从未打算生成的东西。生成对抗网络也被用于通过DeepFaceLab和Wav2Lip等开源项目专门研究deepfakes。使用这些服务真的很容易:了解如何使用Wav2Lip项目网站上的一行代码自动将视频角色口型同步到任何音频文件。这些技术仍处于起步阶段,但它们会变得更加复杂和更具说服力。有些应用确实很有趣,但是目前这些算法更容易被一些别有用心的人用来做一些坏事。如果什么都不做,deepfakes的危害可能会超过它们微薄的娱乐价值。
