创造假现实的技术

时间：2024-02-27 18:11:37 技术突破

　　如今，任何孩子都可以用手机或平板电脑实时显示自己的脸部扭曲版本，或者已经转换为动画动画片的扭曲版本，但这是她脸部表情以及嘴唇运动以惊人的表现精确。在互联网上，许多应用程序像面部掉期一样激增，它交换了用户的面孔或faceApp的面孔，这些脸部会立即修饰，恢复或衰老。好莱坞大型作品向我们展示了死者或女演员如何重生，例如《星球大战》中的嘉莉·费舍尔（Carrie Fisher）。

FaceApp可以恢复活力，年龄，修饰或改变性别。图片来源：Tudortulok

　　所有这些都是新一代视听编辑工具的一部分，该工具利用了人工智能（AI）的进步，并在数字操作中实现了令人难以置信的现实主义水平。但是，除了娱乐性的使用外，这些技术还将对假新闻的关注达到了一个全新的水平，这挑战了传统上授予视频剪辑的信誉。2017年12月，该网站主板报道说，具有别名Deepfakes的Reddit用户将诸如Gal Gadot或Scarlett Johansson等女演员的面孔插入了色情视频。

　　这些贬低的骗局的创建基于开源深入学习软件，例如Google的TensorFlow。但是，今年的Fakeapp应用程序推出，可以为拥有家用计算机的任何人创建这些“深击”。然而，尽管结果令人惊叹，但这些自制作品尚未在面部运动或表达的自然性中达到完美。

　　管理特朗普的表情

　　另一个不同的情况是看到计算机科学实验室中光线的算法。在这种情况下，结果甚至可以欺骗最敏锐的眼睛。2016年，由慕尼黑技术大学Matthias Niessner领导的一支团队发布了其Face2face工具的结果，该工具捕获了一个模型的现场表达式，该模型将在录制的视频中实时移植给另一个人的脸。研究人员设法指导自己的面孔，乔治·W·布什（George W.Niessner告诉Open -Mind说：“我们由此产生的合成模型非常接近输入，以至于很难区分合成面和真实面部。”

　　Face2face捕获了要移植到他人脸的面部表情。信用：?? MATTHIAS NIESSNER

　　同样壮观的是华盛顿大学保罗·艾伦（Paul G. Allen）计算机科学与工程学院的一支团队在2017年取得的结果。他们开发的神经网络分析了一个人的视频，以学习他们的发声手势。接下来，系统从音频剪辑开始，以生成一个人出现的视频，将嘴唇的运动与单词同步。在示例视频中，几乎不可能猜测巴拉克·奥巴马（Barack Obama）发表演讲的形象是数字创作。

　　根据研究的合着者史蒂夫·塞兹（Steve Seitz）的说法，该系统可用于生成逼真的视频，以避免当前视频会议中的带宽大量消耗。合着者Ira Kemelmacher-Shlizerman添加了另一种可能的娱乐用途：“能够通过通过音频创建视觉效果来与虚拟现实中的历史人物进行对话。”但是，Seitz澄清说，他的目的并没有扭曲现实：“我们非常有意识地决定不走上别人的话语的道路。”

　　以数字方式重现声音

　　但是，如果有人想创建恶意的假音频或视频，事实是他们可以找到必要的工具。2016年，公司Adobe介绍了Voco，这是一个声音编辑的平台（尚未发布到市场），仅20分钟的聆听学习就可以模拟任何人的声音，以便可以将任何短语都放入他们的声音中只需键入即可。从那时起，其他类似且越来越强大的工具出现了，例如加拿大AI启动Lyrebird的工具，该工具仅使用一分钟的音频学习，并允许任何Internet用户数字地重新创建自己的声音。最近，来自中国搜索引擎Baidu的研究人员发布了一个神经网络的结果，该网络从仅几秒钟的材料开始就夹着一个人的声音。

　　Lyrebird创建了Barack Obama声音的数字副本。图片来源：Lyrebird

　　自Adobe于1990年推出了Photoshop的第一个版本以来，出于恶意或欺诈目的进行修饰的照片已成为一个问题。如今，新的基于AI的系统正在以一种流放的速度改进，以至于将真实的音调与音频和视频文档中的假货区分开来变得越来越困难。

　　面对这种担忧，这些工具的发明者的响应已经变化。例如，Lyrebird总结了它的信息，即它的意图是诚实的，公众对他的产品的访问将阻止滥用：“我们正在向任何人提供技术，我们正在逐步介绍它，以便社会适应它，并利用它的技术良好的积极方面，同时阻止潜在的负面应用。”他们在网站上说。就其本身而言，Adobe的发言人说，该公司正在采用水印风格的系统，以确保可以检测到欺诈性的音频剪辑。

　　检测假视频

　　事实是，视听伪造技术的进步将同时导致开发更好的技术以发现欺诈。Seitz和他的合作者指出，他们的系统也可以适应假视频的检测。尼斯纳（Niessner）解释说，他的工作的一部分是与毒药同时制造解毒剂：“我们的努力包括在录像中发现编辑，以验证剪辑的真实性。”

面部表情的分析允许将可疑视频与另一个真实的视频进行比较。学分：Marlon Barrios Solano

　　研究人员解释说，面部表情及其过渡在每个人的独特之处与书法一样独特，并且对面部系统特征的分析允许将可疑视频与另一个真实的人进行比较，从揭示操纵。归根结底，正如Niessner所建议的那样，基于计算机的视听娱乐已经存在数十年了，并且可能对其目的的变态不应掩盖这些技术的承诺。他总结说：“我们希望提供积极的收获。”

　　哈维尔·亚纳斯（Javier Yanes）

　　@yanes68

上一篇：70个超音速年

下一篇：新兴语言：人工智能时代的常识

创造假现实的技术相关文章