当前位置: 首页 > 科技观察

人工智能配音演员如何“以假乱真”

时间:2023-03-12 22:56:51 科技观察

人工智能语音创业公司Sonantic表示,它在深度音频模仿方面取得了小的突破,创造了一种可以表达微妙情绪的合成语音,如戏弄和调情。该公司表示,其进步的关键是将非语言声音融入音频:训练AI模型重现那些微小的呼吸感觉,例如微小的嘲笑和半掩半掩的笑声,为AI的声音提供了真实的生物标记。Sonantic的研究目标是看看人工智能是否可以模拟微妙的情绪,如愤怒、恐惧、快乐、悲伤和情绪化。Sonantic的首席执行官ZeenaQureshi将公司的软件描述为“声音的Photoshop”。它的界面允许用户输入他们想要合成的语音,指定语音的语调,并从一组人工智能语音中进行选择,其中大部分语音都是以人类演员为蓝本的。它绝不是一款独特的产品(Descript等竞争对手也销售类似产品),但Sonantic表示定制化水平比其竞争对手更深。情绪选择包括愤怒、恐惧、悲伤、幸福和快乐。最新的选项现在包括调情、羞怯、戏弄和吹嘘。“导演模式”允许进行更多调整:可以调整声音的音高,可以上下调节声音的强度,以及那些非语言的声音,如笑声和呼吸声。这是Sonantic的主要特点:指挥、控制、编辑和塑造表演的能力。目前的客户主要是游戏工作室和娱乐工作室,但该公司正在扩展到其他行业。此前,它刚刚与奔驰达成合作(为其定制车载数字助理)。然而,与此类技术的常见情况一样,Sonantic成就的真正基准是其机器学习模型的音频,而不是那些精美的、准备好公关的演示。人性化优化,就是将AI语音的效果发挥到极致。许多人工智能工作都是如此,例如自动驾驶汽车,它们已经成功地实现了非常基本的驾驶自动化,但仍在努力实现人类最后也是最重要的5%的能力。这意味着完全自动化、完全可信的AI语音合成还有很长的路要走。但除了技术本身的问题外,Sonantic的研究还提出了其他问题——比如,部署调情人工智能的道德规范是什么?以这种方式操纵观众是否公平?为什么Sonantic会把调情描绘成一个女人?(在男性主导的科技行业,这种选择算作微妙的性别歧视。)Sonantic表示他们对女声的选择只是受到了SpikeJonze2013年的电影《她》(Her)的启发。影片中,主人公爱上了一位名叫萨曼莎的人工智能女助手。另一方面,Sonantic表示,它认识到新技术发展带来的道德困境,并且对AI语音的使用方式和使用地点非常谨慎。首席执行官库雷希说:“这是我们留在娱乐业务的最大原因之一。它被用在最好的娱乐产品和模拟中。”将AI语音合成与其他娱乐产品进行比较是合理的。毕竟,我们可以分辨真假电影和电视节目(因为它们都是假的)。但同样值得注意的是,人工智能将允许大规模部署此类操作,而较少关注它们在个别情况下的影响。例如,在世界各地(包括国内),人们已经开始与AI聊天机器人建立关系,甚至爱上它。为这些机器人添加AI生成的声音肯定会让它们变得更强大,这引发了关于这些系统和其他系统应该如何设计的问题。如果人工智能的声音可以令人信服地调情,它们会说服你做什么?