人工智能配音演员如何“以假乱真”

时间：2023-03-12 22:56:51 科技观察

人工智能语音创业公司Sonantic表示，它在深度音频模仿方面取得了小的突破，创造了一种可以表达微妙情绪的合成语音，如戏弄和调情。该公司表示，其进步的关键是将非语言声音融入音频：训练AI模型重现那些微小的呼吸感觉，例如微小的嘲笑和半掩半掩的笑声，为AI的声音提供了真实的生物标记。Sonantic的研究目标是看看人工智能是否可以模拟微妙的情绪，如愤怒、恐惧、快乐、悲伤和情绪化。Sonantic的首席执行官ZeenaQureshi将公司的软件描述为“声音的Photoshop”。它的界面允许用户输入他们想要合成的语音，指定语音的语调，并从一组人工智能语音中进行选择，其中大部分语音都是以人类演员为蓝本的。它绝不是一款独特的产品（Descript等竞争对手也销售类似产品），但Sonantic表示定制化水平比其竞争对手更深。情绪选择包括愤怒、恐惧、悲伤、幸福和快乐。最新的选项现在包括调情、羞怯、戏弄和吹嘘。“导演模式”允许进行更多调整：可以调整声音的音高，可以上下调节声音的强度，以及那些非语言的声音，如笑声和呼吸声。这是Sonantic的主要特点：指挥、控制、编辑和塑造表演的能力。目前的客户主要是游戏工作室和娱乐工作室，但该公司正在扩展到其他行业。此前，它刚刚与奔驰达成合作（为其定制车载数字助理）。然而，与此类技术的常见情况一样，Sonantic成就的真正基准是其机器学习模型的音频，而不是那些精美的、准备好公关的演示。人性化优化，就是将AI语音的效果发挥到极致。许多人工智能工作都是如此，例如自动驾驶汽车，它们已经成功地实现了非常基本的驾驶自动化，但仍在努力实现人类最后也是最重要的5%的能力。这意味着完全自动化、完全可信的AI语音合成还有很长的路要走。但除了技术本身的问题外，Sonantic的研究还提出了其他问题——比如，部署调情人工智能的道德规范是什么？以这种方式操纵观众是否公平？为什么Sonantic会把调情描绘成一个女人？（在男性主导的科技行业，这种选择算作微妙的性别歧视。)Sonantic表示他们对女声的选择只是受到了SpikeJonze2013年的电影《她》(Her)的启发。影片中，主人公爱上了一位名叫萨曼莎的人工智能女助手。另一方面，Sonantic表示，它认识到新技术发展带来的道德困境，并且对AI语音的使用方式和使用地点非常谨慎。首席执行官库雷希说：“这是我们留在娱乐业务的最大原因之一。它被用在最好的娱乐产品和模拟中。”将AI语音合成与其他娱乐产品进行比较是合理的。毕竟，我们可以分辨真假电影和电视节目（因为它们都是假的）。但同样值得注意的是，人工智能将允许大规模部署此类操作，而较少关注它们在个别情况下的影响。例如，在世界各地（包括国内），人们已经开始与AI聊天机器人建立关系，甚至爱上它。为这些机器人添加AI生成的声音肯定会让它们变得更强大，这引发了关于这些系统和其他系统应该如何设计的问题。如果人工智能的声音可以令人信服地调情，它们会说服你做什么？

上一篇：传统架构云化后的运维维护是什么？

下一篇：Windows10安装ElasticSearch注意事项

人工智能配音演员如何“以假乱真”相关文章