微软自定义神经语音技术已允许用户创建高度逼真、类似于人类的声音

时间：2023-03-21 01:15:34 科技观察

Microsoft的自定义神经语音技术允许用户创建高度逼真的、类似人类的声音（自定义神经语音）-文本到语音功能已普遍可用。该功能将允许用户使用微软开创性的神经文本转语音模型为应用程序创建高度逼真、类人的自定义语音。由于创造的声音如此逼真，微软限制了允许用户负责任地使用该技术的权限。微软表示，“作为微软对负责任的人工智能承诺的一部分，我们设计并发布自定义神经语音，以保护个人和社会的权利，促进透明的人机交互，抵制有害的deepfakes和误导性内容的扩散。为此，我们对自定义神经语音的访问和使用有限。”要创建自定义语音，您只需录制音频并将其作为训练数据上传。Azure语音服务将为您的录音创建独特的语音调整。自定义神经语音提供代表您品牌的自然声音，允许用户与应用程序互动一种自然的方式。Microsoft强调以下客户已经在使用这一最新的TTS功能。AT&T/WarnerBros.：他们最近在德克萨斯州达拉斯的AT&T体验店推出了首创的创意和互动体验，客户可以直接与BugsBunny对话。Progressive：利用标志性Progressive保险代言人Flo的声音，创建了Flo聊天机器人，以简化客户查询并提供个性化体验。Duolingo：为了让学习一门新语言变得可行和适用，Duolingo使用课程创造各种程式化的声音。

上一篇：未来网络空间混合威胁的三大趋势_0

下一篇：迈向全栈开发，程序员必须知道的19个框架和库

微软自定义神经语音技术已允许用户创建高度逼真、类似于人类的声音相关文章