智能语音技术的快速发展,让AI合成语音更加自然、逼真,让越来越多的企业实现与客户的多模态沟通互动。
基于微软Azure云平台打造的语音定制服务定制的专属个性化语音已广泛应用于语音助手、聊天机器人、在线学习、有声读物或新闻广播等多种使用场景。
传统上,完成定制声音需要很长时间并且非常复杂。
演讲者需要录制数千个句子作为训练数据,然后拥有深度神经网络和语音合成专业背景的专家根据客户的语音数据训练和调优声学模型和语音合成器。
整个过程往往需要数据。
几个月的时间。
微软推出的基于深度神经网络的语音定制服务是业界的先驱。
需要的训练数据较少,只需句子语料数据(约30分钟);训练和调优的难度和复杂性被简化,甚至没有深度。
具有神经网络和语音合成专业背景的用户也可以实现自助训练,达到与人类发音相媲美的效果。
用户只需注册Azure云平台Speech Studio并申请深度神经网络声音定制权限即可。
然后,他们可以一键完成个性化声音模型的训练,并快速部署API,适合各种场景的应用开发。
除了平台自助服务外,微软专家还可以为有需求的客户提供全流程的语音定制支持和辅导,包括语音肖像设计、演讲者选择、录音指导、模型评估和调优等,帮助英国BBC广播公司公司、Swisscom Switzerland 电信、AT&T 的 Warner Bugs Bunny 体验店、Progressive Insurance Company、Duolingo 以及国内的小米和 Human Express 等不同行业的用户都成功创建了自己的定制声音。
美国AT&T体验店的兔八哥语音助手采用了微软的语音定制服务,使用兔八哥配音演员的授权声音来创建这个虚拟动画角色的语音模型。
它以有趣的方式与客户交谈,回答常见问题,增强客户粘性。
微软AI语音技术让AT&T体验店里的兔八哥栩栩如生:Flo是美国Progressive Insurance Company创建的虚拟销售助理。
她性格乐观开朗、俏皮可爱。
几年前,美国Advance保险公司邀请专业配音演员使用微软的语音定制服务为Flo配音,让Flo能够自然地交流和互动,深受客户喜爱,打破了大众对机械手感的固有认知。
智能语音客服。
虚拟销售助理弗洛语音:定制了9种独特的卡通角色语音,让语言学习变得更有趣。
同时,这项服务支持多语言能力,可以让每个卡通人物同时讲英语、西班牙语、法语、德语、日语等多种语言。
微软的AI语音技术为Duolingo的9个各具特色的卡通人物定制个性化的声音。
人工智能创新不仅对产业发展产生深远积极影响,还将逐步融入人们的日常生活,让每个人都享受到它。
科技带来的便利。
作为一家平台公司,在降低技术门槛、推广普惠技术的同时,微软还坚持负责任地使用人工智能,以赢得信任的方式设计人工智能,并基于公平、可靠与安全、隐私与安全、六大基本道德宽容、透明和责任原则指导着人工智能的开发和应用。
要了解有关 Microsoft 基于深度神经网络的声音定制技术和 Microsoft Azure 认知服务的更多信息,请单击了解。