当前位置: 首页 > 科技赋能

从流畅到优雅,捷通华盛凌云的情感语音合成技术堪比人声

时间:2024-05-22 14:50:55 科技赋能

电影《Her》中,主角西奥多刚刚结束了一段失败的婚姻。

一次偶然的机会,他接触到了一台配备了人工智能的计算机系统的化身“萨曼莎”。

萨曼莎有着迷人而磁性的声音,时而风趣幽默,时而温柔体贴。

它与我们在现实生活中听到的许多机器人单词和句子的发音相去甚远。

他爱上了这个声音。

这个虚构的角色虽然是由演员配音的,但却透露了一个真实的信息——声音越接近真实人的说话标准,充满情感表现力,就越容易被大众接受。

利用声音的“粘性”为产品打造专属影像,让机器摆脱直白的发声,带来更舒适自然的聆听体验。

这也是当前语音合成技术的发展方向。

捷通华声凭借十余年深厚的技术积累和行业应用,创造了划时代的凌云情感语音合成技术,可以合成更接近真实人的语气、情感等丰富情感的声音。

“+end”格式让每个企业轻松拥有更优美、更有情感的语音合成服务。

在语音合成需求市场中,不同的品牌、公司和服务提供商会根据自己不同的场景和产品特性,使用不同的语音。

例如,银行的智能客服需要甜美、温柔、动人的声音,催收公司则需要真诚、略带甜美的声音。

严厉的声音。

语音合成的个性化、情感化已成为当今市场的迫切需求。

为了打造出高品质的语音,让用户喜欢,对声音形成“粘性”,捷通华声采用最新的深度学习技术建模,配合高品质声码器,产生个性细节丰富的语音效果和语气感。

现实。

情感语音合成技术采用高度自动化的数据处理和注释。

用户只需提供自己喜欢的录音即可快速定制声音库。

同时,捷通华声十几年积累了大量的领域词库和预选音库,可以为金融证券、天气预报、体育赛事、公交运输、航空等众多领域提供更多信息。

、税务、POI、排队等。

专业语音合成播报,客户可以快速轻松定制符合自身产品属性和形象的语音,为产品赋能。

语音情感新技术引领行业。

传统的语料数据处理方法是人工精准标注,需要大量的人力。

捷通华盛采用先进的人工智能技术,通过计算机程序进行预处理,然后进行人工修正,大大提高了工作效率。

在核心技术方面,捷通华声也达到了行业领先水平:在声学模型训练方面:高度鲁棒的预处理和建模框架,减少了之前对录音风格和稳定性的严格限制,让普通人也能说话自然而刻意的情感表达和性格模仿都可以通过训练来产生逼真和稳定的效果。

语音合成效果方面:凌云情感语音合成技术发布了多样化、个性化的声音库:童声有夸张俏皮的卡通配音,也有真实儿童的可爱学字;女声有林志玲般的低语,还有大气磅礴的宣告,充满优雅;男声既有新闻主播式的耿直报道,又有网络主播式的踏实踏实的语气,为各种应用场景提供合适的声音。

多语言合成:凌云语音合成技术全面支持中文、粤语、维吾尔语、英语、日语、德语、法语等21种语言。

完整的用户自定义系统,可以弥补基础合成的不足,保证合成效果稳定在高水平;用于阅读带有中国口音的英语的自定义词汇表可确保中英文混合时的无缝自然过渡。

十多年来,捷通华盛一直专注于技术研发和创新。

十多年来,捷通华盛一直专注于技术研发和创新。

依托国内领先的凌云语音合成技术,捷通华声已占据国内智能语音市场50%以上的份额:早在2018年,捷通华声就推出了代表国际领先水平的jTTS世纪版。

随后,捷通华声成为建设银行、农业银行唯一的语音合成供应商,全国99%的高铁车站也采用凌云语音合成进行广播。

同时,捷通华声成功服务北京奥运会,上海世博会也采用凌云语音合成技术进??行赛事转播。

截止2020年,捷通华声已成功为数千家企业提供语音合成技术。

让声音自然、富有情感、富有表现力一直是语音合成技术的一大难点。

如今,捷通华声正在利用新推出的凌云情感语音合成技术,为金融、电信、能源、交通、政府、医疗、互联网等数千家企业提供更好的服务,全新体验的语音合成产品引起了巨大的兴奋变化。

无论是智能客服、地图导航、机场广播的甜美女声,还是新闻播报、听书读书的清爽男声,智能家电或机器人的可爱童声,凌云情感语音合成技术都可以快速实现。

让不同需求的企业都能拥有它。

更有竞争力的产品让大众体验到动情、更感性的聆听体验。

在升级核心技术的同时,捷通华盛还着力打造更加稳定、便捷的私有云能力平台和公有云开放平台,从而形成从底层数据、到核心技术、到服务应用的三层业务架构。

,极大地满足了合作伙伴的多方位需求,方便企业用户实现产品的快速无缝演进。