今年是智能语音交互技术加速落地的一年。
在常态化防疫要求下,远程会议、在线教育、在线办公已成为人们生活的标配。
这极大地推动了智能语音交互技术的大规模发展。
为了赋予合成语音更丰富的情感表现力和个性化,打造极致的AI语音体验,表贝科技近期对语音合成技术进??行了又一次“升级改造”,并于3月25日完成了TTS3.0版本的验收,标贝科技官方网站正式上线。
全新技术升级,让AI发音更具表现力,发音效果显着提升。
标贝科技升级的TTS3.0技术,采用全新的非自回归声学模型,发音效果显着提升,适合不同的声音和情绪表达。
判断更准确,输出音质稳定、清晰、流畅、音色表现力强;声码器采用GAN结构,可以高效真实地还原波形,增加合成声音的真实质感。
多音词和停顿更准确。
此外,标贝科技TTS3.0还优化了发音细节。
例如,基于Mask-based Model神经网络多音字模型,对所有多音字进行统一建模,提高了语音合成时多音字发音的准确性;在韵律方面,使用多任务神经网络模型来利用韵律间的差异。
层次关系,在同一模型结构下,建模多个韵律层次,合成语音高低、停顿的处理更加自然流畅。
模型兼容性标贝科技在此TTS3.0中使用了新的声学模型和声码器。
同时保持了对老TTS2.0模式的全部兼容性,最大程度保证系统服务的无缝升级,减少老客户的升级。
产生的开发成本。
更多音色加持,帮助语音场景快速落地。
此前,表贝科技基于海量语音数据和TTS1.0、TTS2.0技术优势,已推出中英文男、女、老人、儿童等多音调声音。
、中英混合阅读、小语种、方言等多语言解决方案,并支持用户定制需求,可满足车载、音频阅读、智能客服、新闻等多个领域大多数客户的应用需求媒体、影视解说等,与国内外100多家企业客户建立合作,服务项目共计100多个。
此次TTS3.0技术升级,标贝科技经过多次大规模的产品体验评测,再次扩充了音库和场景化解决方案。
官网已正式上线儿童声音、少男少女声音等9大声音,深度覆盖有声朗读、语音交互、智能客服等领域更多场景的需求。
表贝科技新的音调列表与TTS1.0、TTS2.0相同。
此次TTS3.0还支持SDK、流/非流API、MRCP协议等对接形式。
接口同步/异步调用,整体合成速度更快。
相比之前提升了1.6倍,完整的效果帮助开发者快速实现声音场景应用。
丰富情感表达,助推有声阅读创作 近年来,我国有声读物市场发展迅速。
各大有声平台、阅读应用、视频网站甚至传统出版业也纷纷尝试进军有声读物市场。
相关数据显示,2018年中国有声读物市场规模达95.6亿元,同比增长50.3%。
随着5G时代的到来,有声阅读势必会引起更大的爆发。
标贝科技TTS3.0结合了最新的语音技术、海量文本和声学数据以及大规模计算能力,使机器的语音情感表达更加真实自然,完全满足当前音频阅读场景的需求。
比如有声小说中最难表达的人物情感和对话,TTS3.0技术处理了很多细节,让合成的语音突出了对话的重音和语气,让人物的情感表达更加细腻,恰到好处。
就像真人“配音”一样,让观众更直接地理解小说情节,进一步享受听觉“盛宴”。
作为一家专注于智能语音交互和AI数据服务的公司,表贝科技经过五年的发展,推出了AI数字虚拟人、智能客服、智能媒体等一站式解决方案。
在产品方面,标贝科技推出了标贝科技。
悦读和恐龙面包两大C端产品,从原来的单点语音技术服务升级为融合语音、图像、虚拟图像等多个技术模块的行业解决方案。
标贝科技的TTS3.0技术升级迎合了语音合成发展的新趋势,加速智能语音应用并提高效率,在极致用户体验上实现新突破。
未来,表贝科技将继续深耕智能语音技术的研发,为更多语音合成应用场景提供服务。