当前位置：首页 > 科技赋能

标贝科技语音合成技术再次升级，倾力打造AI语音极致体验

时间：2024-05-20 00:58:44 科技赋能

今年是智能语音交互技术加速落地的一年。

在常态化防疫要求下，远程会议、在线教育、在线办公已成为人们生活的标配。

这极大地推动了智能语音交互技术的大规模发展。

为了赋予合成语音更丰富的情感表现力和个性化，打造极致的AI语音体验，表贝科技近期对语音合成技术进??行了又一次“升级改造”，并于3月25日完成了TTS3.0版本的验收，标贝科技官方网站正式上线。

全新技术升级，让AI发音更具表现力，发音效果显着提升。

标贝科技升级的TTS3.0技术，采用全新的非自回归声学模型，发音效果显着提升，适合不同的声音和情绪表达。

判断更准确，输出音质稳定、清晰、流畅、音色表现力强；声码器采用GAN结构，可以高效真实地还原波形，增加合成声音的真实质感。

多音词和停顿更准确。

此外，标贝科技TTS3.0还优化了发音细节。

例如，基于Mask-based Model神经网络多音字模型，对所有多音字进行统一建模，提高了语音合成时多音字发音的准确性；在韵律方面，使用多任务神经网络模型来利用韵律间的差异。

层次关系，在同一模型结构下，建模多个韵律层次，合成语音高低、停顿的处理更加自然流畅。

模型兼容性标贝科技在此TTS3.0中使用了新的声学模型和声码器。

同时保持了对老TTS2.0模式的全部兼容性，最大程度保证系统服务的无缝升级，减少老客户的升级。

产生的开发成本。

更多音色加持，帮助语音场景快速落地。

此前，表贝科技基于海量语音数据和TTS1.0、TTS2.0技术优势，已推出中英文男、女、老人、儿童等多音调声音。

、中英混合阅读、小语种、方言等多语言解决方案，并支持用户定制需求，可满足车载、音频阅读、智能客服、新闻等多个领域大多数客户的应用需求媒体、影视解说等，与国内外100多家企业客户建立合作，服务项目共计100多个。

此次TTS3.0技术升级，标贝科技经过多次大规模的产品体验评测，再次扩充了音库和场景化解决方案。

官网已正式上线儿童声音、少男少女声音等9大声音，深度覆盖有声朗读、语音交互、智能客服等领域更多场景的需求。

表贝科技新的音调列表与TTS1.0、TTS2.0相同。

此次TTS3.0还支持SDK、流/非流API、MRCP协议等对接形式。

接口同步/异步调用，整体合成速度更快。

相比之前提升了1.6倍，完整的效果帮助开发者快速实现声音场景应用。

丰富情感表达，助推有声阅读创作近年来，我国有声读物市场发展迅速。

各大有声平台、阅读应用、视频网站甚至传统出版业也纷纷尝试进军有声读物市场。

相关数据显示，2018年中国有声读物市场规模达95.6亿元，同比增长50.3%。

随着5G时代的到来，有声阅读势必会引起更大的爆发。

标贝科技TTS3.0结合了最新的语音技术、海量文本和声学数据以及大规模计算能力，使机器的语音情感表达更加真实自然，完全满足当前音频阅读场景的需求。

比如有声小说中最难表达的人物情感和对话，TTS3.0技术处理了很多细节，让合成的语音突出了对话的重音和语气，让人物的情感表达更加细腻，恰到好处。

就像真人“配音”一样，让观众更直接地理解小说情节，进一步享受听觉“盛宴”。

作为一家专注于智能语音交互和AI数据服务的公司，表贝科技经过五年的发展，推出了AI数字虚拟人、智能客服、智能媒体等一站式解决方案。

在产品方面，标贝科技推出了标贝科技。

悦读和恐龙面包两大C端产品，从原来的单点语音技术服务升级为融合语音、图像、虚拟图像等多个技术模块的行业解决方案。

标贝科技的TTS3.0技术升级迎合了语音合成发展的新趋势，加速智能语音应用并提高效率，在极致用户体验上实现新突破。

未来，表贝科技将继续深耕智能语音技术的研发，为更多语音合成应用场景提供服务。

标贝科技语音合成技术再次升级，倾力打造AI语音极致体验相关文章