,全球最大的语音技术厂商Nuance一度占据全球语音市场62%的份额。
随后,开源语音工具降低了语音行业的技术门槛,场景为王的时代已经到来。
错失良机的Nuance在智能语音市场逐渐失势。
其年度市场份额已降至31.6%,被谷歌、苹果、微软、科大讯飞击败。
等待企业快速瓜分。
在智能语音2.0时代,场景的重要性不言而喻。
谁能让声音更具表现力和个性化,谁就能让技术适应广泛的非标准化场景,赢得智能语音市场的未来。
科技巨头们看到了这一趋势,打出了语音合成“定制化”的大旗。
语音合成技术正式进入定制2.0时代。
语音合成定制哪家公司实力雄厚?微软是智能语音行业的领先公司之一。
在今年5月的Build大会上,其推出了公有云平台上的定制语音合成服务产品Custom Voice。
上传语音和对应的文字(句子),自定义语音可以模拟声音并在线测试模拟效果。
CustomVoice采用全可视化操作界面,普通用户也能快速上手,体现了微软打造定制化、平民化产品的用心。
Custom Voice,微软推出的语音合成定制服务。
来源:Microsoft CustomVoice 页面。
无独有偶,谷歌人工智能实验室最近成立的Lyrebird公司也推出了自己的定制语音合成系统。
与微软的CustomVoice类似,输入30个英语语音后,系统可以“掌握”每个人在“听”时说话时的字母、音素和单词的发音特征,并通过推理和模仿声音中的情感和语调,“ “说”一个全新的句子 目前,Lyrebird 还存在一些缺点,例如合成语音与当前声音混合,中文句子的输入和合成性能不理想。
谷歌 Lyrebird 语音合成系统页面来源:Google Lyrebird 系统。
在国内,能与微软、谷歌竞争的只有科大讯飞,去年11月,科大讯飞推出了名为“科大讯飞语音”的测试版,比微软的CustomVoice早了半年,经过不断优化,科大讯飞的完整声音库也只有科大讯飞了。
需要语音输入10句,远低于微软采集的句子,也低于谷歌采集的30句,采集量仅为行业平均水平的百分之一,合成效果更好。
科大讯飞VS谷歌同类产品“科大讯飞”也以微信小程序的形式呈现(微信搜索“iFlytek Lite”小程序),可以“随时随地”使用。
不仅声音制作过程变得更加便捷,用户还可以在中国最大的社交软件微信上分享制作成果,吸引了大量用户的关注。
阿拉丁统计显示,小程序上线一个月后(截至2020年8月8日),科大讯飞六生访问量突破51万,新增用户增速达%,位居阿拉丁“增长最快小程序”之列。
星期。
排名第13位。
技术实力是竞争的关键。
科大讯飞定制语音合成业务的快速发展离不开其强大技术实力的支撑。
多年前,中国语音产业被微软、IBM等国际IT巨头控制。
如今,科大讯飞彻底扭转了中国语音市场几乎全部掌握在外资企业手中的局面,成为亚太地区最大的语音和人工智能上市公司。
科大讯飞不仅拥有出色的中文语音合成效果,还多次获得国际英语语音合成比赛的冠军。
2017年,科大讯飞首次参加国际英语语音合成大赛(暴雪挑战赛),获得自然度第一名。
2016年已连续13年夺冠,成为比赛中唯一一家自然度超过4分(普通话水平)的选手。
在国际语音合成大赛中,科大讯飞在10个评测评分项目中的9个项目中获得第一名,成为“全能冠军”。
语音合成可以表达特定的情感,但是一段文字应该表达什么?情绪变化涉及语义理解和语境分析。
除了在智能语音技术方面处于世界领先地位,科大讯飞在自然语言理解方面也是行业领先者。
随着语义与语音的融合与交叉发展,科大讯飞或将率先解决语音合成和情感表达问题,将语音合成技术的发展推向新的阶段。
领先的核心技术、丰富的反馈数据和广阔的应用场景,三者共同构筑了语音合成的行业壁垒。
科大讯飞在语音合成技术上拥有绝对优势,在商用层面也表现出色,创造了导航APP、央视虚拟主机解决方案中大量明星播音音库等经典案例。
科大讯飞的推出,率先向普通用户提供免费定制服务。
凭借先发优势和强大的技术支持,科大讯飞在定制语音合成的商业化落地上迈出了关键的一步。