文章| 4月3日消息,搜狗推出语音交互引擎“知音”,这是一款基于深度学习算法的智能语音引擎。
有理解能力和思考能力。
据介绍,“知音”识别速度快,纠错能力强,支持复杂的多轮对话和匹配服务能力。
在搜狗看来,基于语义结构体系结构的用户数据与搜狗垂直应用的结合,是“知音”引擎的重要差异化优势。
产品优势 据介绍,在实际场景应用中,“知音”具有以下三大优势: 1、在语音识别方面,解决了用户说话过程中语速过快导致的吞咽问题,以及语音识别出错的问题。
率比较高。
下降30%以上,语音识别速度提升3倍。
2、语音交互过程中,支持用户纠正错误的识别结果。
他们可以使用自然语言来纠正错误。
例如,用户可以说,将“张”改为“张”,也可以说将其改为文章的“张”。
“章节”。
3、语音理解方面,支持多轮对话,处理更复杂的用户交互逻辑。
例如,如果用户要求去首都机场,机器可以反馈“我们应该去T1还是T2?”当用户确认终端时,它会提出问题。
,无论是出发还是接人。
搜狗语音交互技术中心负责人王彦峰表示,在今年3月对搜狗、科大讯飞、百度语音引擎的第三方评测中,搜狗和科大讯飞在能力上不相上下,总体领先于百度。
在资源积累活动上,搜狗CTO杨洪涛介绍,搜狗于2018年开始研发智能语音技术,并于2018年进行深度学习探索。
目前,搜狗智能语音技术已应用于搜狗全系产品。
搜狗在线语音输入法语音助手的请求量已超过1.4亿次,日使用率占8%。
依托深度学习的语义理解,搜狗语义引擎的错误率较年初下降了60%,同比下降了30%。
提高语义理解需要以高质量、大规模的材料为基础。
据杨洪涛介绍,搜狗输入法用户每天可产生的预计规模达到11.7万小时。
他强调,这比当前任何语音技术团队预期使用的规模都要大。
此外,搜狗表示正在通过端到端模型、主动积累错误反馈、在线部署GPU加速等方式,推动机器语义理解的智能化。
在具体应用层面,搜狗也强调垂直产品的场景化应用特性。
结论:依托搜狗输入法、搜狗地图等应用的大规模用户数据库,搜狗语音引擎在训练数据方面具有较强优势。
活动最后,杨洪涛表达了搜狗语音的开放态度,但他强调搜狗不会打造平台化的语音引擎,只会选择一些垂直场景化的应用合作伙伴。
据杨洪涛介绍,现阶段已达成的合作包括基于车载导航的四维图新。
受限于场景和语音背景的复杂性和变化,通用语音引擎现阶段无法满足用户期望。
将注意力和资源集中在解决某个痛点场景上是一种有效的方式。