11月28日,百度大脑宣布语音能力引擎日均调用量突破1亿次,排名第一应用规模居行业前列。
开发者提供覆盖云、端、核的全栈、全场景语音开放能力,推动智能语音技术在各行业的应用。
在当天举行的百度大脑语音能力引擎论坛上,百度大脑语音引擎全新发布升级14大产品内容,包括4大硬件模块、开发板以及基于百度鸿鹄语音芯片的3大场景解决方案。
语音自训练平台、呼叫中心语音解决方案等。
来自家电、农业、医疗等行业的合作伙伴代表也到场分享百度大脑语音技术赋能成果。
百度首席技术官王海峰出席论坛并致辞。
他表示:“AI技术演进与产业赋能处于良性循环、相互促进。
AI在应用场景不断演进。
百度语音技术基于深度学习,加速突破行业应用,已应用于百度App、百度地图、小度音箱、百度输入法等百度产品,并通过AI开放平台赋能众多行业合作伙伴,百度大脑的语音能力日调用量已突破亿次。
”现场,百度语音首席架构师贾磊正式提出了基于复杂CNN网络的语音增强和语音识别的集成端到端建模技术,该方法抛弃了数字信号处理学科和语音识别的各种先验假设。
语音识别学科,消除学科之间的障碍,直接实现端到端的集成建模技术,与传统基于数字信号处理的麦克风阵列算法相比,错误率降低30%以上。
该方法现已集成到百度最新的百度鸿鹄芯片中(百度语音首席架构师贾磊主题演讲:百度大脑语音技术的前沿进展) 据悉,百度已经开始将深度学习用于中文。
自2016年开始语音搜索,成为全球最早将深度学习技术应用于工业化产品的公司之一。
。
百度大脑现已开放跨云、端、核的全栈语音引擎能力,包括语音识别、语音合成,广泛应用于金融、政务、娱乐等各个行业和场景。
百度AI技术生态部总经理余友平表示,百度大脑语音能力引擎应用规模已达到行业第一,并一直在积极拓展语音能力引擎生态链建设。
(百度AI技术生态部总经理于友平介绍了百度大脑语音引擎的全栈开放能力)针对智能硬件设备,百度大脑发布了基于百度鸿鹄语音芯片的四款硬件模块和开发板,以及例如智能家居和智能汽车。
,智能物联网设备3大型端到端软硬件一体化远场语音交互场景解决方案,具有交互效果优异、软硬件一体化快速应用、集成门槛低、兼容性广等优点。
同时,在语音识别领域,我们全面升级了短语音识别和实时语音识别能力,发布了音频文件转录能力,升级了语音自训练平台,可以提高商业术语的识别率。
零代码、呼叫中心语音解决方案;在语音合成性能方面,新发布了6个在线语音合成高品质声音库和5个离线语音合成高品质声音库。
丰富的语音能力助力智能硬件、互联网、呼叫中心等领域智能化升级。
嘉宾分享第一排从左到右:创维、灵悦科技、北京紫洁婴儿科技公司第二排从左到右:华致米业、江西慈善论坛,来自家居、金融、医疗、农业、慈善等领域的合作伙伴现场上台分享了与百度大脑的合作细节,以及如何利用语音技术帮助自己完成智能升级。
创维AIoT研究院产品经理李凯表示:“大屏物联网的行业痛点在于信息检索困难、设备控制操作复杂。
通过加入语音交互能力,整个AIoT设备的交互体验双方在电视领域的合作成果已在10个电视芯片型号、10000台电视中落地,助力中高端产品线在下一代“远距离”提升产品溢价能力。
现场语音解决方案,百度鸿鹄语音芯片为创维产品带来高性价比。
双方将基于硬件价值并集成优化的软件算法,在基于百度鸿鹄芯片的多款产品上进行合作。
灵悦科技信贷运营总监宋莉分享了百度大脑语音技术在贷后领域的应用。
依托百度大脑呼叫中心实时语音识别等AI服务,精准识别用户语音,灵越打造了降低成本、提升效率的智能系统。
机器人。
通过贷后智能机器人、智能语音质检的应用,贷后人力投入减少61.47%,有效实现了合规高效的运营体系,提升了客户体验。
北京紫捷婴儿科技有限公司项目经理肖云峰在会上演示了语音技术在医疗领域的应用:“我们开发的智能输入系统是在百度大脑语音自学习上的语音识别模型上进行训练的。
- 培训平台,识别率从80%提升到95%以上,包括医学专业生僻词的识别,而很多厂家的机型识别率无法满足这一要求,该系统有效降低了工作强度。
医务人员,提高临床护理效率。
“在农业领域,我们也遇到了农业作物专业词汇语音识别率低的行业问题。
对此,华智生物信息技术总监龙晓波表示:“感谢百度大脑语音自训练平台,使用方便,准确度高。
、可扩展性等优点。
经过多次迭代,我们的农业结构化性状数据的语音识别准确率从71.09%提高到98.75%。
试验田性状信息的采集由人工时间减少为人工时间,工作效率提高了一倍。
山星智能联合创始人黄小贵介绍了基于百度大脑语音等技术的小Q智能导盲眼镜,帮助盲人生活、出行,为残疾人提供智能辅助。
现场还公布了“语音为AI”公益计划:百度大脑将为提供公益服务的企业或组织提供免费语音技术、专属语音技术支持等福利,为特殊群体带来便利和帮助,让人工智能很有用。
温度。
百度大脑开放平台是国内服务规模最大的人工智能开放平台。
已开放多项AI能力,拥有超过10000名开发者用户。
与会人员认为,百度大脑语音技术能力的全新发布和升级,将为开发者和企业提供更加完善的全栈语音引擎能力,帮助更多用户高效打造具有语音交互能力的独特应用和产品。
加速语音技术在各行各业的应用。