IEEE SLT研讨会由西北工业大学、清华大学、厦门大学和标贝科技共同主办,中国计算机学会语音对话与听力专业组支持旗舰赛事——儿童语音识别挑战赛(CSRC)最终排名结果和官方论文近日发布。
此次证监会竞赛历时近三个月。
经过激烈角逐,第一赛道前三名分别由上海交通大学、大连启辉计算机网络有限公司、网易有道信息技术(北京)有限公司夺得,第二赛道前三名分别为:韩元。
前三名分别由小米、东芝和同花顺夺得。
荣誉桂冠当之无愧。
据了解,本次大赛的数据得到了协办单位之一标贝科技的全力支持。
近一小时的高质量成人朗读数据以及少儿朗读、对话等竞赛数据均取自标贝自己的小时成人中文朗读语音。
数据库,小时少儿语音对话数据库,完全满足比赛和匹配语音识别模型训练的需要。
事实上,事件数据一直是本次SLT证监会的一大看点,增加了该事件的关注度和参与度。
儿童的语音数据更是厂商们关心的问题。
原因是这些数据在智慧教育、早教产品、智能音箱等众多语音交互场景中具有广泛的应用基础。
然而,儿童讲话因其声音和发音而与成人的语音和语言特征不同,在技术上自然难以区分。
并且在训练过程中,如果不覆盖大量标记的儿童语音,儿童的 ASR 准确率仍然明显低于成人。
因此,高质量的儿科ASR数据的重要性不言而喻。
从本次活动报名情况来看,SLT证监会吸引了来自全球不同地区的近60家大学、科研机构和制造商报名,覆盖中国大陆、香港、美国、新加坡、爱尔兰等地区。
其中,国内厂商参赛队伍包括爱奇艺、小米、网易、华为、马财经等业内知名厂商。
国内大学和科研机构有清华大学、浙江大学、上海交通大学、中科院自动化研究所等。
本次证监会竞赛得到了上述机构和厂商的积极参与,但部分团队仍未能如期报名,并表示希望有机会再次参赛并申请数据进行研究。
另外,本次事件数据的价值也体现在本次SLT证监会的论文中。
截至目前,基于标贝科技提供的儿童语音识别数据,已有SLT官方、小米、香港中文大学等机构发表学术论文。
论文的发表不仅代表了当前行业内极高的学术水平,也为从业者提供了专业的参考指南。
本次SLT证监会竞赛的结果和论文已经公布,但业界对数据的需求并未停止。