当前位置: 首页 > 科技赋能

2021年SLT证监会 -标贝科技增发2800小时儿童ASR商业数据服务

时间:2024-05-20 01:50:16 科技赋能

IEEE SLT研讨会由西北工业大学、清华大学、厦门大学和标贝科技共同主办,中国计算机学会语音对话与听力专业组支持旗舰赛事——儿童语音识别挑战赛(CSRC)最终排名结果和官方论文近日发布。

此次证监会竞赛历时近三个月。

经过激烈角逐,第一赛道前三名分别由上海交通大学、大连启辉计算机网络有限公司、网易有道信息技术(北京)有限公司夺得,第二赛道前三名分别为:韩元。

前三名分别由小米、东芝和同花顺夺得。

荣誉桂冠当之无愧。

据了解,本次大赛的数据得到了协办单位之一标贝科技的全力支持。

近一小时的高质量成人朗读数据以及少儿朗读、对话等竞赛数据均取自标贝自己的小时成人中文朗读语音。

数据库,小时少儿语音对话数据库,完全满足比赛和匹配语音识别模型训练的需要。

事实上,事件数据一直是本次SLT证监会的一大看点,增加了该事件的关注度和参与度。

儿童的语音数据更是厂商们关心的问题。

原因是这些数据在智慧教育、早教产品、智能音箱等众多语音交互场景中具有广泛的应用基础。

然而,儿童讲话因其声音和发音而与成人的语音和语言特征不同,在技术上自然难以区分。

并且在训练过程中,如果不覆盖大量标记的儿童语音,儿童的 ASR 准确率仍然明显低于成人。

因此,高质量的儿科ASR数据的重要性不言而喻。

从本次活动报名情况来看,SLT证监会吸引了来自全球不同地区的近60家大学、科研机构和制造商报名,覆盖中国大陆、香港、美国、新加坡、爱尔兰等地区。

其中,国内厂商参赛队伍包括爱奇艺、小米、网易、华为、马财经等业内知名厂商。

国内大学和科研机构有清华大学、浙江大学、上海交通大学、中科院自动化研究所等。

本次证监会竞赛得到了上述机构和厂商的积极参与,但部分团队仍未能如期报名,并表示希望有机会再次参赛并申请数据进行研究。

另外,本次事件数据的价值也体现在本次SLT证监会的论文中。

截至目前,基于标贝科技提供的儿童语音识别数据,已有SLT官方、小米、香港中文大学等机构发表学术论文。

论文的发表不仅代表了当前行业内极高的学术水平,也为从业者提供了专业的参考指南。

本次SLT证监会竞赛的结果和论文已经公布,但业界对数据的需求并未停止。