当前位置: 首页 > 科技赋能

创下新的世界纪录,这家公司一年内就占领了人脸识别和语音OS两大技术高地

时间:2024-05-20 02:25:22 科技赋能

在人脸识别领域,有很多国际级别的比赛,比较出名的有:LFW、MegaFace、其中,微软在2018年提出的MS-Celeb-1M基准测试被誉为人脸识别的年度“世界杯”。

近日,“世界杯”也落下帷幕,来自中国的人工智能公司Orion Star获得了比赛第一名。

此外,Panasonic-NUS(新加坡国立大学)荣获非限制类(免费使用外部数据)第一名;在小样本学习(Low-Shot Learning)子命题(挑战2)中,美国东北大学获得限制类第一名; NUS-Panasonic(新加坡国立大学)在非限制类别中获得第一名。

冠军背后:一周岁的猎户星有哪些故事?仔细调查不难发现,猎户星全称是北京猎户星科技有限公司,成立于2016年9月,实际上是猎豹移动旗下的人工智能子公司。

从官方介绍可以看出:猎户星自成立以来,聚集了来自世界各地的人工智能精英人才。

创始团队包括来自美国硅谷、日本、台湾、北京、深圳等世界一流科技公司的技术专家和产品极客。

博士占比近50%。

今年6月,他们还与喜马拉雅联合发布了面向用户的小雅AI音箱。

作为猎户星AI生态链首款产品,小雅AI音箱的核心是猎户星自主研发的远场语音交互系统。

该音箱一经推出,就获得了行业和市场的一致好评,预售5万台全部售空。

(图为小雅AI音箱)此次参加微软百万名人表彰大赛也是猎户星在行业的一次大规模应用,希望能够实现技术突破。

赛后的技术成果也将被猎户星运用到实际场景中,比如:门禁、机器人、手机APP等。

微软百万名人表彰大赛有何不同?据了解,2020年6月,微软向公众发布了大规模真实世界面部图像数据集MS-Celeb-1M,其中包含10万名名人的约10万张(10M)面孔。

这张图片鼓励研究人员开发先进的面部识别技术。

同时宣布的还有 MS-Celeb-1M 百万人脸识别挑战赛。

本次大赛由微软研究院主办,采用计算机视觉领域顶级会议ICCV平台。

既包括大规模人脸识别竞赛(Hard Set和Random Set),又推出新的更具挑战性的小样本学习(Low-Low- Shot Learning)竞赛,堪称“最高水平”和“最难的”技术竞赛。

大赛实现了“端到端”的人脸识别,帮助参赛模型落地到现实生活中。

根据竞赛形式,本次竞赛的两个子命题包括限制类和非限制类。

两者的区别在于是否可以使用外部数据。

相比之下,受限类别只能在有限的数据集中调用,并且竞争是基于团队的算法能力。

猎户星队选择直接在限制赛场展开硬仗,这是一场更加公平、纯粹的技术比赛。

凭借其技术实力和积累,猎户星团队获得了限制类(仅使用竞赛提供的数据)百万人名人识别子命题(挑战1)第一名。

(图为比赛结果)比赛过程中,他们面临很多困难:比赛数据噪声很大,无法直接用于训练;而且整个训练数据集非常大,适合大规模训练人脸模型的模型对资源要求非常高。

高,很难做到又快又好。

庆幸的是,团队一直在算法上不断追求极致。

经过研究,他们设计了一种鲁棒的去噪算法,可以有效地对各类不同程度噪声的噪声数据进行去噪。

同时,我们选择采用适合大规模训练的三元组模型,并创新性地采用巧妙的设计,在有限资源下加速三元组网络的训练,大幅提升性能。

这些创新方法成为猎户星在本次比赛中的王牌。

最终猎户星队取得了0.75/0的高分。

(随机集/硬集)。

要知道,随机设定的成绩已经达到了不使用外部数据的极限,远远超过了之前的记录,碾压了去年所有队伍的成绩。

用比赛主办方的话说,0.75已经接近满分了,这个成绩非常难达到。

结果。

而硬集上的0.分也远高于去年的最好成绩(0.)。

此时距离猎户星成立仅一年时间。

此前,猎户星还在另一项国际人脸识别大赛LFW的评测中取得前三名的成绩。

短短一年时间,猎户星就在人工智能两大领域——语音系统和图像识别领域取得了突出成果。

凭借技术积累和不断创新,猎户星将走得更远。