当前位置: 首页 > 科技观察

达摩院提出目标重识别新范式,已向全球开发者开源

时间:2023-03-21 01:01:42 科技观察

达摩院提出了一种新的目标重识别范式,已经开源给全球开发者德国哲学家莱布尼茨曾说过,世界上没有两片完全相同的树叶,这种差异也意味着世界上的每一个物体有自己的唯一ID。如今,人工智能已经逐渐掌握了识别物体细微差异、从海量图像中找到目标物体的能力。8月6日,据记者了解,达摩院首次将PureTransformer模型(以下简称Transformer模型/结构)引入到目标重识别任务中。该方法可以高效完成细粒度图像检索任务,超越其他AI算法,在准确性和检索时间上都取得了迄今为止最好的结果。该研究已被顶级AI会议ICCV2021收录,并获得CVPR2021AICity挑战赛目标重识别赛道冠军。目前,该技术已正式向全球开发者开源。DharmaAcademy算法荣获CVPR2021AICityChallengeObjectRe-IdentificationTrack冠军Objectre-identification是计算机研究的新趋势。据统计,目前每1000篇计算机视觉论文中就有30篇与物体重识别研究相关。与目标检测、目标分割等任务不同,目标重识别难度更大。例如,同一个物体会因为视角、光线、遮挡等因素而呈现出不同的外观。不同的物体在相同的角度和光线下具有高度的视觉相似性。即使用肉眼,也很难克服这些干扰信息。如何区分寻找差异,准确找到目标对象,一直是业界的难题。过去几年,AI研究者逐渐尝试使用深度学习CNN模型来解决这个问题,但CNN模型在处理目标重识别任务时,往往会丢失图像的一些细节信息,同时不能有效挖掘图像各个特征的全局相关性,因此在复杂场景下的表现较差。此次,达摩院创新地将PureTransformer模型应用到目标重识别任务中,并提出了第一个基于PureTransformer结构的ReID框架TransReID。融合不同模态信息解决视角差异问题。测试表明,该方法在6个数据集上均超越了最好的SOTA算法成绩。图:达摩院TransReID首先将图片物理切割成若干个小图片块,每个图片小块通过特征提取模块提取自己的视觉特征,然后计算最终图像的全局特征。此外,该框架还可以帮助模型克服相机带来的外观偏差,提取更鲁棒的全局特征。项目研究负责人、达摩院算法专家罗浩表示:“PureTransformer过去在NLP和基础视觉领域取得了巨大的成功,但还没有尝试更细粒度的图像检索任务.达摩院这项研究引领了一个新的研究趋势,是行业的又一个里程碑。”据悉,该技术的应用前景广阔,达摩院研究团队表示,未来将应用于安全防护、自然资源、动物保护等领域,例如利用算法找回丢失的物品。珍稀动物。