当前位置: 首页 > 科技赋能

云从科技在无人机目标检测ICCV挑战赛中创下四项世界纪录

时间:2024-05-20 01:47:43 科技赋能

10月27日至11月2日,在云从科技ICCV Workshop举办的Vision Meets Drone: A Challenge(简称:VisDrone)上,研究院及团队中国科学院信息工程研究所葛世明研究员(以下简称“联合研究组”)荣获Task3“单物体跟踪挑战赛(SOT)”冠军赛冠军,再次刷新世界纪录对于这个项目。

继今年3月在跨范围追踪(ReID)、3D人体重建技术、自然语言处理技术等方面刷新世界纪录后,云从科技在人工智能领域再次领先世界。

同时,这也是云从科技第14次赢得世界冠军的青睐。

VisDrone 挑战 ICCV 国际计算机视觉会议由 IEEE 主办。

它与计算机视觉模式识别会议(CVPR)、欧洲计算机视觉会议(ECCV)并称为计算机视觉领域三大顶级会议,是CCF A类会议。

VisDrone(无人机物体检测)挑战赛旨在从无人机获得的视觉数据中检测和跟踪物体。

吸引了包括中国科学院、清华大学、马里兰大学等国内外知名大学、科研机构和企业。

伊利诺伊大学香槟分校、云从科技、三星研究院等近百支队伍参赛。

这项挑战包括四项任务。

联合研究团队参加“任务三:单目标跟踪挑战赛”,最终在众多参赛团队中脱颖而出,荣获冠军奖。

VisDrone数据集由天津大学机器学习与数据挖掘实验室AISKYEYE团队采集。

整个基准数据集由无人机捕获,包括视频片段,总共 08 帧和 9 个静态图像。

这些框架由数万个手动注释的框组成,用于行人、汽车、自行车和三轮车等常见物体。

为了让参与团队更有效地利用数据,数据集还提供了场景可见性、对象类别和遮挡等重要属性。

因此,本次比赛存在很多疑难问题。

在“任务三:单目标跟踪挑战”中,联合研究团队不仅要处理训练集、验证集、测试集等大量数据,还要克服分辨率低、长距离等困难。

数据中的术语遮挡和相机运动模糊。

任务3:单目标跟踪挑战创造新的世界纪录。

经过反复训练和测试,联合研究团队最终提出了一种改进的精确目标状态估计算法:ED-ATOM。

该方法包含两个模块:目标估计和对象分类。

其中,目标估计模块使用IOU预测网络、ResNet-18网络和ImageNet等数据集进行预训练。

它还使用低光图像增强算法来处理原始数据。

离线微调模型后,在线改进基于跟踪状态的搜索策略。

很棒的性爱。

对象分类模块利用数据增强方法进行在线数据扩展,以方便分类模型的泛化。

同时,基于跟踪状态的有效搜索策略提高了鲁棒性。

最终,结合了IE(图像增强)、ED(用增强数据训练的IOU预测网络)、DA(在线数据增强)、LT(长期跟踪)的ED-ATOM算法取得了最好的结果,树立新标杆。

世界纪录。

利用弱光图像增强方法进行暗跟踪训练,并通过不同方法的测试确定最佳方案;当目标外观发生变化时,利用数据扩展方案进行翻转、平移、缩放、仿射、旋转、模糊等操作。

以及其他增强方法来提高跟踪适应性;面对严重的失场和完全遮挡的跟踪情况,长时跟踪方案可以自适应搜索区域,提高跟踪鲁棒性。

通过ED-ATOM算法,我们可以在低分辨率、长时间遮挡、相机运动/运动模糊等情况下实现有效的可视化,从而达到锁定目标、预测动作等效果。

高质量跟踪成绩的取得,是联合研究团队在人工智能实际场景应用方面始终坚持技术研究和创新的共同努力。

云从科技由中科院重庆研究院孵化,与中科院同线。

作为人工智能领域智能服务的领导者,云从科技吸引并拥有全球最优秀的人才。

在广州、重庆、上海、苏州、成都等地设立研发中心,拥有研发人员100余人,提供核心技术产品研发能力。

同时,我们与大学、科研院所等建立联合实验室,掌握最前沿的核心技术研发能力。

强大的人才和技术储备为云从科技再创世界纪录提供了强劲动力。

在追求技术创新的同时,云从科技始终坚持技术的场景化应用。

ED-ATOM算法的提出将在未来安全检测、行人跟踪、安全检测等方面的产品开发中发挥更有价值的作用。

例如,在智能安防方面,云从科技研发的智能安防管理系统,是基于物联网、人工智能、大数据技术的以人为中心的智能应用系统。

新算法的集成大大增加了在可能的移动终端(无人机或自主系统)上应用的机会。

随着无人机作为视觉数据采集设备在城市、农业、航空等应用领域得到快速、广泛的部署,分析和理解无人机平台采集的视觉数据的需求变得越来越迫切。

云从科技参与单目标跟踪挑战赛的成果不仅进一步推动了计算机视觉乃至人工智能技术的发展,对于视频监控、人机交互、自动驾驶、虚拟现实等场景也具有重要意义。

未来,云从科技将继续以人工智能技术和人机协作平台为基础,通过行业领先的人工智能、认知计算和大数据技术形成的一体化解决方案,推动泛在智能下的未来城市建设。