当前位置: 首页 > 科技观察

Facebook开源了自己的AR核心技术,可以快速识别视频中的物体

时间:2023-03-12 01:40:35 科技观察

FacebookAIResearch最近开源了Detectron,这是一个基于深度学习框架Caffe2用Python编写的物体识别框架。它包含几个重要和流行的目标检测算法,Detectron可以根据计算机视觉任务自动生成合适的模型。Facebook在去年的F8大会上展示了AR/VR应用,特别展示了多种在生活场景中叠加图片的AR技术。如今,开源的目标检测框架Detectron可以快速识别视频或图片中物体的形状或边缘,方便图像的叠加。Detectron项目于2016年7月启动,当时的目标是在深度学习框架Caffe2上打造快速灵活的目标检测系统,后期进入预览开发阶段。在过去一年半的时间里,Detectron已经成熟,可以支持FAIR的大部分项目,包括MaskR-CNN,FocalLossforDenseObjectDetection,分别获得2017年ICCV的MarrAward和***StudentPaperAward.Detectron支持的这些算法为实例分割(Instancesegmentation)等重要的计算机视觉任务提供了直观的模型。另外,Detectron对于一些视觉感知系统也会有很大的帮助。在Facebook人工智能研究所,Detectron已被用于多个项目,例如用于对象检测的特征金字塔网络、MaskR-CNN、检测和识别人与对象的交互、用于密集对象检测的焦点损失、非局部神经网络、学习分割每一件事和数据蒸馏:迈向全监督学习。FacebookAI研究院开源Detectron的目的是让FAIR的研究成果能够与大家共享,加速全球范围内的研究成果。除了研究,Facebook团队还使用Detectron为不同的重要应用程序训练定制模型。模型训练完成后,可以通过轻量级、模块化的Caffe2部署到云端和移动端。Facebook期望Detectron能够帮助开发下一代物体检测技术。此外,RossGirshick表示,Facebook人工智能研究院还在ModelZoo中发布了70多个使用Detectron训练的模型,供开发者下载并创建自己的目标检测系统。