BeyondYOLOv5,1.3M超轻量级,高效易用,在目标检测领域这一款就足够了作为视觉技术行业的支柱,目标检测技术不仅在人脸等场景的单兵作战中有着出色的表现、车辆、商品、缺陷检测,也是文本识别、图像检索、视频分析、目标跟踪等复合技术的核心模块。应用场景可谓无处不在。各行各业的开发者追求极致的高精度、高效率的目标检测算法,以及便捷高效的开发部署方式。但业界缺乏一个充分考虑高性能算法、便捷开发、高效训练、完整部署的开源目标检测项目。百度飞桨端到端物体检测开发套件PaddleDetection升级到2.0版本后,终于充分考虑到行业开发者的需求,成长为中国工业实践中物体检测领域的重磅利器。下面我们来回顾一下PaddleDetection2.0的升级内容:1.全明星算法阵容:PP-YOLOv2超越YOLOv4和YOLOv5,1.3M超超超轻量级目标检测算法PP-YOLOTiny,全面领先其同行框架的RCNN系列算法,以及SOTA的AnchorFree算法:PAFNet(PaddleAnchorFree)2.全面的功能覆盖:除了全方位的通用目标检测算法外,还涵盖了旋转框检测、实例分割、行人检测、人脸检测、车辆检测等Vertical任务。3、易用性全面提升:全面支持动态图开发、压缩、部署等全流程解决方案,大大提高了用户开发的易用性,加快了算法的产业化应用速度。△图1PaddleDetection2.0星型通用目标检测模型性能。对性能着急的可以直接去开源项目的主页直接体验:https://github.com/PaddlePaddle/PaddleDetection本文也将为大家详细讲解PaddleDetection2.0的升级内容,初尝这个重磅检测工具的杀伤力:1.更多更好的算法1.PPYOLOv2,比YOLOv4和YOLOv5强!自去年PPYOLO成为业界最好的目标检测模型后,随着PaddleDetection2.0的发布,PPYOLO也推出了v2版本。PPYOLOv2延续了v1版本的理念,继续加深了对工业实践中算法精度和速度平衡需要的考虑。PPYOLOv2(R50)的mAP从45.9%达到了49.5%,相比v1提升了3.6个百分点,FPS高达106.5FPS,超越了YOLOv4,甚至超越了YOLOv5!而如果使用RestNet101作为骨架网络,PPYOLOv2(R101)的mAP高达50.3%,在同等精度下比YOLOv5x快15.9%!完整论文请参考:https://arxiv.org/abs/2104.10419不再需要在眼花缭乱的目标检测算法中进行比较和选择,就用PP-YOLOv2吧!△图2PP-YOLOv2性能对比2.PPYOLOTiny,1.3M,比YOLO-Fastest和NanoDet轻!随着物联网的快速发展,在端侧芯片上部署轻量级深度学习算法的需求越来越强烈。基于此,PaddleDetection2.0推出了深度优化后体积仅为1.3M的超超超轻量级目标检测算法——PPYOLOTiny。如下表所示,在cocoval2017数据集测试中,输入尺寸版本为320px,mAP达到20.6,单次预测延迟为10.83ms(92.3FPS);输入尺寸为416px版本,mAP达到22.7,单次预测延迟为15.48ms(64.6FPS)。强于YOLO-Fastest,NanoDet!△图3PP-YOLOTinyperformance3.RCNN系列算法全面超越同类开发工具!除了YOLO系列,PaddleDetection2.0还升级了目标检测的基础两阶段系列算法——RCNN。从表1中可以清楚地看到,RCNN系列模型(FasterRCNN、MaskRCNN、CascadeRCNN等)都是在PaddleDetection上训练的,比mmDetection和Detectron2在更短的时间内获得了更高的准确率!△表1:PaddleDetection、mmDetection和Detectron2开发包下的RCNN系列模型,在COCO2017valset上的mAP对比结果4.SOTAAnchorFree算法:PAFNet(PaddleAnchorFree)&PAFNet-Lite对比SSD和RCNN等一系列基于锚点的算法。Anchor-Free算法具有超参数少、配置简单、多尺度目标检测效果好等优点,但也存在检测结果不稳定、训练时间长等问题。近年来科研领域的热点方向。Paddle当然也一直紧跟全球科研趋势,基于TTFNet的多维优化,推出PAFNet(PaddleAnchorFree)算法,在COCO数据集上精度达到42.2,V100预测速度达到67FPS,以及在无主播领域的SOTA级别!同时提供了移动端的轻量级模型PAFNet-Lite。COCO数据集准确率达到23.9,麒麟990芯片延迟26ms。△图4PAFNet网络结构5.旋转框检测算法—S2ANet在一般的目标检测项目中,我们通常使用水平矩形框作为检测框来框住目标。但在工业场景中,如质检、遥感图像等,目标往往是任意方向排列,长宽比差异较大。如果使用水平矩形框,会出现大量空白的非目标区域,目标的方位角信息会丢失,例如图5的精度就不能满足业务需求。旋转坐标系目标检测算法可以很好地解决这类问题。它可以在检测四边形矩形框的同时获得旋转角度。本次PaddleDetection2.0升级,新增了高性价比的旋转框检测算法——S2ANet,方便开发者直接使用或进一步开发。△图5左:传统检测效果;图6右:S2ANet旋转框检测效果到目前为止,PaddleDetection包含了19类231种模型算法,其中动态图像预训练模型70种,静态图像预训练模型161种。其中包括PPYOLO、RCNN、PAFNet系列等明星算法!涵盖通用目标检测、人脸检测、行人检测、车辆检测、旋转框检测、实例分割任务,得益于FlyingGeneral框架和PaddleDetection套件本身的设计,算法训练效率也超越同类开发工具!二、更好的易用性1、动态图开发,调试代码灵活PaddleDetection2.0基于PaddlePaddle2.0.1版本,默认使用动态图进行开发。在这种模式下,每执行一次操作,都可以立即得到结果。而不是事先定义好网络结构,然后再去执行。用户还可以快速获取网络结构、每一层的输入输出以及对应的梯度信息等,并据此进行快速调整。这样,用户可以更快速地组织代码,更轻松地调试程序。2、更方便的安装方式除了传统的gitclone方式,PaddleDetection2.0这次还增加了whl包的发布。用户可以直接通过pipinstall安装,因此可以通过importppdet调用PaddleDetection2.0。API快速完成其检测任务。3、打通训练、压缩、部署全流程为进一步加速深度学习算法的产业落地,PaddleDetection2.0动态图顺利打通算法部署全流程。△图7PPDet全流程解决方案在模型训练期间或之后,PaddleDetection2.0方便开发者使用PaddleSlim对量化、蒸馏、裁剪等算法进行压缩优化,支持模型从动态图像快速转换为静态图像。支持模型的高效多平台预测部署。1、模型压缩能力为了满足开发者对计算量、模型体积、计算速度的极致追求,PaddleDetection2.0动态图模式在PaddleSlim的基础上增加了多种模型压缩能力,包括裁剪、量化、蒸馏、clipping+distillation联合策略压缩方案可以大大减少模型参数或计算量,易于在有限的硬件环境中部署。从下表可以看出,量化策略为模型带来了1.7%的精度提升,同时体积压缩了3.71倍,速度提升了1.46倍!而采用蒸馏+裁剪的联合策略,在精度几乎无损的情况下,体积压缩了3.05倍,速度提升了1.58倍!△表3:基于YOLOv3-MobileNetv1模型的模型压缩效果对比2.预测和部署能力得益于Paddle预测库系列产品的PaddleInference、PaddleLite和PaddleServing的能力。、NVJetson等多系统多平台算法部署,同时提供Python预测和C++预测方法,覆盖主流目标检测算法。此外适配TensorRT,支持TensorRT动态尺寸输入和TensorRTINT8量化预测,在硬件加速方面全面支持用户。△表4:主流算法在TeslaV100上的预测速度对比汇总:PaddleDetection2.0的这次重大升级为开发者在目标检测领域提供了全新的开发体验。mAP50.3的PP-YOLOv2超越YOLOv4、YOLOv5,1.3M超轻量级PP-YOLOTiny超越YOLO-Fastest和NanoDet。RCNN系列算法领先于其他框架。PAFNet(PaddleAnchorFree)SOTA还涵盖了旋转框检测、实例分割、行人检测、人脸检测、车辆检测等任务。动态图的升级和全流程解决方案的整合,大大提高了用户开发的易用性。无论您是学术研究人员还是工业开发人员;无论您是刚刚入门还是已经成为高手,PaddleDetection2.0都可以帮助您更快地进行算法实验,获得高性能的目标检测算法,投入工业实用。如此用心打造的高水准产品,期待业界开发者的参与,共同打造!PaddleDetection更多内容参考链接,请点击文末阅读原文或以下链接访问GitHub项目体验或Star:https://github.com/PaddlePaddle/PaddleDetection
