超越YOLOv5，1.3M超轻量，高效易用，目标检测领域这一个就够了

时间：2023-03-22 10:30:35 科技观察

BeyondYOLOv5，1.3M超轻量级，高效易用，在目标检测领域这一款就足够了作为视觉技术行业的支柱，目标检测技术不仅在人脸等场景的单兵作战中有着出色的表现、车辆、商品、缺陷检测，也是文本识别、图像检索、视频分析、目标跟踪等复合技术的核心模块。应用场景可谓无处不在。各行各业的开发者追求极致的高精度、高效率的目标检测算法，以及便捷高效的开发部署方式。但业界缺乏一个充分考虑高性能算法、便捷开发、高效训练、完整部署的开源目标检测项目。百度飞桨端到端物体检测开发套件PaddleDetection升级到2.0版本后，终于充分考虑到行业开发者的需求，成长为中国工业实践中物体检测领域的重磅利器。下面我们来回顾一下PaddleDetection2.0的升级内容：1.全明星算法阵容：PP-YOLOv2超越YOLOv4和YOLOv5，1.3M超超超轻量级目标检测算法PP-YOLOTiny，全面领先其同行框架的RCNN系列算法，以及SOTA的AnchorFree算法：PAFNet（PaddleAnchorFree）2.全面的功能覆盖：除了全方位的通用目标检测算法外，还涵盖了旋转框检测、实例分割、行人检测、人脸检测、车辆检测等Vertical任务。3、易用性全面提升：全面支持动态图开发、压缩、部署等全流程解决方案，大大提高了用户开发的易用性，加快了算法的产业化应用速度。△图1PaddleDetection2.0星型通用目标检测模型性能。对性能着急的可以直接去开源项目的主页直接体验：https://github.com/PaddlePaddle/PaddleDetection本文也将为大家详细讲解PaddleDetection2.0的升级内容，初尝这个重磅检测工具的杀伤力：1.更多更好的算法1.PPYOLOv2，比YOLOv4和YOLOv5强！自去年PPYOLO成为业界最好的目标检测模型后，随着PaddleDetection2.0的发布，PPYOLO也推出了v2版本。PPYOLOv2延续了v1版本的理念，继续加深了对工业实践中算法精度和速度平衡需要的考虑。PPYOLOv2（R50）的mAP从45.9%达到了49.5%，相比v1提升了3.6个百分点，FPS高达106.5FPS，超越了YOLOv4，甚至超越了YOLOv5！而如果使用RestNet101作为骨架网络，PPYOLOv2（R101）的mAP高达50.3%，在同等精度下比YOLOv5x快15.9%！完整论文请参考：https://arxiv.org/abs/2104.10419不再需要在眼花缭乱的目标检测算法中进行比较和选择，就用PP-YOLOv2吧！△图2PP-YOLOv2性能对比2.PPYOLOTiny，1.3M，比YOLO-Fastest和NanoDet轻！随着物联网的快速发展，在端侧芯片上部署轻量级深度学习算法的需求越来越强烈。基于此，PaddleDetection2.0推出了深度优化后体积仅为1.3M的超超超轻量级目标检测算法——PPYOLOTiny。如下表所示，在cocoval2017数据集测试中，输入尺寸版本为320px，mAP达到20.6，单次预测延迟为10.83ms（92.3FPS）；输入尺寸为416px版本，mAP达到22.7，单次预测延迟为15.48ms（64.6FPS）。强于YOLO-Fastest，NanoDet！△图3PP-YOLOTinyperformance3.RCNN系列算法全面超越同类开发工具！除了YOLO系列，PaddleDetection2.0还升级了目标检测的基础两阶段系列算法——RCNN。从表1中可以清楚地看到，RCNN系列模型（FasterRCNN、MaskRCNN、CascadeRCNN等）都是在PaddleDetection上训练的，比mmDetection和Detectron2在更短的时间内获得了更高的准确率！△表1：PaddleDetection、mmDetection和Detectron2开发包下的RCNN系列模型，在COCO2017valset上的mAP对比结果4.SOTAAnchorFree算法：PAFNet（PaddleAnchorFree）&PAFNet-Lite对比SSD和RCNN等一系列基于锚点的算法。Anchor-Free算法具有超参数少、配置简单、多尺度目标检测效果好等优点，但也存在检测结果不稳定、训练时间长等问题。近年来科研领域的热点方向。Paddle当然也一直紧跟全球科研趋势，基于TTFNet的多维优化，推出PAFNet（PaddleAnchorFree）算法，在COCO数据集上精度达到42.2，V100预测速度达到67FPS，以及在无主播领域的SOTA级别！同时提供了移动端的轻量级模型PAFNet-Lite。COCO数据集准确率达到23.9，麒麟990芯片延迟26ms。△图4PAFNet网络结构5.旋转框检测算法—S2ANet在一般的目标检测项目中，我们通常使用水平矩形框作为检测框来框住目标。但在工业场景中，如质检、遥感图像等，目标往往是任意方向排列，长宽比差异较大。如果使用水平矩形框，会出现大量空白的非目标区域，目标的方位角信息会丢失，例如图5的精度就不能满足业务需求。旋转坐标系目标检测算法可以很好地解决这类问题。它可以在检测四边形矩形框的同时获得旋转角度。本次PaddleDetection2.0升级，新增了高性价比的旋转框检测算法——S2ANet，方便开发者直接使用或进一步开发。△图5左：传统检测效果；图6右：S2ANet旋转框检测效果到目前为止，PaddleDetection包含了19类231种模型算法，其中动态图像预训练模型70种，静态图像预训练模型161种。其中包括PPYOLO、RCNN、PAFNet系列等明星算法！涵盖通用目标检测、人脸检测、行人检测、车辆检测、旋转框检测、实例分割任务，得益于FlyingGeneral框架和PaddleDetection套件本身的设计，算法训练效率也超越同类开发工具！二、更好的易用性1、动态图开发，调试代码灵活PaddleDetection2.0基于PaddlePaddle2.0.1版本，默认使用动态图进行开发。在这种模式下，每执行一次操作，都可以立即得到结果。而不是事先定义好网络结构，然后再去执行。用户还可以快速获取网络结构、每一层的输入输出以及对应的梯度信息等，并据此进行快速调整。这样，用户可以更快速地组织代码，更轻松地调试程序。2、更方便的安装方式除了传统的gitclone方式，PaddleDetection2.0这次还增加了whl包的发布。用户可以直接通过pipinstall安装，因此可以通过importppdet调用PaddleDetection2.0。API快速完成其检测任务。3、打通训练、压缩、部署全流程为进一步加速深度学习算法的产业落地，PaddleDetection2.0动态图顺利打通算法部署全流程。△图7PPDet全流程解决方案在模型训练期间或之后，PaddleDetection2.0方便开发者使用PaddleSlim对量化、蒸馏、裁剪等算法进行压缩优化，支持模型从动态图像快速转换为静态图像。支持模型的高效多平台预测部署。1、模型压缩能力为了满足开发者对计算量、模型体积、计算速度的极致追求，PaddleDetection2.0动态图模式在PaddleSlim的基础上增加了多种模型压缩能力，包括裁剪、量化、蒸馏、clipping+distillation联合策略压缩方案可以大大减少模型参数或计算量，易于在有限的硬件环境中部署。从下表可以看出，量化策略为模型带来了1.7%的精度提升，同时体积压缩了3.71倍，速度提升了1.46倍！而采用蒸馏+裁剪的联合策略，在精度几乎无损的情况下，体积压缩了3.05倍，速度提升了1.58倍！△表3：基于YOLOv3-MobileNetv1模型的模型压缩效果对比2.预测和部署能力得益于Paddle预测库系列产品的PaddleInference、PaddleLite和PaddleServing的能力。、NVJetson等多系统多平台算法部署，同时提供Python预测和C++预测方法，覆盖主流目标检测算法。此外适配TensorRT，支持TensorRT动态尺寸输入和TensorRTINT8量化预测，在硬件加速方面全面支持用户。△表4：主流算法在TeslaV100上的预测速度对比汇总：PaddleDetection2.0的这次重大升级为开发者在目标检测领域提供了全新的开发体验。mAP50.3的PP-YOLOv2超越YOLOv4、YOLOv5，1.3M超轻量级PP-YOLOTiny超越YOLO-Fastest和NanoDet。RCNN系列算法领先于其他框架。PAFNet(PaddleAnchorFree)SOTA还涵盖了旋转框检测、实例分割、行人检测、人脸检测、车辆检测等任务。动态图的升级和全流程解决方案的整合，大大提高了用户开发的易用性。无论您是学术研究人员还是工业开发人员；无论您是刚刚入门还是已经成为高手，PaddleDetection2.0都可以帮助您更快地进行算法实验，获得高性能的目标检测算法，投入工业实用。如此用心打造的高水准产品，期待业界开发者的参与，共同打造！PaddleDetection更多内容参考链接，请点击文末阅读原文或以下链接访问GitHub项目体验或Star：https://github.com/PaddlePaddle/PaddleDetection

上一篇：基于Qdrant和FiftyOne的最近邻嵌入搜索算法实践

下一篇：1分钟发5万张票！阿里影展抢票技术揭晓

超越YOLOv5，1.3M超轻量，高效易用，目标检测领域这一个就够了相关文章