当前位置: 首页 > 科技观察

YOLOv5来了!基于PyTorch,它比YOLOv4小90%,但速度快一倍

时间:2023-03-12 11:24:37 科技观察

来了,来了,YOLOv5来了!Ultralytics官方更新了YOLOv5,已经登顶GitHub飙升榜首。它运行推理速度极快,权重可以导出到移动设备,并且在COCO上达到了最先进的水平。YOLOv5项目由Ultralytics创建和维护。Ultralytics是一家总部位于美国的粒子物理学和人工智能初创公司,为政府、学术和商业客户提供支持。在粒子物理学、数据科学和人工智能方面领导了美国情报界(IC)和国防部(DoD)的多项计划,并与多所大学、国家实验室和私营公司合作。你一定也注意到了iOS这个关键词。他们确实做了一个iOS应用程序,甚至还做了一张特别的海报,这真是令人印象深刻。大家感受一下:如果不是左下角的“AppStore认证标志”,我还以为是某款手机的广告呢。毕竟现在手机长得像iPhone,电脑长得像Mac。YOLO模型的演进在实时目标检测方面得到了快速提升。提升的速度就更快了。结果也很惊人。3月18日,谷歌开源了EfficientDet的一个实现,这是一种不同大小的快速训练模型,其中一个提供实时输出。4月23日,AlexeyBochoviskiy等人开源了YOLOv4。6月9日,GlennJocher开源了YOLOv5的PyTorch实现。YOLO(YouOnlyLookOnce)是一个模型家族,最初由PJReddie在2016年的一篇文章中创立,YOLO一出生就让大家大吃一惊。让人不敢相信,YOLO的小体积竟然能展现出如此超强的性能!是实时条件和设备上部署环境的理想选择。PJReddie的研究团队负责随后推出的YOLOv2和YOLOv3,这两个模型都在性能和速度上不断改进。2020年2月,PJReddie表示他将停止研究计算机视觉。2020年4月,AlexeyBochkovskiy、Chien-YaoWang和Hong-YuanMarkLiao推出了YOLOv4,并取得了令人瞩目的成果。值得注意的是,YOLOv4中的许多改进都来自改进的数据增强和模型架构。我们已经写过关于YOLOv4的分析,以及如何在自定义对象上训练YOLOv4模型)。YOLOv5:实时目标检测的新时代领导者GlennJocher发布的YOLOv5与其他版本相比,有许多差异和改进。Glenn是YOLOv4中一项非常关键的技术“马赛克增强”的创造者。YOLOv5不是单一模型,而是一个模型族,包括YOLOv5s(最小)、YOLOv5m、YOLOv5l、YOLOv5x(最大)。那么,YOLO5为什么能够成为目标检测的新领军者呢?RoboFlow引入了4个优势。首先,这是YOLO家族中第一个使用原生版本PyTorch代替PJReddie的Darknet的模型。Darknet是一个非常灵活的研究框架,但它并不是为生产而构建的,并且拥有一个小的用户社区。这导致Darknet在配置上花费了很多精力,还没有准备好投入生产。由于YOLOv5在PyTorch中实现,它受益于成熟的PyTorch生态系统:更简单的支持和更容易的部署。此外,作为一个更广为人知的研究框架,YOLOv5的迭代对于更广泛的研究社区来说可能更容易。这也使得部署到移动设备更简单,因为模型可以很容易地编译到ONNX和CoreML中。其次,YOLOv5出奇的快。在运行TeslaP100的YOLOv5Colab笔记本上,我们看到每张图像的推理时间仅为0.007秒,相当于每秒140帧(FPS)!相比之下,YOLOv4在转换为相同的UltralyticsPyTorch库后为50FPS。YOLOv5比YOLOv4快两倍以上!第三,YOLOv5的准确率超高。在Roboflow对血细胞计数和检测(BCCD)数据集的测试中,它在仅训练100个epoch后就达到了约0.895的平均精度(mAP)。诚然,EfficientDet和YOLOv4具有不相上下的性能,但在不损失准确率的情况下实现如此全面的性能提升是非常罕见的。第四,YOLOv5体积小。具体来说,YOLOv5的权重文件为27兆字节。YOLOv4(使用Darknet架构)的权重文件为244兆字节。YOLOv5比YOLOv4小近90%!这意味着YOLOv5可以更容易的部署到嵌入式设备上,所以Ultralytics也在招iOS开发。项目地址:https://github.com/ultralytics/yolov5