当前位置: 首页 > 科技观察

模型仅1MB,更轻量的人脸检测模型开源,效果不弱于主流算法

时间:2023-03-17 18:28:59 科技观察

模型只有1MB,更轻的人脸检测模型是开源的,效果不弱于主流算法。AI模型越来越小,需要的计算能力越来越弱,但精度还是有保证的。最新的代表是刚刚在GitHub上开源的一个中国项目:超轻量级通用人脸检测模型。据项目贡献者介绍,该模型文件大小仅为1MB,在320x240输入下计算量仅为90MFlops。当然,效果不弱于目前业界主流的开源人脸检测算法,甚至有过之而无不及。超轻量级通用模型的贡献者是linzai。他说,这是一个为边缘计算设备或低计算设备(如ARM推理)设计的实时超轻量级通用人脸检测模型:默认FP32精度(.pth)文件大小为1.1MB,并且推理框架int8量化大小约为300KB。目标是在低计算设备的一般场景下使用ARM进行实时人脸检测和推理。同时,这也适用于移动环境(Android&IOS)、PC环境(CPU&GPU)等。根据GitHub项目页面,该模型已经在Ubuntu16.04、Ubuntu18.04、Windows10上进行了测试;Python3.6;火炬1.2;CUDA10.0+CUDNN7.6等环境,并能保证正常运行。模型设计有两个版本,分别是:1)version-slim,主干精简速度稍快,2)version-RFB,增加了修改后的RFB模块,精度更高。此外,它还提供了在320x240和640x480不同输入分辨率下使用widerface训练的预训练模型,可以在不同场景下更好地工作。据linzai介绍,整个项目没有专门的算子,支持onnx导出,便于移植和推理。效果不弱于目前主流的开源算法,那么效果/准确率如何呢?临仔也在GitHub项目页面发布了该模型在准确率、速度、场景测试、尺寸等方面的测试。参赛选手有两个,一个是Libfacedetection,OpenCV中文网负责人于世奇开源的人脸检测算法。另一个是Retinaface-Mobilenet-0.25(Mxnet)——业界最先进的开源人脸检测算法之一。在Widerface数据集上的测试结果如下:version-slim/version-RFB基本可以达到最优效果。树莓派4BMNN推理测试耗时测试结果如下:相比之下,version-slim版本的速度并不处于劣势。在地铁站、万达广场、写字楼等场景进行测试,结果表明version-RFB同样具有优势。更重要的是,新开源模型的轻量级:传送门在这个项目的GitHub页面上,林仔还分享了如何生成VOC格式的训练数据集和训练过程,以及如何更好地使用这个模型。有兴趣的话不妨看看~