当前位置: 首页 > 科技观察

只有1MB大小!超轻量级人脸识别模型在Github上火爆

时间:2023-03-21 12:31:33 科技观察

近日,用户Linzaer在Github上开源了一个适用于边缘计算设备、移动设备和PC端的超轻量级通用人脸检测模型。该模型文件仅1MB大小,一经开源便霸占GithubTrending榜单。短短几天时间,Github上已经有2.1Kstar和398个fork(Github地址:https://github.com/Linzaer/Ultra-Light-Fast-Generic-Face-Detector-1MB)据Linzaer介绍,这模型是为边缘计算设备或低计算设备(如ARM推理)设计的。可用于ARM等低算力设备,实现一般场景下的实时人脸检测和推理。也适用于移动终端和PC。.其主要有以下特点:在模型大小方面,默认的FP32精度(.pth)文件大小为1.04~1.1MB,推理框架int8量化大小约为300KB。在模型计算方面,320x240的输入分辨率约为90~109MFlops。模型有两个版本,version-slim(主干流线速度稍快),version-RFB(增加了改良的RFB模块,精度更高)。提供在320x240和640x480的不同输入分辨率下使用widerface训练的预训练模型,可以更好地适应不同的应用场景。支持onnx导出,便于移植推理。目前测试的正常运行环境如下:Ubuntu16.04,Ubuntu18.04,Windows10(inference)Python3.6Pytorch1.2CUDA10.0+CUDNN7.6准确率、速度、模型大小对比训练集使用Retinaface清洗的widerface标签与widerface数据集结合生成VOC训练集。Widerface测试在WIDERFACE测试集上进行测试(单尺度输入分辨率:320*240或按最大边长320缩放)。在WIDERFACE测试集上测试准确率(单尺度Scale输入分辨率:VGA640*480或与最大边长640成正比)终端设备推理速度树莓派4BMNN推理测试耗时(单位:ms)(ARM/A72x4/1.5GHz/输入分辨率:320x240/int8量化)模型尺寸对比图片效果如下: