罗斯·吉尔希克(Ross Girshick)在2014年提出的
与R_CNN相比,使用VGG16作为网络的骨干链,训练速度的速度快9倍,测试推理为213次,准确率从62%增加到66%
在2015年提议,互联网的骨干作为网络也被用作网络。
在特征矩阵上使用$ 3 IMES 3 $的滑动窗口,投影到原始地图,选择三个标准($ 128^2,256^2,512^2 $),三个比例($ 1:1,1::2、2、2、1:2、1:2、1:2、1:2、1:2、1:2、1:2、1:2、1:2、1:2、2、1:2、2、2,2,1:2,2,1:2,1:2,2,2,2,2,2,2,2,2,2,2,1:2,1:2,2,2,2,2,1:2,2,2,1::2,2,1:2.2:1 $)anhor,每个位置对应于原始地图上的9个锚
对于$ 1000 IMES 600 IMES 3 $的图像,大约有60美元的IMES 40 IMES 9 $锚点,忽略了横穿边界的锚点,约为6K锚。RPN生成的候选盒之间有很多重叠。基于候选框的CLS分数用于用非长度值抑制它。IOU设置为0.7,因此每个图像中只剩下2K候选框。
RPN多任务损失
火车