一.如图是预测框的相应feature map
其中anchor的长宽关系,s就是上图中的scale,a就是上图中的anchor ratio
二.代码
主要由三部分组成
1.vgg作为基础网络
要注意的是作者对38*38*512进行L2正则化,并用一个可学习参数调节通道权重
2.增加大目标检测网络
3.输出包括预测框的偏移量输出与分类
偏移量计算
误检的HEM(hard negative mine)loss函数,用于分类
import torch
import os
from torch import nn
import torch.nn.functional as F
im
评论0