多尺度目标检测

https://zh-v2.d2l.ai/chapter_computer-vision/multiscale-object-detection.html

  1. 是的,实际上尺度较小的往往对应较高的抽象层次,尺度较大的则对应较小的抽象层次,因为越深层、特征图尺度越小特征图上的每个位置感受野越大、非线性性越强,得到的特征映射也更加复杂抽象

  2. 见以下代码
    ‘’’
    display_anchors(img, fmap_w=4, fmap_h=4, s=[0.25])
    ‘’’

  3. 通过一个11卷积,将通道数变为(Ca+4a),其中Ca代表为每个位置a个锚框,每个锚框有C个可能的类别(含背景);4a代表每个位置a个锚框,每个锚框对应四个偏移量,这样截取前Ca个通道的输出,并沿通道维度每C个做一次softmax就得到每个位置每个锚框对应各类别概率;其余4a个通道就作为偏移量,最后输出的形状为1×(Ca+4*a)×h×w

1 Like