“如果使用了全连接层,可能会完全放弃表征的空间结构”
请问这是为什么?
在pytorch版本中,直接按照原NIN的代码训练老是显示accuracy是10%,在每个卷积层后面加一个BatchNorm之后就可以正常训练了。
个人理解是空间结构是在表征在不同的输出通道的 用全连接层需要flattern 把不同的通道连接在一起展平 作为输入 输出也是一样 因此损失了空间结构
“如果使用了全连接层,可能会完全放弃表征的空间结构”
请问这是为什么?
在pytorch版本中,直接按照原NIN的代码训练老是显示accuracy是10%,在每个卷积层后面加一个BatchNorm之后就可以正常训练了。
个人理解是空间结构是在表征在不同的输出通道的 用全连接层需要flattern 把不同的通道连接在一起展平 作为输入 输出也是一样 因此损失了空间结构