http://zh.d2l.ai/chapter_convolutional-modern/nin.html
“如果使用了全连接层,可能会完全放弃表征的空间结构” 请问这是为什么?
在pytorch版本中,直接按照原NIN的代码训练老是显示accuracy是10%,在每个卷积层后面加一个BatchNorm之后就可以正常训练了。