深度卷积神经网络(AlexNet)

应该是写错了。AlexNet 原论文,没有说要加 padding。

LeNet 的 SGD 用的默认值 weight_decay=0 ,应该也是没有使用权重衰减吧

我是在回复那个在网络结构里找不到权重衰减的帖子。这是个超参数,可以调的不一定用0,