多层感知机

https://zh.d2l.ai/chapter_multilayer-perceptrons/mlp.html

讨论题的第四问在说什么?(怎么少于20字的还不让发)

小批量套用非线性 可能会造成 过拟合 不稳定 梯度爆炸等等