https://zh.d2l.ai/chapter_linear-networks/linear-regression-concise.html
Exercise 1
将学习率除以 batch_size,使得梯度值都差不多,便于学习率的调整(感觉像梯度的归一化)。参考沐神的解答 3:18
Exercise 2
损失替换成 Huber Loss:
原来的 MSE:
Exercise 3
(可参考 2.5. 自动微分)
1 Like