在训练13.7 SSD模型的过程中,我的训练结果出现了梯度爆炸的情况:
最后MAE上升到了6000多(书上的结果是小于0.005),class error正常。我没有修改过书上的任何代码。有没有大佬解释一下为什么会出现这种情况,我要怎么修改代码才能让MAE正常收敛?