如果是在jupyter notebook里运行,检查一下内核选对没,我之前就是没有选内核(内核在上面工具栏kernel里最下面有个change kernel 里面是你的所有环境)
主要是学习率的问题,我bs调成2048也能收敛