参数管理

这个就是表示问题 , 可能 torch 默认就是行列互换的形式

我的理解是反向传播计算梯度,share层的梯度会计算两次,这两次的结果会叠加,也就是你这个值是叠加两次后的梯度值

为什么5.2中第一个参数管理中的权重和偏置会有输出,但是没有给它们赋值啊,难道是因为初始化会随机生成权重和偏置吗?