多层感知机的从零实现

goldpiggy · January 14, 2021, 5:27am

https://zh.d2l.ai/chapter_multilayer-perceptrons/mlp-scratch.html

Jerry1127 · April 6, 2021, 7:04am

这个问题怎么解决

shuaizhu · April 19, 2021, 11:55am

你应该使用torch.max而不是max

函数原型：
torch.max(input, other, out=None) → Tensor
参数：
input (Tensor) – 输入张量
other (Tensor) – 输出张量
out (Tensor, optional) – 结果张量
例子：

a = torch.randn(4)
a

1.3869
0.3912
-0.8634
-0.5468
[torch.FloatTensor of size 4]

b = torch.randn(4)
b

1.0067
-0.8010
0.6258
0.3627
[torch.FloatTensor of size 4]

torch.max(a, b)

1.3869
0.3912
0.6258
0.3627
[torch.FloatTensor of size 4]

qingyulan · July 5, 2021, 12:29pm

RuntimeError: DataLoader worker (pid(s) 20584, 44860) exited unexpectedly

在运行训练代码时出现这个报错，网上说要把n_workers设置为0，
回到图像分类数据库那里，把load_data_fashion_mnist返回值里面的n_workers设置为0并重新运行仍然报错
请教下前辈们这个问题该如何解决

qingyulan · July 5, 2021, 12:41pm

问题已经解决了我重启了notebook 核心原因可能是内存方面的原因（还是不太懂）
另一方面 n_workers 在3.5一节中改变并运行能否将修改应用到这里仍然不清楚
如果遇到同样问题的人可以尝试重启重新运行解决问题如果有大神能帮忙解决上述两个问题我非常感激

chenjs · August 12, 2021, 8:57am

我是在加载完后把进程设置为0就可以了，不知道你是不是做了这个操作。
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)
test_iter.num_workers = 0
train_iter.num_workers = 0

aaronshi2017 · September 18, 2021, 2:46pm

Original: one hidden, num=256, epoch=10, lr=0.1

Test1) Change num_hiddens=512
num_hiddens_512_
似乎测试集准确率有较大波动
Test2) Change epoch=20
Epoch_20
损失函数没有变化，测试集准确率最后没有跟训练集一致
Test3) Change lr=0.05
lr_0.05
损失函数一直没有达到之前的结果，测试集准确率最后低于训练集
Test4) Adding second hidden layer num=64
2_hidden_256_64
损失函数收敛较慢，开始训练集和测试集准确率较低，但是最后更好接近
Test5) Adding third hidden layer

无论如何修改hiddenlayer num, 都有溢出

aaronshi2017 · September 18, 2021, 3:10pm

W1=nn.Parameter(torch.randn(num_inputs,num_hiddens_1,requires_grad=True)*0.01)

请问上面为什么要有*0.01?这个参数的意义是什么？如何确定取值的?

MatrixLyz0623 · November 8, 2021, 8:50am

关于问题5请大家指教：我的想法是如果调单一超参数的情况下复杂度是N，那么联合m个超参的复杂度就是N**m。
但是好像部分超参数会有关联，比如batchsize和lr，在降低batchsize的同时提高lr。会得到不错的效果。
关于问题6很希望得到大家的建议，目前我想到的办法是：在调整某个超参的时候，保证别的参数不变，当得到较优数值后再迭代的调别的参数。这样复杂度就是N*M，但是有个疑问，不能保证最后得到的结果是最好的，比如lr在不同batchsize上有不同的最优值。

Joey · November 20, 2021, 9:53am

torch.randn是生成以0为均值1为方差的随机数，之前章节中取的参数的方差是0.01，因此这儿也*0.01，不然参数会有些过大，可能会影响训练结果

whereisthewind · November 29, 2021, 9:05am

增加hidden layer以后，需要增加训练次数才能达到更好的精度，请问这是什么原因啊？

11163 · December 27, 2021, 9:38am

我的理解是，你增加了隐藏层，就需要更多次学习来得到其中的权重，否则，你学习不到理想结果的权重。

Cp233ForLearning · January 1, 2022, 2:57pm

我想知道为什么我看不到loss值

d2l-Commentor · January 2, 2022, 4:06am

Plus One 我也正想问这个问题

Nicolas_Gong · January 13, 2022, 9:59am

你debug进代码查看loss值，会发现loss的值很小，大概小数点后三(0.001),所以在图形上无法辨认

YIBOWAY · January 15, 2022, 2:58am

想问下我运行老师的代码时候，就会报类似于您最后的这个错误，请问这是什么原因呢，请教下修改建议

YIBOWAY · January 15, 2022, 10:05am

问题解决了，0.17.1的d2l包封装的pytorch的训练模型迭代的代码有一个小问题，train_epoch_ch3函数的第9行代码应该是“l.mean().backward()”，d2l包中的封装代码则是“l.sum().backward()”导致损失越来越大，会发生上述assert问题，目前GitHub上的最新版本的d2l包没有这个问题。

jgh · January 18, 2022, 1:49am

这个怎么解决啊

jgh · January 18, 2022, 3:03am

请问我也是会报出最后那个异常这个是什么意思啊

Ruid · January 19, 2022, 1:56pm

所以应该卸载现在d2l，再重装是吗？现在更新到0.17.3了可以运行了