使用块的网络(VGG)

https://zh.d2l.ai/chapter_convolutional-modern/vgg.html

因为后三个卷积层块,每个块里有两个卷积层

8 Likes

我的打印里可以看到11个层的结构啊,为啥习题1说只有8层?
Sequential output shape: torch.Size([1, 64, 112, 112])
Sequential output shape: torch.Size([1, 128, 56, 56])
Sequential output shape: torch.Size([1, 256, 28, 28])
Sequential output shape: torch.Size([1, 512, 14, 14])
Sequential output shape: torch.Size([1, 512, 7, 7])
Flatten output shape: torch.Size([1, 25088])
Linear output shape: torch.Size([1, 4096])
ReLU output shape: torch.Size([1, 4096])
Dropout output shape: torch.Size([1, 4096])
Linear output shape: torch.Size([1, 4096])
ReLU output shape: torch.Size([1, 4096])
Dropout output shape: torch.Size([1, 4096])
Linear output shape: torch.Size([1, 10])

在笔记本CPU上训练,很慢,半天没出结果

你的输出只看Sequential和Linear是8层:5层Sequential和3层Linear。

5 Likes

上节的AlexNet我在macbook上跑了通宵,第二天一看,花了811分钟 :crazy_face:
感觉这一章的内容确实需要支持CUDA的电脑 :rofl:

6 Likes

我疑惑的是样本数总共就几万个,跑vgg里面有千万个参数不会过拟合吗

2 Likes

1,后三层的2个卷积看成了一个块,所以只有8层,因为在做conv_blks.append()时是按照块添加的。

2 Likes

我colab跑一次100多分钟,太离谱了,有钱人游戏

1 Like

请问一下各位,这两个报错是什么意思呢?该怎么解决呢?
RuntimeError: cuDNN error: CUDNN_STATUS_INTERNAL_ERROR
RuntimeError: DataLoader worker (pid(s) 8884, 16172, 3724) exited unexpectedly

上colab吧,如果免费的觉得不够用可以花个10美元一个月直接起飞

1 Like

不会吧,我也是colab非付费用户,分到的gpu是tesla k80跑完程序花了31分钟

1 Like

我这边用colab pro跑起来10min,还挺快的

1 Like

so,他采用了dropout,防止过拟合啊

2 Likes

我这个跑的比前面的AlexNet还要快啊

1 Like

前几天试过了,国内的银行卡不支持支付呀…

X = torch.randn(size=(1, 1, 224, 224))
想问问这前两个1分别是什么啊?

批量 和 通道吧 好像 111111111111

1 Like

我记得有家银行可以,好像是工商银行还是啥的,可以用PayPal

1 Like

我怕把我的电脑跑炸了,gpu温度40摄氏度