实战 Kaggle 比赛：预测房价

goldpiggy · January 14, 2021, 5:33am

LinkHS · April 20, 2021, 1:24am

竞赛数据很大，使用pd.get_dummies(all_features, dummy_na=True)处理时，内存（12G）会爆，请问有什么好的办法可以处理？目前我将"Address"和"Summary"列删除了。

Wiley_Z · April 26, 2021, 5:20am

pd.to_datetime()会把’NaN’变成’NaT’，然后.astype(‘str’) … .astype(‘float’)就会报错could not convert string to float: ‘NaT’，坑死我了

Wjr-001 · July 2, 2021, 11:22am

文章，在对数据集进行0均值处理时，在未确定是否存在np.nan情况下 apply(lamba: x ; (x-x.mean())/x.std()), 在进行填补。缺少均值填补的步骤。

Ianien · July 13, 2021, 2:30am

为什么这里训练模型的时候使用的损失函数还是nn.MSEloss()而不是上面定义的那个log_rmse？我们期望的不是这个损失最小吗？

Ianien · July 13, 2021, 2:43am

为什么这里的lr要求高达5呢？一般来说不是小于1 吗？

Horus · July 20, 2021, 8:28am

翻译错误。

Horus · July 20, 2021, 8:29am

英文原版内容，means的意思应该是“均值”而非“意味着”

yangfan · August 10, 2021, 2:37am

这里应该是’test_features’

Alinanini · August 21, 2021, 2:37pm

num_samples should be a positive integer value, but got num_samples=0，总是报这个错误是什么原因呢

gray311 · September 1, 2021, 7:14am

弱弱问一句，还有12g内存吗。。。。。。

RealMorty · September 2, 2021, 2:16am

本地train能达到99%以上，但是在网站测试只有90%以下了，调参真不容易

MonKeyBoy · October 5, 2021, 6:58am

我今天看到的时候，也有这个疑问~

Zhang_Kin · December 21, 2021, 2:12pm

我也想问这个问题，而是明明按特征量来说，其实图片的数据更大才对，不知道为什么这个dummies后的数据量 shape没多少但是量是真的大

Zhang_Kin · December 25, 2021, 3:16am

主要是其他的types也有很多

william-lbn · January 14, 2022, 9:41am

训练提交kaggle成功，为什么我本地pycharm 出不来这个图呢？ debug代码也看到执行到这段逻辑了

LuYuanGao1017 · January 16, 2022, 5:01am

你好这个问题解决了吗我也遇到了一样的问题。。。

LuYuanGao1017 · January 16, 2022, 5:17am

我的好了加了个plt.show()

d2l-Commentor · January 17, 2022, 1:24am

你这是过拟合了😂 .。。。。。。。。。。。。。。。

JamRoronoa · February 15, 2022, 3:19am

预测问题在训练时还是使用最小均方误差作为损失函数，定义的log_rmse只是用来比较不同模型的好坏