实战 Kaggle 比赛:预测房价

https://zh-v2.d2l.ai/chapter_multilayer-perceptrons/kaggle-house-price.html

竞赛数据很大,使用pd.get_dummies(all_features, dummy_na=True)处理时,内存(12G)会爆,请问有什么好的办法可以处理?目前我将"Address"和"Summary"列删除了。

pd.to_datetime()会把’NaN’变成’NaT’,然后.astype(‘str’) … .astype(‘float’)就会报错could not convert string to float: ‘NaT’,坑死我了 :sob: