实战 Kaggle 比赛:预测房价

你好,我独热编码后也是330个特征,请问你现在解决了吗?到底是什么原因导致少了一个特征啊

你好,请问330的问题怎么解决啊,我也少一个特征

我也是k :smiling_face_with_tear:,听说是有些版本下none会被当做na缺失值,所以少了特征为none的独热编码,但不知道怎么解决呜呜呜

找到解决方案了,在train.csv和test.csv文件里去把None全部替换成None_或者None_pea就行了,反正别是None,用ide的查找加全部替换就可以了

要么就是把summary那一列去掉,要么对该列单独使用ordinalencoder(但会引入顺序关系,可能会干扰模型)、要么仔细观察这一列数据,检查是否有价值,如果没有额外的信息价值是可以去掉该列特征的(可以使用互信息查看)。