消除带有缺失值的特征或样本

处理缺失值最简单的手段无疑是直接将带有缺失值的特征(列)或样本(行)从数据集中去掉。去掉行可以通过dropna方法:

去掉列同样用dropna方法,只不过将参数axis设置为1:

dropna方法包含多个参数:

虽然移除缺失值的操作很简单,但是这样做的缺点也很明显,比如,如果每一行都有一个缺失值,那整个数据集都被移除了。或者移除了过多的特征。

下一节我们学习处理缺失值真正常用的做法:插入法(interpolation)。

results matching ""

    No results matching ""