处理缺失值最简单的手段无疑是直接将带有缺失值的特征(列)或样本(行)从数据集中去掉。去掉行可以通过dropna方法:
去掉列同样用dropna方法,只不过将参数axis设置为1:
dropna方法包含多个参数:
虽然移除缺失值的操作很简单,但是这样做的缺点也很明显,比如,如果每一行都有一个缺失值,那整个数据集都被移除了。或者移除了过多的特征。
下一节我们学习处理缺失值真正常用的做法:插入法(interpolation)。