本章最开始我们介绍了如何处理缺失值。在训练模型之前,我们必须保证已经正确处理分类数据。
此外,我们简单讨论了L1正则,它可以帮助我们降低模型复杂度来避免过拟合。另一种移除不相关特征的方法是使用序列特征选择算法来选择有意义的特征。
在下一章,你将会学到另一类降维的方法:特征抽取。它能够将特征压缩到一个低维度子空间而不是移除某些特征。