第四章 构建一个好的训练集---数据预处理

数据的质量和包含的有用信息量是决定一个机器学习算法能够学多好的关键因素。因此,我们在训练模型前评估和预处理数据显得至关重要。在本章,我们要讨论必不可少的预处理技术,能够帮助我们构建更好的机器学习模型。

本章涉及的主题:

  • 移除数据集中的缺失值
  • 将分类(category)数据转型,能够被机器学习算法处理
  • 特征选择

results matching ""

    No results matching ""