如何选择合适的分类器算法

对于一个具体的分类问题,如何选择合适的分类器算法绝非纸上谈兵就能确定的:每一个算法都有其独特的数据偏好和假设。再一次强调"No Free Lunch"定理:在所有场景下都最厉害的分类器是不存在滴。实际上,常用的做法就是多选择几个分类器试试,然后挑选效果最好的那一个。对于同一个问题,样本数的不同、特征数目的多少、数据集中的噪音和数据是否线性可分 都会影响到分类器的效果。

最终,分类器的性能、计算能力和预测能力,都极大依赖训练集。我们概况一下训练一个机器学习算法通常的5大步骤:

  • 特征选择
  • 选择性能评价指标
  • 选择分类器和优化算法
  • 评估模型的性能
  • 模型调参

本书的内容贯穿上面的5大步骤,不要心急,本章重点关注常用算法的重要概念,至于特征选择、预处理、评价指标和如何调参将在后面章节一一介绍。

results matching ""

    No results matching ""