第五章 通过降维压缩数据
在第四章,你学习了使用不同的特征选择方法来降维,除了特征选择,另一种降维的方法是特征抽取(feature extraction)。本章你将会学到三种基本的方法,帮助我们摘要数据集的信息,即将原始的特征空间压缩到低纬度的特征子空间。数据压缩是机器学习中的重要课题,它能帮助我们存储和分析当今时代不断涌现的大数据。本章,我们主要讨论以下几个内容:
- 主成分分析(principal component analysis, PCA), 用于无监督数据压缩
- 线性判别分析(linear discriminant analysis, LDA), 用于监督降维作为一种监督降维
- 通过核PCA进行非线性降维