(一) 数据降维——主成分分析(PCA)
本文主要目的是了解 PCA 的计算流程以及 MATLAB 自带的 PCA 函数参数说明,从数据
的计算过程了解 PCA 的结果。借鉴其他人工作,在此做一些总结,希望对他人有所帮助。
PCA 思想:利用降维的思想,把多个特征转化为少数的几个综合特征,其中每个成分都
是原始变量的线性组合,且各成分之间互不相关,从而这些成分能够反映原始变量的绝
大部分信息,且所含信息互不重叠。
PCA 过程:1 矩阵标准化。2.计算标准化的矩阵协方差;3 计算协方差矩阵的特征值和特
征向量,并按照特征值从大到小排序;4. 根据要求(这一步计算贡献率)选取降多少
维,计算标准化矩阵*特征向量的个数,即为所要将的维数。(即我们最终所要的数据)
1)验证:MATLAB(pca 函数),数据 hald
load hald
[coeff,score,latent,tsquared,explained,mu] = pca(ingredients);
coeff 为主成分系数,也是特征向量的按照特征值从大到小排序。
Score 为主成分分数,为标准化的数据*coeff