小组成员:何思远 董雅雯
基于PCA主元分析
的化工过程故障诊断
每个变量都在不同程度上反映了所研究问题的信息,指标间彼
此有一定的相关性,所得的统计数据反映的信息在一定程度上有重
叠。在用统计方法研究多变量问题时,变量太多会增加计算量和增
加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的
变量较少,得到的信息量较多。主成分分析(PCA)正是适应这一要
求产生的,是解决这类题的理想工具。
问题介绍
主成分分析法是一种降维的统计方法,它借助于一
个正交变换,将其分量相关的原随机向量转化成其分量
不相关的新随机向量,这在代数上表现为将原随机向量
的协方差阵变换成对角形阵,在几何上表现为将原坐标
系变换成新的正交坐标系,使之指向样本点散布最开的
p 个正交方向,然后对多维变量系统进行降维处理,使
之能以一个较高的精度转换成低维变量系统,再通过构
造适当的价值函数,进一步把低维系统转化成一维系统
。
问题介绍
PCA主要步骤
1.形成样本矩阵,样本中心化
2.计算样本矩阵的协方差矩阵
3.对协方差矩阵进行特征值分解,选取最大的p个特征值对应的
特征向量组成投影矩阵
4.对原始样本矩阵进行投影,得到降维后的新样本矩阵
数据标准化
在进行主元分析时,首先要将数据进行标准化,即将每个变
量的均值减掉然后除以它的标准差。
其中M是变量X的均值,s是变量X的标准差。