主成分分析法（PCA）原理及代码资源-CSDN文库

共2个文件

m：1个

doc：1个

5星 · 超过95%的资源需积分: 50 114 浏览量 2011-10-17 15:10:34 上传评论 2 收藏 46KB RAR 举报

资源详情

资源评论

收起资源包目录

主成分分析法（PCA）原理及代码.rar （2个子文件）

主成分分析1.doc 119KB

PCA.m 317B

1、主成分分析的概念及基本思想

主成分分析(Principle Component Analysis, PCA)是最为常用的特征提取方法，

被广泛应用到各领域，如图像处理、综合评价、语音识别、故障诊断等。它通过对

原始数据的加工处理，简化问题处理的难度并提高数据信息的信噪比，以改善抗干

扰能力。主成分概念首先由 Karl parson 在 1901 年引进，不过当时只是对非随机变

量进行讨论，1933 年 Hotelling 将这个概念推广到随机向量。

在实际问题中，研究多指标(变量)问题是经常遇到的，然而在多数情况下，不

同指标之间是有一定相关性。由于指标较多并且指标之间有一定的相关性，势必增

加了分析问题的复杂性。主成分分析就是设法将原来众多具有一定相关性的指标

(比如 p 个指标)，重新组合成一组新的相互无关的综合指标来代替原来指标。通常

数学上的处理就是将原来 p 个指标作线性组合，作为新的综合指标，但是这种线性

组合，如果不加限制，则可以有很多，我们应该如何去选取呢？如果将选取的第一

个线性组合即第一个综合指标记为 F

，自然希望 F

尽可能多的反映原来指标的信

息，这里的“信息”用什么来表达？最经典的方法就是用 F

的方差来表达，即 Var(F

)

越大，表示 F

包含的信息越多。因此在所有的线性组合中所选取的 F

应该是方差

最大的，故称 F

为第一主成分。如果第一主成分不足以代表原来 P 个指标的信息，

再考虑选取 F

即选第二个线性组合，为了有效地反映原来信息，F

已有的信息就

不需要再出现在 F

中，用数学语言表达就是要求 Cov(F

，F

)=0 ，称 F

为第二主成

分，依此类推可以构造出第三，四，…，第 p 个主成分。不难想象这些主成分之间

不仅不相关，而且它们的方差依次递减。因此在实际工作中，就挑选前几个最大主

成分，虽然这样做会损失一部分信息，但是由于它使我们抓住了主要矛盾，并从原

始数据中进一步提取了某些新的信息。因而在某些实际问题的研究中得益比损失大，

这种既减少了变量的数目又抓住了主要矛盾的做法有利于问题的分析和处理。

2、主成分分析的数学模型及几何意义

2.1、数学模型

设有 n 个样品，每个样品观测 p 项指标(变量)：X

, ….X

，得到原始

数据资料阵：

其中

用数据矩阵 X 的 p 个向量(即 p 个指标向量)X

，X

，…X

作线性组合(即

综合指标向量)为：

简写成

其中，Xi 是 n 维向量，所以 Fi 也是 n 维向量。上述方程组要求：

且系数 a

由下列原则决定：

(1) F

与 F

(i≠j,i,j=1,…p)不相关；

(2) F

是 X

，…,X

的一切线性组合(系数满足上述方程组)中方差最大的，F

与

不相关的 X

，…,X

一切线性组合中方差最大的，…，F

是与 F

，F

，…，F

都不相关的 X

，…,X

的一切线性组合中方差最大的。

如何求满足上述要求的方程组的系数 a

呢？下一节将会看到每个方程式中的

系数向量(a

, …,a

)，i=1,2, …,p 不是别的而恰好是 X 的协差阵∑的特征值所对应

的特征向量，也就是说，数学上可以证明使 Var(F

)达到最大，这个最大值是在协

方差阵∑的第一个特征值所对应特征向量处达到。依此类推使 Var(F

)达到最大值是

在协方差阵∑的第 p 个特征值所对应特征向量处达到。

2.2、主成分的几何意义

从代数学观点看主成分就是 p 个变量 X

，…,X

的一些特殊的线性组合，而

在几何上这些线性组合正是把 X

，…,X

构成的坐标系旋转产生的新坐标系，

新坐标轴使之通过样品变差最大的方向(或说具有最大的样品方差)。下面以最简单

的二元正态变量来说明主成分的几何意义。

设有 n 个样品，每个样品有 p 个变量记为 X

，…,X

，它们的综合变量记为

，F

，…，F

。当 p=2 时，原变量是 X

，X

，它们有下图的相关关系：

主成分的意义

对于二元正态分布变量，n 个分散的点大致形成为一个椭圆，若在椭圆长轴方

向取坐标轴 F

，在短轴方向聚 F

，这相当于在平面上作一个坐标变换，即按逆时

针方向旋转 θ 角度，根据旋转轴变换公式新老坐标之间有关系：

矩阵表示为：

评论收藏

内容反馈

yhj70

2013-10-01

很实用，简单明了！解决了燃眉之急

主成分分析法（PCA）原理及代码

评论20

最新资源

主成分分析法（PCA）原理及代码

评论20

最新资源

相关推荐

主成分分析(PCA)

matlab 实现主成分分析（PCA）

主成分分析法PCA_pca_序列数据_主成分分析_

主成分分析法PCA.docx

主成分分析法（PCA）原理介绍（课件）

PCA_主成分分析法代码_主成分分析_

pca kernel pca 主成分分析 核主成分分析 Matlab算法源代码

主成分分析法（PCA）

主成分分析法（PCA）及MATLAB实现

主成分分析法PCA

主成分分析法matlab

PCA主成分分析三维Demo（Matlab）

主成分分析法

PCA.zip_PCA matlab_主成分分析_主成分分析法

主成分分析法（PCA）MATLAB函数

主成分分析（PCA）法

理解主成分分析法

主成分分析法.zip_pca_主成分_主成分分析_主成分分析法_主成分案例

Qt 5实现串口调试助手 （源工程文件、0积分下载）

【SystemVerilog】路科验证V2学习笔记（全600页）.pdf

AutoSAR标准协议4.2.2

光伏-储能并网系统仿真.rar

NPPJSONViewer.zip

GD32替换STM32注意事项.pdf

XCP协议的规范文档

VS2015安装证书，JavaScript_ProjectSystem.msi，JavaScript_LanguageService.msi

CANoe通过CAPL脚本实现自动测试

蓝牙BLE协议中文版.pdf

BaiduOCR.zip

pca kernel pca 主成分分析核主成分分析 Matlab算法源代码

Qt 5实现串口调试助手（源工程文件、0积分下载）