partial-least-squares-regression.rar_regression_回归分析数据matlab_多_make

共1个文件

pdf：1个

版权申诉

regression

148 浏览量 2022-07-15 16:46:36 上传评论收藏 157KB RAR 举报

资源详情

资源评论

资源推荐

收起资源包目录

partial-least-squares-regression.rar （1个子文件）

partial least squares regression.pdf 168KB

-531-

第三十章偏最小二乘回归

在实际问题中，经常遇到需要研究两组多重相关变量间的相互依赖关系，并研究用

一组变量（常称为自变量或预测变量）去预测另一组变量（常称为因变量或响应变量），

除了最小二乘准则下的经典多元线性回归分析（MLR），提取自变量组主成分的主成

分回归分析（PCR）等方法外，还有近年发展起来的偏最小二乘（PLS）回归方法。

偏最小二乘回归提供一种多对多线性回归建模的方法，特别当两组变量的个数很

多，且都存在多重相关性，而观测数据的数量（样本量）又较少时，用偏最小二乘回归

建立的模型具有传统的经典回归分析等方法所没有的优点。

偏最小二乘回归分析在建模过程中集中了主成分分析，典型相关分析和线性回归分

析方法的特点，因此在分析结果中，除了可以提供一个更为合理的回归模型外，还可以

同时完成一些类似于主成分分析和典型相关分析的研究内容，提供更丰富、深入的一些

信息。

本章介绍偏最小二乘回归分析的建模方法；通过例子从预测角度对所建立的回归模

型进行比较。

§1 偏最小二乘回归

考虑

个变量

yyy ,,,

与 m 个自变量

xxx ,,,

" 的建模问题。偏最小二乘

回归的基本作法是首先在自变量集中提出第一成分

t （

t 是

xx ,,

" 的线性组合，且

尽可能多地提取原自变量集中的变异信息）；同时在因变量集中也提取第一成分

u ，

并要求

t 与

u 相关程度达到最大。然后建立因变量

yy ,,

与

t 的回归，如果回归方

程已达到满意的精度，则算法中止。否则继续第二对成分的提取，直到能达到满意的精

度为止。若最终对自变量集提取

个成分

ttt ,,,

" ，偏最小二乘回归将通过建立

yy ,,

与

ttt ,,,

" 的回归式，然后再表示为

yy ,,

与原自变量的回归方程式，

即偏最小二乘回归方程式。

为了方便起见，不妨假定

个因变量

yy ,,

与 m 个自变量

xx ,,

" 均为标准

化变量。因变量组和自变量组的

次标准化观测数据阵分别记为

⎥

⎦

⎤

⎢

⎣

⎡

npn

111

，

⎥

⎦

⎤

⎢

⎣

⎡

nmn

111

偏最小二乘回归分析建模的具体步骤如下：

-532-

（1）分别提取两变量组的第一对成分，并使之相关性达最大。

假设从两组变量分别提出第一对成分为

t 和

u ，

t 是自变量集

xxX ),,(

的

线性组合：

Xwxwxwt

mm 111111

=++= " ，

u 是因变量集

yyY ),,(

"= 的线性组

合：

Yvyvyvu

pp 111111

=++= "

。为了回归分析的需要，要求：

①

t 和

u 各自尽可能多地提取所在变量组的变异信息；

②

t 和

u 的相关程度达到最大。

由两组变量集的标准化观测数据阵

E 和

F ，可以计算第一对成分的得分向量，记

为

t 和

：

⎥

⎦

⎤

⎢

⎣

⎡

⎥

⎦

⎤

⎢

⎣

⎡

⎥

⎦

⎤

⎢

⎣

⎡

111

101

nmnmn

wEt ##

⎥

⎦

⎤

⎢

⎣

⎡

⎥

⎦

⎤

⎢

⎣

⎡

⎥

⎦

⎤

⎢

⎣

⎡

111

101

npnpn

vFu ##

第一对成分

t 和

u 的协方差 ),(Cov

ut 可用第一对成分的得分向量

t 和

u 的内积

来计算。故而以上两个要求可化为数学上的条件极值问题：

⎪

⎩

⎪

⎨

⎧

====

⇒>=>=<<

1,1

max,

111

1001101011

vvvwww

xFEwvYwEut

利用Lagrange乘数法，问题化为求单位向量

w 和

v ，使

⇒=

10011

vFEw

最大。问

题的求解只须通过计算

mm× 矩阵

0000

EFFEM

的特征值和特征向量，且

的最大特

征值为

，相应的单位特征向量就是所求的解

w ，而

v 可由

w 计算得到

100

wEFv

= 。

（2）建立

yy ,,

对

t 的回归及

xx ,,

" 对

t 的回归。

假定回归模型为

-533-

⎪

⎩

⎪

⎨

⎧

1110

FuF

EtE

其中

),,(

1111

ααα

"= ，

),,(

1111

βββ

"= 分别是多对一的回归模型中的参数向量，

E 和

F 是残差阵。回归系数向量

的最小二乘估计为

⎪

⎩

⎪

⎨

⎧

1101

ˆˆ

ttF

ttE

，

称

为模型效应负荷量。

（3）用残差阵

E 和

F 代替

E 和

F 重复以上步骤。

记

110

= ，

110

= ，则残差阵

001

EEE −=

，

001

FFF −=

。如果残差阵

中元素的绝对值近似为 0，则认为用第一个成分建立的回归式精度已满足需要了，可以

停止抽取成分。否则用残差阵

E 和

F 代替

E 和

F 重复以上步骤即得：

www ),,(

2212

"= ；

vvv ),,(

2212

"= 分别为第二对成分的权数。而

212

wEt = ，

212

vFu

为第二对成分的得分向量。

，

分别为 YX, 的第二对成分的负荷量。这时有

⎪

⎩

⎪

⎨

⎧

++=

222110

ˆˆ

FttF

EttE

ββ

αα

（4）设

数据阵

E 的秩为 ),1min( mnr

−

≤

，则存在

个成分

ttt ,,,

" ，

使得

⎪

⎩

⎪

⎨

⎧

+++=

FttF

EttE

ββ

αα

ˆˆ

110

把

mkmkk

xwxwt ++= "

（ rk ,,2,1 "

），代入

ttY

，即得

个

因变量的偏最小二乘回归方程式

-534-

mjmjj

xaxay ++= "

，（

mj ,,2,1 "

）

（5）交叉有效性检验。

一般情况下，偏最小二乘法并不需要选用存在的

个成分

ttt ,,,

" 来建立回归

式，而像主成分分析一样，只选用前

l 个成分（ rl

≤

），即可得到预测能力较好的回归

模型。对于建模所需提取的主成分个数

l ，可以通过交叉有效性检验来确定。

每次舍去第

i 个观测（ ni ,,2,1 "= ），用余下的 1

−

n 个观测值按偏最小二乘回归

方法建模，并考虑抽取 h 个成分后拟合的回归式，然后把舍去的第 i 个观测点代入所拟

合的回归方程式，得到

),,2,1( pjy

在第 i 个观测点上的预测值

)(

。对

ni ,,2,1 "=

重复以上的验证，即得抽取 h 个成分时第

个因变量

),,2,1( pjy

的

预测误差平方和为

∑

−=

jiijj

hyyh

)(

))(

()(PRESS （ pj ,,2,1 "

）

yyY ),,(

的预测误差平方和为

∑

)(PRESS)(PRESS 。

另外，再采用所有的样本点，拟合含

h 个成分的回归方程。这时，记第 i 个样本点

的预测值为

)(

，则可以定义

的误差平方和为

∑

−=

ijijj

hyyh

))(

()(SS

定义

的误差平方和为

∑

)(SS)(SS

当

)(PRESS h 达到最小值时，对应的 h 即为所求的成分个数。通常，总有

)(PRESS h 大于 )(SS h ，而 )(SS h 则小于 )1(SS

−

h 。因此，在提取成分时，总希望比

值

)1(SS)(PRESS −hh 越小越好；一般可设定限制值为 0.05，即当

评论收藏

内容反馈

版权申诉

JonSco

粉丝: 66
资源: 1万+

partial-least-squares-regression.rar_regression_回归分析数据 matlab_多

评论0

最新资源

partial-least-squares-regression.rar_regression_回归分析 数据 matlab_多

评论0

regression.rar_MATLAB回归分析_matlab回归_regression_回归_回归分析

matlab说话代码-The-method-of-least-squares-on-Matlab:这是回归分析中近似确定超定系统（方程组多于未

matlab偏最小二乘法代码-partial-least-squares-classification:用于数据分类的偏最小二乘算法的Matl

Partial Least Squares Regression_回归_偏最小二乘_偏最小二乘回归算法_最小二乘回归.zip

Partial Least Squares Regression_回归_偏最小二乘_偏最小二乘回归算法_最小二乘回归_源码.zi

pls.zip_PLS-regression_Plsr和pls_pls_pls matlab_多变量自回归

libPLS_1.95

7_kinds_of_Linear_regression.zip

Categorical Data Analysis Using The SAS System

Study on the Determination of Three Components in Potato Using Near Infrared Spectroscopy Based on Partial least squares and Generalized Regression Neural Networks Model

矩阵学习资源

Matrix Diﬀerential Calculus with Applications in Statistics and Econometrics

利用MATLAB实现偏最小二乘回归数学建模算法

Computational Statistics Handbook with MATLAB, 3rd Edition

Partial least squares regression for predicting economic loss of vegetables caused by acid rain (2009年)

End Point Determination of Blending PCA and PLS Regression

人工智能词汇.docx

偏最小二乘回归方法(PLS)

人工智能词汇.doc

matlab偏最小二乘法代码-feature-selection:使用PLS和行列式最大化的特征选择

张量网络 降维算法 大规模优化

冰河的渗透实战笔记-冰河.pdf

大灰狼远控2021最新版，解压密码222

J-LINK V10 V11固件.rar

ISO21434.pdf

Web安全漏洞扫描工具-AWVS14

CTF 竞赛入门指南（ctf-all-in-one）.pdf

Web中间件常见漏洞总结.pdf

最新资源

partial-least-squares-regression.rar_regression_回归分析数据 matlab_多

张量网络降维算法大规模优化