【免费】27第二十七章偏最小二乘回归分析1资源-CSDN文库

需积分: 0 54 浏览量更新于2022-08-03 收藏 176KB PDF 举报

《第二十七章偏最小二乘回归分析1》偏最小二乘回归（Partial Least Squares Regression，简称PLS）是一种在统计学和数据分析中广泛使用的多元线性回归技术，尤其适用于处理变量数目众多、存在多重共线性并且样本量相对较少的情况。这种方法综合了主成分分析、典型相关分析和线性回归分析的特点，不仅能够建立合理的回归模型，还能提供关于数据结构的额外信息。 PLS回归的主要目标是找到自变量（predictors）和因变量（responses）之间的最佳线性关系，同时最大化这两组变量之间的相关性。在具体操作中，PLS首先通过提取自变量和因变量的第一对主成分，使它们之间的相关性达到最大。这一步骤可以通过求解数学上的条件极值问题实现，通常涉及到计算观测数据阵的特征值和特征向量。建模过程通常包括以下步骤： 1. 提取成分：分别从自变量和因变量集中提取第一对成分。这些成分是原始变量的线性组合，旨在最大化两者之间的相关性，同时保留最多的信息。 2. 回归建模：建立因变量对自变量第一成分的回归模型，以及自变量对第一成分的回归模型。最小二乘法用于估计回归系数，得到模型效应负荷量。 3. 残差处理：使用残差阵代替原始数据阵，重复以上步骤，提取更多的成分，直到模型达到满意的预测精度或达到预定的成分数量。 4. 交叉有效性检验：通过交叉验证来评估模型的预测性能，确保模型不过拟合或欠拟合。这一步骤对于评估模型的泛化能力至关重要。在实际应用中，PLS回归分析常用于化学计量学、生物信息学、市场研究等领域，因为它能有效处理高维数据和多重共线性问题。此外，PLS回归还具有模型解释性强、计算效率高等优点，特别是在变量数量远大于样本数量的情况下，它比传统的多元线性回归和主成分回归更适用。偏最小二乘回归是一种强大且灵活的统计工具，能够帮助研究人员在复杂的数据环境中发现变量间的关系，并构建可靠的预测模型。然而，正确理解和应用这一方法需要对统计理论有深入的理解，并结合实际数据特点进行适当的调整。

-674-

第二十七章偏最小二乘回归分析

在实际问题中，经常遇到需要研究两组多重相关变量间的相互依赖关系，并研究用

一组变量（常称为自变量或预测变量）去预测另一组变量（常称为因变量或响应变量），

除了最小二乘准则下的经典多元线性回归分析（MLR），提取自变量组主成分的主成

分回归分析（PCR）等方法外，还有近年发展起来的偏最小二乘（PLS）回归方法。

偏最小二乘回归提供一种多对多线性回归建模的方法，特别当两组变量的个数很

多，且都存在多重相关性，而观测数据的数量（样本量）又较少时，用偏最小二乘回归

建立的模型具有传统的经典回归分析等方法所没有的优点。

偏最小二乘回归分析在建模过程中集中了主成分分析，典型相关分析和线性回归分

析方法的特点，因此在分析结果中，除了可以提供一个更为合理的回归模型外，还可以

同时完成一些类似于主成分分析和典型相关分析的研究内容，提供更丰富、深入的一些

信息。

本章介绍偏最小二乘回归分析的建模方法；通过例子从预测角度对所建立的回归模

型进行比较。

§1 偏最小二乘回归分析

考虑

个因变量

yyy ,,,

L 与 m 个自变量

xxx ,,,

L 的建模问题。偏最小二

乘回归的基本作法是首先在自变量集中提出第一成分

t （

t 是

xx ,,

L 的线性组合，

且尽可能多地提取原自变量集中的变异信息）；同时在因变量集中也提取第一成分

u ，

并要求

与

相关程度达到最大。然后建立因变量

yy ,,

L 与

的回归，如果回归方

程已达到满意的精度，则算法中止。否则继续第二对成分的提取，直到能达到满意的精

度为止。若最终对自变量集提取

个成分

ttt ,,,

L ，偏最小二乘回归将通过建立

yy ,,

L 与

ttt ,,,

L 的回归式，然后再表示为

yy ,,

L 与原自变量的回归方程式，

即偏最小二乘回归方程式。

为了方便起见，不妨假定

个因变量

yy ,,

L 与 m 个自变量

xx ,,

L 均为标准

化变量。因变量组和自变量组的

n 次标准化观测数据阵分别记为

⎥

⎦

⎤

⎢

⎣

⎡

npn

111

，

⎥

⎦

⎤

⎢

⎣

⎡

nmn

111

偏最小二乘回归分析建模的具体步骤如下：

（1）分别提取两变量组的第一对成分，并使之相关性达最大。

假设从两组变量分别提出第一对成分为

t 和

u ，

t 是自变量集

xxX ),,(

L= 的

线性组合：

Xwxwxwt

mm 111111

=++= L ，

u 是因变量集

yyY ),,(

L= 的线性组

合：

Yvyvyvu

pp 111111

=++= L 。为了回归分析的需要，要求：

①

t 和

u 各自尽可能多地提取所在变量组的变异信息；

②

t 和

u 的相关程度达到最大。

由两组变量集的标准化观测数据阵

E 和

F ，可以计算第一对成分的得分向量，记

剩余9页未读，继续阅读

资源推荐

资源评论

lirumei

粉丝: 73
资源: 301

27第二十七章 偏最小二乘回归分析1

数学建模-27第二十七章 偏最小二乘回归分析.zip

基于偏最小二乘回归分析综述

偏最小二乘回归

偏最小二乘法回归

偏最小二乘回归分析(PLS)

偏最小二乘回归分析的应用

最小二乘法及数据拟合建模的回归分析

偏最小二乘回归分析ppt

常用数学模型及其算法

数学建模的29个通用模型及matlab解法.zip

数学建模常用32种算法.zip

30个重要数学模型

数学建模的基本模型.zip

偏最小二乘回归分析.zip

偏最小二乘回归算法

偏最小二乘回归分析.docx

偏最小二乘回归方法(PLS)

数学建模_优化问题_偏最小二乘回归分析

偏最小二乘回归的算法

偏最小二乘

数模大全 数学建模算法大全

科研常用代码（预测分类评价）

数学建模-30种算法-汇总大全.zip

应用多元统计分析+高惠璇-旋转后的

偏最小二乘回归,其主成分个数采取交互验证的方式选取

主成分回归于偏最小二乘回归

最新资源

27第二十七章偏最小二乘回归分析1

数学建模-27第二十七章偏最小二乘回归分析.zip

数模大全数学建模算法大全