基于PCA的图像降维及重构.rar_对图像进行PCA降维资源-CSDN文库

共2个文件

jpg：1个

py：1个

4星 · 超过85%的资源需积分: 50 56 浏览量 2019-09-23 19:23:57 上传评论 5 收藏 34KB RAR 举报

PCA（主成分分析，Principal Component Analysis）是一种广泛应用的数据降维技术，它通过线性变换将原始数据转换到一个新的坐标系中，新坐标系中的各坐标轴是原数据集中变量的线性组合，这些新的坐标轴被称为主成分。主成分的选取原则是它们是方差最大的方向，这样可以尽可能保留原始数据的信息，同时减少数据的维度，降低计算复杂度。在图像处理领域，PCA常被用于图像降维和特征提取。图像通常具有高维特性，例如一个像素为24位色彩的图像，每一行每一列都代表一个特征维度。当图像数据量庞大时，计算和存储成本会显著增加。通过PCA，我们可以将高维图像数据转换为较低维的表示，从而减少计算资源的需求，同时在一定程度上保持图像的主要特征。在给定的"PCA_TEST.py"代码中，很可能包含了PCA的实现过程。代码可能会加载"banana.jpg"这张测试图像，将其像素值作为数据样本。接着，PCA的预处理步骤可能包括对图像进行灰度化处理，如果图像原本是彩色的，以及数据标准化，使得数据具有相同的尺度。 PCA的核心步骤如下： 1. **计算均值**：对每个特征（像素）计算平均值，然后将所有数据减去均值，使得数据集的中心位于原点。 2. **计算协方差矩阵**：协方差矩阵反映了各个特征之间的关联程度，它是数据变形的重要度量。 3. **求解特征值和特征向量**：通过对协方差矩阵进行特征分解，可以得到一组特征值和对应的特征向量。特征值代表了特征向量所在方向上的数据变异性，而特征向量则对应了新的坐标轴。 4. **选择主成分**：根据特征值的大小排序，选取前k个最大的特征值对应的特征向量，这k个特征向量构成新的主成分空间。 5. **投影和重构**：原始数据可以被投影到这个低维空间中，形成降维后的数据。若要恢复原始数据，可以通过主成分的逆变换进行重构。在"PCA_TEST.py"中，降维后的图像可能会被用来展示PCA的效果，比如比较降维前后的图像质量和信息损失。此外，由于标签提到了“迁移学习”，可能这个例子还涉及将PCA用于预处理，以提取图像的特征，然后将这些特征输入到预训练的深度学习模型中，实现迁移学习的目的。在迁移学习中，PCA可以降低过拟合的风险，提高模型的泛化能力。 PCA是一种强大的数据分析工具，尤其在处理高维图像数据时，它可以有效降低数据维度，提高计算效率，同时保持关键信息。在这个示例中，PCA被应用于图像降维，并可能结合了迁移学习，以提升机器学习模型的性能。

资源推荐

资源详情

资源评论

收起资源包目录

PCA.rar （2个子文件）

banana.jpg 37KB

PCA_TEST.py 3KB

#encoding:GBK """ Created on 2019/09/23 16:19:11 @author: Sirius_xuan """ ''' 基于PCA的图像降维及重构 ''' import numpy as np import cv2 as cv def Z(dataMat): rows,cols=dataMat.shape meanVal = np.mean(dataMat, axis=0) # 按列求均值，即求各个特征的均值 meanVal = np.tile(meanVal,(rows,1)) stdVal = np.std(dataMat, axis=0) # 按列求标准差，即求各个特征的标准差 stdVal = np.tile(stdVal,(rows,1)) newdata = (dataMat-meanVal) / stdVal return newdata, meanVal #数据中心化 def Z_centered(dataMat): rows,cols=dataMat.shape meanVal = np.mean(dataMat, axis=0) # 按列求均值，即求各个特征的均值 meanVal = np.tile(meanVal,(rows,1)) ''' stdVal = np.std(dataMat, axis=0) # 按列求标准差，即求各个特征的标准差 stdVal = np.tile(stdVal,(rows,1)) newdata = (dataMat-meanVal) / stdVal ''' newdata = dataMat-meanVal return newdata, meanVal #协方差矩阵 def Cov(dataMat): meanVal = np.mean(data,0) #压缩行，返回1*cols矩阵，对各列求均值 meanVal = np.tile(meanVal, (rows,1)) #返回rows行的均值矩阵 Z = dataMat - meanVal Zcov = (1/(rows-1))*Z.T * Z return Zcov #最小化降维造成的损失，确定k def Percentage2n(eigVals, percentage): sortArray = np.sort(eigVals) # 升序 sortArray = sortArray[-1::-1] # 逆转，即降序 arraySum = sum(sortArray) tmpSum = 0 num = 0 for i in sortArray: tmpSum += i num += 1 if tmpSum >= arraySum * percentage: return num #得到最大的k个特征值和特征向量 def EigDV(covMat, p): D, V = np.linalg.eig(covMat) # 得到特征值和特征向量 k = Percentage2n(D, p) # 确定k值 print("保留99%信息，降维后的特征个数："+str(k)+"\n") eigenvalue = np.argsort(D) K_eigenValue = eigenvalue[-1:-(k+1):-1] K_eigenVector = V[:,K_eigenValue] return K_eigenValue, K_eigenVector #得到降维后的数据 def getlowDataMat(DataMat, K_eigenVector): return DataMat * K_eigenVector #重构数据 def Reconstruction(lowDataMat, K_eigenVector, meanVal): reconDataMat = lowDataMat * K_eigenVector.T + meanVal return reconDataMat #PCA算法 def PCA(data, p): dataMat = np.float32(np.mat(data)) #数据中心化 dataMat, meanVal = Z_centered(dataMat) #计算协方差矩阵 #covMat = Cov(dataMat) covMat = np.cov(dataMat, rowvar=0) #得到最大的k个特征值和特征向量 D, V = EigDV(covMat, p) #得到降维后的数据 lowDataMat = getlowDataMat(dataMat, V) #重构数据 reconDataMat = Reconstruction(lowDataMat, V, meanVal) return reconDataMat def main(): imagePath = 'D:/desktop/banana.jpg' image = cv.imread(imagePath) image=cv.cvtColor(image,cv.COLOR_BGR2GRAY) rows,cols=image.shape print("降维前的特征个数："+str(cols)+"\n") print(image) print('----------------------------------------') reconImage = PCA(image, 0.99) reconImage = reconImage.astype(np.uint8) print(reconImage) cv.imshow('test',reconImage) cv.waitKey(0) cv.destroyAllWindows() if __name__=='__main__': main()

评论收藏

内容反馈