没有合适的资源?快使用搜索试试~ 我知道了~
第二次作业报告1
需积分: 0 0 下载量 186 浏览量
2022-08-03
19:46:18
上传
评论
收藏 12.63MB PDF 举报
温馨提示
试读
89页
1. 基本原理 1. 向量数据集去均值 2. 求协方差矩阵 3. 求取协方差矩阵的特征值和特征向量 4. 得到 2. 仿真方法 3. 压缩结果 1. 按图像作为
资源详情
资源评论
资源推荐
学号:17210720048 姓名:俞钧昊
神经网络第二次作业
一、PCA压缩
用两种PCA方法对人脸图像进行压缩,分别给出压缩比为50%,60%,70%,80%,90%,95%时,SNR是多少。
更进一步,对两种PCA的求法进行比较分析
1. 基本原理
1.1理论原理
对于给定的向量数据集,一般情况下,向量分量与分量之间存在高度的相关性,这表现在线性空间中,就是数据集
大多数都分布在某个子空间附近,因此,对原始数据集的坐标轴进行旋转,得到新的坐标轴,在新的坐标轴中,数
据的分布使得某些分量值更接近在0附近,从而其他维的信息可以作为该数据的估计。而这里的变换矩阵,从理论
上来说,可以通过求协方差矩阵特征向量来获得,对于新坐标系中某些维的省略,构成了PCA压缩的原理,这也是
PCA算法一种几何解释。如下图所示,向量
就是这些数据的两个主元。
PCA本质上是一个基替换的过程,假设元数据 ,变换后的数据 。其目的是找到 个基, 。
使得投影后的数据误差最小。
1
因此,记新的一组正交基为:
。则
为 上的投影系数。取其中的 个基:
则目标即是:
所以,当 为协方差矩阵 的特征向量时:
所以当取最大的 个特征值对应的特征向量时,E将最小。
1.2 算法分类
1.2.1 COVPCA
即用协方差矩阵的特征值来进行PCA,流程如下:
1. 向量数据集去均值
2. 求协方差矩阵
3. 求取协方差矩阵的特征值和特征向量。保留前 个最大特征值以及对应的特征向量
4. 得到
可以预想到,这种方法在协方差矩阵维数小时会很快,但是当协方差矩阵维数很大时,会出现维数灾难,大大增加
计算量,使得非常耗时。当然,当样本数和样本长有一个较小时,可以用对样本矩阵先转置再求解的方法来处理,
这样会大大减少运算量,因为两个协方差矩阵的特征值是一致的。
1.2.2 CCIPCA(Candid Covariance Free Incremental PCA)
在协方差PCA方法中,计算协方差是唯一在实际操作中比较困难的方法。由于我们对于统计量,可以采用步进的方
法实现,当输入的样本数量足够多,且样本的统计特性比较稳定的时候,步进的方式得到的协方差可以趋于真实数
据的协方差。在该思路的基础上,提出了CCFIPCA的算法。
首先是对于第一个主元的收敛。若在某次迭代后,
趋于对应最大特征值的特征向量的倍数,即 ,
其中
为特征值,则由特征值特征向量的定义,有:
神经网络第二次作业报告
2
压缩率 主元个数m 实际压缩率
10% 1 10.01%
20% 2 20.02%
30% 3 30.03%
40% 4 40.04%
50% 5 50.05%
60% 6 60.06%
70% 7 70.07%
80% 8 80.08%
90% 9 90.09%
当
稳定时,由上式可以得到迭代公式:
所以当 收敛后,归一化即可得到最大特征值对应的特征向量,然后将原数据减去该方向上的投影,即:
之后对于去除第一主元的样本再用上述方法可以求取次大的特征值所对的特征向量。而实际操作中减去主分量的步
骤可以穿插在每一步迭代中进行。
2. 仿真方法
2.1 压缩比和PCA主元数
压缩比又称为压缩率,PCA压缩的计算方法如下:
记主元个数为
,主元长度为 ,样本个数为 ,则,压缩比 为:
也有将压缩比记为被压缩数据量与原数据量的比值,即为 , 在这里,我采用上面的说法,出于完整性考虑,
在列表时也会列出10%-90%的PSNR值,但出于篇幅考虑,仅放少部分图片。
所以主元数与其他参数的关系为:
在本例中,所有图像为: pixel大小,所以可以取每个主元长度为10304。按人进行压缩时,则每次有10
个样本,则(无法达到95%压缩率,所以不列出):
神经网络第二次作业报告
3
压缩比 主元个数m 实际压缩率
5% 4 4.47%
10% 9 10.59%
20% 17 20.00%
30% 26 30.58%
40% 34 39.99%
50% 43 50.58%
60% 51 59.99%
70% 60 70.57%
80% 68 80.00%
90% 77 90.57%
95% 81 95.28%
压缩比 主元个数m 实际压缩率
5% 5 5.02%
10% 10 10.04%
20% 20 20.08%
30% 30 30.12%
40% 90 40.16%
50% 50 50.08%
60% 60 60.09%
70% 70 70.11%
80% 80 80.12%
90% 90 90.14%
95% 95 95.15%
当以每行像素为样本时,则主元长度为92,按人进行压缩,则每次有1120个样本,则:
以每列为样本时,主元长为112,按人进行压缩,则每次有920个样本,则:
以每幅图的同一个像素作为样本,主元长为10,每次有10304个样本,则:
神经网络第二次作业报告
4
压缩比 主元个数m 实际压缩率
10% 1 10.01%
20% 2 20.02%
30% 3 30.03%
40% 4 40.04%
50% 5 50.05%
60% 6 60.06%
70% 7 70.07%
80% 8 80.08%
90% 9 90.09%
3.2压缩图像评价标准:
3.2.1 峰值信噪比PSNR
一般来说,对于压缩最直观也最常用的便是肉眼评价,但是这一方法具有一定的主观性,并且,对于微小差异无法
给出评价。在此,我们使用峰值信噪比(PSNR)和压缩比进行评价,其中,峰值信噪比定义为:
为图像点最大值,对于uint8的图像, , 为均方误差:
为原始图像, 为压缩后的图像。
3. 压缩结果
以下结果均以s1作为样本进行PSNR的分析:
3.1 COVPCA
1. 按图像作为样本进行压缩:
神经网络第二次作业报告
5
剩余88页未读,继续阅读
耄先森吖
- 粉丝: 60
- 资源: 293
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0