没有合适的资源？快使用搜索试试~ 我知道了~

文库首页安全技术网络安全第二次作业报告1

第二次作业报告1

需积分: 0 0 下载量 186 浏览量 2022-08-03 19:46:18 上传评论收藏 12.63MB PDF 举报

温馨提示

试读

89页

1. 基本原理 1. 向量数据集去均值 2. 求协方差矩阵 3. 求取协方差矩阵的特征值和特征向量 4. 得到 2. 仿真方法 3. 压缩结果 1. 按图像作为

资源详情

资源评论

资源推荐

学号：17210720048 姓名：俞钧昊

神经网络第二次作业

一、PCA压缩

用两种PCA方法对人脸图像进行压缩，分别给出压缩比为50%，60%，70%，80%，90%，95%时，SNR是多少。

更进一步，对两种PCA的求法进行比较分析

1. 基本原理

1.1理论原理

对于给定的向量数据集，一般情况下，向量分量与分量之间存在高度的相关性，这表现在线性空间中，就是数据集

大多数都分布在某个子空间附近，因此，对原始数据集的坐标轴进行旋转，得到新的坐标轴，在新的坐标轴中，数

据的分布使得某些分量值更接近在0附近，从而其他维的信息可以作为该数据的估计。而这里的变换矩阵，从理论

上来说，可以通过求协方差矩阵特征向量来获得，对于新坐标系中某些维的省略，构成了PCA压缩的原理，这也是

PCA算法一种几何解释。如下图所示，向量

就是这些数据的两个主元。

PCA本质上是一个基替换的过程，假设元数据，变换后的数据。其目的是找到个基，。

使得投影后的数据误差最小。

因此，记新的一组正交基为：

。则

为上的投影系数。取其中的个基：

则目标即是：

所以，当为协方差矩阵的特征向量时：

所以当取最大的个特征值对应的特征向量时，E将最小。

1.2 算法分类

1.2.1 COVPCA

即用协方差矩阵的特征值来进行PCA，流程如下：

1. 向量数据集去均值

2. 求协方差矩阵

3. 求取协方差矩阵的特征值和特征向量。保留前个最大特征值以及对应的特征向量

4. 得到

可以预想到，这种方法在协方差矩阵维数小时会很快，但是当协方差矩阵维数很大时，会出现维数灾难，大大增加

计算量，使得非常耗时。当然，当样本数和样本长有一个较小时，可以用对样本矩阵先转置再求解的方法来处理，

这样会大大减少运算量，因为两个协方差矩阵的特征值是一致的。

1.2.2 CCIPCA(Candid Covariance Free Incremental PCA)

在协方差PCA方法中，计算协方差是唯一在实际操作中比较困难的方法。由于我们对于统计量，可以采用步进的方

法实现，当输入的样本数量足够多，且样本的统计特性比较稳定的时候，步进的方式得到的协方差可以趋于真实数

据的协方差。在该思路的基础上，提出了CCFIPCA的算法。

首先是对于第一个主元的收敛。若在某次迭代后，

趋于对应最大特征值的特征向量的倍数，即，

其中

为特征值，则由特征值特征向量的定义，有：

神经网络第二次作业报告

压缩率主元个数m 实际压缩率

10% 1 10.01%

20% 2 20.02%

30% 3 30.03%

40% 4 40.04%

50% 5 50.05%

60% 6 60.06%

70% 7 70.07%

80% 8 80.08%

90% 9 90.09%

当

稳定时，由上式可以得到迭代公式：

所以当收敛后，归一化即可得到最大特征值对应的特征向量，然后将原数据减去该方向上的投影，即：

之后对于去除第一主元的样本再用上述方法可以求取次大的特征值所对的特征向量。而实际操作中减去主分量的步

骤可以穿插在每一步迭代中进行。

2. 仿真方法

2.1 压缩比和PCA主元数

压缩比又称为压缩率，PCA压缩的计算方法如下：

记主元个数为

，主元长度为，样本个数为，则，压缩比为：

也有将压缩比记为被压缩数据量与原数据量的比值，即为，在这里，我采用上面的说法，出于完整性考虑，

在列表时也会列出10%-90%的PSNR值，但出于篇幅考虑，仅放少部分图片。

所以主元数与其他参数的关系为：

在本例中，所有图像为： pixel大小，所以可以取每个主元长度为10304。按人进行压缩时，则每次有10

个样本，则（无法达到95%压缩率，所以不列出）：

神经网络第二次作业报告

压缩比主元个数m 实际压缩率

5% 4 4.47%

10% 9 10.59%

20% 17 20.00%

30% 26 30.58%

40% 34 39.99%

50% 43 50.58%

60% 51 59.99%

70% 60 70.57%

80% 68 80.00%

90% 77 90.57%

95% 81 95.28%

压缩比主元个数m 实际压缩率

5% 5 5.02%

10% 10 10.04%

20% 20 20.08%

30% 30 30.12%

40% 90 40.16%

50% 50 50.08%

60% 60 60.09%

70% 70 70.11%

80% 80 80.12%

90% 90 90.14%

95% 95 95.15%

当以每行像素为样本时，则主元长度为92，按人进行压缩，则每次有1120个样本，则：

以每列为样本时，主元长为112，按人进行压缩，则每次有920个样本，则：

以每幅图的同一个像素作为样本，主元长为10，每次有10304个样本，则：

神经网络第二次作业报告

压缩比主元个数m 实际压缩率

10% 1 10.01%

20% 2 20.02%

30% 3 30.03%

40% 4 40.04%

50% 5 50.05%

60% 6 60.06%

70% 7 70.07%

80% 8 80.08%

90% 9 90.09%

3.2压缩图像评价标准：

3.2.1 峰值信噪比PSNR

一般来说，对于压缩最直观也最常用的便是肉眼评价，但是这一方法具有一定的主观性，并且，对于微小差异无法

给出评价。在此，我们使用峰值信噪比（PSNR）和压缩比进行评价，其中，峰值信噪比定义为：

为图像点最大值，对于uint8的图像，，为均方误差：

为原始图像，为压缩后的图像。

3. 压缩结果

以下结果均以s1作为样本进行PSNR的分析：

3.1 COVPCA

1. 按图像作为样本进行压缩：

神经网络第二次作业报告

剩余88页未读，继续阅读

内容反馈

耄先森吖

粉丝: 60
资源: 293

上传资源快速赚钱

我的内容管理展开

我的资源快来上传第一个资源

我的收益

登录查看自己的收益

我的积分登录查看自己的积分

我的C币登录后查看C币余额

我的收藏

我的下载

下载帮助

前往需求广场，查看用户热搜

第二次作业报告1

评论0

最新资源

第二次作业报告1

评论0

张逸凯171840708数据挖掘第二次作业报告1

数字通信_王浩_MG20230081_第二次作业报告1

自然语言处理第二次作业报告1

HSEA-第二次作业-实验报告1

计算机视觉第二次作业实验报告.docx

团队第二次作业——需求分析报告

团队第二次作业——原型设计报告

第二次作业评分标准1

第二次作业书面作业报告1

北科大MATLAB实验报告第二次作业MATLAB绘图.pdf

第二次作业实验报告1

《机器学习》第二次大作业实验报告.docx

数值第二次大作业报告_梁寒杲_2017011582_自752

东北大学图像处理第二次作业.rar_Kirsch滤波_mrf_socialhw8_东北大学图像处理第二次作业_基于马尔可夫随机场

RFID第二次作业及心得

吉林大学软件学院服务计算概论第二次作业

广工密码学第一二次作业

燕山大学软件工程操作系统第一次作业

BurpLoaderKeygen.jar.zip

最新版ISO/IEC 27001:2022、ISO 27002:2022中英文合集

Goby红队版-win-x64-2.4.7版本

Chrome Header Editor 插件

ISO SAE 21434-2021 中文版.pdf

OpenVAS GVM 中文翻译补丁

安全认证cisp教材全套

STM32F103C8T6核心板-电路原理图1.PDF

软件工程导论(第六版)课后习题答案1

OpenVAS离线资源

最新资源