没有合适的资源?快使用搜索试试~ 我知道了~
针对特定测试样本的隐写分析方法1
需积分: 0 0 下载量 37 浏览量
2022-08-04
13:53:17
上传
评论
收藏 1.89MB PDF 举报
温馨提示
试读
15页
摘要:现今主流的图像隐写分析方法主要聚焦于设计检测特征,用以提高通用盲检测(universal blind detection,简称 UBD)模型的检测准确率,
资源详情
资源评论
资源推荐
软件学报 ISSN 1000-9825, CODEN RUXUEW E-mail: jos@iscas.ac.cn
Journal of Software,2018,29(4):9871001 [doi: 10.13328/j.cnki.jos.005411] http://www.jos.org.cn
©中国科学院软件研究所版权所有. Tel: +86-10-62562563
针对特定测试样本的隐写分析方法
张逸为
1,2
,
张卫明
1,2
,
俞能海
1,2
1
(中国科学技术大学 信息科学技术学院,安徽 合肥 230027)
2
(中国科学院 电磁空间信息重点实验室(中国科学技术大学),安徽 合肥 230027)
通讯作者: 张卫明, E-mail: zhangwm@ustc.edu.cn
摘 要: 现今主流的图像隐写分析方法主要聚焦于设计检测特征,用以提高通用盲检测(universal blind detection,
简称 UBD)模型的检测准确率,这类检测方法与待测图像无关,难以做到精准检测.在拥有大数据训练资源的前提下,
研究了隐写对图像特征的影响,找出了隐写分析与图像特征之间的重要关系,基于此提出了一种为测试样本选择专
用训练集的隐写分析方法.以经典的 JPEG 隐写算法 nsF5 和主流的 JPEG 隐写分析特征(CC-PEV、CC-Chen、
CF*、DCTR 和 GFR)为例组织实验,结果表明,该方法的检测准确率高于其他同类方法.
关键词: 信息隐藏;隐写分析;特定测试样本;高精度;机器学习
中图法分类号: TP391
中文引用格式: 张逸为,张卫明,俞能海.针对特定测试样本的隐写分析方法.软件学报,2018,29(4):9871001. http://www.jos.
org.cn/1000-9825/5411.htm
英文引用格式: Zhang YW, Zhang WM, Yu NH. Specific testing sample steganalysis. Ruan Jian Xue Bao/Journal of Software,
2018,29(4):9871001 (in Chinese). http://www.jos.org.cn/1000-9825/5411.htm
Specific Testing Sample Steganalysis
ZHANG Yi-Wei
1,2
, ZHANG Wei-Ming
1,2
, YU Neng-Hai
1,2
1
(School of Information Science and Technology, University of Science and Technology of China, Hefei 230027, China)
2
(Key Laboratory of Electromagnetic Spatial Information of the Chinese Academy of Sciences (University of Science and Technology of
China), Hefei 230027, China)
Abstract: Nowadays, the steganalysis of digital image mainly focuses on the design of steganalysis features to improve the universal
blind detection (UBD) model’s detection accuracy. However it has nothing to do with the testing images and is difficult to achieve
high-precision detection. Based on large data training resources, this article studies the influence of steganography on image features to
uncover the important relationship between steganalysis and image feature. Furthermore, the article proposes a steganalysis method for
testing samples to select specialized training sets. The classical JPEG steganography algorithm nsF5 and the mainstream JPEG
steganalysis features, such as CC-PEV, CC-Chen, CF*, DCTR and GFR, are used as an example to organize the experiments. The results
show that the accuracy of this method is higher than that of other similar methods.
Key words: information hiding; steganalysis; specific testing sample;
high precision; machine learning
隐写术(steganography)
[13]
是一种将消息嵌入到数字载体(如图像、视频、音频、文本等)进行隐蔽通信的
技术.近十几年来,隐写术作为一种保护通信安全的手段迅速发展,其中以数字图像为载体的隐写技术最为成
基金项目: 国家自然科学基金(U1636201, 61572452)
Foundation item: National Natural Science Foundation of China (U1636201, 61572452)
本文由“多媒体大数据处理与分析”专题特约编辑赵耀教授、李波教授、华先胜研究员、文继荣教授、蒋刚毅教授、常冬霞
副教授推荐.
收稿时间: 2017-04-30; 修改时间: 2017-06-26; 采用时间: 2017-10-13; jos 在线出版时间: 2017-12-01
CNKI 网络优先出版: 2017-12-04 11:50:47, http://kns.cnki.net/kcms/detail/11.2560.TP.20171204.1150.022.html
988
Journal of Software 软件学报 Vol.29, No.4, April 2018
熟.数字图像隐写按照载体压缩方式可分为空域图像隐写和频域图像隐写.空域图像隐写由传统的隐写方法,如
LSB 替换
[4]
、LSB matching
[5,6]
等,发展到自适应隐写算法,如 HUGO
[7]
、WOW
[8]
、S-UNIWARD
[9]
、MG
[10]
、MVG
[11]
和 MiPOD
[12]
等,这类方法定义修改像素的失真,给失真小的像素赋予较高的修改概率以增加隐写的隐蔽性.由
于 JPEG 图像格式的广泛使用,频域图像隐写主要以 JPEG 图像为载体,经典的方法有 F5
[13]
、nsF5
[14]
、
OutGuess
[15]
、MB1
[16]
、MB2
[17]
、PQ
[18]
、MME
[19]
、YA SS
[20]
等;自适应隐写方法有 J-UNIWARAD
[9]
、UED
[21]
及其改进 UERD
[22]
;还有边信息 JPEG 隐写 SI-UNIWARD
[9]
以及 SI-UERD
[22]
,此类方法利用 JPEG 图像压缩过程
的量化取整信息提升隐写安全性.然而,这些技术也成为了不法分子暗地传递秘密信息的有效渠道,在 2001 年
的 911 恐怖袭击、2007 年哥伦比亚毒枭以及 2011 年全能神邪教等案件中都出现了隐写术的影子.
能够与之抗衡的技术被称为隐写分析(steganalysis)
[23]
.隐写分析是针对隐写术的一种分析技术,对于待测
载体,隐写分析工作分为几个不同层次,主要分为:隐写载体检测、隐写算法分析、秘密信息提取、隐写明文获
取等内容.其中,隐写载体检测旨在检测载体是否被嵌入秘密信息;隐写算法分析是在前一步的基础上,分析被
隐写载体的秘密信息嵌入方法和嵌入率;秘密信息提取的任务是在前两步工作的基础上,确定秘密消息嵌入的
位置并提取出隐写密文;最后将密文解密为隐写明文即完成了隐写分析工作.
然而,现今主流隐写分析工作集中在分析过程的第 1 步,也就是隐写载体检测,主要研究如何高精度地确定
载体是否含有秘密信息,并且通常假设隐写方法与嵌入率已知.目前,数字图像隐写分析技术的主流思路是:设
计数字图像特征提取方法,利用机器学习训练分类器区分载体和载密对象,近年来流行使用 Ensemble
[24]
分类
器.常用的隐写分析特征有马尔可夫
[25]
、共生矩阵
[26]
、直方图高阶距
[27]
等,以这些特征为基础发展出了很多
隐写分析算法
[2840]
:空域中有 SPAM
[31]
、CSR
[36]
和基于富模型(RichModel)的高维特征
[32,33,35]
,频域的代表特征
有 PEV
[28]
、CHEN
[29]
、CC-CHEN
[30]
、CC-PEV
[30]
、J+SRM
[32]
以及近几年提出的高效特征 PHARM
[37]
、DCTR
[38]
、
GFR
[39]
等.针对自适应隐写设计的自适应隐写分析方法是最新趋势之一,通过对自适应隐写嵌入路径的估计可
以预测出最可能的隐写位置,从而更有针对性地检测自适应隐写,基于这一思想,Tang 等人
[41]
和 Denemark 等
人
[42,43]
改进了以往的特征,Zhang 等人
[44]
使用高斯偏导数滤波器也得到了很好的检测效果.此外,近年来,深度学
习的成果也逐渐开始应用于隐写分析工作当中
[45]
.
然而,隐写分析在从实验室环境向现实场景过渡的过程中出现了很多困难,其中,最突出的是载体来源失配
(cover source mismatch,简称 CSM)问题.CSM 是测试集与训练集不匹配时隐写分析效果显著下降的一种现
象.Lubenko 等人
[46]
为解决 CSM 问题,使用众多不同数据来源的图像训练分类器,然而,该方法中与测试样本不
相关的训练数据会干扰检测结果;Kodovský等人
[47]
针对 CSM 问题提出了 3 种解决方案,第 1 种方案使用混杂的
载体图像训练一个综合分类器,第 2 种方案为每一类载体图像训练一个分类器,测试集会被与之最匹配的分类
器进行分类,第 3 种方案与第 2 种类似,对每一个测试样本都投入到最匹配的分类器中,但预先训练好的分类器
并不能很好地适用于所有测试样本;Lerch-Hostalot 等人提出了 AT S
[48]
方法,该方法使用测试集与双重隐写(对
图像重复隐写两次)后的测试集作为训练数据训练分类器,使用该分类器检测隐写一次的测试集,将该检测结果
作为对应测试集图像的隐写分析结果,该方法通过绕过训练数据来避免 CSM 问题,但对测试集有一定的载密样
本比例要求,这在真实场景中难以得到满足.
本文考虑需要精准隐写分析少量测试样本的应用场景,这种场景需要很高的检测精度,但是由于待测样本
量很小,可以采用高复杂度的检测方法.对少量特定测试样本的精准隐写分析问题来源于真实应用的实际需求,
典型的应用场景有如下两种(如图 1 所示).
(1) 考虑一个面向海量图像数据的隐写分析监控场景.为了能够处理大量数据,采用层级化的隐写分析系
统.首先使用简单的特征训练出分类器放在层级的第 1 层,输入的图像仅需要提取简单的特征即可进行隐写分
析检测,利用这一层过滤掉大部分图像,将疑似载密的图像移交给下一层;第 2 层分析需要付出更大的计算代价,
但相应地也具有更准确的分析功能,可以再次过滤掉部分非载密图像,留下更少量的可疑图像给下一层.如此设
计若干层分析器,过滤得到高可疑图像,这时便需要特定测试样本隐写分析模块给出最终的精准分析结果.
(2) 在刑侦工作中,分析人员锁定了隐写术的疑似使用者,通过某种手段获取其传输或存储的图像,这些图
张逸为 等:针对特定测试样本的隐写分析方法
989
像往往是高可疑的,值得花更大的计算代价进行有针对性的精准分析.
Fig.1 Typical application scenarios for precise steganalysis
图 1 精准隐写分析的典型应用场景
针对上述场景,本文聚焦隐写分析工作中的载体检测任务,假设隐写算法与嵌入率已知,以准确判断样本是
否藏有秘密信息为目的,首先研究隐写对图像特征的影响,随后找出隐写分析与图像特征之间的重要关系,基于
此提出一种为测试样本选择专用训练集、训练专用分类器的隐写分析方法,我们称其为“特定测试样本隐写分
析(specific testing sample steganalysis,简称 STSS)”,该方法度量每一个测试样本与当前训练数据库中的训练样
本之间的相似程度,选择与测试样本相似度最高的训练数据训练分类器,排除不相关训练数据的干扰,从而大幅
度地提升隐写分析的准确率.形象地讲,如果将训练分类器检测样本比作顾客(测试样本)买衣服(分类器)的过
程,衣服越合身则(隐写分析)效果越好,文献[47]的方法好比是“成衣铺”,事先制作好各种尺码的衣服,顾客来了
可以按照尺码范围选择大致合身的衣服.而本文方法可以比作为每位顾客“量体裁衣”.显然,后者虽然有较高的
成本,但衣服最为合身.
本文第 1 节分析隐写操作对载体图像的影响.第 2 节提出影响隐写分析的两个主要因素.第 3 节设计特
定测试样本隐写分析框架.第 4 节讨论核心实验参数的确定.第 5 节、第 6 节分别为实验结果和结论.
剩余14页未读,继续阅读
小崔个人精进录
- 粉丝: 32
- 资源: 316
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0