### 基于GAN的恶意软件对抗样本生成
#### 一、背景意义
##### **1.1 简述恶意软件检测发展现状**
**1.2 恶意软件领域相比图像领域增加的约束**
在过去**六年发表的1600多篇**关于对抗ML的论文中,大约有**40篇**集中在恶意软件上,其中大部分集中在**特征空间**上
+ https://nicholas.carlini.com/writing/2019/all-adversarial-example-papers.html
##### 1.2.1 Evading Machine Learning Malware Detection
+ 2017 blackhat
+ https://github.com/drhyrum/gym-malware
+ **PE文件(特征空间)进行少量的修改,这些修改不会破坏PE文件格式,也不会改变代码的执行**
1. **添加一个不使用的API函数+更新导入地址表**
2. 操作现有的section name
3. 添加一个新的节区
4. 将部分字节添加到节区的额外空间
5. 创建一个新的入口点,它会立即跳到原来的入口点
6. 修改/删除签名
7. 修改调试信息
8. 打包或解包文件
9. 修改或删除头部检验
10. 添加字节到PE文件末尾
##### 1.2.2 Intriguing Properties of Adversarial ML Attacks in the Problem Space
+ 2020 SP
+ 揭示了特征空间和问题空间之间的关系,并引入了副作用特征的概念作为反特征映射问题的副产品
+ 四种常见于任何问题空间攻击的主要约束类型:(除了攻击目标函数外,所考虑的问题空间域还可能带有对特征向量修改的约束)
+ **可用转换**:在图像域中,像素的值必须限定在0和255之间,在软件领域中(2017 blackhat)
+ 保留语义:**Misleading authorship attribution of source code using adversarial learning(2020 SP)**
+ 似然性:程序要看起来是手动编写的
+ 对预处理的鲁棒性:程序的死代码删除
+ **附加特征**:为API调用插入有效参数,以及为其调用导入依赖项。这些特征**不遵循任何特定的梯度方向**,因此它们可能对分类得分产生积极或消极的影响
+ **投影类比:**攻击者首先在对象x的特征空间中进行基于梯度的攻击,从而得到一个特征向量 $$x+δ$$,该特征向量被分类为负数,具有很高的可信度。然而,这一点不在约束条件Γ的可行性空间中,后者比Ω的约束条件更为严格。因此,攻击者需要找到一个投影,将$$ x+δ^*$$ 映射回可行的问题空间区域,从而增加副作用特征向量
![](https://www.writebug.com/myres/static/uploads/2022/6/1/1440ed1ddf8285e567e5c6eb7a2a52e4.writebug)
##### 1.2.3 A survey on practical adversarial examples for malware classifiers
#### 二、核心内容
##### <u> 2.1 Generating Adversarial Malware Examples for Black-Box Attacks Based on GAN</u>
+ 2017 abs 第一篇
+ **复现**:[Malware-GAN](https://github.com/yanminglai/Malware-GAN)
+ **框架**:![](https://www.writebug.com/myres/static/uploads/2022/6/1/ab0784f4db7b8f860264b9d8252b69af.writebug)
+ API序列提取方式:**CuckooAPI(cuckoo 接口)** -> json报告 -> API_list.txt -> 特征(0,1)
```python
import CuckooAPI
api = CuckooAPI.CuckooAPI("172.29.226.111", APIPY=True, port=8090)
api.submitfile("*.exe")
```
+ 框架描述
+ 一个API序列表示一个软件
![](https://www.writebug.com/myres/static/uploads/2022/6/1/04c1f10512ffb509b6548c7c2e1ead5b.writebug)
+ 实验结果分析
+ 缺点分析
+ 只停留在特征空间,没有生成问题空间
+ 解决方案
+ [IAT_patcher](http://hasherezade.github.io/IAT_patcher/):IAT hooking application 根据API对抗特征(特征空间)生成对抗可执文件(问题空间)
![](https://www.writebug.com/myres/static/uploads/2022/6/1/9f4d21900c448cec0807ebae8cb79fbb.writebug)
+ 笔记博客
+ https://blog.csdn.net/jmh1996/article/details/102972421
+ https://www.zybuluo.com/wuxin1994/note/881171
##### **2.2 Generic blackbox end-to-end attack against state of the art API call based malware classifiers**
+ 2018 RAID
+ 提出了一种基于API序列调用分析的针对Windows恶意软件分类器的黑盒对抗式攻击,这种规避策略也适用于类似的Android分类器除了对基于API的序列特征的有限关注外,它们的问题空间变换留下了两个主要的工件,可以通过程序分析:添加无操作指令(no ops)和修补导入地址表(IAT)。首先,插入的API调用需要在运行时执行,因此包含作者按照“默默无闻的安全”实践硬编码的单个no ops,这是已知无效的[19,37];直观地说,可以通过识别攻击者用于执行no OPAPI调用的技巧来检测和删除它们(例如。,读取0字节),或者在将动态执行序列馈送到分类器之前,从动态执行序列中过滤“死”API调用(即,没有执行任何实际任务)。其次,为了避免需要访问源代码,新的API调用被插入并使用IAT补丁调用。然而,所有新的API必须包含在二进制文件的一个单独的段中,并且由于IAT修补是恶意软件作者使用的一种已知的恶意策略[25],IAT对非标准动态链接器的调用或从IAT到二进制文件内部段的多次跳转将立即被识别为可疑。
+ Practical black-box attacks against machine learning
+ 使用基于雅可比矩阵的数据集扩充
+ [IAT_patcher](http://hasherezade.github.io/IAT_patcher/)
##### 2.3 Black-Box Adversarial Attacks Against Deep Learning Based Malware Binaries Detection with GAN
+ 2020 ECAI
+ 框架:
![](https://www.writebug.com/myres/static/uploads/2022/6/1/b8ebd7681d381ff8edcf0dd399012aec.writebug)
#### 问题:
+ 为什么要用GAN生成对抗样本?
+ 在图像领域出色的模仿能力
+ 在我们的模型中,一旦GANs的训练过程完成,生成器就可以在很短的时间内用输入的恶意软件二进制文件独立生成恶意软件对抗样本。
+ [GAN生成对抗样本的方法解析](https://www.sohu.com/a/405844314_500659) (advGAN)
检测模型:
Activation analysis of a byte-based deep neural network for malware classification (SPW)
对抗样本:
Efficient black-box optimization of adversarial windows malware with constrained manipulations
Aimed: Evolving malware with genetic programming to evade detection
Adversarial malware binaries: Evading deep learning for malware detection in executables.(2018 EUSIPCO)
Optimization-guided binary diversification to mislead neural networks for malware detection
Exploring adversarial examples in malware detection.
### ytt流程:
#### 一、背景意义
##### 1.1 恶意软件发展现状
+ 每天恶意软件增长数量
+ 很多安全公司使用机器学习的检测模型
+ 基于签名的检测 ,只能防御已知的攻击
+ Processing virus collections. VIRUS 129 (2001), 129–134
+ 机器学习(**特征空间**):预测新的输入,无监督对相同的家族进行聚类
+ 深度学习(问题空间):
+ Malware Images: Visualization and Automatic Classification (2011)
+ Malware Detection by Eating a Whole EXE (2018)
+ 机器学习模型的脆弱性->恶意软件对抗样本这些研究指出,深度学习算法和人工智能应用的安全性受到严重威胁
+ Intriguing properties of neural networks (2013)
+ Explaining and harnessing adversarial examples(2015 goodflow)
+ Adversarial camera stickers: A physical camera-based attack on deep learning systems
+ Transferable adversarial attacks for image and video object detection (2019 IJCAI)
##### 1.2 恶意软件对抗样本的约束
+ 对抗性例子的概念在[72]中首次提出,并在[28]中得到扩展。
+ 举例**图像**和**文本**的对抗样本举例(1600多篇对抗样本攻击中大约40片恶意代码的,大部分**特征空间**)
+ *Pierazzi*定义了两种搜索策略
+ 梯度驱动:对码扰动对梯度的影响进行了**近似**,并用它来跟踪梯度的方向
+ 问题驱动:一种问题驱动的方法,在采用进化�
shejizuopin
- 粉丝: 1w+
- 资源: 1302
最新资源
- ABAQUS高速铁路板式无砟轨道耦合动力学模型
- 短路电流计算 Matlab编程计算 针对常见的四种短路故障(单相接地短路,两相相间短路,两相接地短路,三相短路),可采取三种方法进行计算: 1.实用短路电流计算 2.对称分量法计算 3
- 优化算法改进 Matlab 麻雀搜索算法,粒子群优化算法,鲸鱼优化算法,灰狼优化算法,黏菌优化算法等优化算法,提供算法改进点 改进后的优化算法也可应用于支持向量机,最小二乘支持向量机,随机森林,核
- 遗传算法优化极限学习机做预测,运行直接出图,包含真实值,ELM,GA-ELM对比,方便比较 智能优化算法,粒子群算法,花授粉算法,麻雀算法,鲸鱼算法,灰狼算法等,优化BP神经网络,支持向量机,极限学
- FX3U,FX5U,控制IO卡 ,STM32F407ZET6工控板,包括pcb,原理图 , PLC STMF32F407ZET6 FX-3U PCB生产方案 板载资源介绍 1. 8路高速脉冲加方向
- 利用matlab和simulink搭建的纯跟踪控制器用于单移线轨迹跟踪,效果如图 版本各为2018b和2019 拿后内容包含: 1、simulink模型 2、纯跟踪算法的纯matlab代码,便于理解
- 三相光伏并网逆变器设计,原理图,PCB,以及源代码 主要包括以下板卡: 1)主控DSP板, 负责逆变器的逆变及保护控制 原理图为pdf. pcb为AD文件 2)接口板,负责信号采集、处理,以及
- 考虑气电联合需求响应的 气电综合能源配网系统协调优化运行 该文提出气电综合能源配网系统最优潮流的凸优化方法,即利用二阶锥规划方法对配电网潮流方 程约束进行处理,并提出运用增强二阶锥规划与泰勒级数展开相
- 光子晶体BIC,OAM激发 若需第二幅图中本征态以及三维Q等计算额外
- 基于共享储能电站的工业用户日前优化经济调度,通过协调各用户使用共享储能电站进行充放电,实现日运行最优 代码环境:matlab+yalmip+cplex gurobi ,注释详尽,结果正确 对学习储
- 三相PWM整流器simulink仿真模型,采用双闭关PI控制,SVPWM调制策略,可以实现很好的整流效果,交流侧谐波含量低,可以很好的应对负载突变等复杂工况
- 红外遥控器+红外一体化接收头部分的仿真 带程序 红外线编码是数据传输和家用电器遥控常用的一种通讯方法,其实质是一种脉宽调制的串行通讯 家电遥控中常用的红外线编码电路有μPD6121G型HT622型和
- 新能源系统低碳优化调度(用Matlab) 包含各类分布式电源消纳、热电联产、电锅炉、储能电池、天然气等新能源元素,实现系统中各种成本的优化,调度 若有需要,我也有matlab
- Matlab 遗传算法解决0-1背包问题(装包问题) 源码+详细注释 问题描述:已知不同物品质量与不同背包最大载重,求取最优值使得所有背包所装得的物品质量总和最大 可以改物品质量与背包载重数据
- 信捷plc控制3轴机械臂调试程序,只是调试程序,包含信捷plc程序,信捷触摸屏程序,手机组态软件程序,含手机组态软件 程序自己写的,后期还会增加相关项目 触摸屏示教程序写好,可以任意示教完成全部动
- ABS制动系统开发 PID控制 开关控制 matlab simulink carsim联合仿真,下面视频为pid控制效果和不带ABS的对比 滑移率控制目标20% 分离路面制动
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
- 1
- 2
前往页