等
[5]
描述了 3 种不同的特征选择方法, 并使用 DT 作为分类器来找到具有更好
分类性能的特征选择方法. Kuang 等
[6]
引入了一个基于 SVM 的模型, 该模型使
用内核主成分分析(KPCA)来选择特征并降低原始数据的维数. Farnaaz 等
[7]
使
用随机森 林构造 分类器 并建立 异常检 测系统 模型. 该方法 旨在检 测复杂 的攻
击并提高检测率. Wu 等
[8]
提出了一种 kNN 的异常检测方法, 利用该方法使用时
间敏感性 来查找 在不同 时间间 隔内表 现出不 同行为 特征的 异常值 . 但是 它使
用的数据集 KDD-CUP 是 20 世纪 90 年代末提出的一个数据集, 在互联网飞速
发展的今天, 里面涉及的数据以及攻击类型都具有一定的局限性. 文献[9]提到
基准数据集的可靠性也将对数据检测产生一定的影响. 综上所述, 基于特征选
择的机器学习方法根据人为制订的规则, 选取与流量重要性较高的特征, 形成
一个最优的特征子集, 从而降低数据维度和计算成本. 然后, 通过机器学习算
法训练分类器, 达到检测和分类的目的. 然而, 基于特征选择的机器学习方法
也有两个限制. 一方面, 特征选择的过程涉及人工的干预, 所以时间成本和人
力成本较高
[10]
. 另外, 它忽略了特征之间的相互关系, 只选择与网络流量关系
最大的部分特征. 另一方面, 由于网络数据的流量大、结构复杂, 机器学习的
处理能力有限, 容易出现误报率高、泛化能力差等问题
[11]
. 因此, 建立一种能
够有效识别异常流量的检测模型迫在眉睫.
近年来, 深度学习优异的表示能力引起了人们的广泛关注, 并在图像识别
和自然语言处理领域取得了显著的成绩. 由于传统机器学习方法的局限性, 深
度学习方法在网络异常流量检测领域也引起了很多学者的研究兴趣
[12]
. 深度学
习方法最早在异常检测中的应用是循环神经网络(Recurrent Neural Network,
RNN). Yin 等
[12]
使用 RNN 模型来提高二进制分类和多分类的性能. 由于 RNN
对于高维数据易产生梯度消失的情况且无法解决长期依赖的问题
[13]
. 为了解决
这个问题, 文献[14]提出了长短期记忆(Long Short-Term Memory, LSTM), 它
是 RNN 的 一 种 变 形 . 在 实 际 操 作 中 , 卷 积 神 经 网 络 (Convolutional Neural
Networks, CNN)和 LSTM 模型的应用更加广泛, 在实验性能方面也非常出色.
CNN 是 一 类 包 含 卷 积 计 算 的 神 经 网 络 , 通 过 卷 积 核 进 行 特 征 提 取 和 筛 选 .
Wang 等
[15]
结合使用 LSTM 和 DT. 在他们的方法中, 数据首先通过 LSTM, 然
后放入 DT 中进行二次检测, 以提高准确性并降低误报率. Wang 等
[10]
将 CNN
应用于网络流量中的流量分类. 他们将二进制字节流转换为灰度图像, 然后将
这些图像形式输入 CNN 模型以完成分类. 但是, 网络流量包含的信息量少于
评论0
最新资源