自注意力的多特征网络流量异常检测与分类.docx资源-CSDN文库

版权申诉

195 浏览量 2022-11-29 17:39:45 上传评论收藏 228KB DOCX 举报

网络流量异常检测与分类是网络安全领域的重要研究课题，其目的是及时发现并识别网络中的异常行为，以便采取相应的防护措施。传统的异常检测方法主要包括基于签名和基于统计两种。基于签名的方法依赖于预先定义的攻击模式，适用于已知攻击，但对新出现或变化的攻击效果有限。基于统计的方法，如机器学习，通过学习流量行为来识别异常，能更好地适应动态网络环境。机器学习在异常检测中的应用广泛，常见的算法包括决策树、支持向量机、k-最近邻和随机森林等。特征选择是提升检测性能的关键步骤，它有助于减少计算复杂度，提高分类速度。各种特征选择方法，如基于决策树、支持向量机和随机森林的策略，被用于寻找最佳特征子集。然而，传统机器学习方法存在一些挑战，如特征选择的人工干预导致的时间和人力成本较高，以及忽视特征间关联性。此外，面对大规模、复杂结构的网络数据，机器学习模型可能面临高误报率和泛化能力不足的问题。近年来，深度学习技术因其强大的表示学习能力而受到关注。特别是在网络异常检测中，深度学习模型如循环神经网络（RNN）被用来处理时间序列数据。然而，RNN在处理长序列时存在梯度消失和长期依赖问题。为解决这些问题，长短期记忆网络（LSTM）被提出，LSTM通过其特殊的门控机制能更好地捕获时间序列中的长期依赖关系，因此在异常检测任务中表现出色。除此之外，自注意力机制是另一种在深度学习中备受瞩目的技术，尤其在自然语言处理领域。自注意力允许模型在没有显式循环的情况下处理序列数据，捕捉不同位置之间的依赖关系。将自注意力应用于多特征网络流量，可以有效地整合和分析不同特征，增强模型对复杂异常模式的识别能力。综合运用自注意力和深度学习，可以构建更强大的网络异常检测与分类模型。这种模型能够自动学习和理解流量特征间的复杂关系，降低对人工特征工程的依赖，同时提高检测准确性和泛化性能。未来的研究可能会进一步探索自注意力与深度学习的结合，优化网络流量异常检测，以应对不断演化的网络安全威胁。

资源详情

资源评论

0 引　　言

随着数据量的快速增长和网络应用的广泛使用 , 网络安全引起了越来越

多专家学者的关注. 在网络流量中, 异常现象是安全问题的主要症状

[1]

. 通常

情况下, 网络异常指的是行为和模式与正常网络状态存在偏差. 网络异常的因

素有多种, 包括病毒、蠕虫、黑客入侵、广播风暴、网络流量超载和 DDoS 攻

击等. 网络异常会造成网络拥堵、资源分配不均衡、性能下降以及一些安全问

题, 最终可能导致数据泄露和经济损失

[2]

. 例如, 2017 年, 一种名为 Wannacry

的类似蠕虫的勒索病毒爆发并在全球范围内传播. 该病毒对电脑中的图片、程

序等文件实施了高强度的加密锁定, 并向用户索要赎金, 导致社会的经济利益

受损. 网络异常流量检测可以检测网络中的突发攻击事件, 检测到攻击后可以

做出应对, 减少损失, 而分类可以把攻击的类型识别出来, 针对不同的攻击采

取不同的应对措施, 对症下药. 因此, 进行网络异常检测, 识别异常流量就具

有重要的应用价值.

目前 , 异常流量检测的方法可分为基于签名的方法和基于统计的方法

[3]

基于签名的检测技术主要是利用模式匹配的思想, 为每一个已知的攻击生成

一个唯一的签名标记. 基于签名的方法简单有效, 不需要很高的计算能力, 但

需要为每种攻击类型设计一个签名. 此方法虽然适用于单一网络行为模式的

攻击, 但是对动态攻击无效. 此外, 基于签名的方法只能检测已知的攻击, 不

能检测未知的攻击. 基于统计的方法根据网络流量的行为来对流量的异常情

况进行判断, 该方法可以学习网络流量的行为, 对于动态的、复杂的网络异常

行为, 可以达到更好的检测性能. 机器学习技术是最常用的基于统计的方法之

一, 具有强大的功能, 可以自动学习识别复杂的模式, 并根据数据做出明智的

决策

[3]

. 在使用机器学习方法训练分类器进行异常检测和分类之前, 有必要进

行特征选择以降低数据的维度 . 特征选择的目的是在众多特征中挑选出对分

类识别最有效的特征, 实现数据空间维度的降低来减少计算量, 提高分类速度,

即获取一组少而精且分类错误概率小的子特征集合. 目前的研究表明, 基于特

征选择的机器学习方法已经取得了比较令人满意的性能

[4]

. 经典的机器学习算

法包括决策树 (Decision Tree, DT), 支持向量机 (Support Vector Machine,

SVM), k-Nearest Neighbor (kNN)和随机森林(Random Forest, RF)等. Sheen

等

[5]

描述了 3 种不同的特征选择方法, 并使用 DT 作为分类器来找到具有更好

分类性能的特征选择方法. Kuang 等

[6]

引入了一个基于 SVM 的模型, 该模型使

用内核主成分分析(KPCA)来选择特征并降低原始数据的维数. Farnaaz 等

[7]

使

用随机森林构造分类器并建立异常检测系统模型. 该方法旨在检测复杂的攻

击并提高检测率. Wu 等

[8]

提出了一种 kNN 的异常检测方法, 利用该方法使用时

间敏感性来查找在不同时间间隔内表现出不同行为特征的异常值 . 但是它使

用的数据集 KDD-CUP 是 20 世纪 90 年代末提出的一个数据集, 在互联网飞速

发展的今天, 里面涉及的数据以及攻击类型都具有一定的局限性. 文献[9]提到

基准数据集的可靠性也将对数据检测产生一定的影响. 综上所述, 基于特征选

择的机器学习方法根据人为制订的规则, 选取与流量重要性较高的特征, 形成

一个最优的特征子集, 从而降低数据维度和计算成本. 然后, 通过机器学习算

法训练分类器, 达到检测和分类的目的. 然而, 基于特征选择的机器学习方法

也有两个限制. 一方面, 特征选择的过程涉及人工的干预, 所以时间成本和人

力成本较高

[10]

. 另外, 它忽略了特征之间的相互关系, 只选择与网络流量关系

最大的部分特征. 另一方面, 由于网络数据的流量大、结构复杂, 机器学习的

处理能力有限, 容易出现误报率高、泛化能力差等问题

[11]

. 因此, 建立一种能

够有效识别异常流量的检测模型迫在眉睫.

近年来, 深度学习优异的表示能力引起了人们的广泛关注, 并在图像识别

和自然语言处理领域取得了显著的成绩. 由于传统机器学习方法的局限性, 深

度学习方法在网络异常流量检测领域也引起了很多学者的研究兴趣

[12]

. 深度学

习方法最早在异常检测中的应用是循环神经网络(Recurrent Neural Network,

RNN). Yin 等

[12]

使用 RNN 模型来提高二进制分类和多分类的性能. 由于 RNN

对于高维数据易产生梯度消失的情况且无法解决长期依赖的问题

[13]

. 为了解决

这个问题, 文献[14]提出了长短期记忆(Long Short-Term Memory, LSTM), 它

是 RNN 的一种变形 . 在实际操作中 , 卷积神经网络 (Convolutional Neural

Networks, CNN)和 LSTM 模型的应用更加广泛, 在实验性能方面也非常出色.

CNN 是一类包含卷积计算的神经网络 , 通过卷积核进行特征提取和筛选 .

Wang 等

[15]

结合使用 LSTM 和 DT. 在他们的方法中, 数据首先通过 LSTM, 然

后放入 DT 中进行二次检测, 以提高准确性并降低误报率. Wang 等

[10]

将 CNN

应用于网络流量中的流量分类. 他们将二进制字节流转换为灰度图像, 然后将

这些图像形式输入 CNN 模型以完成分类. 但是, 网络流量包含的信息量少于

图片包含的信息量, 在转换过程中某些信息可能会丢失. Kim 等

[16]

引入了一种

新的编码技术, 该技术增强了使用 CNN 结构识别异常事件的性能. 不可否认,

深度学习方法确实达到了很好的性能

[15]

. 但这些深度学习方法仍然存在一些不

足之处. 我们都知道, 网络流量是一个数据序列 . RNN 只适用于局部依赖性,

无法解决长期依赖性的问题

[13]

, 对于 LSTM 来说如果序列太长, 它也无法更好

地记忆

[17]

. 而 CNN 需要叠加多个过滤器才能学习到全局的特征, 这增大了计

算复杂度

[18-19]

谷歌所提出的 self-attention 机制

[20]

取代了传统的 RNN. 该方法通过学习

句子内的单词依赖关系, 捕捉句子的内部结构. 目前在自然语言处理(Natural

Language Processing, NLP)领域得到了广泛的应用

[21-22]

. 与 CNN 相比 , self-

attention 具有较低的计算复杂性. 此外, 与 RNN 和 LSTM 相比, self-attention

可以关注一个序列中的所有元素, 因此它被认为是解决长期依赖性问题的好

办法.

为了解决上述问题 , 我们所提出的方案通过 self-attention 技术来学习多

特征之间的相关性, 解决了传统特征选择方法中为了减少计算量而仅挑选少

量的最具代表性的分类特征组成子集合的方式, 因此忽略了特征和其他特征

之间微小的联系. 本文所提出的策略, 打破了传统特征选择方法, 单纯选择网

络流量中重要性高的特征规则. 基于提取的特征相关性, 我们提出了一个模型,

对提取出的特征关系进行编码, 并对网络攻击进行分类. 本文的主要成果总结

如下:

(1)设计了一个基于 self-attention 的模型来提取多特征的相关性. 该模型

旨在自动学习特征间的相关性 , 降低特征选择所带来的人工成本以及时间成

本.

(2)提出了一种对所提取的特征间关系进行编码的模型, 从而对网络流量

异常进行有效检测和分类.

(3)进行了大量的实验来评估本文所提出方法的性能. 实验结果表明, 与

两种基准方法相比 , 本文所提出的方法将异常流量识别的准确率提高了

1.65%, 并将误报率降低了 1.1%.

剩余18页未读，继续阅读

评论收藏

内容反馈

版权申诉

自注意力的多特征网络流量异常检测与分类.docx

评论0

最新资源

自注意力的多特征网络流量异常检测与分类.docx

评论0

最新资源

相关推荐

基于TCN和注意力机制的异常检测和定位算法.docx

基于注意力-生成式对抗网络的异常行为检测.docx

基于深度特征学习的网络流量异常检测方法.pdf

基于深度学习的网络流量分类及异常检测方法研究.pdf

基于时间特征的网络流量异常检测

基于CGAN-LSTM的无监督网络异常流量检测算法.docx

基于LSTM与改进残差网络优化的异常流量检测方法.docx

基于免疫仿生机理和图神经网络的网络异常检测方法.docx

计算机论文题目50.docx

基于图注意力机制和Transformer的异常检测.docx

基于突变理论特征的网络流量异常检测方法

基于平衡迭代规约层次聚类的无线传感器网络流量异常检测方案.docx

基于KNN算法的网络流量异常检测之软件工程研究.docx

基于注意力机制的多特征融合人脸活体检测.docx

基于改进卷积神经网络识别DNS隐蔽信道.docx

大数据时代人工智能在通信技术网络中的应用研究.docx

基于CDN的安全私有云.docx

全国计算机仿真大赛.docx

交换机安全技术操作规程.docx

基于注意力机制的特征融合缺陷检测方法及装置与流程.docx

基于卷积循环神经网络的网络流量异常检测技术.docx

IoT23-network-traffic-anomalies-classification:基于IoT23数据集的网络流量异常检测与分类

基于时间特征的网络流量异常检测_刘仁山1

基于双重注意力机制的遥感图像场景分类特征表示方法.docx

国内培训班CISSP认证中文模拟试卷一套.docx

高权重B2B网站发外链经验吐血分享.docx

闲逸庭院智能家居控制系统解决方案.docx

001自动化仪表维修技能提升手册.docx

2020化工自动化控制仪表作业试题（五）.docx