毕业设计基于CNN+LSTM的在线流量分析识别系统设计与实现源码(含数据集+模型+报告+运行说明).zip

共20个文件

py：6个

csv：3个

lonelyprince7-gl553ve：2个

版权申诉

毕业设计

lstm

数据集

17 浏览量 2023-11-29 10:27:12 上传评论 3 收藏 23.47MB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

毕业设计基于CNN+LSTM的在线流量分析识别系统设计与实现源码(含数据集+模型+报告+运行说明).zip （20个子文件）

rnn_classifier.py 7KB

prediction

prediction.csv 12KB

项目说明.md 5KB

data

test_data.csv 60KB

data.csv 107KB

cnn_classifier.py 4KB

基于LSTM+CNN的流量实时分析系统.pdf 487KB

data_helper.py 4KB

summaries

train

events.out.tfevents.1600693482.lonelyprince7-GL553VE 842KB

valid

events.out.tfevents.1600693482.lonelyprince7-GL553VE 687KB

model

1600693479

saved_model.pb 407KB

variables

variables.index 1KB

variables.data-00001-of-00002 6.54MB

variables.data-00000-of-00002 18.04MB

requirements.txt 54B

params

params.pkl 1KB

vocab 67KB

train.py 10KB

test.py 4KB

clstm_classifier.py 6KB

基于在线学习的分布式流量实时分析系统

1.概述

目前，各种类型的流量充满了网络空间，其中包含了正常上网业务，具有

CVE

编号的网络攻击、计算机病毒（邮件病毒、木马、蠕虫、勒索软件）等等。

这些流量中既包含未加密的流量，也包含经过加密的流量，如广泛使用的安全

传输层

(TLS)

协议。如何开发出一个网络安全系统，能够有效抵对

TLS

加密

与非加密的流量数据进行检测、分析与分类，并实时识别出网络上的恶意攻击

行为成为现阶段面临的一个挑战。目前在工业界，已经已经有了基于网络端口

映射的流量分类识别方法和基于有效载荷分析的流量分类识别方法等，但这些

方法面临两个都面临了准确性和可靠性低的问题，且这两种方法是无法在加密

流量上使用的，因此探究其他的流量检测方法显得格外重要。同时，

CVE

、恶

意加密流量等网络攻击具有攻击量大、高并发的特点，对于检测系统更是提出

了实时化与分布式部署的要求。

我们提出将分布式网络系统与深度学习技术、虚拟化技术相结合，同时引

入在线学习机制做到实时推断与模型动态更新。该系统具有以下特点：利用

CyberFlood

产生

TLS

加密与非加密的、不同种类的业务流量和恶意流量；

利用

Hive

分布式数据库存储原始流量数据；通过

Spark

和

Flink

流量分别

对流量进行并行批处理和流式处理；使用

CNN+LSTM

的时空深度学习网络

对不同类型的流量进行分类；利用

redis

缓存加速实时流量的特征读取；利用

Docker

虚拟化容器对深度学习模型进行部署。该系统同时具有高隔离性、高

容错性、高准确性和高实时性特点，可以解决传统安全系统所面临的的挑战。

目前我们的系统版本为

V2.0

，可以识别出包含加密与非加密的业务流量、

恶意软件流量和网络攻击流量这三种流量类型，并进行动态流量数据的可视化

呈现。

2.目标

2.1.

对

CyberFlood

产生流量数据进行抓取、分析与分类。

2.2.

能够实时、准确识别出网络上的

TLS

加密与非加密的正常业务流量、

网络攻击流量，恶意软件流量，模型上线后能够不断进行动态调整。

2.3.

实现一个可交互的、具有高并发能力、高容错性的分布式网络流量监测

系统，并且能对流量数据可视化。

3.系统架构

系统架构大致分为以下几个部分：

3.1

流量生成模块：

CyberFlood

生成包括

TLS

加密与非加密的业务流量

与恶意流量。

3.2

流量抓取模块：

Python

抓取流量并解析。

3.2

批处理模块：将解析后流量以

JSON

格式的存储在

Hive

分布式数据库

中，然后由

Spark

对流量特征进行批处理。

3.3

流式处理模块：将解析后的流量由

Kafka

收集送往

Flink

对流量特征

进行流式处理。

3.4 Web

后端模块：批处理和流式处理的结果都送往后端服务器的

MySQL

数据库以

CSV

格式存储。

3.5

模型训练模块：使用带标签的流量数据对时空神经网络

(CNN+LSTM)

模型进行训练和交叉验证，然后对模型进行准确的评估，通过不断地调试调优改

进模型。

3.6

模型线上推断与在线学习模块：

Java

后端将未知种类的流量特征从

MySQL

数据库中导出，送往

Redis

进行缓存，然后将

Redis

中的流量特征通

过

gRPC

请求发往

Docker

容器，然后以

JSON

格式返回流量的分类结果。

在推断的过程中，模型权重会动态调整并更新。

3.7

流量可视化模块：通过前端可视化呈现流量的分析结果。

整体系统架构如图

所示。

图 1 系统架构

4.关键技术

4.1

数据采集与特征选取

数据集通过组委会提供的

CyberFlood

工具，生成

TLS

加密与非加密

的正常业务流量与网络攻击行为流量，再使用

Python

对指定的网络端口抓取

流量，数据采集流程如图

所示。

图 2 数据采集流程

其中对于非加密流量我们为了使用模型精度达到最大化，我们直接匹配其

URL

字段用于模型训练。

而对于

TLS

加密流量，检测加密流量中的恶意攻击行为通常应先解密相关

的加密流量（如

SSL

和

TLS

），再检测相应恶意攻击行为，但通过

CyberFlood

所生成的加密流量并未给出相应证书签名，故本系统考虑在不解密加密流量的情

况下，通过获取数据流中的元数据特征并将其导入至机器学习模型中进行识别。

接下来介绍该操作的原理。由于加密流量的 TLS 数据流中的元数据包含了

无法隐藏或者加密的指纹信息，TLS 数据流可被用于模糊明文数据，但同时必

须生成一组“可观测的复杂参数”，后者可用于训练数据模型。当一个 TLS 数

据流开始后，会先执行一次握手。客户端会向服务端发送一个 ClientHello 的

消息，该消息包括一组参数（包括加密算法、版本等信息）。像 ClientHello

的这种 TLS 元数据主要在加密数据传输前进行交互，没有被加密。这样，数据

模型就可以通过分析元数据来检测恶意攻击行为，而不需要对加密数据进行解密

操作。

如图 3 所示，一个完整的 TLS 会话过程一定包含以下类型的消息：

ClientHello、ServerHello、ServerHelloDone、ClinentKeyExchange、

图 3 TLS 握手协议示意图

ChangeCipherSpec

。

根据

TLS

流在交互之初需要同远程服务器进行握手是不加密的特性，可以

观测到的未加密

TLS

元数据包括

ClientHello

和

clientKeyExchange

。从这

些包的信息中，我们可以推断出客户端使用的

TLS

库等信息。通过比较获取到

的特征信息，可以观察到业务流量与业务流量存在较大差别，因此将

TLS

流作

为本系统特征来源，利用思科研究人员开发的基于

libpcap

的通用工具，用于

分析并提取捕获到的数据流（恶意流量和正常流量）的数据特征，包含

clientHello, serverHello, certificate

和

clien-tKeyExchange

等信息基于

进行特征提取。

接下来介绍我们对特征分析方法进行介绍。客户端方面，我们首先观察两个

TLS

特征：

Offered Ciphersuites

和

Advertised TLS Extensions

。对于

前者，恶意流量更喜欢在

clientHello

中提供

0x0004(TLS_RSA_WITH_RC4_128_MD5)

套件，而业务流量则更多提供

0x002f(TLS_RSA_WITH_AES_128_CBC_SHA)

套件；对于后者，大多数

TLS

流量提供

0x000d(signature_algorithms)

，但是业务流量会使用以下很

少在恶意流量中见到的参数，如表

所示。

Encode

Feature

0x0005

status request

0x3374

next protocol negotiation

0xFF01

renegotiation info

表 1 TLS 特征以及对应编码

观察业务与恶意流量客户端公钥的区别。业务流量往往选择

256-bit

的椭圆

曲线密码公钥，而恶意流量往往选择

2048-bit

的

RSA

密码公钥。

服务端方面，我们能够从

serverHello

流中得到服务端选择的

Offered

Ciphersuites

和

Advertised TLS Extensions

信息。业务流量的选择比较多

元化，而恶意流量往往会选择较为过时的技术。在

certificate

流中，我们能够

得到服务端的证书链。无论是恶意流量还是业务流量，其证书的数量都是差不多

的，但若我们观察长度为

的证书链，就能够发现，其中的

70%

都来自恶意流

量自签名，

0.1%

来自业务流量自签名。

由上述分析可知，加密恶意流量与加密业务流量具有非常明显的

TLS

特征

差异，这些差异主要体现在客户端

TLS

扩展、客户端加密套件、客户端公钥长

度、服务端

TLS

扩展、服务端证书签名长度以及服务端证书签名算法等。如表

所示。

TLS_Feature

Illustration

Client_Extensions

A set of length values followed

by a set of extension type values is

used to describe the TLS extension

usage observed in the message of

the TLS flow

评论收藏

内容反馈

版权申诉

z同学的编程之路

粉丝: 2501
资源: 2135

毕业设计基于CNN+LSTM的在线流量分析识别系统设计与实现源码(含数据集+模型+报告+运行说明).zip

基于XGBoost的流量分析识别系统源码+数据集+模型+报告项目说明.zip

基于LSTM预测比特币和黄金价格走势的综合决策模型python实现源码(多种实验对比分析)+数据集+报告.zip

基于CNN+LSTM的网络流量检测系统python源码(课设项目).zip

基于CNN和LSTM的流量分析识别系统设计与实现源码+训练好的模型+PDF报告.zip

基于CNN+LSTM时空神经网络的在线流量分类模型源码+全部数据+PDF文档.zip

基于KNN+SVM+CNN+LSTM四种方法实现遥感图像识别python源码（95分以上期末大作业）.zip

基于Pytorch+LSTM+CNN实现的自动对对联系统源码+数据集+项目使用说明.zip

基于相关性分析的CNN-Attention-LSTM期货价格预测模型python源码+数据集+模型+详细注释.zip

基于CNN+LSTM时空神经网络的在线流量分类模型源码+说明文档.zip

人工智能课程设计-基于cnn-lstm的轴承故障诊断python源码(带数据+训练好的模型+详细代码注释+说明).zip

2020年中国高校计算机大赛(C4)-基于CNN+LSTM时空神经网络的在线流量分类模型源码+项目说明.zip

基于相关性分析的CNN_Attention_LSTM期货价格预测模型python源码+数据集+模型+详细注释.zip

基于KNN+SVM+CNN+LSTM四种方法实现遥感图像识别python源码.zip

基于Python3.6+tensorflow1.6的实践源码（minist数据集+CNN+LSTM等）.zip

基于CNN+LSTM网络用于可变长度的手写数字识别算法python源码.zip

基于LSTM(长短期记忆人工神经网络)-CNN+LSTM-堆叠式LSTM的时间序列预测python源码+超详细注释.zip

CNN+LSTM EGG项目,cnn-lstm,Python源码.zip

Python识别系统源码合集51套源码超值（含验证码、指纹、人脸、图形、证件、 通用文字识别、验证码识别等等）.zip

34个经典javaweb项目实例.zip

项目源码：基于Hadoop+Spark招聘推荐可视化系统 大数据项目 计算机毕业设计

毕业设计 springBoot人力资源管理系统+毕业论文+前后端源代码

毕业设计：舆情监测系统（SpringBoot+NLP）

基于spring boot的小区物业管理系统源码+论文+答辩ppt

计算机毕业设计：Flask股票数据采集分析可视化系统 python+爬虫+金融数据

毕业设计 基于javaweb的在线答题平台

人脸识别系统OpenCV+dlib+python（含数据库）Pyqt5界面设计 项目源码 毕业设计

毕业设计-基于JAVA的springboot超市进销存系统(源代码+论文）

基于深度学习的课堂行为识别和考试作弊检测系统的设计与实现（python源码）

最新资源

Python识别系统源码合集51套源码超值（含验证码、指纹、人脸、图形、证件、通用文字识别、验证码识别等等）.zip

项目源码：基于Hadoop+Spark招聘推荐可视化系统大数据项目计算机毕业设计

毕业设计基于javaweb的在线答题平台

人脸识别系统OpenCV+dlib+python（含数据库）Pyqt5界面设计项目源码毕业设计