http://www.paper.edu.cn
- 1 -
中国科技论文在线
基于 FP-Growth 算法的 P2P 业务流量特征
自动识别机制
李娜,何刚
*
作者简介:李娜,(1988-),女,研究生,宽带流量监控. E-mail: nxln@163.com
(北京邮电大学信息与通信学院,北京 100876) 5
摘要:本文提出一种基于 FP-Growth 算法的 P2P 业务流量特征自动识别机制,该机制将流量
特征识别设计为一种正反馈结构,在识别过程中强化并扩展了流量特征,并通过构建流量数
据的 FP-Tree 提高了特征识别的时间效率并获得了较高的识别准确率。实验对比了 Aprioi
算法和 FP-Growth 算法的效率,对本文提出的机制的准确度和效率进行了验证。
关键词:深度报文检测;流量特征识别;P2P 业务 10
中图分类号:TP319
An Automatic P2P Traffic Characteristics Identification
Mechanism based on FP-Growth Algorithm
LI Na, HE Gang 15
(Sochool of Information and Communicaiton, Beijing University of Posts and Telecommunicaiton,
Beijing 100876)
Abstract: An Automatic P2P Traffic Charateristics Identification Mechanism based on FP-Growth
Algorithm is proposed in this paper.The mechanism is designed to identify the traffic
characteristics in a structure of positive feedback. During the identification process, the traffic 20
characteristics will be strengthened and expanded. By building the FP-Tree the efficiency and the
accuracy of identification is imporved. This paper also compares the efficience of Aprioi
Algorithm and FP-Growth Algorithm in traffic characteristics identification and certificates the
accuracy and the efficiency of the mechanism proposed in this paper.
Keywords:
Deep Packet Inspection; Traffic Characteristics Identification; P2P 25
0 引言
P2P 网络是一种分布式网络, 网络的参与者( Peer )共享他们所拥有的一部分资源(处理
能力、 存储能力、 网络连接能力、 内容等) ,这些共享资源能被其他对等节点直接访问而
无需经过中间实体。P2P(peer-to-peer)业务由于其可扩展性,健壮性,高性价比以及负载均30
衡等优点,近年来在数据下载,在线视频方面得到了广泛的应用。其迅速发展的同时也带来
了诸多问题,例如对网络带宽的大量占用,影响传统 Internet 应用,网络运营的成本增加以
及 p2p 系统本身的安全问题等。解决这些问题,需要引入对 p2p 业务的识别机制。
传统的应用层业务流量识别主要基于对协议端口识别。然而,随着网络技术的发展,以
P2P 为代表的应用层协议为了避免防火墙或主机的限制,开始大量采用动态端口策略,接近35
70%的 Kazaa P2P 流量使用并非默认端口
[1]
,基于固定端口的流量识别的局限性越来越明显,
已经不能满足新的业务流量识别的要求。
针对传统流量识别技术的局限性,研究机构和科研人员提出了 DPI(Deep Packet
Inspection)和 DFI(Deep Flow Inspection)技术。这两种技术除了对 L3 层和 L4 层的源地址、
目的地址、源端口、目的端口以及协议类型前面的分析外,还增加了应用层分析,识别各种40
应用及其内容。DFI 面向流,在处理速度和维护成本上有一定优势;DPI 面向报文,逐报文
分析,识别的粒度细于 DFI。
评论0
最新资源