网络监控日志可视化分析
栾鑫月, 王 美,聂俊岚
图 1.A:网络结构力导向图,B:结合玫瑰图的平行坐标系,C:HSDC 图,D: 环形坐标系
摘要—基于 BigBusiness 公司两个月网络监控日志数据,对内部网络的通信进行分析。使用主机的度、主机通信次数、主机的各端口
使用率对服务器进行初步筛选,适当的调整后,将其在图 1A 中标出,验证了选出服务器的正确性。用结合了玫瑰图的平行坐标系、
HSDC(Host-Server-Daily-Communication)图和环形坐标系来展示数据的多层次属性之间的关系,以更好地探索用户的行为模式。
HSDC 图和环形坐标系还分别实现对多用户多层次和单用户多层次连接传输的实时模拟。
关键字—服务器识别;可视分析;网络异常;行为模式;环形坐标系
1 引言
ChinaVis 2016提供了由网络监控系统在BigBusiness公司
的骨干通信链路上抓取的数据包信息,它记录数据包在链路
层、网络层和应用层的相关信息
[1]
。通过分析该监控系统试运
行期间两个月的网络监控日志,识别该公司内部网络中的客
户端与服务器,实现对数据连接的多层次可视分析,探索其
可能反映的用户行为模式。
2 概述
首先对数据进行清洗,根据主机间的通信画出力导向图,
然后使用基于主机的度、主机通信次数、主机的各端口使用
率的公式进行服务器的初步筛选,适当的调整后,将其标于
力导向图中,如图1A所示,验证选出服务器的正确性。在可
视化设计阶段主要使用热度图、堆叠图、折线图和力导向图
来发现网络中的异常。树地图适于展现经同一虚拟管道进行
通信的源IP和目的IP的分布规律和连接模式;甘特图、河流图
可以更简明地展示虚拟管道随时间的推移而出现的各种模
式。用结合了玫瑰图的平行坐标系、HSDC图和圆形坐标系展
示数据的多层次属性之间的关系,以更好地探索用户的行为
模式。HSDC图和环形坐标系还分别实现对多用户多层次和单
用户多层次连接传输的实时模拟。
3 区分客户端与服务器
3.1 客户端与服务器的识别方法
由于通常情况下服务器会与较多的主机通信,且根椐其
提供服务的不同,某个端口的使用率会远高于其它端口;我
们用下面的公式来识别内网中的服务器:
通过上述公式计算每台主机的Z值,Z值大于0,该主机为服务
器,否则不是。上式中: 、 、 分别代表主机i的通信
次数、度、使用端口 通信的次数; r、d和w分别表示主机
通信次数、度和端口使用率的阀值。本题中r=53*2=106次,d
取通信次数大于106的主机的度的期望值,w=0.5。
为保证服务器对整个网络提供服务的全面性,针对不同
的应用,分别在力图中将找到的服务器标出,对结果进行筛
选、补充。最后在力图表示的内网中将找到的服务器用粉色
结点标出,将内网的客户端用白色结点标出进行验证,结果
如图1中A图所示,图中红色的结点位于主干网上,且能把内
网的各个主机连接起来,验证了所选出的服务器的正确性。
4 可视化设计
4.1 力导向图
用节点表示主机,用节点之间的连线表示二者的通信关
系,绘制出网络中主机通信的结构图。观察其结构,发现独
立于主干网络的子网,进一步分析发现,此子网存在时间较
短,认为这些子网是异常的结构。图1中A图绿色和蓝色结点
所在的子网即为这种异常结构。
4.2 堆栈图
堆栈图可以发现随着时间的推移,各个组成部分数量的变化
及总量的变化。图 2 展示不同的端口每天的使用次数。
图 2:端口访问量异常
栾鑫月,燕山大学,
E-mail: 464176845@qq.com.
聂俊岚,燕山大学
教授
, E-mail: niejll3@163.com.
Manuscript received xx xxx. 201x; accepted xx xxx. 201x. Date of
Publication xx xxx. 201x; date of current version xx xxx. 201x.
For information on obtaining reprints of this article, please send
e-mail to: reprints@ieee.org.
(( ) 0) (( ) 0) (( ( ) ( ) ) 0)
k
i i i i j i j
jm
Z r r d d c p c p w
评论0