龙源期刊网 http://www.qikan.com.cn
改进 k—means 算法在网络入侵检测系统中
的应用研究
摘要:入侵检测技术作为一种主动的网络安全防护技术越来越引起研究者的关注,但现有
技术的误检率和漏检率较高。对入侵检测技术进行了介绍,分析了k-means 算法及其存在的问
题,提出了相应的改进策略,并将改进后的算法应用于入侵检测系统中。仿真实验结果表明,
改进后的 k-means 算法在检测率和误检率上均优于传统的 k-means 算法。
关键词:网络入侵检测;聚类分析;k-means 算法
中图分类号:TP312
文献标识码:A 文章编号:1672-7800(2014)003-0059-03
0 引言
随着网络规模的不断扩大,网络受到入侵的威胁也越来越大,有效阻止各种网络入侵行为
尤为必要。入侵检测系统作为一种积极主动的安全防护技术提供了对网络内部攻击、外部攻击
和误操作的实时保护,确保在网络系统受到危害之前拦截和响应入侵。基于聚类算法的入侵检
测是一种无监督的异常检测算法,通过对未标识数据进行分类,能发现新型的和未知的入侵类
型。
传统的 k-means 算法存在许多问题,如:k 的点数必须提前给出;初始值对算法影响极
大;对噪声点和孤立点敏感等,这些问题极大地限制了其在网络入侵检测方面的应用。基于上
述原因,本文对传统的 k 均值算法进行了改进,提出了一种基于改进k 均值算法的入侵检测系
统,并通过仿真实验验证了该系统的优越性。
1 传统 k-means 算法
1.1 k-means 算法介绍
k-means 算法是一种 cluster analysis 算法,通过不断地取离种子点最近均值,计算数据聚
集。其特点是收敛速度较快、算法简单、算法效率高。算法流程如下:
输入:聚类个数 k 包含 n 个数据对象的数据样本集;
输出:k 个聚类结果。