论文研究-基于主元分析和支持向量机的异常检测.pdf

所需积分/C币:10 2019-07-22 23:08:47 190KB .PDF
收藏 收藏 1
举报

为了提高异常检测的效率,提出了一种基于主元分析和支持向量机的异常检测方法。基于主元分析对入侵数据进行约简,使用SVM对约简的数据进行训练,得到支持向量机实现异常检测。以KDDCUP 99数据源进行实验,先将数据从40维约简为15维,22维约简为5维,训练与检测的实验结果表明,该检测方法具有良好的准确度和泛化性能,训练时间和检测时间显著减少。
第7期 任勋益,等:基于主元分析和支持向量机的异常检测 2721· 在于本次约简减少了一些特征,目的是为了检验PCA分析方法 从表3和4可以看出,无论是采用22个特征还是5个特 的稳定性。约简的特征值为5个,并得到相应的降维矩阵。 征,对于任一训练数据,当测试数据从1000增大到5000,测 3.2检测实验结果与分析 试的准确度得到了提高,而且,随着训练数据的增大,测试的准 采用Kdp910w子集作为实验数据源,从中随机确辛也在提高,这说明PCA约简后特征与使用22特在具有 抽取正常数据与异常数据混合后,50%作为训练数据,5形%作同等的准确度和泛化能力。从表5和6可以看出,随着训练数 为实验数据,首先使用15个特征共实验四次。实验数据如表据的增大,相问测试样本检测耗时增大,但是约简的检测耗时 1所示。 明显小于未约简的耗时,而且随着测试样本的增大,这种趋势 表1基于ECA与SVM异常检测数据源 更加明显。因此,得到实验结论是:本文提出的基于PCA约简 noumal 的sVM异常检测能够保持很高的准确度,貝有良好的泛化能 data/% 力,学习和检测更加快速 3450 2760 5670 1083 4587 结束语 8340 l606 6734 0 采用IsVM软件进行sM训练与检测,先使用gil.异常检测本质上是一个分类间题,SWM是目前最数的分 Py进行最优参数搜索,得到最优c、G2。再利用最优参数进行类方法之一,因此,将SVM用于异常检测是一种较好的选择 训练得到训练模型,最后使用模型进行测试。对使用PCA约但是,将网络数据全部特征用于SVM学习,需要解决一个复杂 简和未约简两种实验结果统计如表2所示。 的二次规划问题。入侵高维薮据维数之间存在着一定的依赖 表2PCA&CSVM和sVM异常检测结果 关系,发现这种关系,对高维进行变换,降低维数是提高SVM PCA & CsvM 入侵检测效率的一种途径。本文利用PCA对高维数据进行线 lest correct time/'s time/ lIme/ s correct o timers 性变化,将人侵高维数据约简降维,对 KDDcup99数据源上的 2,0.125 99.53151.90.42.0,0.007812598.90632.81.2 实验表明,经过约简后的SVM在保持较高的检测准确度情况 2512.001294230.6320.0.0081598361.8下,其训练和检测时间减少了,泛化性能良好。因此,木文提出 332768,0.078125995622.9125120.0012599×42422.1 的方法具有较好的检测效果。未来的工作是将本文提出的方 128,8.099.54443.51.68.0,.0.12599.80825.12.8 法用于在线检测和多类分类研究。 从表2可以发现,使用PCA约简特征与直接使用仝部特 征相比,它们的准确度一致,均达到了9%以上。但是,前者参考文献 的训练速度和检测速度明显比后者要快,这主要是因为经过1] CHANGR KO. Defending against flonrling-based distributer denial PCA约简后,入侵数据的维数降低了,其计算速度得到了 of-service attack: a tutorial[ J]. IEEE Communications Maga 提高。 zine,2002,40(10):42-51 为了考察PA约简异常检测方法的泛化能力,本文使用2] MUKKAMALA, JANOSKI C, SUNG H. Intrusion detection using 22个和5个特征分别进行实验,检测的准确度结果如表3、4 neural networks and support vector machines.]//Proc of Interna 所示,检测耗时结果如表56所示。 tional Joint Conference. New Jersey IEEE Computer Society Press 表322个特征训练与须测数据和准确度结果 2002 est number train number [3 SUNG A. Ranking importance of input parameters of neural networks 1000 2000 100000 1000 97.9% 98.05% 97.82 97.914% [J]. Expert Systems with Applications, 1998, 15(3): 405-411 98.54 98.18% 98.224% [4 VAPNIK V. The nature of statistical learning theory I 5000 98.8% 99.1% 98.92%98.924% York: Springer-Verlag, 1995 表45个特征训练与预测数据和准确度结果 [5. BURGES C. A tutorial on support vector machines for pattern recog est numbe train number tion [J]. Data Mining and Knowledge Discovery, 1998, 2(2) 000 L020 10000 121-167 98.23% 98.304% 8.3% 98.4% 98.534% 6 FROHLICH H, CHAPELLE O, SCHOLKOPF B. Feature selection 5000 8.5% 98.6% 98.6% 98.626% for support vector machines by means of genetic algorithm C]//Prod 表522个特征训练与预測数据耗费时间结果 of the 15 th IEEE Intemational Conference on Tools with Artific ial In test number telligence. California: IEEE Compuler Society Press, 2003 train number 1000 200 10000 50000 [7 SMITH I L. A Tutorial on principal component analysis L EB/OL. l00 0.344 0.453 2.015 9.J65 2000 0.344 0.500 1.1016 (2002-02-16)[2008-11-26].htt:// csnet. otago.ae.nz/cosc453/ 0.406 0.735 3.016 1.4312 tudent_tutorials/ principal_components. pd 表65个特征训练与预测数据耗费时间结果 8 MITLincdn Lab. DARPA intrusion detection scenanio-specificdatasets test number Leb/Olj.(2000).http://www.Il.mitedu/ist/idevAl/datA 002 0000 50000 2000/2000 data index. html 0.1016 0.5328 2000 0.312 0.1141 0.550 [9 lin C. L.irSvM: a library for SvmS [ Er/ol ].(2001). htTp: // 5000 0.219 0.391 0.1562 www.csic.ntu.edu.tw/-ejlin/papers/libsvm.pe

...展开详情
试读 3P 论文研究-基于主元分析和支持向量机的异常检测.pdf
立即下载 低至0.43元/次 身份认证VIP会员低至7折
    抢沙发
    一个资源只可评论一次,评论内容不能少于5个字
    img
    • 至尊王者

      成功上传501个资源即可获取

    关注 私信 TA的资源

    上传资源赚积分,得勋章
    最新推荐
    论文研究-基于主元分析和支持向量机的异常检测.pdf 10积分/C币 立即下载
    1/3
    论文研究-基于主元分析和支持向量机的异常检测.pdf第1页

    试读已结束,剩余2页未读...

    10积分/C币 立即下载 >