本文是关于网络安全中的一种新型数据挖掘技术——基于 PrefixSpan 算法的研究。PrefixSpan 算法是一种数据挖掘技术,它源自序列模式挖掘算法,广泛应用于网络安全领域,特别是在入侵检测系统中,用以识别网络攻击和恶意行为。在本文中,研究者孙佑明提出了一种基于数据挖掘的 PrefixSpan 算法网络安全防御模型。
文章指出传统安全防御算法存在的不足,主要表现在耗时长、识别精度低和适用性差。为了解决这些问题,孙佑明提出了基于数据挖掘的 PrefixSpan 网络安全防御算法研究,通过在序列模式数据挖掘的理论研究基础上,提出了 PrefixSpan 算法,并以此为基础构建了网络安全防御模型。
在序列模式数据挖掘的研究中,涉及到了数据挖掘的基本概念和方法。数据挖掘是从大量数据中提取信息和知识的过程,主要目的是发现数据中的模式,从而用于预测和分析。数据挖掘算法的概念描述涉及对数据的每个概念和类别进行汇总分析,并提取数据的属性模型,以分析和预测海量数据集合。数据的关联分析则是用来描述一类数据的关联度和密切度,以在海量数据库集合中找出具有预测性价值的信息。
序列模式挖掘是数据挖掘中的一种重要模式,它可以获取相对时间模式或其他模式的出现频次。在 PrefixSpan 算法中,涉及到的序列模式挖掘的重要参数包括持续时间、事件重叠窗口以及模式之间的时间间隔。持续时间是指用户选择的序列,事件重叠窗口是指特定时期内一组事件的出现,而模式之间的时间间隔指的是模式间发现的最小和最大间隔。
PrefixSpan 算法的主要思想是将采集到的数据在 Prefix 上投影,并进行数据挖掘,提取其中的数据频繁项补充到序列前缀中,直至挖掘出全部的频繁序列。PrefixSpan 算法在时空效率上相对于传统数据挖掘算法有明显提高,并能有效识别各种不同类型的数据入侵,保证网络安全。
在具体实现中,研究者提出了构建网络安全防御模型,该模型对采集到的网络数据实施预处理、序列匹配与判定,实现对入侵数据的识别与检测。仿真实验结果表明,提出的网络安全防御算法在检测精度和检测效率方面都有良好的表现,能够准确识别出不同类型的入侵数据。
文章中还提到了数据集、文献标识码、文章编号以及中图分类号等参考文献信息。文章编号为 2096-4102(2018)05—0139—04,中图分类号为 TP393.08,文献标识码为 A,这些都是学术文章的标准格式,有助于归类和检索。
作者孙佑明是巢湖学院的讲师、硕士,提供了作者简介,为研究提供了背景信息。文章最后提到的收稿日期为2018年7月11日,符合学术论文发表的时间标准。
文章通过提出基于数据挖掘的 PrefixSpan 算法网络安全防御模型,探讨了其在网络安全中的应用和效果,为网络安全领域提供了新的研究方向和实际应用价值。