基于软件执行路径的行为模式挖掘算法研究
随着全球智能化的不断发展,计算机软件在人们生活中发挥越来越重要的作
用,各行各业的软件产品应运而生,由此也产生大量冗余的软件数据。将数据挖掘
中的方法应用到软件的行为分析中,从这些软件数据中获取有价值的信息,能够
帮助软件开发人员进行系统错误定位、软件漏洞预测、系统行为预测等工作,从
而有效地完成对软件的更新和维护工作。
本文从获取软件的动态行为模式出发,在软件执行路径中进行序列模式挖掘,
将具有高效用的模式提供给研究人员,本文主要工作如下。首先,本文对软件执行
路径的特性进行分析。
通过对软件执行路径的理论研究,提出本文的研究工作是在软件动态行为分
析基础上进行的,阐述获取软件执行路径的方法,分析序列模式的特性,同时总结
经典的序列模式挖掘算法的实现思想和优缺点。其次,针对行为模式结果集的数
量较多的问题,提出基于软件执行路径的高效用闭模式挖掘算法。
为软件执行路径中的每个函数模式设计一种结构,保存函数所在的序列编号
和效用值等信息,根据这种结构提出一种剪枝策略,能够有效地减少扩展次数,同
时根据这种结构提出挖掘闭模式的方法,从而实现压缩结果集数量的目的。再次,
针对用户难以确定效用阈值的问题,提出挖掘 Top-k 高效用连续序列模式的算法。
为软件执行路径中的每个函数模式设计一种结构,其中包含下一个相邻的函
数信息,以便挖掘连续序列模式。同时,为尽快丢弃位于 k 个位置之后的模式,提
出四种剪枝策略,从不同方面提高算法的执行效率。
最后,选取不同的数据集,在 Windows 环境下进行实验,比较本文提出的算法