一种基于Grubbs和孤立森林的多维序列异常检测方法.docx
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
基于Grubbs和孤立森林的多维序列异常检测方法 本文提出了一种基于Grubbs和孤立森林的多维序列异常检测算法,对采集到的多维数据使用优化的孤立森林算法进行异常检测,最后得出相关异常值发生的时间点以及相关联的异常数据。实验结果表明,该方法可获得较高的准确率和计算效率。 关键词:多维序列;异常检测;孤立森林;Grubbs 传统的异常检测是针对单维指标进行异常判别,但随着计算机技术的发展,异常检测的方式也发生改变,逐渐发展为面向实时性更强、信息更加丰富的大数据场景的多维序列异常检测。然而,太多的维度以及数据量会导致检测速度变慢,累积更多的错判和漏判,很难发现相关联的异常指标数据,不利于整体分析问题。 本文提出的方法采用了优化的孤立森林算法,实现了较好的异常检测效果。该算法易于理解,计算开销小,并且泛化能力和实用性较好。 孤立森林(iForest)是一种集成学习方法,广泛应用于异常检测领域。iForest 对数据集的适应能力很强,同时在训练样本以及样本属性的选择方面都是随机的,在处理多维序列存在一定的优势。其算法流程大致如下:从训练数据中随机选择个点作为子样本,放入一棵孤立树的根节点;随机指定一个维度,在当前节点数据范围内随机产生一个切割点 p,切割点产生于当前节点数据中指定维度的最大值与最小值之间;此切割点的选取生成了一个超平面,将当前节点数据空间切分为 2 个子空间;在节点的左分支和右分支节点递归步骤,不断构造新的叶子节点,直到叶子节点上只有一个数据(无法再继续切割)或树已经生长到了所设定的高度,此时获得了一个 iTree。获得 t 个 iTree 之后,iForest 训练就结束,然后可以用生成的 iForest 来评估测试数据。 本文的方法还结合了Grubbs算法,对多维序列数据进行异常检测。Grubbs算法是一种基于统计学的异常检测方法,通过计算数据点的离散度和方差来检测异常点。该算法简单易行,计算效率高,但在处理多维序列数据时存在一定的局限性。 本文提出的基于Grubbs和孤立森林的多维序列异常检测方法可以有效地检测多维序列数据中的异常值,具有较高的准确率和计算效率,能够满足大数据场景下的异常检测需求。
剩余10页未读,继续阅读
- 粉丝: 4494
- 资源: 1万+
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助