2015年第 7期
计 算 机 与 现 代 化
JISUANJI YU XIANDAIHUA 第 239期
文章编号 :1006—2475(2015)07-0005-04
基于 AUC的非参数 快速变点检测算法
吴学龙 ,徐维超
(广 东工业大学 自动化学院 ,广东 广州 510006)
摘要 :目前 ,变点检 测技 术已经广 泛应 用到各 个领域 。然而,由于实际生产环境 的复杂性 ,变点检测技 术 中的 常用参数方
法往往存在一 定的局 限性 。为了克服这 些 问题 ,提 出一种新 的变点检 测的 非参数 方 法,通过 互联 网检 索应 为首 次应 用
AUC(曲线下面积)对样本数据进行在线 变点检 测。该方法将 变点检测分 为 2个阶段 :预 分析 阶段 ,对样 本数 据进行加 窗
处理 ,通过计算窗 1:2中样本数据的 AUC值 的方式来间接得 到其均值 和方差 ;检测阶段 ,通过假 设检验 的方法对经过 处理
后 的样本数据进行 变点检 测。通过 实验仿真 ,可 以观察到此算法与常规 CUSUM 算法相 比,具有 更好 的稳健性 ,而且对检
测 多个突变点 的情 况同样有效 。
关键词 :变点检测 ;非参数估计 ;AUC
中图分类号 :TP391.9 文献标识码 :A doi:i0.3969/j.issn.1006-2475.2015.07.002
A Nonparametric Fast Algorithm for Abrupt Changes Detection Based on AUC
W U Xue-long.XU W ei—chao
(School of Automation,Guangdong University of Technology,Guangzhou 510006,China)
Abstract:Recently,the technologies for detecting abrupt changes have been prevalent in many fields.However,as the conven—
tional strategy.parametric method has some inherent limitations when it iS used in real production environment.In order to solve
these problems,we propose a novel nonparametric method for abrupt changes detection,which solves the problem by AUC(Area
under the Curve).We divided the process into two phases:during the pre—analysis period,we set two continuous scanning win—
dows and then calculate the AUC values of the samples in difficult scanning windows in order to obtain the means and variances;
during the detection period,we detect the changes by hypothesis testing.In simulation experiments,the method we proposed out—
performs CUSUM in terms of robustness and multiple changes detection.
Key words:abrupt changes detection;nonparametric method;area under the curve(AUC)
0 引 言
目前 ,变点检测技术 已经广泛应用到工业质量控
制、气 候模 拟、网络安全 、欺诈 检测等各 个领域 ,具有
十分重 要 的研究 意义 。
变点(也称异常点或孤立点 ),即模 型中某 个或
某些量 起突然变化的点 ,这种变 化往 往反映事 物的某
种质的变化 H 。例如 ,在工业生产过程 中,电机转速
在某一时刻可能 由于故障而突然变大或变小 ;在 网络
监测过 程中,服务器接 收的数据包可 能因为分布式 拒
绝服务攻击 (DDos)而突然激增 。因而,及 时准确地
检测出变点 ,并采取进 一步处理就显得很重 要。
常见的变 点检测方法根据过程 的分 布情 况可 以
分为参数方法和非参数方法。文献 [4]中所提 出的
累积和控制图(CUSUM)是 一种 常用 的参数方法 ,而
文献[10]提出了一种改进的非 参量 的 CUSUM算法 ,
并将其应用到网络安全监测 中。在实际生产环境的
检测过 程中,过程 的分 布或者 参数往 往是未知的 ,应
用参数方法检测变点 ,模型太清晰以至于在很多应用
场合中并不灵活。又 由于历史数据不足、采样误差 、
噪声等不确定 因素的影响 ,直接通过历史数据来估计
过程的参数往往也 十分 困难 。
为了解决上述 参数 方法的不 足,本 文提出一种新
的非参数检测方法 ,从模式识别 的角度出发 ,首次将
收稿 日期 :2015-03—12
基金 项 目:国家 自然科学基金资助项 目(61271380);广东省 自然科学基金资助项 目(¥2012010009870,1414050001981)
作者简介 :吴学龙 (1990-),男 ,山东临沂人 ,广东工业 大学 自动化学院硕士研 究生 ,研究方向 :模 式识别 ;徐维超(1970一),男 ,
山东青 岛人 ,教授,研究方 向:模式识别与智能系统。