论文研究-数据挖掘技术在基站巡检系统中的应用 .pdf

所需积分/C币:5 2019-08-18 22:11:06 265KB .PDF

数据挖掘技术在基站巡检系统中的应用,孙振华,吴伟明,通讯事业的迅速发展离不开基站的正常运转,为了保障基站工作的可靠性与稳定性,需要对基站进行巡检,包括安防巡检和设备故障排除
山国武技论文在线 http:/www.paper.edu.cn 聚类是无监督的,本系统要利用它将维教众多的巡检薮据分成固定的几类薮据簇,每 80簇的数据代表着基站运行稳定性级别,聚类算法中划分法符合这个要求,因此选择了具有 代表性的K- means算法,其描述如下所示: (1)从巡检数据屮随机选择k个对象,每个对象代表一个簇,且为该簇的初始屮心; (2)计算每个对象到这k个对象的距离,将该对象划分至最小距离的簇中 (3)重新计算发生变化的簇的均值,即重新确定簇的中心; 85(4)重复步骤2、3,直至每个簇不再发生变化 2.2分类算法的选择 排障记录数据中设备告警的种类很多,但是每类对基站影响较为固定,而且各个设备告 警是相互独立的,因此希望将这些告警按照需要处理的紧急程度分为固定几类,决定采用分 类方法处理数据。薮据挖掘中的常用分类算法有:决策树分类、贝叶斯分类、基于规则的分 90类、用后向传播分类、攴持向量机、关联分类和懒惰学习法等 基站排障记录冇很多历史数据,很容易得到训练元组,因此我们选择了懒惰学习屮的K 近邻分类方法。K近邻算法( K Ncarcst Neighbors,KNN)是一种常用的基于距离度量的分 类方法。K近邻算法假设整个训练集不仅包含数据集,而∏包含每个元组期望的类别标签。 实际上,训练数据成为模型。当对一个新元组进行分类时,必须首先硝定它与训练集中的每 95个元组之间的距离。然后进一步考虑训练集中与新元组相距最近的元组。新元组将被分配到 个类中,这个类包含了K个最近元组中的最多的元组 3数据挖掘算法在巡检系统中的应用 在分析了基站巡检系统的工作方式和数据控掘算法后,本节将数据挖掘算法引入到基站 巡检系统的设计中,将K- means聚类算法用于基站安防巡检数据分析,同时将K近邻分类 100算法用于故障排除记录数据分析,并通过实验说明研究的可行性。 3.1K- Imeans算法在安防巡检数据聚类中的应用 木节将聚类应用」基站巡检系统中,使用聚类算法分析安防巡检历史数据,将其聚成不 同的类来指导未来的基站安防巡检工作,处理流程如图1(a)所示 初始数提 初始化 初始口心选拯 预处理 类划分 聚类分析 类中心点移功 「指寻派单 收歙 聚类结 ()系统处理流程 率类分析流程 105 图1K- means聚类处理流程图 Fig. 1 Flow chart of K-means clustering process 首先我们将数据库屮存储的ⅹ市近2年的基站定期巡检数据进行预处理,从近100项 属性屮选择有较大影响的属性36项参与聚类分析,包括空调状态、制冷管路、徵波设备、 排水检査等属性。每项属性取值范围在两项到三项之间。我们将将数据库中的 varchar类型 110映射成int类型。取值范围为两项的映射关系如图2(a)所示,取值范围为三项的映射关系 山国科技论文在线 http:/www.paper.edu.cn 如图2(b)所示。 正 常 异掌 严重 a)两项契射关系 k)三项射关系 图2数据数值映射 Fig. 2 The numerical data mapping 115 预处理工作完成后,使用K- means对X市的安防巡检数据进行分析,目标是将数据聚 成3簇,分别表小:正常运转基站,轻微异常基站,严重异常基站。其分析流程如图1(b) 所小。从数据记录中取3000条记录,每条记录看作36维空间中的一个点,K值取3进行聚 类。在数据中随机选取3个点作为簇的初始中心,然后开始训算,依据距离重新选择簇的中 心点,直至结果收敛。在实验结果中聚成的3类数目为1680、1156和164即基站运行正 120常的有1680条数据,有轻微异常的1156条,较为严重的有停服甚至更换设备的有164条 上述例子就是应用了聚类分析的基站巡检系统的聚类分析结果,得到这个结果后,把有 轻微异常和严重异常的基站名称记汞下来存储在数据库中,待下次定期基站安防巡检派单 时,系统发送这两类基站派工单时要把两类中经常岀现问题的项目枟红,提示巡检人员重点 检测这些易出问题的项。例如实验中轻微异常类中有名为“新区咸丰路汽车站BMIT”的 125基站,巡检数据显示该基站门窗经常有损坏,而且基站有鼠洞,有电线被咬坏记录。囚此在 下次给该基站派单时,要把门窗、鼠泂检查项标红,并挠醒巡检人员在基站内投放鼠药。从 而实现基站巡检系统给安防巡检智能化派单。 3.2K近邻算法在排障数据分类中的应用 基站巡检系统负责收集基站上报的告警信息,并立刻以故障派单的形式将告警转发给排 130障人员。排障人员在排障中记录大量的故障数据存储在数据库中。本节将分类算法引入到基 站巡检系统,对排障数据进行分类分析,找岀髙故障率的基站。方法是将数据库记录的故障 分成3级,每级赋予不同的杈重。系统对出现故障的基站统计故障发生次数,每级枚障次数 乘以杈重再求和,为每个故障基站求得一个加权值。加杈值越大说明基站故障率越高,然后 再次按加权值将这些基站均分成3类,划在高故障率一类的基站将是下一期基站安防巡检的 135重点巡检对象。系统工作流程如图3所示。 待分 「练蚁探 新教据 求和 丝与末 佟3分类处理流程图 Fig. 3 Flow chart of classification process 4 山国武技论文在线 http:/www.paper.edu.cn 本文实验数据来自ⅹ市基站故障处理记录薮据,使用K近邻算法进行分类,训练数据 集包含三组训练元组,每组有70个训练元组,三组内的元组代表故障类别为:主要告警(权 140重设为10),次要告警(权重设为5),一般告警(权重设为1)。参与分类的属性有枚障 设备数目、璋处理时间、排障人数三个维度。在待分类元组到来时,计算该元组与每个训 练元组的欣几里德距离。在计算出210个欧式距离之后,选择距离最小的K个元组,然后 待分类元组被分到3类中的一组,该组包含了这K个最近元组中的最多的元组,实验证明 在本文中K值取8时分类正确率在80%以上,符合要求 145 以上工作确立了今后再接受故障排除记录时分类标准,在完成上述工作后,接着统计每 个基站在三组中出现故障次数,并加权求和。在加权求和之后,每个故障基站都有一个加 杈值,然后将这些基站按照加权值从大到小均分成3类,分别为高故障率基站、次髙故障率 基站和低故障率基站。将这3类故障基站的名称仔入数据库中。 基站巡检系统在完戊以上分析工作后,就可以在下次安防巡检派单时将高故障率基站和 150次高故障率基站作为基站巡检的重点巡检对象。 4结论 木文将数据挖掘中的K- means聚类和K近邻分类算法引入到基站巡检系统进行数据分 析,并使用巡检薮据对这两个算法进行了实验验证,聚类和分类的效率都符合要求,其中聚 类算法分析岀了基站内部需要重点检査的安全薄弱环节,分类算法的使用分析出了系统管辖 155范围内的髙故障率基站,因此可以将K- means算法和K近邻算法推广到基站巡检系统作为 数据分析之用,使基站巡检系统派单更有针对性,实现智能化派单 「参考文献]( References) [1]苏志伟.移动通信基站告警关联分析及其远程监管系统设计[D].南昌:南昌人学,2012 160[2]柳炳祥,徐远纯.数据挖掘在企业危机管理中的应用[科学学与科学技术管理,2002,23(6):7880 [3]秦钰,荆继武,向繼,等.基于优化初始类中心点的 K-means改进算法[J屮国科学院研究生院学报 2007,24(6):771-777 [4]陈振洲,李磊,姚正安.基于SWM的特征加权KNN算法[中山大学学报:自然科学版,2005,44 165 靖小平,彭小圣,姜伟,等.基于K- Means聚类算法的自动图谱识别在电缆局部放电在线监测系统中的 立用高电压技术,2012,38(9):24372446. [6]李蓉,叶世伟,史忠植. SVM-KNN分类器—一和提高SVM分类精度的新法门.电子学报,2002, 5):745-748

...展开详情
img

关注 私信 TA的资源

上传资源赚积分,得勋章
    最新推荐