第 39 卷 第 2 期
2019 年 2 月
电 力 自 动 化 设 备
Electric Power Automation Equipment
Vol.39 No.2
Feb. 2019
改进谱聚类与遗传算法相结合的电力时序曲线聚类方法
丁 明
1
,黄 冯
1
,邹佳芯
2
,刘金山
2
,宋晓皖
1
(1. 合肥工业大学 安徽省新能源利用与节能重点实验室,安徽 合肥 230009;
2. 国网青海省电力公司电力科学研究院 青海省光伏发电并网技术重点实验室,青海 西宁 810008)
摘要:为改善传统聚类算法在电力时序数据上的聚类效果,提出一种基于优化特征向量选取的遗传谱聚类算
法。 针对应用数据结构特点,合理优化谱聚类算法中特征向量的提取过程,避免传统方法可能造成的数据信
息缺失问题;采用遗传聚类优化算法对优选后的特征向量进行聚类划分,并将最终划分结果映射回原始数
据。 以 UCI 标准合成时间序列数据与美国区域电网运营商 PJM 提供的日负荷数据为例,对比分析现有常用
聚类算法与所提算法测试结果的聚类有效性指标与形态特征。 研究结果表明,所提算法分类效果显著,有较
高的聚类质量和算法稳健性,具有工程应用前景。
关键词:时序数据;谱聚类;遗传算法;特征向量提取;负荷聚类
中图分类号:TM 714 文献标识码:A DOI:10.16081 / j.issn.1006
-
6047.2019.02.014
收稿日期:2018
-
04
-
01;修回日期:2018
-
10
-
30
基金项目:国家电网公司科技项目(5228001600DX)
Project supported by the Science and Technology Program of
SGCC(5228001600DX)
0 引言
近年来,随着智能电网逐步成为电力工业的发
展方向与趋势,电力系统信息化、数字化的时代已经
到来
[1]
。 电力系统中的数据通常种类繁杂、来源广
泛,在电力系统的发电、输电、变电、配电、用电等各
个环节均有大量、不同类型的电力数据不断产生,如
何有效地从各类电力数据中挖掘具有价值的信息是
电力系统亟需解决的问题。 针对电力数据具有海
量、异构且含大量噪音的特点,采用数据挖掘技术分
析与处理电力数据,并为电力决策提供参考,已被广
泛认为是一种有效的方法
[2]
。
聚类分析属于数据挖掘技术中的无监督学习方
法,它旨在发现未知数据中具有相似模式的对象,并
分别归类
[3]
。 目前,聚类分析技术已被广泛应用于
电力系统领 域 的各个方 向中,如电力负 荷曲 线聚
类
[4]
、供电块划分
[5]
、电力工业异常数据识别
[6]
、电
能质量扰动识别
[7]
、可再生能源发电预测
[8]
等。 现
有的聚类方法一般包括划分聚类算法、层次聚类算
法、基于密度聚类算法、基于网格聚类算法与基于模
型聚类算法
[9]
等。 在电力系统中应用较为成熟的聚
类方法包括 K⁃means 算法、模糊 C 均值 FCM(Fuzzy
C⁃Means)算法、层次聚类以及基于神经网络的聚类
算法等。 文献[10]采用改进的 K⁃means 算法对全年
风电、光伏、负荷曲线进行聚类划分,得到一组可以
反映周期内历史数据特征的典型场景,并将其代入
以风电接纳能力最大为目标的机组组合模型中验证
所提方法的有效性。 文献[11] 将重采样技术、层次
聚类与划分聚类相结合,提出一种用户用电曲线的
集成聚类算法。 文献[12] 提出一种基于云模型确
定聚类数目与初始聚类中心的 FCM 算法,从负荷曲
线中提取相似的用户用电模式。 文献[13] 将主成
分分析法与层次聚类相结合,从而对全年风电出力
序列进行聚类划分。 文献[14]利用 K⁃means 算法对
气象信息与风电历史数据进行聚类,并结合神经网
络方法提高了风力发电预测的精度。 文献[ 15] 提
出一种基于密度空间聚类与引力搜索算法的居民负
荷用电模式分类模型。
由于无论是负荷曲线,还是新能源出力曲线,本
质上它们均属于时间序列数据,因此研究适用于时
序数据的聚类方法与相关技术,对电力数据分类而
言具有重要的参考价值。 目前,时序数据聚类的方
法主要分为基于原始测度的方法与基于时间序列形
态特征的方法这两大类
[16]
。 文献[17] 用动态弯曲
距离( DTW) 替换普通欧氏距离度量,并结合全局时
间序列平均法提高了 K⁃means 算法聚类时间序列的
能力,但最终的效果并不显著。 文献[18] 采用基于
MapReduce 框架改进的谱聚类算法,并应用于实际
股市数据中,取得了较好的分类效果。
本文提出一种谱聚类特征向量优化选取与遗传
聚类算法相结合的聚类优化算法。 算法主要分为 2
个步骤:根据算法应用数据的结构特征,合理优化
NJW 算法中的特征向量选取过程;在形成的特征向
量聚类空间中,用遗传聚类优化算法取代传统 NJW
算法中的最后一步 K⁃means 聚类,以提高传统 NJW
算法的全局寻优能力,实现对数据的合理聚类分析。
将本文方法分别应用于 UCI 标准合成时间序列分析
与实际负荷数据聚类中,验证了所提方法的合理性。
1 基于优化特征向量提取的遗传谱聚类
1.1 特征聚类空间的提取
1.1.1 谱聚类理论
谱聚类是从图论中演化出的算法,它将数据聚
评论0
最新资源