没有合适的资源?快使用搜索试试~ 我知道了~
方法MATLAB编制Kmeans算法程序并进行仿真分析.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 201 浏览量
2022-11-10
20:19:58
上传
评论
收藏 1.41MB DOCX 举报
温馨提示
试读
23页
。。。
资源推荐
资源详情
资源评论
文档来源为:从网络收集整理.word 版本可编辑.欢迎下载支持.
【关键字】方法
摘要
基于电力用户负荷曲线进行聚类分析,是获得典型负荷分布和按负荷特性对用户分类的
重要手段,对于负荷预测、负荷控制、用电异常检测甚至电价目录制定和开发营销策略等都
有理论和实际意义。目前对负荷曲线聚类的方法有很多,各有优点与不足。本文首先对常用
的聚类算法K-means和层次聚类进行了分析研究,最终用MATLAB编制K-means算法程序并进
行仿真分析,结果表明,此方法效果良好。
关键字:聚类算法;K-means算法;负荷曲线
0
Abstract
Cluster analysis based on power user load curve is obtained by a typical load distribution and
load characteristics of the user classification important means for load forecasting, load control,
anomaly detection and even electricity tariff directory developed and developing marketing
strategies have theoretical and practical significance. There are many, each with advantages and
disadvantages of the load curve clustering method. Firstly, the commonly used K-means clustering
algorithm and hierarchical clustering analysis carried out, the final preparation of K-means algorithm
and procedures used matlab simulation results show that this method works well.
Keywords: clustering algorithm; K-means algorithm; load curve
1.引言
近些年来,智能电网早已成为全球的热门话题。
美国在 2003 年 6 月发布的“Grid2030——电力下一个 100 年的国家设想” 应用程序的分
布式的报告中提到生成智能化、自动化分发网络结构和计划在将来把它变成现实。在中国的
十一五规划,国内也将在智能电网的建设投入了大量资金。智能电网,包括智能电网与智能
配电网络,但主要是指智能配电网。随着时间推移,配电网建设完成之后,电力负荷很难免
会出现一些与设计时的偏差,比如用户负荷分布不均衡,在一些地区负荷增长过快(尤其是
高峰负荷),对电网安全造成了严重的威胁,而另一些地区却因负荷太小而引起电气设备利用
率太低,导致经济性差等。于是,对于电网的经济安全可靠运行来说如何获取负荷的详情至
关重要。智能配电网的发展到如今,更多的传感器被应用到了电力网络中,用来实时获取电
网数据,经筛选加工后的这些数据成为了支持电网维护、改造、运行的信息,为电网的经济、
安全、可靠运行打下了坚实的基础。目前所有电力用户的分类都是先由用户自己报装类型然
后经由电力部门的批准审核,不能根据实际负荷曲线分类,其主要过程为:用电客户提出申
请—业务的受理—前往现场勘查—计量录入数据—电费的审核—信息归档等等环节。但是,
这些步骤忽略了一个重要细节,那就是没有人对归档后的电价执行事中、事后管理,同时也
没有人对电价进行日常审核、监督、分析。所以,真实负荷信息的掌控是很有限的,因此这
会导致偏离实际的负荷。国家在《电价改革方案》中所提出过的“合理成本、合理赢利、公平
负担”的定价原则。于是,想要达到公平,必须根据实际负荷曲线分类才有意义。在电力市场,
从经济公平的角度和负荷控制实现电网安全的角度来看,都应该是按照用户负荷实际曲线分
别采取针对性措施,对用户进行分类,而其中最为基础工作就是对负荷曲线进行聚类。
基于电力用户负荷曲线的聚类分析,是获得典型负荷分布的重要手段,对按负荷特性对
用户分类有重要帮助,对于负荷控制、负荷预测、用电异常检测甚至电价目录制定和开发营
销策略等都有实际意义。
负荷曲线是负荷分析的数据来源,是用户电能消费行为的直观表示。如果用户具有相似
的消费模式,则他们也具有相似的负荷分布形状。为了方便企业的管理和制定有针对性的运
营策略,可以根据用户负荷分布的相似性来对用户加以归类。而聚类分析在负荷分析中占有
主导地位,是负荷分析的基础。本文介绍了聚类分析的一些方法,运用 k-means 聚类算法并结
合数据的归一化处理,以某一地点超过二百多个用户的负荷数据为研究东西,提取出日负荷
特征曲线,对用户负荷进行了研究。并用MATLAB编写了算法程序并进行仿真分析,结果表
明,此方法效果良好。
2.聚类问题综述
2.1 聚类的概念及综述
聚类分析是一种多元统计方法,同时也是一种模式识别技术。数据库中知识的发现和数
据挖掘(knowledge discovery and data mining,简称 KDDM)广泛受到当今国际人工智能与数
据库界的重视。聚类则是该领域中的一个十分重要的研究课题。聚类分析(Cluster Analysis)是
一个新的数学分支,它是在多元统计分析被引入分类学中后逐步形成的。聚类分析是研究如
何将一组样品(指标、东西、属性等)分成类内相近、类间有别的若干类群的一种多元统计分析
方法。聚类所生成的簇是一组东西的集合,这些东西与同一个簇中的其他东西彼此相似,与
其它簇中的东西相异。简单的来说,所谓聚类就是将物理或抽象的集合分组成为类似的东西
组成的多个类。
人类早在儿时,就能通过不断地改进下意识的聚类模式来学习如何区分动物植物。通过
自动聚类能够识别东西空间中稠密和稀疏的区域,包括市场研究、模式识别、数据分析和图
像处理。在商业应用中,聚类能够帮助市场分析员根据购买模式从顾客数据库中发现不同的
顾客群体。在生物学中,聚类能够用来推导植物和动物的分类,根据相似功能对基因进行分
类,获得对种群中固有结构的认识。在电力系统中,对于电力用户负荷特性进行聚类分析,
能够帮助找出电力零售市场下的用电营销群体,提高识别电力用户中存在的用电异常现象等。
所以,基于电力用户负荷特性的聚类分析近年在国内外得到快速发展。下面就聚类分析方法
研究现状及基于电力用户负荷特性分类研究的发展情况分别展开详细的说明。
聚类的过程就是一个将数据集合区分为若干个不同子集的过程,并同时满足使得同一集
合内的数据东西相似度较高,而不同集合中的数据东西则是不相似的。其中提到的相似或不
相似的度量,是基于数据东西描述属性的取值来确定的。通常则利用各个聚类间的距离来描
述集合之间的相似程度。聚类分析的基本原则是使类中东西最大程度地相似,不同类间的东
西相似度则达到最小。这里需要指出的是,聚类与分类是不同的。在分类的时候,存在样本
数据,这些数据属于哪个;类别是已知的,分类的目的是从样本集中提取出分类的规则,用
于对其他未知类别的东西进行类标识。而聚类预先并不知道目标数据有关于类别的相关信息,
需要以某种度量为标准将所有的数据东西划分到新生成的各个簇中。因此,聚类分析又称为
无监督的学习。而获得能够反映 N 维空间中这些样本点的最本质的“类”的性质就是聚类算法
的目。聚类主要包括以下几个过程:
1
(l)数据准备
包括特征降维和标准化。
(2)特征选择、提出
从最初的特征中选择最有效的特征,并将选出的特征其存储于向量中。
(3)特征提取
对所选择之特征进行转,通过换形成的新特征具有突出特征。
(4)聚类(或分组)
先选择一个合适特征类型的距离函数(或构造一个全新的距离函数)进行相似程度的度量。
然后执行聚类或分组。
(5)聚类结果评估
评估聚类的结果。评估主要有 3 种:内部有效性评估、外部有效性评估和相关性测试的评
估。
动态的聚类过程如图 2.1 所示:
图2.1 动态的聚类过程
2.1.3 聚类算法的要求
聚类分析是一个正在蓬勃发展的新领域。聚类分析所涉及的领域包括: 统计学、数据挖掘、
空间数据库技术、生物学、机器学习和市场学等等。正是因为每个应用程序数据库中包含的
数据量越来越多,聚类分析在数据挖掘中已成为一个非常活跃的研究课题。作为统计学的一
个分支,聚类分析已有多年的研究历史,这些研究主要集中在基于距离的聚类分析方面。许
多统计软件包,诸如:S-Pins、SPSS 和 SAS,都包含基于 K-means、K-medoids 等其它许多聚
类分析工具。在机器学习中,聚类分析属于一种无监督的学习方法。与分类学习不同,无监
督学习不依靠事先确定的数据类别,以及标有数据类别的学习训练样本集合。正因为如此,
聚类分析又是一种通过观察学习方法 ,而不是示例学习。在概念聚类方法中,仅当一组东西
可以由一个概念所描述时,这些东西方才能构成一个类。这与基于几何距离表示相似程度并
进行聚类的传统聚类方法有所不同。概念聚类方法主要包含两部分内容:
(l)发现适当的类。
(2)根据每个类形成相应的特征描述,与在分类学习中的方法类似。无论如何最大程度地实
现类中东西相似度最大,类间东西相似度最小是聚类分析的基本指导思想。在数据挖掘中,
大多数工作都集中在发现能够有效、高效地对大数据库进行聚类分析的方法上。相关的研究
2
剩余22页未读,继续阅读
资源评论
xxpr_ybgg
- 粉丝: 6520
- 资源: 3万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功