没有合适的资源?快使用搜索试试~ 我知道了~
基于云计算和改进K_means算法的海量用电数据分析方法_张承畅1
需积分: 0 0 下载量 24 浏览量
2022-08-04
13:04:54
上传
评论
收藏 1.97MB PDF 举报
温馨提示
试读
6页
引言近年来,随着化石能源的日益枯竭,社会对环境保护、节能减排和可持续发展的要求日益提高,未来的电网必须是“绿色”的电网,未来的小区也必须是“绿色”的小区。在此背
资源详情
资源评论
资源推荐
收稿日期
: 2017-07-04;
修回日期
: 2017-08-21。
基金项目
:
中国电力科学研究院科技基金资助项目
( XXB51201603155) ;
国网北京经济技术研究院科技基金资助项目
( 15JS191) 。
作者简介
:
张承畅
( 1975—) ,
男
,
湖北利川人
,
副教授
,
博士
,
主要研究方向
:
能源互联网
、
电力大数据
、
数据挖掘
、
信息物理系统
;
张华誉
( 1990—) ,
男
,
安徽合肥人
,
硕士研究生
,
主要研究方向
:
数据挖掘
;
罗建昌
( 1990—) ,
男
,
湖北荆州人
,
硕士研究生
,
主要研究方向
:
信息物理系
统
、
大数据
;
何丰
( 1962—) ,
男
,
重庆人
,
教授
,
主要研究方向
:
大数据
、
通信技术
。
文章编号
: 1001-9081( 2018) 01-0159-06 DOI: 10. 11772 /j. issn. 1001-9081. 2017071660
基于云计算和改进
K-means
算法的海量用电数据分析方法
张承畅
1
,
张华誉
2
*
,
罗建昌
1
,
何 丰
1
( 1.
重庆邮电大学 光电工程学院
,
重庆
400065; 2.
重庆邮电大学 通信与信息工程学院
,
重庆
400065)
( *
通信作者电子邮箱
15923180953@ 139. com)
摘 要
:
针对小区居民用电数据挖掘效率低
、
数据量大等难题
,
进行了基于云计算和改进
K-means
算法的海量用
电数据分析方法研究
。
针对传统
K-means
算法中存在初始聚类中心和
K
值难确定的问题
,
提出一种基于密度的
K-
means
改进算法
。
首先
,
定义样本密度
、
簇内样本平均距离的倒数和簇间距离三者乘积为权值积
,
通过最大权值积法
依次确定聚类中心
,
提高了聚类的准确率
;
然后
,
基于
MapReduce
模型实现改进算法的并行化
,
提高了聚类的效率
;
最
后
,
以小区
400
户家庭用电数据为基础
,
进行海量电力数据的挖掘分析实验
。
以家庭为单位
,
提取出用户的峰时耗电
率
、
负荷率
、
谷电负荷系数以及平段用电量百分比
,
建立聚类的数据维度特征向量
,
完成相似用户类型的聚类
,
同时分
析出各类用户的行为特征
。
基于
Hadoop
集群的实验结果证明提出的改进
K-means
算法运行稳定
、
可靠
,
具有很好的
聚类效果
。
关键词
:
用电数据
;
云计算
;
改进
K-means
算法
; MapReduce
模型
;
并行化
中图分类号
: TP301; TP274. 2
文献标志码
: A
Massive data analysis of power utilization based on
improved K-means algorithm and cloud computing
ZHANG Chengchang
1
, ZHANG Huayu
2
*
, LUO Jianchang
1
, HE Feng
1
( 1. College of Optoelectronic Engineering, Chongqing University of Posts and Telecommunications, Chongqing 400065, China;
2. College of Communication and Information Engineering, Chongqing University of Posts and Telecommunications, Chongqing 400065, China)
Abstract: For such difficulties as low mining efficiency and large amount of data that the data mining of residential
electricity data has to be faced with, the analysis based on improved K-means algorithm and cloud computing on massive data
of power utilization was researched. As the initial cluster center and the value K are difficult to determine in traditional K-
means algorithm, an improved K-means algorithm based on density was proposed. Firstly, the product of sample density, the
reciprocal of the average distance between the samples in the cluster, and the distance between the clusters were defined as
weight product, the initial center was determined successively according to the maximum weight product method and the
accuracy of the clustering was improved. Secondly, the parallelization of improved K-means algorithm was realized based on
MapReduce model and the efficiency of clustering was improved. Finally, the mining experiment of massive power utilization
data was carried out on the basis of 400 households' electricity data. Taking a family as a unit, such features as electricity
consumption rate during peak hour, load rate, valley load coefficient and the percentage of power utilization during normal
hour were calculated, and the feature vector of data dimension was established to complete the clustering of similar user types,
at the same time, the behavioral characteristics of each type of users were analyzed. The experimental results on Hadoop
cluster show that the improved K-means algorithm operates stably and efficiently and it can achieve better clustering effect.
Key words: power utilization data; cloud computing; improved K-means algorithm; MapReduce model; parallelization
0
引言
近年来
,
随着化石能源的日益枯竭
,
社会对环境保护
、
节
能减排和可持续发展的要求日益提高
,
未来的电网必须是
“
绿色
”
的电网
,
未来的小区也必须是
“
绿色
”
的小区
。
在此背
景下
,
居民用电行为逐步智能化
,
电网和用户实现用电信息的
双向交互成为必然趋势
。
由于智能小区在不断建设和发展过
程中积累了大量的基础用电数据
,
这些数据不仅具有海量
、
高
频
、
分散等特点
,
而且数据之间存在关联性和相似性
[1 - 2]
。
对
智能小区用户的用电数据采用大数据分析方法进行挖掘并研
究用户类型
,
可以帮助电网公司了解用户消费习惯
,
为用户提
供个性化
、
差异化的服务需求
,
从而帮助电网公司进一步拓展
服务的深度和广度
,
为未来的电力需求响应政策的制定提供
数据支撑
。
同时
,
电网公司将小区用电数据及居民用电情况
及时反馈给用户
,
让用户清楚自身用电信息
,
规范用电行为
,
挖掘节能潜力
,
为低碳环保作贡献
[3 - 5]
。
Journal of Computer Applications
计算机应用
,2018,38( 1) : 159 - 164
ISSN 1001-9081
CODEN JYIIDU
2018-01-10
http: / /www. joca. cn
方2郭
- 粉丝: 26
- 资源: 324
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于PHP+swoole实现的微信机器人,依赖vbot和微信网页版的功能,帮助管理微信群/聊天/踢人等+源码+开发文档+运行教程
- com.xunmeng.pinduoduo_Release_cd290ca9_ARM64.apk
- 2788727d-25a0-41b2-b6b4-265d193edb95.doc
- 基于AVR单片机的伺服电机系统研究
- Lab-Electronic Craft Practicum-2-Simulation of a Single Tube Com
- 贪吃蛇基于TypeScript
- CS-CP1-2C3WF固件
- 软件测试测试用例设计方法大全
- 计算机与网络基础知识要点学习
- 移动通信(RC-YDTX-III)实验指导书
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0