没有合适的资源?快使用搜索试试~ 我知道了~
强化学习A3C算法在电梯调度中的建模及应用_刘宇1
需积分: 0 2 下载量 16 浏览量
2022-08-04
14:56:11
上传
评论
收藏 1.06MB PDF 举报
温馨提示
试读
7页
摘要:为让电梯调度算法在电梯电力能耗、用户乘梯体验和算法适应性方面具备更好表现,在目前主流的电梯调度算法基础之上,提出对调度环境、电梯行为和调度目标3个方面进行
资源详情
资源评论
资源推荐
2022
年
1
月
第
43
卷
第
1
期
计算机工程与设计
COMPUTER
ENGINEERING
AND
DESIGN
Jan.2022
Vol.43
No.1
强化学习
A3C
算法在电梯调度中的建模及应用
刘
宇
1
,
2
,
张
聪
2+
,
李
涛
3
(
1.
武汉大学 计算机学院
,
湖北 武汉
430000
;
2.
武汉轻工大学 数学与计算机学院
,
湖北 武汉
430000
;
3.
国网湖北省电力有限公司荆州供电公司 发展策划部
,
湖北 荆州
434000
)
摘
要
:
为让电梯调度算法在电梯电力能耗
、
用户乘梯体验和算法适应性方面具备更好表现
,
在目前主流的电梯调度算法
基础之上
,
提出对调度环境
、
电梯行为和调度目标
3
个方面进行统一建模的基于强化学习
A3C
的电梯智能调度算法
。
让调
度电梯在不断地和环境交互学习过程中逐渐学习得到最优电梯调度策略
,
与基于具体环境建模的相关电梯调度算法进行对
比实验
,
基于
A3C
的调度算法具有建模简单规范
、
适应性强和控制目标多样的优势
,
对比
A3C
算法与部分强化学习算法
在电梯调度中的优劣
,
实验结果表明
,
A3C
算法具备较好的调度性能
。
关键词
:
智能调度
;
电梯调度算法
;
电梯节能
;
强化学习
;
A3C
中图法分类号
:
TP391
文献标识号
:
A
文章编号
:
1000
-
7024
(
2022
)
01
-
0196
-
07
doi
:
10.16208
/
j
.issn1000
-
7024.2022.01.026
收稿日期
:
2020
-
07
-
29
;
修订日期
:
2021
-
07
-
16
基金项目
:
湖北省重大科技专项基金项目
(
2018ABA099
);
国家自然科学基金面上基金项目
(
61272278
);
湖北省自然科学基金重点基金
项目
(
2015CFA061
);
湖北省自然科学基金青年基金项目
(
2018CFB408
);
2020
年国网湖北省电力科技基金项目
(
5215J0200012
)
作者简介
:
刘宇
(
1994
),
男
,
重庆人
,
博士研究生
,
CCF
学生会员
,
研究方向为人工智能技术及其运用
;
+
通讯作者
:
张聪
(
1968
),
男
,
上海人
,
博士
,
教授
,
研究方向为多媒体信息处理与网络通信
;
李涛
(
1986
),
男
,
湖北 荆州人
,
硕士
,
高级工 程师
,
研究方 向为
电力系统及其自动化
。
E
-
mail
:
hb
_
wh
_
zc
@
163.com
Modelin
g
and
a
pp
lication
of
reinforcement
learnin
g
A3C
in
elevator
schedulin
g
al
g
orithm
LIU
Yu
1
,
2
,
ZHANG
Con
g
2+
,
LI
Tao
3
(
1.School
of
Com
p
uter
Science
,
Wuhan
Universit
y
,
Wuhan
430000
,
China
;
2.School
of
Mathematics
and
Com
p
uter
Science
,
Wuhan
Pol
y
technic
Universit
y
,
Wuhan
430000
,
China
;
3.Develo
p
ment
Plannin
g
De
p
artment
,
Jin
g
zhou
Power
Su
pp
l
y
Com
p
an
y
of
State
Grid
Hubei
Electric
Power
Limited
Com
p
an
y
,
Jin
g
zhou
434000
,
China
)
Abstract
:
To
make
the
elevator
schedulin
g
al
g
orithm
have
better
p
erformance
in
the
as
p
ects
of
elevator
p
ower
consum
p
tion
,
user
ex
p
erience
and
al
g
orithm
ada
p
tabilit
y
,
based
on
some
elevator
schedulin
g
al
g
orithms
,
the
elevator
intelli
g
ent
schedulin
g
al
g
o
-
rithm
based
on
reinforcement
learnin
g
A3Cwas
constructed
,
which
unified
the
three
as
p
ects
of
schedulin
g
environment
,
elevator
behavior
and
schedulin
g
ob
j
ectives.The
elevator
learned
the
o
p
timal
schedulin
g
strate
gy
in
the
p
rocess
of
continuous
interactive
learnin
g
with
the
environment.Com
p
ared
with
some
elevator
schedulin
g
al
g
orithms
,
the
schedulin
g
al
g
orithm
of
reinforcement
learnin
g
modelin
g
has
the
advanta
g
es
of
sim
p
le
modelin
g
and
hi
g
h
schedulin
g
efficienc
y
.At
the
same
time
,
the
ex
p
eriment
ex
p
lores
that
A3Cal
g
orithm
has
better
schedulin
g
p
erformance
than
some
reinforcement
learnin
g
al
g
orithms.
Ke
y
words
:
intelli
g
ent
schedulin
g
;
elevator
schedulin
g
al
g
orithm
;
elevator
ener
gy
savin
g
;
reinforcement
learnin
g
;
A3C
0
引
言
楼宇电梯调度
[
1
]
是一个复杂的过程
,
调 度 算 法 的 设
计复杂性一般取决于调度环境的复杂性
,
当 调 度 电 梯 数
量越多楼宇楼层越高时
,
从众多调度策略中选择最优调
度策略这本质 上 类 似 一 个
NP
完 全 问 题
。
当 前 随 着 认 知
智能技术的发展
,
探索更加智能的调度算法
,
让 调 度 算
法更具多环境适应性
、
调度高效性和低能耗性成为新的
研究热点
。
目前电梯调度算法往往基于特定需求方面进行建
懂得越多越要学
- 粉丝: 20
- 资源: 308
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0