没有合适的资源?快使用搜索试试~ 我知道了~
基于深度强化学习的多小区NOMA能效优化功率分配算法.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 83 浏览量
2022-12-15
14:20:21
上传
评论 2
收藏 311KB DOCX 举报
温馨提示
试读
14页
基于深度强化学习的多小区NOMA能效优化功率分配算法.docx
资源推荐
资源详情
资源评论
近年来,随着移动用户数量的爆炸式增长,多小区间的功率分配问题引起了广泛关
注。此外,小区内和小区间的干扰管理对于提高蜂窝网络系统的能量效率也很重要。为了
解决移动用户密度大的问题,非正交多址接入技术成为当前通信系统的研究热点之一
[1-5]
。
非正交多址接入(non-orthogonal multiple access,NOMA)技术的基本思想是在发送端
采用非正交方式发送信号,在接收端采用串行干扰删除技术,从而实现信号的正确解调。
已有很多文献研究了 NOMA 系统的功率分配问题。文献[1]提出一种单输入单输出情况下
的优化问题,随后将单输入单输出解决方案扩展为多输入多输出场景,在满足每个用户的
最小速率要求的服务质量和总功率约束条件下使总容量最大化。文献[2]将深度强化学习
(deep reinforce learning, DRL)应用于无授权 NOMA 系统的决策中,旨在减轻冲突并提高未
知网络环境中的系统吞吐量。文献[3]研究了包含任意用户的单个 NOMA 簇,目标是在满
足每个用户所需的最小数据速率下最大化能量效率。文献[4]研究了集群中多用户多输入多
输出 NOMA 系统中最大化能量效率的功率分配方案。
很多功率优化函数是非凸的,且优化问题是非确定性多项式(non-deterministic
polynomial, NP)难题,机器学习技术被引入用于解决功率优化问题。机器学习包括监督学
习、非监督学习和强化学习等。监督学习需要训练样本带有类别标签,通过训练深度神经
网络逼近已给出的标签,文献[6-7]给出了关于监督学习的实现方案。无监督学习的训练样
本没有标签,文献[8-9]相继提出了多种无监督学习研究方案。强化学习讨论一个智能体如
何在未知环境里面最大化能获得的奖励。因为监督学习需要提前给出类别标签,非监督学
习在学习过程中无反馈,强化学习在近年来成为无线通信中功率分配的热门技术
[10-14]
。文
献[10]将 Actor-critic 算法应用于 NOMA 系统中不同认知无线电之间的功率分配,其目的是
满足认知无线电最小数据速率要求的同时,最大化系统能量效率。文献[11]研究使用深度
Q 网络(deep Q networks, DQN)算法,旨在最大化整个网络的能量效率。文献[12]考虑动态
无线网络中发射功率和信道的联合决策优化问题,通过构造 DQN 解决状态空间过大的复
杂决策问题,提高系统能量效率。文献[13]提出基于 Actor-Critic 算法研究混合能源异构网
络中用户调度和资源分配的最优策略,目的是最大化系统的能量效率。
本文针对单输入单输出的下行多小区 NOMA 系统,研究了一种 DRL 的功率分配算法
(energy efficient power allocation-DQN,EEPA-DQN),将 DQN 作为动作−状态值函数,目
的是优化信道功率分配,使系统能量效率最大化。将基站到用户的单个信道视为一个智能
体,使用经验回放池将数据进行集中训练,分步执行时使用该智能体学习到的策略。仿真
结果表明,EEPA-DQN 算法与加权最小均方误差(weight minimum mean square error,
WMMSE)
[15]
、分式规划(fractional programming, FP)
[16]
、最大功率(maximal power, MP)
[17]
和
随机功率 (random power, RP)
[18]
等算法相比,得到的能量效率更高,收敛速度更快。
1. 下行多小区 NOMA 系统模型
考虑多小区下行非正交多址接入系统,每个小区的中心设置有一个基站(BS)。基站通
过信道向用户发送信号,小区和用户的索引集分别为 c={1,2,⋯,C}c={1,2,⋯,C}和
k={1,2,⋯ ,K}k={1,2,⋯ ,K}。小区 c 的第 k 个用户表示为 Uc,kUc,k,每个小区包含两个用户。
在时隙 t,小区 c 基站和用户 k 之间的信道增益描述为:
gtc,k=βc,k∣∣htc,k∣∣2gc,kt=βc,k|hc,kt|2
(1)
式中,htc,khc,kt 是小尺度衰落;βc,kβc,k 是大尺度衰落。蜂窝网络系统模型如图 1 所
示,系统包含 C 个小区。假设用户 Uc,1Uc,1 为近端用户,用户 Uc,2Uc,2 为远端用户,基站
到 Uc,1Uc,1 和 Uc,2Uc,2 的信道增益分别为 gc,1gc,1 和 gc,2gc,2,则
|gc,1|2>|gc,2|2|gc,1|2>|gc,2|2。小区 c 基站的发射功率为 pcpc,为 Uc,1Uc,1 和 Uc,2Uc,2 分配
的功率分别为 pc,1pc,1 和 pc,2pc,2,pc=pc,1+pc=pc,1+pc,2pc,2,Uc,1Uc,1 为近端用户,且
pc,1<pc,2pc,1<pc,2。
图 1 蜂窝网络模型
下载: 全尺寸图片 幻灯片
基站向不同用户发送消息,每个基站发送给用户的叠加信号表示为:
xc=∑k=1Kpc,k−−−√sc,kxc=∑k=1Kpc,ksc,k
(2)
式中,pc,kpc,k 和 sc,ksc,k 分别为基站 c 中用户 k 的发送功率和信号。用户 Uc,kUc,k 的
接收信号 yc,kyc,k 表示为:
yc,k=gc,kxc+nc,kyc,k=gc,kxc+nc,k
(3)
式中,nc,knc,k 是 Uc,kUc,k 接收到的高斯白噪声,均值为 0,方差为 σ2σ2。
在下行多小区 NOMA 系统中,接收机使用串行干扰消除(successive interference
cancellation, SIC)技术消除用户间干扰。已知 Uc,1Uc,1 是近端用户,Uc,2Uc,2 是远端用户,
故 Uc,1Uc,1 首先解调出来自 Uc,2Uc,2 干扰信号,并用 SIC 技术消除 Uc,2Uc,2 带来的干扰;
再解调出自身的信号。Uc,2Uc,2 可以直接解调出所接收的信号。在接收端,由 SIC 技术可
得到 Uc,1Uc,1 和 Uc,2Uc,2 的信干扰比分别为:
sinrtc,1=gtc,1ptc,1∑c′∈Dcgtc′,k∑kptc′,k+σ2sinrc,1t=gc,1tpc,1t∑c′∈Dcgc′,kt∑kpc′,kt+σ2
(4)
sinrtc,2=gtc,2ptc,2gtc,2ptc,1+∑c′∈Mcgtc′,k∑kptc′,k+σ2sinrc,2t=gc,2tpc,2tgc,2tpc,1t+∑c′∈Mcgc′,kt∑kpc′,kt+σ2
(5)
式中,McMc 是干扰小区集;p 是基站的发射功率;gtc,2ptc,1gc,2tpc,1t 为小区 c 内
Uc,1Uc,1 对 Uc,2Uc,2 的干扰;∑c′∈Dcgtc′,k∑kptc′,k∑c′∈Dcgc′,kt∑kpc′,kt 为小区间用户的干
扰;σ2σ2 表示附加噪声功率。
该链路的下行链路和速率根据远、近端用户可分别表示为 Rc,1Rc,1、Rc,2Rc,2:
Rtc,1=Blog2(1+sinrtc,1)Rc,1t=Blog2(1+sinrc,1t)
(6)
Rtc,2=Blog2(1+sinrtc,2)Rc,2t=Blog2(1+sinrc,2t)
(7)
式中,B 为信道带宽。单个小区的和速率为两个用户和速率之和,定义为:
Rtc=Rtc,1+Rtc,2Rct=Rc,1t+Rc,2t
(8)
单个小区的能量效率 ηtcηct 定义为:
ηtc=Rtcptc+N0ηct=Rctpct+N0
(9)
式中,ptcpct 为小区 c 在时隙 t 的发射功率;N0N0 为电路固定损耗。
NOMA 系统的能量效率定义为:
ηt=∑c=1Cηtcηt=∑c=1Cηct
(10)
优化目标是在最大发射功率约束下最大化系统的能量效率,描述如下:
maxpηtmaxpηt
(11)
s.t.0⩽ptc⩽Pmaxs.t.0⩽pct⩽Pmax
式中,PmaxPmax 为基站发射功率的最大值。上述优化问题是一个非凸的问题,很难
用最优化的方法解决这个问题。根据强化学习的理论
[19]
,对于一个给定的马尔可夫随机过
程,尤其当系统是动态时,深度强化学习可以找到最优的决策动作,解决这个功率分配的
优化问题。深度神经网络可以近似为一个函数,可以利用神经网络建立起状态 stst 到价值
Qπ(st,at)Qπ(st,at)的一个映射,状态值会从时隙 tt 跳转到下一时隙(t+1t+1),通过训练神经
网络找到最大的 Qπ(st,at)Qπ(st,at)值对应的动作值 atat(基站的发射功率)。
剩余13页未读,继续阅读
资源评论
罗伯特之技术屋
- 粉丝: 3550
- 资源: 1万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Windows系统下安装与配置Neo4j的步骤
- 基于matlab实现潮流计算和最优潮流计算的程序1,对毕业设计有一定用处.rar
- 基于大数据学习资源推荐系统的设计与实现(部署视频)-kaic.mp4
- 哈工大形式语言和自动机2022期末含答案
- Windows系统下安装与配置Neo4j的步骤
- 哈希算法(Hash Algorithm)是一种将任意长度的二进制数据映射为较短的、固定长度的二进制值的函数.txt
- Windows系统下安装与配置Neo4j的步骤
- 在二叉树或更复杂的树形结构中,先序输出叶结点.txt
- 列出所有祖先结点的概念通常与树形结构或图论中的节点相关.txt
- 基于matlab实现潮流计算程序,MATLAB潮流计算程序.rar
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功