基于深度强化学习的多小区NOMA能效优化功率分配算法.docx资源-CSDN文库

版权申诉

83 浏览量 2022-12-15 14:20:21 上传评论 2 收藏 311KB DOCX 举报

资源推荐

资源详情

资源评论

近年来，随着移动用户数量的爆炸式增长，多小区间的功率分配问题引起了广泛关

注。此外，小区内和小区间的干扰管理对于提高蜂窝网络系统的能量效率也很重要。为了

解决移动用户密度大的问题，非正交多址接入技术成为当前通信系统的研究热点之一

[1-5]

。

非正交多址接入(non-orthogonal multiple access，NOMA)技术的基本思想是在发送端

采用非正交方式发送信号，在接收端采用串行干扰删除技术，从而实现信号的正确解调。

已有很多文献研究了 NOMA 系统的功率分配问题。文献[1]提出一种单输入单输出情况下

的优化问题，随后将单输入单输出解决方案扩展为多输入多输出场景，在满足每个用户的

最小速率要求的服务质量和总功率约束条件下使总容量最大化。文献[2]将深度强化学习

(deep reinforce learning, DRL)应用于无授权 NOMA 系统的决策中，旨在减轻冲突并提高未

知网络环境中的系统吞吐量。文献[3]研究了包含任意用户的单个 NOMA 簇，目标是在满

足每个用户所需的最小数据速率下最大化能量效率。文献[4]研究了集群中多用户多输入多

输出 NOMA 系统中最大化能量效率的功率分配方案。

很多功率优化函数是非凸的，且优化问题是非确定性多项式(non-deterministic

polynomial, NP)难题，机器学习技术被引入用于解决功率优化问题。机器学习包括监督学

习、非监督学习和强化学习等。监督学习需要训练样本带有类别标签，通过训练深度神经

网络逼近已给出的标签，文献[6-7]给出了关于监督学习的实现方案。无监督学习的训练样

本没有标签，文献[8-9]相继提出了多种无监督学习研究方案。强化学习讨论一个智能体如

何在未知环境里面最大化能获得的奖励。因为监督学习需要提前给出类别标签，非监督学

习在学习过程中无反馈，强化学习在近年来成为无线通信中功率分配的热门技术

[10-14]

。文

献[10]将 Actor-critic 算法应用于 NOMA 系统中不同认知无线电之间的功率分配，其目的是

满足认知无线电最小数据速率要求的同时，最大化系统能量效率。文献[11]研究使用深度

Q 网络(deep Q networks, DQN)算法，旨在最大化整个网络的能量效率。文献[12]考虑动态

无线网络中发射功率和信道的联合决策优化问题，通过构造 DQN 解决状态空间过大的复

杂决策问题，提高系统能量效率。文献[13]提出基于 Actor-Critic 算法研究混合能源异构网

络中用户调度和资源分配的最优策略，目的是最大化系统的能量效率。

本文针对单输入单输出的下行多小区 NOMA 系统，研究了一种 DRL 的功率分配算法

(energy efficient power allocation-DQN，EEPA-DQN)，将 DQN 作为动作−状态值函数，目

的是优化信道功率分配，使系统能量效率最大化。将基站到用户的单个信道视为一个智能

体，使用经验回放池将数据进行集中训练，分步执行时使用该智能体学习到的策略。仿真

结果表明，EEPA-DQN 算法与加权最小均方误差(weight minimum mean square error,

WMMSE)

[15]

、分式规划(fractional programming, FP)

[16]

、最大功率(maximal power, MP)

[17]

和

随机功率 (random power, RP)

[18]

等算法相比，得到的能量效率更高，收敛速度更快。

1. 下行多小区 NOMA 系统模型

式中，pc,kpc,k 和 sc,ksc,k 分别为基站 c 中用户 k 的发送功率和信号。用户 Uc,kUc,k 的

接收信号 yc,kyc,k 表示为：

yc,k=gc,kxc+nc,kyc,k=gc,kxc+nc,k

(3)

式中，nc,knc,k 是 Uc,kUc,k 接收到的高斯白噪声，均值为 0，方差为 σ2σ2。

在下行多小区 NOMA 系统中，接收机使用串行干扰消除(successive interference

cancellation, SIC)技术消除用户间干扰。已知 Uc,1Uc,1 是近端用户，Uc,2Uc,2 是远端用户，

故 Uc,1Uc,1 首先解调出来自 Uc,2Uc,2 干扰信号，并用 SIC 技术消除 Uc,2Uc,2 带来的干扰；

再解调出自身的信号。Uc,2Uc,2 可以直接解调出所接收的信号。在接收端，由 SIC 技术可

得到 Uc,1Uc,1 和 Uc,2Uc,2 的信干扰比分别为：

sinrtc,1=gtc,1ptc,1∑c′∈Dcgtc′,k∑kptc′,k+σ2sinrc,1t=gc,1tpc,1t∑c′∈Dcgc′,kt∑kpc′,kt+σ2

(4)

sinrtc,2=gtc,2ptc,2gtc,2ptc,1+∑c′∈Mcgtc′,k∑kptc′,k+σ2sinrc,2t=gc,2tpc,2tgc,2tpc,1t+∑c′∈Mcgc′,kt∑kpc′,kt+σ2

(5)

式中，McMc 是干扰小区集；p 是基站的发射功率；gtc,2ptc,1gc,2tpc,1t 为小区 c 内

Uc,1Uc,1 对 Uc,2Uc,2 的干扰；∑c′∈Dcgtc′,k∑kptc′,k∑c′∈Dcgc′,kt∑kpc′,kt 为小区间用户的干

扰；σ2σ2 表示附加噪声功率。

该链路的下行链路和速率根据远、近端用户可分别表示为 Rc,1Rc,1、Rc,2Rc,2：

Rtc,1=Blog2(1+sinrtc,1)Rc,1t=Blog2(1+sinrc,1t)

(6)

Rtc,2=Blog2(1+sinrtc,2)Rc,2t=Blog2(1+sinrc,2t)

(7)

式中，B 为信道带宽。单个小区的和速率为两个用户和速率之和，定义为：

Rtc=Rtc,1+Rtc,2Rct=Rc,1t+Rc,2t

(8)

单个小区的能量效率 ηtcηct 定义为：

ηtc=Rtcptc+N0ηct=Rctpct+N0

(9)

式中，ptcpct 为小区 c 在时隙 t 的发射功率；N0N0 为电路固定损耗。

NOMA 系统的能量效率定义为：

ηt=∑c=1Cηtcηt=∑c=1Cηct

(10)

优化目标是在最大发射功率约束下最大化系统的能量效率，描述如下：

maxpηtmaxp⁡ηt

(11)

s.t.0⩽ptc⩽Pmaxs.t.0⩽pct⩽Pmax

式中，PmaxPmax 为基站发射功率的最大值。上述优化问题是一个非凸的问题，很难

用最优化的方法解决这个问题。根据强化学习的理论

[19]

，对于一个给定的马尔可夫随机过

程，尤其当系统是动态时，深度强化学习可以找到最优的决策动作，解决这个功率分配的

优化问题。深度神经网络可以近似为一个函数，可以利用神经网络建立起状态 stst 到价值

Qπ(st,at)Qπ(st,at)的一个映射，状态值会从时隙 tt 跳转到下一时隙(t+1t+1)，通过训练神经

网络找到最大的 Qπ(st,at)Qπ(st,at)值对应的动作值 atat(基站的发射功率)。

剩余13页未读，继续阅读

评论收藏

内容反馈

版权申诉

罗伯特之技术屋

粉丝: 3550
资源: 1万+

基于深度强化学习的多小区NOMA能效优化功率分配算法.docx

无人机辅助的NOMA网络用户分组与功率分配算法.docx

NOMA系统中基于全面学习粒子群算法的功率分配优化.docx

下行NOMA系统中公平的功率分配方案.docx

基于NOMA的移动边缘计算系统公平能效调度算法.docx

基于NOMA的无线携能D2D通信鲁棒能效优化算法.docx

基于深度强化学习的无人机自主部署及能效优化策略.docx

异构云无线接入网下基于功率域NOMA的能效优化算法.docx

基于深度增强学习的无人机赋能雾无线电接入网络的能效优化.docx

基于不完美CSI的异构NOMA网络能效优化算法.docx

多载波NOMA安全通信系统稳健性资源分配算法.docx

基于SWIPT的吞吐量最优化NOMA全双工中继选择策略.docx

基于Matern簇过程的NOMA-HetNet覆盖概率分析.docx

时延有界的PD-NOMA物联网高可靠接入算法.docx

基于NOMA的车联网资源分配算法.pdf

基于移动边缘计算的NOMA异构网络资源分配.docx

认知协作NOMA网络的安全性能分析.docx

基于SWIPT的毫米波大规模MIMO-NOMA系统下安全能效资源优化.docx

窃听者随机分布SWIPT-NOMA系统的物理层安全.docx

基于能效的NOMA蜂窝车联网动态资源分配算法.pdf

NOMA系统中最大化能量效率的功率分配.docx

基于NOMA的超密集MEC网络任务卸载和资源分配方案.docx

相关实用应用程序（Windows可用）

免费可用的ChatGPT网页版.zip

ChatGPT使用总结：150个ChatGPT提示词模板（完整版）

chromedriver-win64.zip

全国计算机二级WPSoffice精选350道选择题题库（含答案）.pdf

哈尔滨工业大学-ChatGPT调研报告-2023.3.6-94页.pdf

2023泛娱乐社交出海手册-ZEGO即构科技

最新资源