没有合适的资源?快使用搜索试试~ 我知道了~
数据新鲜度驱动的协作式无人机联邦学习智能决策优化研究.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 66 浏览量
2023-02-23
20:06:45
上传
评论
收藏 423KB DOCX 举报
温馨提示
试读
15页
数据新鲜度驱动的协作式无人机联邦学习智能决策优化研究.docx
资源推荐
资源详情
资源评论
1. 引言
在传统计算范式中,用户设备通常将原始数据上传至集中云服务器进行处理,但是这
不可避免地造成极大的传输开销和数据隐私泄露。针对该问题,联合利用移动边缘计算
(Mobile Edge Computing, MEC)
[1]
和联邦学习
[2]
设计解决方案逐渐成为研究焦点。一方面,
边缘服务器分担用户设备的联邦学习本地训练任务,既减轻用户设备的计算负载,又降低
向云端传输数据造成的开销;另一方面,利用本地化模型训练结果聚合成全局共享模型,
避免了隐私数据泄露的弊端,有利于实现快速、高效的训练过程。然而,边缘服务器通常
是位置固定的且覆盖范围有限的,这将导致其无法灵活有效地处理复杂变化的强实时性任
务
[3]
。
随着下一代网络系统如 6G 通信网络的快速发展,高性能无人机(Unmanned Aerial
Vehicle, UAV)已被视为具备感知、计算和存储能力的空中边缘服务器
[4]
。与传统的安装在
地面基站上的固定边缘服务器相比,无人机利用其高度敏捷性、灵活性和移动性实现按需
部署,增强了系统的覆盖范围
[5]
。在许多强实时性应用场景(如交通管理、环境和灾难监
测、战场监视等
[6]
)中,多个无人机在不同区域中移动,及时接收众多分散的用户数据,以
协作的方式完成复杂的移动边缘计算任务,训练具有高可用性和高实时性的机器学习模型
(例如,图像分类模型)
[7]
。进一步地,在联邦学习模式下,多无人机完成训练后只需要将本
地模型参数上传至云服务器进行全局模型聚合,实现训练模型的共享和隐私保护。
值得注意的是,无人机的感知半径有限,且有限的机载电池会约束无人机的移动范
围,因此无法保证每个用户设备产生的数据都能及时地被无人机接收并处理。而在移动边
缘计算场景中,数据的实时处理对其可用性和模型的实时更新非常重要。为此,文献[8]在
模型中采用数据的信息年龄(Age-of-Information, AoI) 来刻画数据的新鲜程度,将其定义为
数据最近一次成功传输后经过的时间
[9]
。但是,它们忽略了数据在区域中等待的时间,这
对 MEC 场景中无人机的模型训练和通信决策是至关重要的,特别是在多无人机协作训练
的情况下。本文将数据的新鲜程度,即数据在端设备上等待的时间与被无人机接收并处理
的时间之和定义为数据的信息年龄
[10]
,通过最小化信息年龄来优化无人机移动边缘计算决
策,提升联邦学习性能,增强数据处理实时性。因此,如何规划无人机的路径和制定通信
决策,以及如何在无人机之间展开协同工作,合理地分配计算资源,同时满足能耗和时延
的限制,成为本文需要解决的关键问题。
针对上述挑战,本文提出了一种崭新的基于数据新鲜程度的协作式无人机联邦学习范
式,通过多无人机协同地智能地进行移动、通信和计算卸载决策,高效地完成了边缘数据
处理任务,显著地降低了无人机的能量消耗并保证了模型高准确率和低数据信息年龄。本
文进一步提出一种多智能体深度强化学习(Deep Reinforcement Learning, DRL)算法,有效地
处理复杂状态空间,实现多无人机的高效协作和智能决策优化。本文的主要贡献包括 4 个
方面:
(1) 提出面向实时边缘数据处理的多无人机协作式联邦学习范式,能够充分发挥无人
机辅助移动边缘计算和联邦学习的优势,避免了云中心集中式数据处理的用户隐私保护弱
和任务处理时延大等不足;
(2) 引入信息年龄以描述协作式无人机联邦学习的训练数据的新鲜程度,并据此对多
无人机协同决策问题进行建模,以联合优化边缘数据处理的模型准确率、信息年龄以及总
体能耗;
(3) 设计了一种新颖的具有全局和局部奖励的优先级多智能体深度强化学习算法,实
现多无人机协同地移动、通信和任务卸载决策智能联合优化;
(4) 采用多个真实机器学习数据集进行仿真实验并设置了充分的对比实验,结果表明
了本文提出的算法在不同数据分布下和在快速变化的复杂动态环境中都能实现优越的性能
表现。
2. 系统模型与问题形式化
2.1 区域模型
如图 1 所示,感知区域被划分为 M={1,2,⋯,M}M={1,2,⋯,M}个子区域,每个子区域的
中心位置设为用户设备,它感知并传输该子区域的实时数据至边缘服务器进行处理。在本
系统中,由于安装在地面基站上的边缘服务器(后文简称为基站(Base Station, BS))的覆盖范
围以及用户设备的射频功率有限,用户设备无法与基站直接通信。为了解决计算的局限
性,系统部署多个无人机以接收和处理其覆盖范围内用户设备的实时数据。这些无人机配
备了完成计算任务所必要的载荷,包括数据收发设备(如天线)、数据存储设备(如存储卡)和
数据处理设备(如嵌入式 CPU),以及基本设备(如机体、电池、动力控制和飞行控制装置)及
其相关传感器。无人机的载荷高度集成化使其数据存储、数据处理和移动的综合能力远在
固定的边缘服务器之上。在本文中,无人机作为性能适中的边缘服务器,支持长、短距离
无线通信,能够为基站覆盖不了的区域提供计算服务。因此,无人机可以高效地充当边缘
计算节点来完成本文的边缘计算任务。
图 1 基于 MEC 的多无人机感知区域
下载: 全尺寸图片 幻灯片
在目标感知区域中,一组无人机 N={1,2,⋯,N}N={1,2,⋯,N}组成的智能体群以固定高度
HH 飞行。在每个时隙 t∈T={1,2,⋯,T}t∈T={1,2,⋯,T}结束时,无人机 ii 以方向 θti∈[0,2π)θit
∈[0,2π)和距离 dti∈[0,lmax)dit∈[0,lmax)飞往下一个感知子区域,其中 lmaxlmax 为无人机
在单个时隙内的最大飞行距离。考虑采用二元变量 oti,k∈{0, 1}oi,kt∈{0, 1}表示无人机 ii 在
时隙 tt 时的位置:当且仅当无人机 i∈Ni∈N 处于子区域 k∈Mk∈M 上空时,
oti,k=1oi,kt=1;否则 oti,k=0oi,kt=0。无人机的移动决策有约束条件
∑k=1Moti,k=1,∑i=1Noti,k∈{0,1}∑k=1Moi,kt=1,∑i=1Noi,kt∈{0,1}
(1)
式(1)表示每个时隙内无人机只能停留在一个子区域,并且多个无人机不能停留在同一
个子区域。
假设无人机 ii 的感知能力定义为其最大通信半径 RmaxiRimax,任何在最大通信范围
内的用户设备都被认为是可感知的并且其数据可收集的。无人机 ii 从覆盖的子区域集合
Mi⊂MMi⊂M 中收集数据信息时,满足约束
bti,kRti,k≤Rmaxibi,ktRi,kt≤Rimax
(2)
其中,bti,k∈0,1bi,kt∈0,1 是通信决策二元变量,它表示时隙 tt 时无人机 ii 是否与子区
域 kk 中的用户设备(以下统称用户设备 kk)通信:bti,k=1bi,kt=1 表示通信,否则
bti,k=0bi,kt=0。此外,无人机的通信还存在约束
∑i=1Nbti,k∈{0,1}∑i=1Nbi,kt∈{0,1}
(3)
其表示当用户设备 kk 同时处于两个及以上无人机的覆盖范围内时,它将至多选择一
个无人机进行通信。本文部分参数以及定义如表 1 所示。
表 1 系统参数及其定义
剩余14页未读,继续阅读
资源评论
罗伯特之技术屋
- 粉丝: 4036
- 资源: 1万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功