没有合适的资源?快使用搜索试试~ 我知道了~
图计算加速架构综述.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 91 浏览量
2022-06-10
14:15:18
上传
评论
收藏 1.92MB DOCX 举报
温馨提示
试读
61页
图计算加速架构综述.docx
资源推荐
资源详情
资源评论
摘 要 在大数据时代,图被用于各种领域表示具有复杂联系的数据图
计算应用被广泛用于各种领域,以挖掘图数据中潜在的价值图计算应
用特有的不规则执行行为,引发了不规则负载、密集读改写更新操作
不规则访存和不规则通信等挑战现有通用架构无法有效地应对上述挑
战为了克服加速图计算应用面临的挑战,大量的图计算硬件加速架构
设计被提出它们为图计算应用定制了专用的计算流水线、访存子系统、
存储子系统和通信子系统得益于这些定制的硬件设计,图计算加速架
构相比于传统的通用处理器架构,在性能和能效上均取得了显著的提
升为了让相关的研究学者深入了解图计算硬件加速架构,首先基于计
算机的金字塔组织结构,从上到下对现有工作进行分类和总结,并以
多个完整架构实例分析应用于不同层次的优化技术之间的关系接着以
图神经网络加速架构的具体案例讨论新兴图计算应用的加速架构设计
最后对该领域的前沿研究方向进行了总结,并放眼于未来探讨图计算
加速架构的发展趋势
关键词 图计算;图神经网络;加速架构;不规则访存;数据局部性;
动态访存调度;负载均衡
大数据时代,越来越多的数据采用图结构进行表示图是一种能够
表达对象之间复杂关系的数据存储方式,被广泛用于表示人际关系、
分子拓扑结构、大脑神经元链接等图数据中蕴含着丰富的信息,图计
算应用是一种挖掘图数据中隐含价值的重要应用为了快速处理图数据
和应对不断增长的图数据,图计算应用被广泛部署于各大数据中心,
成为数据中心的典型应用
源于图的无结构特性,图计算应用在现有通用架构上无法被高效
执行现实生活中的图没有固定的结构,节点的出边分布极度不均匀,
节点与节点之间的连接极为随机由于图计算应用的执行行为依赖于图
数据,图数据的以上特性导致图计算应用的执行行为非常不规则这种
不规则的执行行为导致现有的通用架构在计算、访存和通信 个方面
都面临巨大挑战在计算方面,计算单元面临负载不均衡、密集读改写
更新等挑战,导致基于 和 的图计算软件框架的性能严重不
足在访存方面,不规则的细粒度访存导致 的 和 的
命中率极低
, 利用 效 率低下,同时也导致了 的
!"执行模型遇到了大量的
访存歧义#!$%"在多节点计算、存储系统方面,不
规则的细粒度通信,导致了大量无效通信和通信带宽浪费
为了应对图计算应用带来的挑战,为图计算定制专用的加速架构
是一种高效的解决方案它能够为数据中心带来数百倍的性能提升和数
千倍的能耗提升图计算加速器的设计理念是根据图计算应用的操作特
性改造硬件数据通路,量身定制计算流水线、内存子系统、存储子系
统和通信子系统,从而为图计算应用的操作进行固化的硬件表达近年
来,大量的图计算加速架构设计被提出,从不同的角度采取多样的方
法解决图计算应用的各项挑战
为了让相关的研究人员对图计算加速架构的研究现状和发展方向
有深入的了解,本文从现有工作出发探讨图计算加速架构设计面临的
关键问题和主要解决方法值得关注的是,本文还着重探讨了一种新兴
的图计算应用,即图神经网络该新兴图计算应用同时具有传统图计算
应用和传统神经网络应用的执行特征,并且还具有与传统应用不同的
计算和访存特征例如,由于节点的属性是高维数据,所以节点的属性
访问是粗粒度的不规则访问&与传统图计算的细粒度不规则访问不同除
此之外,本文还对图计算加速架构的前沿研究问题进行了归纳和总结
并放眼于未来探讨其发展趋势本文的工作具有一定的指导作用,读者
能够快速明白传统图计算应用加速架构和新兴图神经网络加速架构的
设计要点、关键问题及对应的解决方案,了解目前图计算加速架构设
计的趋势和机遇,并且将相应的概念和技术应用到未来的图计算加速
架构的设计上
现有调研文献是基于硬件平台对现有的图计算加速工作进行分
类,涵盖了现场可编程门阵列 '! (#&
)*" 、 +%, 、 特定应 用 集成 电 路 '
!&*"、,目的是对每个工作的设计思想进
行介绍文献基于图计算加速的主要技术预处理、并行图计算和运
行时调度"对现有工作分类本文的分类方法与前人不同本文从图计算
加速架构的设计角度出发,基于计算机的金字塔组织结构
-
,从上到下,
根据图计算应用带来的挑战、衍生的问题和解决方案对现有工作进行
分类和总结,并为前人的调研工作补充了许多新的先进设计,以及加
入了新兴的图神经网络加速架构的研究工作除此之外,本文也从图计
算加速架构的测试评估与全栈设计角度出发,对未来的研究方向进行
了展望
).
图
.
格式
本文的主要贡献包括 个方面/
"以加速图计算应用遇到的关键挑战为导向,以解决方案为核心
基于计算机金字塔组织结构,从上到下,逐层对图计算加速架构的研
究现状进行了系统的归纳和总结,并以具体例子分析了不同层次优化
技术之间的关系
"以具体图神经网络加速架构设计作为例子,着重介绍和总结了
新兴图计算应用图神经网络"与其特定的加速器设计继神经网络加速
架构之后,图神经网络加速器必将掀起新的研究和产业化热潮
"从图计算加速架构评估与设计的角度对图计算加速架构进行了
展望,指出了全栈式设计方案是实现产业化应用的关键,并阐述了基
于 .%0 生态环境,有助于快速且低成本地实现图计算加速架构的
设计方案
1 图计算应用背景
在本节中,我们主要描述了图的特征和图的存储方式、主要的图
计算编程模型、典型的传统图计算算法和新兴图神经网络模型
1.1 图的表示与特征
图 "是一种用于表示对象之间联系的抽象数据结构,通常被
定义为 G1V&E"每个对象在图中被定义为节点,V 表示节点的集合每
个对象间的联系在图中被定义为边,E 表示边的集合集合 E 中每一条
边 ev
i
&v
j
"表示节点 v
i
与节点 v
j
的链接根据边是否有方向和权值,图又
可细分为有向 无向图和有权 无权图对于有向图,边 ev
i
&v
j
"表示节
点 v
i
可 以 从 自 身 源 节 点 $2"" 出 发 到 达 v
j
目 的 节 点
!$2"节点的出度表示从该节点出发单跳能达到的节
点数目,对应的边被称为出边节点的入度表示从其他节点出发单跳能
到达该节点的节点数目,对应的边被称为入边这些直接链接的节点互
相被称为 % 邻居节点
现实生活中的图大部分结构不固定、极为稀疏且节点度数服从
%3 4%4" 分 布 , 但 局 部 却 具 有 强 集 合 结 构
#"
5
由于现实场景的不确定性,对象间的联系具
有极高的随机性,因此每个对象的链接数目和被链接的对象极为不固
剩余60页未读,继续阅读
资源评论
罗伯特之技术屋
- 粉丝: 3691
- 资源: 1万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功