没有合适的资源?快使用搜索试试~ 我知道了~
面向GPU的通用矩阵乘法计算的容错研究.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 83 浏览量
2022-12-01
09:09:24
上传
评论
收藏 531KB DOCX 举报
温馨提示
试读
9页
面向GPU的通用矩阵乘法计算的容错研究.docx
资源推荐
资源详情
资源评论
1. 引言
由于其超强的浮点计算能力, GPU 已经成为高性能计算的首选平台之一.随着 NVIDIA
公司嵌入式 GPU 的推出, GPU 开始应用于各种复杂环境(如高电磁或高宇宙射线辐射环境),
由于 GPU 本身集成度高, 工作频率高, VLSI 特征尺寸小, 内核电压低等特点, 使其相比于
其它电子元器件更容易受到"位"翻转影响, 比较典型的就是空间环境中的 SEU 问题
[1]
, 这使
得 GPU 的容错研究成为一个热点
[2]
.静默数据损坏错误是 GPU 受"位"翻转影响而最容易发
生的错误之一, 这种错误不易被察觉, 直接导致最终计算结果错误, 在某些关键应用中, 可
能会造成严重的后果.而浮点矩阵运算, 则是很多算法的基础, 也是 GPU 最常实现的计算类
型.本文研究了一种基于算法容错的 GEMM 计算的方法, 并以 CUDA 库函数的方式实现,
可以为某些"计算结果-关键"的应用提供了一种计算结果具有更高可信度的基础函数.
2. 相关技术
2.1 技术背景
GPU 是一种辅助处理器, 一方面可以分担 CPU 高性能计算的工作, 另一方面还需要
CPU 对其进行管理.每次 GPU 运行所需的程序和数据, 都由 CPU 进行管理.GPU 具有非常
复杂的内存结构, 包括集成在芯片内部的 cache 存储器、寄存器等, 以及外部的 DDR 存储
器.这些存储单元和计算单元(如 ALU 单元)都容易发生 SDC 错误.
嵌入式 GPU 采用了 SOC 的方式, 将多个 ARM 内核和 GPU 内核集成在一个芯片中,
使其应用场景更为广泛, 其与传统 GPU 不同之处在于, GPU 内核与 CPU 内核共享外部
DDR 存储器, 所以没有数据搬移的过程.
NVIDIA 公司为方便 GPU 开发而推出的 CUDA 编程模型, 为 GPU 提供了一个功能齐
全的软件开发生态系统, 其中包括编译器、调试器和库.CUDA C/C++程序由不同的代码段
组成, 这些代码段要么在主机系统的 CPU 上执行, 要么在 GPU 上执行, 其中, 在 GPU 上执
行的代码段称为内核函数.
CUDA 提供的 cuBLAS 库是在 CUDA 运行时 API 之上的基本线性代数计算的实现,
包括矩阵和向量相关的各种计算.CUDA 库的使用, 可以减少用户设计的工作量, 并给用户
的程序带来非常大的性能提升.但是这些库并没有容错设计, 在某些恶劣环境应用中, 其计
算结果的可信性会存在问题, 如图 1 所示.
资源评论
罗伯特之技术屋
- 粉丝: 3749
- 资源: 1万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功