面向GPU的通用矩阵乘法计算的容错研究.docx资源-CSDN文库

版权申诉

83 浏览量 2022-12-01 09:09:24 上传评论收藏 531KB DOCX 举报

资源推荐

资源详情

资源评论

1. 引言

由于其超强的浮点计算能力, GPU 已经成为高性能计算的首选平台之一.随着 NVIDIA

公司嵌入式 GPU 的推出, GPU 开始应用于各种复杂环境(如高电磁或高宇宙射线辐射环境),

由于 GPU 本身集成度高, 工作频率高, VLSI 特征尺寸小, 内核电压低等特点, 使其相比于

其它电子元器件更容易受到"位"翻转影响, 比较典型的就是空间环境中的 SEU 问题

[1]

, 这使

得 GPU 的容错研究成为一个热点

[2]

.静默数据损坏错误是 GPU 受"位"翻转影响而最容易发

生的错误之一, 这种错误不易被察觉, 直接导致最终计算结果错误, 在某些关键应用中, 可

能会造成严重的后果.而浮点矩阵运算, 则是很多算法的基础, 也是 GPU 最常实现的计算类

型.本文研究了一种基于算法容错的 GEMM 计算的方法, 并以 CUDA 库函数的方式实现,

可以为某些"计算结果-关键"的应用提供了一种计算结果具有更高可信度的基础函数.

2. 相关技术

2.1 技术背景

GPU 是一种辅助处理器, 一方面可以分担 CPU 高性能计算的工作, 另一方面还需要

CPU 对其进行管理.每次 GPU 运行所需的程序和数据, 都由 CPU 进行管理.GPU 具有非常

复杂的内存结构, 包括集成在芯片内部的 cache 存储器、寄存器等, 以及外部的 DDR 存储

器.这些存储单元和计算单元(如 ALU 单元)都容易发生 SDC 错误.

嵌入式 GPU 采用了 SOC 的方式, 将多个 ARM 内核和 GPU 内核集成在一个芯片中,

使其应用场景更为广泛, 其与传统 GPU 不同之处在于, GPU 内核与 CPU 内核共享外部

DDR 存储器, 所以没有数据搬移的过程.

NVIDIA 公司为方便 GPU 开发而推出的 CUDA 编程模型, 为 GPU 提供了一个功能齐

全的软件开发生态系统, 其中包括编译器、调试器和库.CUDA C/C++程序由不同的代码段

组成, 这些代码段要么在主机系统的 CPU 上执行, 要么在 GPU 上执行, 其中, 在 GPU 上执

行的代码段称为内核函数.

CUDA 提供的 cuBLAS 库是在 CUDA 运行时 API 之上的基本线性代数计算的实现,

包括矩阵和向量相关的各种计算.CUDA 库的使用, 可以减少用户设计的工作量, 并给用户

的程序带来非常大的性能提升.但是这些库并没有容错设计, 在某些恶劣环境应用中, 其计

算结果的可信性会存在问题, 如图 1 所示.

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余8页未读，立即下载

内容反馈

版权申诉

罗伯特之技术屋

粉丝: 3749
资源: 1万+

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip