CudaC编程指南（程润伟）_CUDAC编程权威指南资源-CSDN文库

共2个文件

rar：1个

pdf：1个

CUDA

并行计算

4星 · 超过85%的资源需积分: 46 60 浏览量 2018-11-06 10:43:42 上传评论 6 收藏 67.87MB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

CUDA C编程指南.zip （2个子文件）

CUDA C编程指南

CUDA C编程权威指南_源码.rar 1.45MB

CUDA C编程权威指南第七版(高性能计算技术丛书).pdf 83.57MB

高性能计算技术丛书

CUDA C编程权威指南

Professional CUDA C Programming

（美）程润伟（John Cheng）　等著

颜成钢　殷建　李亮　译

ISBN：978-7-111-56547-5

本书纸版由机械工业出版社于2017年出版，电子版由华章分社（北京华章图文信息有限公

司，北京奥维博世图书发行有限公司）全球范围内制作与发行。

客服热线：+ 86-10-68995265

客服信箱：service@bbbvip.com

官方网址：www.hzmedia.com.cn

新浪微博 @华章数媒

微信公众号华章电子书（微信号：hzebook）

目录
译者序
推荐序
自序
作者简介
技术审校者简介
前言
致谢
第1章　基于CUDA的异构并行计算
1.1　并行计算
1.1.1　串行编程和并行编程
1.1.2　并行性
1.1.3　计算机架构
1.2　异构计算
1.2.1　异构架构
1.2.2　异构计算范例
1.2.3　CUDA：一种异构计算平台
1.3　用GPU输出Hello　World
1.4　使用CUDA　C编程难吗
1.5　总结
1.6　习题
第2章　CUDA编程模型
2.1　CUDA编程模型概述
2.1.1　CUDA编程结构
2.1.2　内存管理
2.1.3　线程管理

1.4　启动一个CUDA核函数
1.5　编写核函数
1.6　验证核函数
1.7　处理错误
1.8　编译和执行
2　给核函数计时
2.1　用CPU计时器计时
2.2　用nvprof工具计时
3　组织并行线程
3.1　使用块和线程建立矩阵索引
3.2　使用二维网格和二维块对矩阵求和
3.3　使用一维网格和一维块对矩阵求和
3.4　使用二维网格和一维块对矩阵求和
4　设备管理
4.1　使用运行时API查询GPU信息
4.2　确定最优GPU
4.3　使用nvidia-smi查询GPU信息
4.4　在运行时设置设备
5　总结
6　习题
第3章　CUDA执行模型
1　CUDA执行模型概述
1.1　GPU架构概述
1.2　Fermi架构
1.3　Kepler架构
1.4　配置文件驱动优化
2　理解线程束执行的本质

2.1　线程束和线程块
2.2　线程束分化
2.3　资源分配
2.4　延迟隐藏
2.5　占用率
2.6　同步
2.7　可扩展性
3　并行性的表现
3.1　用nvprof检测活跃的线程束
3.2　用nvprof检测内存操作
3.3　增大并行性
4　避免分支分化
4.1　并行归约问题
4.2　并行归约中的分化
4.3　改善并行归约的分化
4.4　交错配对的归约
5　展开循环
5.1　展开的归约
5.2　展开线程的归约
5.3　完全展开的归约
5.4　模板函数的归约
6　动态并行
6.1　嵌套执行
6.2　在GPU上嵌套Hello　World
6.3　嵌套归约
7　总结
8　习题