下载  >  课程资源  >  C/C++  > CUDA编程指南(中文译版)

CUDA编程指南(中文译版) 评分:

基于CUDA官方文件翻译,包括cuda编程模型、编程接口、硬件实现、性能指南、C语言扩展、数学函数、纹理获取、计算能力、驱动API等获取等介绍。
目录 目录 第一章导论 1从图形处理到通用并行计算 12 CUDA:一种通用并行计算架构… 1.3一种可扩展的编程模型 1.4文档结构 番 第二章编程模型 2.1内核…… 22线程层次 2.3存储器层次… 2.4异构编程 25计算能力· 第三章编程接口 15 3.1用nvcc编译 15 3.1.1编译流程 16 31.1.1离线编译 16 3.1.1.2即时编译 3.1.2二进制兼容性 3.1.3PTX兼容性… .17 3.1.4应用兼容性 ∴∴18 31.5C/C++兼容性 3.1.664位兼容性 19 3.2 CUDA C运行时 CUDA编程指南5.0中文版 32.1初始化 20 322设备存储器 ··垂音 20 32.3共享存储器 2 32.4分页锁定主机存储器 ..…32 3241可分享存储器( portable memory)… 32.4.2写结合存储器 …….34 32.4.3被映射存储器 34 325异步并发执行 35 3.25.1主机和设备间异步执行 .35 32.5.2数据传输和内核执行重叠 .36 325.3并发内核执行 3.25.4并发数据传输 36 32.5.5流 37 3.2.5.6事件 41 3257同步调用 42 3.2.6多设备系统… 3.26.1枚举设备 222 3.2.6.2设备指定 326.3流和事件行为 43 32.6.4p2p存储器访问 3.2.65p2p存储器复制 45 32.6.6统一虚拟地址空间 …45 3.2.6.7错误检查 327调用栈 328纹理和表面存储器 3.2.8.1纹理存储器 3.28.2表面存储器( surface) 60 3283CUDA数组 目录 328.4读写一致性 66 3.29图形学互操作性 ··· ∴66 3.2.9.1 OpengL互操作性 3.292 Direct3D互操作性 70 3.2.9.3SLI(速力)互操作性 ∴∴∴82 33版本和兼容性 · 3.4计算模式 83 3.5模式切换 84 3.6 Windows上的 Tesla.计算集群模式∵ 85 第四章硬件实现 87 41SIMT架构 42硬件多线程 第五章性能指南 91 5.1总体性能优化策略 5.2最大化利用率 91 52.1应用层次 5.2.2设备层次 92 523多处理器层次 .·····.:··· 5.3最大化存储器吞吐量 5.3.1主机和设备的数据传输… 垂垂 5.32设备存储器访问 96 5321全局存储器 96 5.3.2.2本地存储器∴… 98 532.3共享存储器 5.32.4常量存储器 ·垂垂 100 5.32.5纹理和表面存储器 100 5.4最大化指令吞吐量 100 CUDA编程指南5.0中文版 54.1算术指令 5.42控制流指令 104 54.3同步指令 附录A支持CUDA的GPU· 107 附录BC语言扩展 4 109 B.1函数类型限定符 109 B 1.1 -device 109 B.1.2 B. 1. host B.1.4_ nonline- fll_ forceinline 110 B.2变量类型限定符 110 B 2.1 device B 2.2 constant ⊥L1 B 2.3 Shared 112 B 2.4 restrict 113 B.3内置变量类型∴ 115 B.3.1char1、 charl、char2、 uchar2、char3、 uchar3、char4、 uchar4、 short1、 ushort1、 short2、 ushort2、 short3、 ushort3、 short4、 ushort4、intl、 uinta、int2、uint2、int3、uint3、 int4、uint4、long1、 longl、long2、 ulong2、long3、 ulong3、 long4、 ulong4、 Hoat l、foat2、foat:3、foat4、 double2…15 B.3.2dim3类型 ·115 B.4内置变量 115 B.4.1 gridDim ·115 B 4.2 blockldx 115 B.4.3 blockdim· 117 B.4.4 threadx B.4.5 warpSize……………………… 117 目录 B.5存储器栅栏两数 B.6同步函数 ··· ∴.119 B7数学函数 ∴·120 B.8纹理函数 ∴…120 B.8.1纹理对象函数 120 B.8.1.1 texlDfetch() 120 B.8.1.2tex1D0… 121 B.8. 1.3 tex2DO 121 B.8.1. 4 tex3DO 121 B.8.1.5 texl LAyered B.8.1.6 tex2DLayeredO 122 B.8.1.7 texCubemapo B.8. 1.8 tex Cubemap Layered 122 B.8.1.9 tex2Dgather( 123 B.8.2纹理参考函数 123 B.8.2. 1 texlDfetch( 123 B822tex1D0… B.8.2.3 tex2DO ...124 B.8.2. 4 tex3DO 125 B.8.2.5 texlDLayeredo ∴∴∴·125 B.8. 2.6 tex2DLaveredo 125 B 8.2.7 tex Cubemapo B.8.2.8 texCubemap layere 126 B.8.2. 9 tex2Dgather( 126 B.9表面函数( surface) 126 B9.1表面对象函数 127 B.9.1. 1 surfl Dread 127 B.9.L.2 surfl write()…… l27 CUDA编程指南5.0中文版 B 9.1.3 surf2DreadO B.9. 1.4 surf2Dwrite( ··垂音 ∴·128 B 9.1.5 surf3Dread(o B.9.1.6surf3 Write()………128 B 9.1.7 surflDLayeredreado B 9.1.8 surfIDLayeredwriteO …………129 B. 1.9 surf2DLayeredread( 129 B9.1.10 surf2DLayeredwrite() 130 B9.1. 11 surfCubemapreadO 130 B9.1.12 surfCubemapwriteO .131 B9. 1.13 surfCubemapLayeredreadO B9.1.14 surfCubemapl) 131 B.9.2表面引用API 132 B 9.2.1 surfl Dread 132 B 9.2.2 surflDwriteO 32 B 9.2.3 Surf2Dreac 132 B.9.2. 4 surf2DwriteO 13 B.9. 2.5 surf3Dreado .133 B.926suri3 Write()… ∴.133 B 9.2.7 surflDLayeredreado 134 B.9.2. 8 surflDLayeredwrite( 134 B. 2.9 surf2DLayeredreadO 155 B9.2.10 surf2DLayeredwrite( .135 B9.2. 11 surfCubemapreado 135 B9.2. 12 surfCubemapwriteo 136 B.9.213 surfCubemaplayeredread0……136 B9.2. 14 surfCubemapLayeredwrite( ·137 B.10时间函数… 137 目录 B11原子函数 137 B.11.1数学函数 138 B11. 1.1 atomicAddO 138 B 11.1.2 atomicSubo .139 B 11.1.3 atomicExchO 139 B.1114 atomicmin()… .140 B11. 1.5 atonicMaxO ∴∴∴140 B.111.6 atomicInc()… 140 B 11.1.7 atomicDecO .141 B 11.1.8 atomiC Caso 141 B.11.2位逻辑函数 B.11.2.1 atomic∧And B.11.22 atomicOr(… l42 B 11.2.3 atomicXor( .142 B.12束表决( warp vote)函数 .142 B13東洗牌函数 ·143 B.13.1概览 143 B.13.2在束内广播一个值 ·144 B133计算8个线程的前缀和∴ .145 B.134束内求和 ∴……·146 B.14取样计数器函数 146 B15断言 147 B.16格式化输出 .148 B.16.1格式化符号 B.16.2限制 149 B.16.3相关的主机端API 150 B.16.4例程 151 B.17动态全局存储器分配 ∴152 CUDA编程指南5.0中文版 B.171堆存储器分配 153 B.172与设备存储器API的互操作 ··请·音 ∴∴.154 B.17.3例程 B17.3.1每个线程的分配 154 B.17.3.2每个线程块的分配 155 B.173.3在内核启动之间持久的分配 156 B.18执行配置 …∴∴159 B.19启动绑定 160 B.20# pragma unroll∴∴:∵… ….162 B.21SIMD视频指令 163 附录C数学函数 165 C.1标准函数 .………∵.165 C.1.1单精度浮点函数 165 C.1.2双精度浮点函数 ∴∴………168 C.2内置函数 171 C.2.1单精度浮点函数 172 C.2.2双精度浮点数 172 附录DC+十语言支持 ·· 175 D.1代码例子 175 D.L1数据类 D.1.2派生类 D.1.3类模板 D.1.4函数模板∵ D.1.5函子类 D.2限制 ∴…∴180 D.21预处理符号 180 D.22限定符· 180

...展开详情
2017-12-29 上传 大小:2.55MB
举报 收藏 (3)
分享

评论 下载该资源后可以进行评论 共3条

alay_sjl 除了要价太高 其他都好
2019-12-06
回复
shandianfengfan 不错得资源哦,推荐推荐
2019-10-28
回复
cyang194926 还可以,学习不错用书
2018-06-10
回复