4.3.4.3 来自线性存储器的纹理与来自 CUDA 数组的纹理 ..............................................19
4.4 设备运行时组件 .....................................................................................................................19
4.4.1 数学函数 ......................................................................................................................19
4.4.2 同步函数 ......................................................................................................................19
4.4.3 纹理函数 ......................................................................................................................19
4.4.3.1 来自线性存储器的纹理 .......................................................................................19
4.4.3.2 来自 CUDA 数组的纹理 .....................................................................................20
4.4.4 原子函数 ......................................................................................................................20
4.4.5 warp vote 函数 .............................................................................................................20
4.5 主机运行时组件 .....................................................................................................................21
4.5.1 一般概念 ......................................................................................................................21
4.5.1.1 设备 ...................................................................................................................21
4.5.1.2 存储器 ................................................................................................................22
4.5.1.3 OpenGL 互操作性...............................................................................................22
4.5.1.4 Direct3D 互操作性..............................................................................................22
4.5.1.5 异步并发执行 .....................................................................................................22
4.5.2 运行时 API ..................................................................................................................23
4.5.2.1 初始化 ................................................................................................................23
4.5.2.2 设备管理 ............................................................................................................23
4.5.2.3 存储器管理 .........................................................................................................24
4.5.2.4 流管理 ................................................................................................................25
4.5.2.5 事件管理 ............................................................................................................25
4.5.2.6 纹理参考管理 .....................................................................................................25
4.5.2.7 OpenGL 互操作性...............................................................................................27
4.5.2.8 Direct3D 互操作性..............................................................................................27
4.5.2.9 使用设备模拟模式进行调试 ................................................................................28
4.5.3 驱动程序 API...............................................................................................................29
4.5.3.1 初始化 ................................................................................................................29
4.5.3.2 设备管理 ............................................................................................................29
4.5.3.3 上下文管理 .........................................................................................................29
4.5.3.4 模块管理 ............................................................................................................30
4.5.3.5 执行控制 ............................................................................................................30
4.5.3.6 存储器管理 .........................................................................................................31
4.5.3.7 流管理 ................................................................................................................32
4.5.3.8 事件管理 ............................................................................................................32
4.5.3.9 纹理参考管理 .....................................................................................................33
4.5.3.10 OpenGL 互操作性 .............................................................................................33
4.5.3.11 Direct3D 互操作性 ............................................................................................33
第 5 章 性能指南..........................................................................................................................35
5.1 指令性能................................................................................................................................35
5.1.1 指令吞吐量 ...............................................................................................................35
5.1.1.1 数学指令 ............................................................................................................35
5.1.1.2 控制流指令 .........................................................................................................36
5.1.1.3 存储器指令 .........................................................................................................36
5.1.1.4 同步指令 ............................................................................................................37
5.1.2 存储器带宽............................................................................................................37
5.1.2.1 全局存储器 .........................................................................................................37
5.1.2.2 本地存储器 .........................................................................................................43
5.1.2.3 固定存储器 .........................................................................................................43
5.1.2.4 纹理存储器 .........................................................................................................43
5.1.2.5 共享存储器 .........................................................................................................43
5.1.2.6 寄存器 ................................................................................................................48
5.2 每个块的线程数量..................................................................................................................49