Tesla GPU架构分析5

preview
需积分: 0 2 下载量 84 浏览量 更新于2022-08-08 收藏 423KB DOCX 举报
Tesla GPU 架构分析 本文将对 NVIDIA Tesla V100 GPU 架构进行深入分析,涵盖其主要特性、硬件架构和性能特点。 NVIDIA Tesla V100 主要特性 NVIDIA Tesla V100 加速器性能在全球并行处理器中看成出类拔萃,全新的 Volta GV100 GPU 采用专为 NVIDIA 定制的全新 TSMC 12 nm FFN 高性能制造工艺精心打造而成。主要特性包括: 1. 专为深度学习优化的全新流多处理器架构:Volta GPU 中央配备有全新设计的 SM 处理器架构,全新 Volta SM 的节能效率相较上一代 Pascal 产品提升 50%,在同一功率电路下可显著提高 FP32 和 FP64 的性能。 2. 第二代 NVIDIA NVLink 高速互联功能提供更高宽带与更多链路。 3. 拥有经过重点调整的 16GB HBM2 内存子系统,可提供 900GB/s 的内存宽带峰值。 4. 拥有 Volta 多进程服务,实现硬件加速,从而为共享 GPU 的多个计算应用程序提高性能,实现隔离并改进服务质量。 5. 统一内存寻址和地址转换服务质量提升,新的地址转换服务支持允许 GPU 直接读取 CPU 的分页表。 深入理解 NVIDIA Tesla GV100 GPU 硬件架构 NVIDIA Tesla V100 加速器配备 Volta GV100 GPU,是世界领先的高性能并行计算处理器。GV100 GPU 由多个 GPU 处理集群 GPC、纹理处理集群 TPC、流多处理器 SM 和内存控制器组成。完整的 GV100 GPU 包含以下组件: 1. 6 个 GPC,每个 GPC 拥有 7 个 TPC(各包含两个 SM) 2. 84 个 Volta SM,每个 SM 拥有 64 个 FP32 核心,64 个 INT32 核心,32 个 FP64 核心,8 个 Tensor 核心,4 个纹理单元。 3. 8 个 512 位内存控制器,共 4096 位。 包含 84 个 SM 的完整 GV100 GPU 总共拥有 5376 个 FP32 核心,5376 个 INT32 核心,2688个 FP64 核心,672 个 Tensor 核心以及 336 个纹理单元。 卓越的性能和能效 NVIDIA Tesla V100 加速器在性能和能效方面都取得了卓越的成果。Volta GV100 GPU 的性能相较上一代 Pascal GP100 GPU 有了显著的提升,同时还新增了许多重要的计算功能,并简化了 GPU 编程难度。 Tesla V100 加速器为数千个高性能计算(HPC)、数据中心和机器学习应用程序提供加速动力,已成为推动人工智能革命的领先计算引擎。
小米智能生活
  • 粉丝: 46
  • 资源: 300
上传资源 快速赚钱
voice
center-task 前往需求广场,查看用户热搜