Tesla GPU架构分析5
需积分: 0 33 浏览量
更新于2022-08-08
收藏 423KB DOCX 举报
Tesla GPU 架构分析
本文将对 NVIDIA Tesla V100 GPU 架构进行深入分析,涵盖其主要特性、硬件架构和性能特点。
NVIDIA Tesla V100 主要特性
NVIDIA Tesla V100 加速器性能在全球并行处理器中看成出类拔萃,全新的 Volta GV100 GPU 采用专为 NVIDIA 定制的全新 TSMC 12 nm FFN 高性能制造工艺精心打造而成。主要特性包括:
1. 专为深度学习优化的全新流多处理器架构:Volta GPU 中央配备有全新设计的 SM 处理器架构,全新 Volta SM 的节能效率相较上一代 Pascal 产品提升 50%,在同一功率电路下可显著提高 FP32 和 FP64 的性能。
2. 第二代 NVIDIA NVLink 高速互联功能提供更高宽带与更多链路。
3. 拥有经过重点调整的 16GB HBM2 内存子系统,可提供 900GB/s 的内存宽带峰值。
4. 拥有 Volta 多进程服务,实现硬件加速,从而为共享 GPU 的多个计算应用程序提高性能,实现隔离并改进服务质量。
5. 统一内存寻址和地址转换服务质量提升,新的地址转换服务支持允许 GPU 直接读取 CPU 的分页表。
深入理解 NVIDIA Tesla GV100 GPU 硬件架构
NVIDIA Tesla V100 加速器配备 Volta GV100 GPU,是世界领先的高性能并行计算处理器。GV100 GPU 由多个 GPU 处理集群 GPC、纹理处理集群 TPC、流多处理器 SM 和内存控制器组成。完整的 GV100 GPU 包含以下组件:
1. 6 个 GPC,每个 GPC 拥有 7 个 TPC(各包含两个 SM)
2. 84 个 Volta SM,每个 SM 拥有 64 个 FP32 核心,64 个 INT32 核心,32 个 FP64 核心,8 个 Tensor 核心,4 个纹理单元。
3. 8 个 512 位内存控制器,共 4096 位。
包含 84 个 SM 的完整 GV100 GPU 总共拥有 5376 个 FP32 核心,5376 个 INT32 核心,2688个 FP64 核心,672 个 Tensor 核心以及 336 个纹理单元。
卓越的性能和能效
NVIDIA Tesla V100 加速器在性能和能效方面都取得了卓越的成果。Volta GV100 GPU 的性能相较上一代 Pascal GP100 GPU 有了显著的提升,同时还新增了许多重要的计算功能,并简化了 GPU 编程难度。 Tesla V100 加速器为数千个高性能计算(HPC)、数据中心和机器学习应用程序提供加速动力,已成为推动人工智能革命的领先计算引擎。
![avatar](https://profile-avatar.csdnimg.cn/db127453fc8541a2a8b3e0155a4ae956_weixin_35809056.jpg!1)
小米智能生活
- 粉丝: 46
- 资源: 300
最新资源
- 被忽视的成本:中国城市扩张导致的生态系统服务损失从三耦合的角度来看
- 永磁同步电机PMSM参数辨识的粒子群优化算法实现流程解析与案例探索,基于粒子群优化算法的PMSM参数精准辨识与迭代更新策略,基于粒子群优化算法的永磁同步电机PMSM参数辨识 关键词:永磁同步电机 粒子
- 揭示城市扩张对植被碳的影响封存能力-以长江经济带为例(软件翻译)
- 双馈风电机组与同步发电机组四机两区域Simulink仿真建模及风光储联合调频与多种控制策略结合混合储能技术研究,双馈风电机组与同步发电机组四机两区域Simulink仿真建模及风光储联合调频控制策略,混
- 电气安装工 初级工.pdf
- 清华大学:普通人如何抓住DeepSeek红利
- Swift 编程语言的入门教程,适合零基础或有一定编程经验的读者快速上手
- 清华出品(104页)DeepSeek从入门到精通
- DeepSeek指导手册(24页)
- 研究机翼在不同速度下产生的噪音和性能表现
- JimuFlow RPA工具MacOS版v1.0.0
- MATLAB滚动轴承故障机理建模与仿真分析:基于ODE45的数值计算与多类型故障诊断预测研究,MATLAB轴承动力学模拟:滚动轴承故障机理建模与数值计算,多故障类型模拟及数据分析报告(含故障类型识别与
- 基于改进Relief算法的特征选取与关联向量机在短期负荷预测中的Matlab应用复现,基于改进Relief算法的特征选取与关联向量机在短期负荷预测中的实践(Matlab复现),相关向量机和特征选取技术
- COMSOL模拟技术揭秘:金属合金凝固过程及连铸工艺精确分析-相场流场与温度场的综合运用探究坯壳厚度计算,金属合金凝固与连铸过程数值模拟:相场流场温度场分析下的坯壳厚度计算,comsol数值模拟
- JimuFlow RPA工具Ubuntu版v1.0.0
- 煤层瓦斯渗透扩散与煤体孔隙裂隙二重介质特性研究-基于修正的P-M渗透率模型与气固耦合效应的模拟分析,煤层瓦斯渗透扩散的深部采煤模型研究:建立孔隙裂隙二重介质特性P-M渗透率模型与气固耦合模型的解析