Tesla GPU架构分析5
需积分: 0 84 浏览量
更新于2022-08-08
收藏 423KB DOCX 举报
Tesla GPU 架构分析
本文将对 NVIDIA Tesla V100 GPU 架构进行深入分析,涵盖其主要特性、硬件架构和性能特点。
NVIDIA Tesla V100 主要特性
NVIDIA Tesla V100 加速器性能在全球并行处理器中看成出类拔萃,全新的 Volta GV100 GPU 采用专为 NVIDIA 定制的全新 TSMC 12 nm FFN 高性能制造工艺精心打造而成。主要特性包括:
1. 专为深度学习优化的全新流多处理器架构:Volta GPU 中央配备有全新设计的 SM 处理器架构,全新 Volta SM 的节能效率相较上一代 Pascal 产品提升 50%,在同一功率电路下可显著提高 FP32 和 FP64 的性能。
2. 第二代 NVIDIA NVLink 高速互联功能提供更高宽带与更多链路。
3. 拥有经过重点调整的 16GB HBM2 内存子系统,可提供 900GB/s 的内存宽带峰值。
4. 拥有 Volta 多进程服务,实现硬件加速,从而为共享 GPU 的多个计算应用程序提高性能,实现隔离并改进服务质量。
5. 统一内存寻址和地址转换服务质量提升,新的地址转换服务支持允许 GPU 直接读取 CPU 的分页表。
深入理解 NVIDIA Tesla GV100 GPU 硬件架构
NVIDIA Tesla V100 加速器配备 Volta GV100 GPU,是世界领先的高性能并行计算处理器。GV100 GPU 由多个 GPU 处理集群 GPC、纹理处理集群 TPC、流多处理器 SM 和内存控制器组成。完整的 GV100 GPU 包含以下组件:
1. 6 个 GPC,每个 GPC 拥有 7 个 TPC(各包含两个 SM)
2. 84 个 Volta SM,每个 SM 拥有 64 个 FP32 核心,64 个 INT32 核心,32 个 FP64 核心,8 个 Tensor 核心,4 个纹理单元。
3. 8 个 512 位内存控制器,共 4096 位。
包含 84 个 SM 的完整 GV100 GPU 总共拥有 5376 个 FP32 核心,5376 个 INT32 核心,2688个 FP64 核心,672 个 Tensor 核心以及 336 个纹理单元。
卓越的性能和能效
NVIDIA Tesla V100 加速器在性能和能效方面都取得了卓越的成果。Volta GV100 GPU 的性能相较上一代 Pascal GP100 GPU 有了显著的提升,同时还新增了许多重要的计算功能,并简化了 GPU 编程难度。 Tesla V100 加速器为数千个高性能计算(HPC)、数据中心和机器学习应用程序提供加速动力,已成为推动人工智能革命的领先计算引擎。
小米智能生活
- 粉丝: 46
- 资源: 300
最新资源
- 证券投资交易分析系统(含源码+项目说明+文档资料+全部资料).zip
- 知识图谱医疗问答系统+前端展示源码(2024毕业设计).zip
- 在线教育培训管理系统(含源码+项目说明+功能模块介绍).zip
- 在线考试系统-基于SpringCloud+Vue3近期开发(遗传算法自动组卷、文本批量导入,含源码+项目说明+设计报告).zip
- 在线流量分类模型-基于CNN+LSTM时空神经网络(含源码+说明文档+设计报告).zip
- 云开发电影院订票小程序(微信小程序源码+项目说明+设计报告).zip
- 云计算实验-利用GitHub进行协作并编写YML测试用例实现持续集成(含文档).zip
- 年度死因数字数据集.zip
- 猜数字游戏,再来一次,点名器,定时器,体彩方案
- 基于Matlab图像识别技术的隐形眼镜镜片边缘缺陷检测源代码
- 在线NFT铸造平台-整合区块链、IPFS与React技术(含源码及设计文档).zip
- 运动想象脑电信号分类-基于Transformer(CNN+局部时间空间特征提取,含源码+项目说明).zip
- 游戏AI强化训练-深度强化学习实战源码(比赛项目).zip
- 游戏空战推演系统源码基于强化学习开发源码(期末大作业).zip
- 期末课设-员工信息管理系统-基于Qt+SQLite数据库(含源码+项目说明+设计报告).zip
- 玉米病害与害虫识别系统源码+农业智能应用报告(课程设计).zip