没有合适的资源?快使用搜索试试~ 我知道了~
系统管理器件中的英伟达Tesla P100加速计算平台五大技术突破
3 下载量 171 浏览量
2020-10-16
06:53:05
上传
评论
收藏 127KB PDF 举报
温馨提示
Tesla P100 是NVIDIA Tesla 加速计算平台的最新产品,能为全新级别的服务器提供支持,实现相当于数百个 CPU 服务器节点的性能。尽管当前数据中心融合了巨大的网络基础设施与众多相互连接的商用 CPU 服务器,可用于处理网络服务等大量交易型工作负载。但面对下一代人工智能和科学应用程序,这些数据中心的效率变得捉襟见肘。因为这些新型应用需要效率超高、速度极快的服务器节点。 借助采用五项突破性技术的全新 NVIDIA Pascal GPU 架构,Tesla P100 能发挥无与伦比的性能和效率来运行对计算能力要求最高的应用程序。 NVIDI
资源推荐
资源详情
资源评论
系统管理器件中的英伟达系统管理器件中的英伟达Tesla P100加速计算平台五大技术突加速计算平台五大技术突
破破
Tesla P100 是NVIDIA Tesla 加速计算平台的最新产品,能为全新级别的服务器提供支持,实现相当于数百个
CPU 服务器节点的性能。尽管当前数据中心融合了巨大的网络基础设施与众多相互连接的商用 CPU 服务器,
可用于处理网络服务等大量交易型工作负载。但面对下一代人工智能和科学应用程序,这些数据中心的效率变
得捉襟见肘。因为这些新型应用需要效率超高、速度极快的服务器节点。 借助采用五项突破性技术的全新
NVIDIA Pascal GPU 架构,Tesla P100 能发挥无与伦比的性能和效率来运行对计算能力要求最高的应用程序。
NVIDI
系统管理器件中的英伟达系统管理器件中的英伟达Tesla P100加速计算平台五大技术突加速计算平台五大技术突
破破
类别:系统管理器件 发布于:2016/4/8 | 675 次阅读
Tesla P100 是NVIDIA Tesla 加速计算平台的最新产品,能为全新级别的服务器提供支持,实现相当于数百个 CPU 服务器
节点的性能。尽管当前数据中心融合了巨大的网络基础设施与众多相互连接的商用 CPU 服务器,可用于处理网络服务等大量
交易型工作负载。但面对下一代人工智能和科学应用程序,这些数据中心的效率变得捉襟见肘。因为这些新型应用需要效率超
高、速度极快的服务器节点。
借助采用五项突破性技术的全新 NVIDIA Pascal GPU 架构,Tesla P100 能发挥无与伦比的性能和效率来运行对计算能力要
求最高的应用程序。
NVIDIA 联合创始人兼首席执行官黄仁勋表示:“我们最大的科学挑战 — 治疗癌症、认识气候变化和打造智能机器 — 它们需
要近乎无限的计算性能。借助各个层面的创新,我们从零开始设计了 Pascal GPU 架构。它是计算性能和效率的巨大进步,将
帮助顶尖人才推动明天的进步。”
认知解决方案和 IBM 研究部高级副总裁 John Kelly III 博士表示:“我们正进入全新的计算时代,要充分实现人工智能和认知
的好处,我们需要采用全新的方法来探索底层技术。NVIDIA GPU 和 OpenPOWER 技术的结合正在加速 Watson 对新技能的
学习。包含 NVLink 支持的 IBM Power 架构和 NVIDIA Pascal 架构将共同进一步加速认知工作负载的性能并推动人工智能行
业。”
基于五项突破,Tesla P100 实现了
前所未有的性能、可扩展性和编程效率:
NVIDIA Pascal 架构实现了巨大的性能飞跃 – 相比前代 NVIDIA Maxwell 解决方案,基于 Pascal 的 Tesla P100 解决方案在
神经网络训练方面将性能提升 12 倍。
NVIDIA NVLink 实现了最高水平的应用程序扩展性 – NVIDIA NVLink 高速 GPU 互联技术在多颗 GPU 上扩展了应用程序,
相比当前同级最佳解决方案,带宽实现 5 倍加速 。借助 NVLink,可以连接八颗 Tesla P100 GPU,在同一个节点上将应用程
序的性能最大化,IBM 在自有 POWER8 CPU 上实施了 NVLink 技术来加速 CPU 到 GPU 通讯。
16nm FinFET 实现了前所未有的能效 – Pascal GPU 拥有 153 亿个采用 16 纳米 FinFET 制造技术的晶体管,是世界上迄今
为止最大的 FinFET 芯片。2 打造它的目的是为计算需求近乎无限的工作负载提供最快的性能和最佳的能效。
CoWoS 和 HBM2,适用于大数据工作负载 – Pascal 架构将处理器和数据封装到一起,实现了前所未有的计算效率。包含
HBM2 的芯片-晶圆-基底 (CoWoS) 是内存设计的创新方法,相比 Maxwell 架构提供了 3 倍的显存带宽,高达 720GB/s。
全新人工智能算法,实现了峰值性能–全新的半精度指令为深度学习提供了超过 21 Teraflops 的峰值性能。
资源评论
weixin_38744962
- 粉丝: 9
- 资源: 968
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功