NVIDIA TURING GPU 架构白皮书.pdf

所需积分/C币:35 2019-07-01 16:32:12 24.18MB PDF
收藏 收藏
举报

NVIDIA TURING GPU 架构白皮书.pdf
Turing显存压缩 ..24 视频和显示引擎 25 USBC和 Virtuallink. 27 NVLink改进SL| 28 Turing光线追踪技术 30 Turing rt核心 NⅥ DIA NGX技术 NGX软件架构 39 深度字习超级采样(DLSS 40 n Painting 43 Al SlOW-Mo 44 Al Super rez 44 Turing先进的着色技术 46 网格着色 可变速率着色 50 内容自适应着色 52 移动自适应着色. 注视点渲染技术 54 纹理空间着色 55 TSS的运作机制 56 多视图涫染 多视图渲染用例 59 资源管理和绑定模型 Turing特性增强虚拟现实体验 63 结束语 65 附录A: Turing TU104GPU 附录B: Turing TU106GPU 72 NVIDIA Turing GPU架构WP-09183-00101|i 附录C:RTX-0Ps说明 76 混合渲染模型 76 RTX-OPS基于工作负载的指标阐述. 78 附录D光线追踪概述 79 光线追踪的基本运作机制 80 层次包圉盒 降噪滤波 83 光线追踪阴影、环境光遮蔽和反射. 83 NVIDIA T uring GPU架构WP-09183-001v01|iv 插图目录 Turing重塑图形 图2.含72个SM单元的完整 Turing TU102GPU内部构造…. 冬3 NVIDIA Turing [102 GPU 图4. Turing TU102/TU104丌U106流式多元处理器SM 15 图5 浮点指令和整数指令在 Turing SM中的并行执行结果 16 新的共亨内存架构… ...11...11....11日11 7 图7.在众多不同工作负载上, Turing相较 Pasca的着色性能提升情况…… 17 图8 全新 Turing Tensor核心可为A推理提供多婧度模式… 19 图9. Tesla t4可提供高达40倍的推理性能 图10. Tesla t4的能效高达CPU推理的50多倍 氢11. Turing gDDr6 24 图12 有效带宽提高50% 25 图13 视频特性提升情况 冬14 NVLink实现新型S凵|显示器拓扑 29 图15.NDAS0L光线追踪演示中的 SOL MAN(观看演示) 图16.混合渲染流水线.… 32 冬17.光线追踪和光栅化流水线阶段的详细信息 33 图18 反射演示示例 34 图19.使用 Turing前的光线追踪 36 图20.采用RT核心的 Turing光线追踪 37 图21 Turing光线追踪性能 冬2.搭载4 KDLSS的 Turing性能是搭载4KTAA的 Pascal性能的两倍 41 图23 几乎无法区分DLSS2X和64xSS图像 42 图24.与TAA相比,DLSS2X可提供大幅改善的时间稳定性和图像清晰度…….….….43 NVIDIA T uring GPU架构WP-09183-001v01| 图25. NGX In Painting示例,缺失的图像数据被智能地替换为有意乂的图像信息….44 图26. Al Super Rez相比其他过滤方法提供更高的图像清晰度 45 图27.网格着色,视觉元素丰富的图像… 47 图28.当前的图形流水线对比具有任务和网格着色器的图形流水线 47 图29 小行星场景演示的屏幕截图 48 图30.低细节级别和高细节级别[L0D的小行星 49 图31.在 NVIDIA HolodeckⅨM中观看的经动态计算的< ocnigscgg模型的 球形剖面图 50 图32. Turing VRS支持的着色率和对游戏唢的立用示例. 图33 大容自适立着色示例 53 冬34.物体移动、视网膜以及显示器持续作用下产生的感知模糊 54 图35.传统的光栅化和着色过程… 56 图36.纹理空间着色过程 57 图37.对立体图像进行的纹理空间着色 58 图38.200度 FOV HMD,其中使用两个搭载MVR的倾斜面板 60 图39.MVR单遍层叠式阴影贴图渲染 图40.面向VR的 Turing特性 64 图41. Turing TU104完整芯片图 67 图42. Turing t106完整芯片图. 73 图43 个 Turing帧时间跨度的工作负载分布 77 冬44.RTX2080每类操作的峰值运算. 78 图45.光线追踪的基本过程 .80 图46.树遍历以及光线与包围盒各层相交的拄象图 图47.比较阴影贴图百分比渐近滤波(PCF与应用降噪算法的光线追踪. 84 冬48.比较阴影贴图与每像素抽取1个样本应用降噪算法的光线追踪阴影 84 图49.比较屏幕空间环境光遮蔽与光线追踪环境光遮蔽 85 图50.RTX光线追踪 86 NVIDIA T uring GPU架构WP-09183-001v01| 图51.“战地5( Battlefield VI”中开启和关闭RTX的场景 87 图52.“战地5( BattlefieldⅥ”中开启和关闭RTX的场景2 88 图53.“古墓丽影:暗影 Shadow of the Tomb Raider”中的开启RTX的场景 89 NVIDIA T uring GPU架构WP-09183-001v01|ⅶi 表格目录 表1 NⅥ DIA Pascal gP102与 Turing TU102对比表 表2 增强版视频引擎, Tesla p4与 Tesla t4对比表 22 Turing GPU中的 Display Port支持 26 表4. NVIDIA Pascal gP104与 Turing TU104GPU规格对比表 68 表5 Pascal tesla p4和 uring tesla4对比表 0 NVIDIA Pascal gp104与 Turing TU106GPU对比表 73 NVIDIA T uring GPU架构WP-09183-001v01|ⅶi NV| DIA TURING架构简介 伴随游戏市场的持续发展及其对更优质3D图形的要求与日俱增,NⅥD|A已将GPU 发展为世界领先的并行处理引擎,可满足众多计算密集型应用程序的需求。NVD|AGP∪ 不仅能渲染高庋逼真且引人入胜的3D游戏,还可加速内容创建工作流程、高性能计算 HPC]和数据中心应用程序,以及众多人工智能系统与应用程序。 作为十多年来架构发展的重大飞跃,Tuig架构推出全新核心GPU架构,可大力提升PC 游戏、专业图形应用程序和深度学习推理的效率与性能。 通过釆用基于硬件的全新加速器和混合渲染方法, Turing架构将光栅化、实时光线追踪、 A和模拟技术融于一身,可在PC游戏中实现令人难以置信的真实感、由神经网络驱动的 全新惊艳效果、电影级交互体验,并可在用户创建和浏览复杂3υ模型时为其提供流畅玓 交互性。 Turing核心架构采用全新GPU处理器(流式多元处理器,SM)架构,可有效提升着色器 执行效率,同时还型备支持最新⑤DDR6显存技术的全新显存系统架构。得益于这两大 关键配置, Turing的图形性能得以显著提升。 I mageNet Challenge等图像处理应用程序已率先在深度学习领域初尝硕果,因此可以 预见,A具备解决众多重要图形问题的潜力。 Turing Tensor核心可助力一套基于深度 学习的神经服务,不仅能为基于云的系统提供快速A推理,还可在游戏和专业图形领域 实现出色的图形效果。 NVIDIA T uring GPU架构WP-09183-001v01|1 NVIDIA Turing架构简介 直以来,实时光线追踪都是我们在计算杋图形渲染领域梦寐以求的囯枟。现在梦想照进 现实,一切尽在采用 NVIDIA Turing GPU架构的单GPU系统。 Turing GPU采用全新RT 核心,这些加速器单元能够以非凡效率专门执行光线追踪操作,从而能够彻底摒弃以往 基于软件仿真且代价高昂的光线追踪方式。通过与NⅥ DIA RTXTM软件技术和精密的过滤 算法相结合,这些新单元可助力 Turing提供实时光线追踪渲染,包括凭借对阴影、反射 和折射物理属性的准确把握来获得逼真的物体和环境。 在开发 Turing的同时, Microsoft还于2018年初宣布推出面向A的 Directml和 Directx Raytracing(XRAP。通过将 Turing GPl架构和 Microsoft的新型A及光线追踪AP 相结合,游戏开发者可在其游戏中快速部署实时A和光线追琮。 Turing不仅具有开创性的A和光线追琮功能,而且配备众多新推出的高级着色功能, 可提高性能、改善图像质量,并能提供更高水平的几何图形复杂度。 此外, Turing GPU还继承了vota架构为 NVIDIA CUDA啊M平台引入的所有增强功能, 从而能够提升计算应用程序的能力、灵活度、效率和可移植性。 Turing GPU架构拥有 诸多特性,包括独立线稈调度、具有多应用程序地址空间隔离的硬件加涑多讲稈服务 MPS以及协作组等。 新推出的几款N∨ DIA Ge force和 NVIDIA QUadroTM GPu产品将会搭载 Turing GP∪。 本文中,我们主要关注NVDA旗舰款 Turing GPU的架构和多项功能。 Turing GPu代号 为TU102,而即将发售的 Geforce RπX2080i和α uadro rix6000便搭载此款GP∪。 技术细节(包括刊U104和TU106 luring GPU的产品规格)均包含在附录中。 图1展示了 Turing如何利用全新架构重靼图形,这一架构包括增强版 Tensor核心、全新 RT核心以及新推出的众多高级着色功能。 Turing将可编程着色、实时光统追踪和A算法 融于一身,能够为游戏和专业应用程序打造极为逼真且又具备准确物理属性的图形。 NVIDIA T uring GPU架构WP09183-001v01|2

...展开详情
试读 100P NVIDIA TURING GPU 架构白皮书.pdf
立即下载 低至0.43元/次 身份认证VIP会员低至7折
    一个资源只可评论一次,评论内容不能少于5个字
    jonyliu 非常不错,十分有用,谢谢!
    2019-09-29
    回复
    关注 私信 TA的资源
    上传资源赚积分,得勋章
    最新推荐
    NVIDIA TURING GPU 架构白皮书.pdf 35积分/C币 立即下载
    1/100
    NVIDIA TURING GPU 架构白皮书.pdf第1页
    NVIDIA TURING GPU 架构白皮书.pdf第2页
    NVIDIA TURING GPU 架构白皮书.pdf第3页
    NVIDIA TURING GPU 架构白皮书.pdf第4页
    NVIDIA TURING GPU 架构白皮书.pdf第5页
    NVIDIA TURING GPU 架构白皮书.pdf第6页
    NVIDIA TURING GPU 架构白皮书.pdf第7页
    NVIDIA TURING GPU 架构白皮书.pdf第8页
    NVIDIA TURING GPU 架构白皮书.pdf第9页
    NVIDIA TURING GPU 架构白皮书.pdf第10页
    NVIDIA TURING GPU 架构白皮书.pdf第11页
    NVIDIA TURING GPU 架构白皮书.pdf第12页
    NVIDIA TURING GPU 架构白皮书.pdf第13页
    NVIDIA TURING GPU 架构白皮书.pdf第14页
    NVIDIA TURING GPU 架构白皮书.pdf第15页
    NVIDIA TURING GPU 架构白皮书.pdf第16页
    NVIDIA TURING GPU 架构白皮书.pdf第17页
    NVIDIA TURING GPU 架构白皮书.pdf第18页
    NVIDIA TURING GPU 架构白皮书.pdf第19页
    NVIDIA TURING GPU 架构白皮书.pdf第20页

    试读已结束,剩余80页未读...

    35积分/C币 立即下载 >