统一渲染架构统一渲染架构GPU图形处理量化性能模型研究图形处理量化性能模型研究
统一渲染架构GPU为图形处理提供了丰富的运算、存储资源,也对软件优化提出了更高要求。为了有效地进行
性能设计和优化,针对统一渲染架构实现的GPU 提出一种量化的图形处理性能模型,在深入研究统一渲染架构
GPU架构和工作原理基础上,分析影响图形处理的各种因素:图形指令生成、主机接口数据传输、图形指令解
析、图形处理流水数据吞吐和统一染色阵列处理能力。通过仿真验证表明,在研制自主知识产权GPU过程中,
采用本方法设计各部分性能指标,评估统一染色GPU图形处理性能与实测相比,误差小于7.5%。
0 引言引言
从1999年NVIDIA发布第一款GPU产品至今,GPU技术发展主要经历了固定功能流水线阶段、分离染色器架构阶段、统一
染色器架构阶段
[1]
。其处理架构的不断改变使得图形处理能力和计算能力不断提升,相应的流水线结构、并行计算结构、并行
数据通信结构、存储结构越发复杂,图形处理性能指标已难以从单方面去设计、评价。研究GPU图形处理性能模型意义重
大。
国外NVIDIA、AMD等公司针对GPU图形处理性能方面进行了大量研究,但都是各公司的核心机密,公开甚少
[2]
。国内在统
一渲染架构GPU性能方面进行了一定理论探讨,但主要集中在并行计算、存储结构、编程优化方面,针对GPU设计本身的研
究几乎空白。
本文提出统一渲染架构GPU图形处理量化性能模型,在分析统一渲染架构GPU并行架构和工作原理基础上,分析影响图形
处理的各种因素:图形指令生成、主机接口数据传输、图形指令解析、图形处理流水数据吞吐和统一染色阵列处理能力。为统
一渲染架构GPU的性能参数设计提供方法支持。
1 统一渲染架构统一渲染架构GPU图形处理模型图形处理模型
图形处理器经过近30年的发展,虽然图形处理器体系结构、处理方式发生了巨大变化,但其基于Z-Buffer的光栅化图形处理
流水线一直沿用至今
[3]
。自2006年,NVIDIA发布统一渲染架构的GPU以来,统一渲染架构便成为GPU的主流
[4]
。NVIDIA、
AMD等各厂家都有自己不同的实现方式,但基本的CPU+GPU异构工作方式、图形处理流程都基本一致
[5-6]
。下文将在分析代
表产品的基础上,针对图形处理性能抽象统一渲染架构GPU图形处理模型。
1.1 GeForce 8800
GeForce 8800是2006年NVIDIA发布的第一款统一染色架构GPU,采用G80架构
[7]
。自此NVIDIA每两年发布一款GPU架
构。2006年发布G80,2008年发布Tesla-GT200,2010年发布Fermi-GF100,2012年发布kepler,2014年发布年
Maxwell,2016年发布Pascal。每一款GPU架构都对染色阵列数量及结构进行优化、调整,但图形处理过程改变甚微,基本保
持着G80的处理过程,如图1所示。
图形处理任务由主机生成图形指令存储到主机内存中,GPU通过主机接口获取图形指令,然后将图形指令解析为统一染色
阵列和固定的硬件单元的控制和数据信息,配合完成图形处理过程。
1.2 R700
评论0
最新资源