没有合适的资源?快使用搜索试试~ 我知道了~
智能1702-李博文-201708010602-tesla gpu1
需积分: 0 0 下载量 65 浏览量
2022-08-04
14:04:35
上传
评论
收藏 1.23MB PDF 举报
温馨提示
![preview](https://dl-preview.csdnimg.cn/86328502/0001-87856bdd71af4bb02d90fa0c288b747e_thumbnail.jpeg)
![preview-icon](https://csdnimg.cn/release/downloadcmsfe/public/img/scale.ab9e0183.png)
试读
17页
1、GPU的起源 2、工作原理 1、Kepler相较于Fermi更快,效率更高,性能更好
资源详情
资源评论
资源推荐
![](https://csdnimg.cn/release/download_crawler_static/86328502/bg1.jpg)
HUNAN
UNIVERSITY
计算机设计
学 生 姓 名
李 博 文
学 生 学 号 201708010602
专 业 班 级 智 能 1702
指 导 老 师 吴 强
论 文 题 目 T e s l a G P U 架 构 分 析
![](https://csdnimg.cn/release/download_crawler_static/86328502/bg2.jpg)
一 、 G P U 架 构
1、GPU的起源
GPU缩写为Graphics Processing Unit的,一般称为视觉处理单元。
GPU被广泛用于嵌入式系统、移动电话、个人电脑、工作站和电子游
戏解决方案当中。现代的GPU对图像和图形处理是十分高效率的,这
是因为GPU被设计为很高的并行架构这样使得比通用处理器CPU在大
的数据块并行处理算法上更具有优势。
1985年 8月20日 ATi公司成立,同年10月ATi使用ASIC技术开发
出了第一款图形芯片和图形卡,1992年 4月 ATi发布了 Mach32 图形
卡集成了图形加速功能,1998年 4月 ATi被IDC评选为图形芯片工业
的市场领导者,但那时候这种芯片还没有GPU的称号,很长的一段时
间ATI都是把图形处理器称为VPU,直到AMD收购ATI之后其图形芯片
才正式采用GPU的名字。
NVIDIA公司在1999年发布GeForce 256图形处理芯片时首先提出
GPU的概念。从此NVIDIA显卡的芯片就用这个新名字GPU来称呼。GPU
使显卡削减了对CPU的依赖,并执行部分原本CPU的工作,尤其是在
3D图形处理时。GPU所采用的核心技术有钢体T&L、立方环境材质贴
图与顶点混合、纹理压缩及凹凸映射贴图、双重纹理四像素256位渲
染引擎等,而硬体T&L技术能够说是GPU的标志。
![](https://csdnimg.cn/release/download_crawler_static/86328502/bg3.jpg)
2、工作原理
GPU工作流程简介
GPU的图形(处理)流水线完成如下的工作:
1
顶点处理:这阶段GPU读取描述3D图形外观的顶点数据并根
据顶点数据确定3D图形的形状及位置关系,建立起3D图形的骨架。在
支持DX8和DX9规格的GPU中,这些工作由硬件实现的VertexShader
(定点着色器)完成。
2
光栅化计算:显示器实际显示的图像是由像素组成的,我们
需要将上面生成的图形上的点和线通过一定的算法转换到相应的像
素点。把一个矢量图形转换为一系列像素点的过程就称为光栅化。例
如,一条数学表示的斜线段,最终被转化成阶梯状的连续像素点。
3
纹理帖图:顶点单元生成的多边形只构成了3D物体的轮廓,
而纹理映射(texturemapping)工作完成对多变形表面的帖图,通俗
的说,就是将多边形的表面贴上相应的图片,从而生成“真实”的图形。
TMU(Texturemapping unit)即是用来完成此项工作。
4
像素处理:这阶段(在对每个像素进行光栅化处理期间)GPU
完成对像素的计算和处理,从而确定每个像素的最终属性。在支持DX8
和DX9规格的GPU中,这些工作由硬件实现的Pixel Shader(像素着色
器)完成最终输出,由ROP(光栅化引擎)最终完成像素的输出,1
帧渲染完毕后,被送到显存帧缓冲区。
5
在GPU出现之前,CPU一直负责着计算机中主要的运算工作,
包括多媒体的处理工作。CPU的架构是有利于X86指令集的串行架构,
![](https://csdnimg.cn/release/download_crawler_static/86328502/bg4.jpg)
CPU从设计思路上适合尽可能快的完成一个任务。
但是如此设计的CPU在多媒体处理中的缺陷也显而易见:多媒体
计算通常要求较高的运算密度、多并发线程和频繁地存储器访问,而
由于X86平台中CISC(Complex Instruction Set Computer)架构中暂存
器数量有限,CPU并不适合处理这种类型的工作。
以Intel为代表的厂商曾经做过许多改进的尝试,从1999年开始为
X86平台连续推出了多媒体扩展指令集SSE(Streaming SIMD
Extensions)的一代到四代版本,但由于多媒体计算对于浮点运算和
并行计算效率的高要求,CPU从硬件本身上就难以满足其巨大的处理
需求,仅仅在软件层面的改并不能起到根本效果。
对于GPU来说,它的任务是在屏幕上合成显示数百万个像素的图
像,也就是同时拥有几百万个任务需要并行处理,因此GPU被设计成
可并行处理很多任务,而不是像CPU那样完成单任务。
因此CPU和GPU架构差异很大,CPU功能模块很多,能适应复杂运算
环境;GPU构成则相对简单,目前流处理器和显存控制器占据了绝大
部分晶体管。
CPU中大部分晶体管主要用于构建控制电路(比如分支预测等)
和Cache,只有少部分的晶体管来完成实际的运算工作。而GPU的控
制相对简单,且对Cache的需求小,所以大部分晶体管可以组成各类
专用电路、多条流水线,使得GPU的计算速度有了突破性的飞跃,拥
有了更强大的处理浮点运算的能力。
剩余16页未读,继续阅读
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![xlsx](https://img-home.csdnimg.cn/images/20210720083732.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![avatar](https://profile-avatar.csdnimg.cn/38880c95b8bb4b72ac20e95c92876aa8_weixin_35740875.jpg!1)
叫我叔叔就行
- 粉丝: 28
- 资源: 323
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![voice](https://csdnimg.cn/release/downloadcmsfe/public/img/voice.245cc511.png)
![center-task](https://csdnimg.cn/release/downloadcmsfe/public/img/center-task.c2eda91a.png)
安全验证
文档复制为VIP权益,开通VIP直接复制
![dialog-icon](https://csdnimg.cn/release/downloadcmsfe/public/img/green-success.6a4acb44.png)
评论0