没有合适的资源?快使用搜索试试~ 我知道了~
[计算机体系结构-量化研究方法].5th.[John L. Hennessy&David A. Patterson]1
需积分: 0 30 下载量 78 浏览量
2022-08-03
23:21:24
上传
评论
收藏 27.13MB PDF 举报
温馨提示
试读
612页
新增加的第 4 章会让刚刚接触新型图形处理引擎的读者受益匪浅,这一章的重点是数据级并行,解释了一些虽有不同但正在趋于一致的解决方案,这些方案是由通用处理器中的多
资源详情
资源评论
资源推荐
对本书的赞誉
”《计算机体系结构:量化研究方法(第
5
版)》继续发扬传统,为学习计算机体系结构的
学生提供了当前计算平台的最新信息,使他们能够洞悉体系结构,便千设计未来系统。这一
版的亮点在于大幅修订了数据级并行那一章,用传统的体系结构术语清晰地解读了
GPU
体系
结构。”
-Krste
Asanovic,
加州大学伯克利分校
”《计算机体系结构:量化研究方法》是一部经典,犹如美酒,历久而弥醇。我在本科毕业
时第一次购买了本书,它到现在仍然是我最经常参考的书籍之一。第
4
版问世时,我发现其中
包含了如此之多的新材料,为了跟上这一领域的最新趋势,我必须得再买一本。而当审阅第
5
版时,我发现
Hennessy
和
Patterson
再现神奇。全书内容都进行了大量更新,对于希望真正理解
云和仓库级计算的人们来说,单凭第
6
章的内容,这个新版本就值得一读。只有
Hennessy
和
Patterson
才可能接触到谷歌、亚马逊、微软等云计算与互联网规模的应用提供商的内部人士,
对这一重要领域,业内的介绍材料无出其右。”
一—
James
Hamilton, Amazon
Web
服务部
"Hennessy
和
Patterson
撰写本书的第一版时,研究生们是在用
50000
个晶体管组装计算机。
今天,仓库级的计算机集群会包含
50000
个服务器,每个服务器中包含数十个处理器和数十亿
个晶体管。计算机体系结构一直在不停地快速发展,而《计算机体系结构:量化研究方法》紧
跟它的步伐,每个版本都准确地解释和分析了这一领域激动人心的最新重要思想。”
—James
Lams,
微软研究院
”这一版新增加了一章非常丰富的内容,用来讨论向量、
SIMD
和
GPU
体系结构中的数据
级并行技术。它解释了应用于大众市场的
GPU
内部的关键体系结构概念,给出这些概念与传统
术语的对应关系,并与向量和
SIMD
体系结构进行了对比。这一内容非常及时,与业内转向
GPU
4
河个节的霄管
并行计算的潮流相适应。《计算机体系结构:量化研究方法》继续独领风骚,全面地介绍了体系
结构方面的重大新进展!”
John Nickolls, NVIDIA
“本书已经成为一本经典教科书了,这一版突出介绍了各种显式并行技术(数据、线程、请
求)的兴起,各用整整一章来描述。数据并行一章尤为夺目:通过向量
SIMD
、指令级
SIMD
和
GPU
的对比,避开每种体系结构的专用术语,揭示了这些体系结构之间的相似与区别。”
—Kunle Olukotun,
斯坦福大学
”《计算机体系结构:量化研究方法(第
5
版)》探讨了各种并行概念和它们各自的技术权衡。
和过去的几个版本一样,这一新版本中同样涵盖了最新的技术发展趋势。两个重点是个人移动
设备
(PMD)
和仓库级计算
(WSC)
的爆炸性增长一与原来一味追求性能相比,这里的焦点
已经转为更全面地寻求性能与能效之间的平衡。这些趋势刺激了人们不断追求更强劲的处理能
力,而这种追求又推动人们在并行道路上走得更远。”
一一
-Andrew
N. Sloss,
实施顾问,
ARM
公司
ARM System Developers
Guide
一书的作者
作者简介
John
L.
Hennessy
是斯坦福大学的第
10
任校长,从
1977
年开始在该校电子工程与计算机
系任教。
Hennessy
是
IEEE
和
ACM
会士,美国国家工程院、国家科学院和美国哲学院院士,美
国艺术与科学院院士。他获得过众多奖项,如
2001
年度
Eckert-Mauchly
奖,表彰他对
RISC
技术的贡献;
2001
年度
Seymour
Cray
计算机工程奖;与
David
Patterson
共同获得的
2000
年
度约翰·冯·诺依曼奖章。他还拥有
7
个荣誉博士学位。
1981
年,
John
L.
Hennessy
带领几位研究生在斯坦福开始
M
职江页目的研究。
1984
年完成该
项目之后,他暂时离开大学,与他人共同筹建
MIPS
计算机系统公司(也就是现在的
MIPS
技术
公司),这家公司开发了最早的商用
RISC
微处理器之一。到
2006
年,已经有
20
多亿个
MIPS
微处理器被用于视频游戏、掌上电脑、激光打印机和网络交换机等各种设备中。
Hennessy
后来
领导了
DASH
(Director Architecture for Shared Memory,
共享存储器控制体系结构)项目,这
一项目设计了第一个可扩展缓存一致性多处理器原型,其中的许多重要思想都在现代多处理器
中得到了应用。除了参与科研活动、履行学校职责之外,他仍作为前期顾问和投资者参与了无
数的创业项目。
David
A.
Patterson
自
1977
年进人加州大学伯克利分校执教以来,一直讲授计算机体系结
构课程,拥有该校计算机科学
Pardee
讲座教授职位。他因为教学成果显著而荣获了加州大学的
杰出教学奖、
ACM
的
Karlstrom
奖、
IEEE
的
Mulligan
教育奖章和本科生教学奖。因为在
RISC
方面的贡献而获得了
IEEE
技术成就奖和
ACM
Eckert-Mauchly
奖,他还因为在
RAID
方面的贡
献而分享了
IEEE
Johnson
信息存储奖,并与
John
Hennessy
共同获得了
IEEE
约翰·冯·诺依曼
奖章和
C&C
奖金。和
John
Hennessy
相似,
Patterson
也是美国艺术与科学院院士、美国计算机
历史博物馆院士、
ACM
和
IEEE
会士。他还被选入美国国家工程院、美国国家科学院和硅谷工
程名人堂。
Patterson
身为美国总统信息技术顾问委员会委员,同时也是伯克利电子工程与计算
机科学系计算机科学分部主任、计算机研究协会主席和
ACM
主席。这一履历使他荣获了
ACM
和
CRA
颁发的杰出服务奖。
在加州大学伯克利分校,
Patterson
领导了
RISC!
的设计与实现工作,这可能是第一台
VLSI
精简指令集计算机,为商业
SPARC
体系结构奠定了基础。他曾是廉价磁盘冗余阵列
(Redundant
2
作者简介
Arrays
of
Inexpensive Disks,
RAID)
项目的领导者之一,正是由于这一项目,才有了后来许多
公司出品的可靠存储系统。他还参与了工作站网络
(Network
of
Workstations,
NOW)
项目,因
为这一项目而有了因特网公司使用的集群技术和后来的云计算。这些项目获得了
ACM
颁发的
三个论文奖。作为"算法-机器-人类
"(AMP)
实验室和并行计算实验室的主管,他目前在这
里开展自己的研究项目。
AMP
实验室的目标是开发可扩展的机器学习算法、适用于仓库级计算
机的编程模型、能够快速洞悉云中海量数据的众包
(Crowd-Sourcing)
工具。并行计算实验室
的目标是研发先进技术,为并行个人移动设备提供可扩展、可移植、方便快捷的效率软件。
序
言
Hennessy
和
Patterson
合著的《计算机体系结构:量化研究方法》第
1
版是在我刚上研究生
时出版的,因此,我属于第一批在本书指导下学习体系结构的人。要写一篇有用的序言,少不
了要有作序者自己的独特观点,而我发现自己在这方面有点欠缺,因为我已深受本书前
4
个版
本的影响。还有另外一个不利因素,就是我从学生时代就对这两位计算机科学巨匠心存敬畏,
尽管后来我有机会与他们合作,近距离了解他们,但也可能正因如此,所以这种敬畏心现在仍
未消失。不过,由于我从第一版开始就一直从事这一领域的研究,有机会看到它不断完善,欣
赏它持久不变的实用性,这从一定程度上抵消了上述不利因素。
几年前,英特尔取消其
4GHz
单核
CPU
开发项目,转向多核
CPU
研发,标志着业内对更
高
CPU
时钟频率的激烈竞争正式结束,两年之后,本书第
4
版出版。经过两年的充分观察,
John
和
Dave
在书中将这一变化明确表述为计算技术在过去
10
年中的一个转折点,而不是一次非常
随意的生产线升级。第
4
版对指令级并行
(ILP)
的强调有所降低,增加了线程级并行的相关内
容;第
5
版则更进一步,用整整两章的篇幅来讨论线程级和数据级并行,而将
ILP
的讨论压缩
为一章。新增加的第
4
章会让刚刚接触新型图形处理引擎的读者受益匪浅,这一章的重点是数
据级并行,解释了一些虽有不同但正在趋于一致的解决方案,这些方案是由通用处理器中的多
媒体扩展以及可编程性日益增强的图形处理器提供的。这一章还有一些非常实用的内容:如果
你一直被
CUDA
术语搞得晕头转向,可以参考表
4-10
。(难题:“共享存储器”实际上是本地存
储器,而“全局存储器”更接近于大众认知的共享存储器。)
多核技术仍处在不断变化之中,但第
5
版还介绍了下一代重大技术:云计算。因特网的无
处不在和
Web
服务的发展将人们的注意力引向两个极端:一端是超小型设备(智能手机、平板
电脑),一端是超大型设备(仓库级计算系统)。第
3
章的"融会贯通”一节
(3.13
节)介绍了
A
四
Cortex
AS,
它是智能手机中的一种常用
CPU,
而新增加的整个第
6
章则专门结合仓库级
计算系统讨论了请求级并行和数据级并行。在这一章中,
John
和
Dave
将这些新出现的大型集
群看作一类特殊的新型计算机一欢迎广大计算机架构师一同来推动这一新兴领域的发展。将
第
3
版中的
Google
集群体系结构与这一版第
6
章中更现代化的具体实现进行对比,读者就可以
欣赏到这一领域在过去
10
年的发展过程。
剩余611页未读,继续阅读
ShepherdYoung
- 粉丝: 31
- 资源: 337
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0