没有合适的资源?快使用搜索试试~ 我知道了~
并行体系结构(陈国良版)课后答案
资源推荐
资源详情
资源评论
![rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![doc](https://img-home.csdnimg.cn/images/20210720083327.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![doc](https://img-home.csdnimg.cn/images/20210720083327.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![doc](https://img-home.csdnimg.cn/images/20210720083327.png)
![application/msword](https://img-home.csdnimg.cn/images/20210720083327.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![doc](https://img-home.csdnimg.cn/images/20210720083327.png)
![](https://csdnimg.cn/release/download_crawler_static/88954417/bg1.jpg)
编辑版 word
习题设计
计划
1.指导思想
要求学生理解高端并行计算机系统设计技术,高端 MPP、
DSM、CLUSTER 等大规模并行计算机的关键设计理论和实现技
术,包括互连网络技术、存储架构和高可用技术等。为此,必须
用适量的作业、习题,启发学生独立思考以及熟练掌握一些基础
知识和基本技能。
2.作业安排
本教材每一章都附有大量的习题,根据教学进度和学时,合
理选择书上习题,以达到进一步加深理解课堂讲授的内容。每一
章讲授结束,收一次作业,给出成绩,并作一次集体答疑,讲解
作业中的共性问题。作业成绩记入总成绩内。
第一章 绪论
1.1 什么是并行计算机?
答:简单地讲,并行计算机就是由多个处理单元组成的计算机系统,这些处理单元相互通信
和协作,能快速高效求解大型的复杂的问题。
1.2 简述 Flynn 分类法:
答:根据指令流和数据流的多重性将计算机分为:
1)单指令单数据流 SISD
2)单指令多数据流 SIMD
3)多指令单数据流 MISD
4)多指令多数据流 MIMD
1.3 简述当代的并行机系统
答:当代并行机系统主要有:
1) 并行向量机(PVP)
2) 对称多处理机(SMP)
3) 大规模并行处理机(MPP)
4) 分布式共享存储(DSM)处理机
5) 工作站机群(COW)
1.4 为什么需要并行计算机?
答:1)加快计算速度
2)提高计算精度
3)满足快速时效要求
4)进行无法替代的模拟计算
1.5 简述处理器并行度的发展趋势
答:1)位级并行
2)指令级并行
3)线程级并行
1.6 简述 SIMD 阵列机的特点
答:1)它是使用资源重复的方法来开拓计算问题空间的并行性。
2)所有的处理单元(PE)必须是同步的。
3)阵列机的研究必须与并行算法紧密结合,这样才能提高效率。
![](https://csdnimg.cn/release/download_crawler_static/88954417/bg2.jpg)
编辑版 word
2
1
m
4)阵列机是一种专用的计算机,用于处理一些专门的问题。
1.7 简述多计算机系统的演变
答:分为三个阶段:
1)1983-1987 年为第一代,代表机器有:Ipsc/1、Ameteks/14 等。
2)1988-1992 年为第二代,代表机器有:Paragon、Intel delta 等。
3)1993-1997 年为第三代,代表机器有:MIT 的 J-machine。
1.8 简述并行计算机的访存模型
答:1)均匀存储访问模型(UMA)
2)非均匀存储访问模型(NUMA)
3)全高速缓存存储访问模型(COMA)
4)高速缓存一致性非均匀访问模型(CC-NUMA)
1.9 简述均匀存储访问模型的特点
答:1)物理存储器被所有处理器均匀共享。
2)所有处理器访问任何存储字的时间相同。
3)每台处理器可带私有高速缓存。
4)外围设备也可以一定的形式共享。
1.10 简述非均匀存储访问模型的特点
答:1)被共享的存储器在物理上分布在所有的处理器中,其所有的本地存储器的集合构成
了全局的地址空间。
2)处理器访问存储器的时间不一样。
3)每台处理器可带私有高速缓存,外备也可以某种的形式共享。
第二章 性能评测
2.1 使用 40MHZ 主频的标量处理器执行一个典型测试程序,其所执行的指令数及所需的周
期数如表 2.13 所示。试计算执行该程序的有效 CPI、MIPS 速率及总的 CPU 执行时间。
解:CPI=total cycles / total instructions
=(45000*1+32000*2+15000*2+8000*2)/(45000+32000+15000+8000)
=1.55
MIPS=时钟频率 / (CPI*10
6
)=(40*10
6
) / (1.55*10
6
)=25.8
CPU 执行时间= total cycles /时钟频率=0.00375s
2.2 欲在 40MHZ 主频的标量处理器上执行 20 万条目标代码指令程序。假定该程序中含有 4
种主要类型之指令,各指令所占的比例及 CPI 数如表 2.14 所示,试计算:
①在单处理机上执行该程序的平均 CPI。
②由①所得结果,计算相应的 MIPS 速率。
解:(1)CPI=1*60%+2*18%+4*12%+8*10%
=2.12
(2)MIPS=时钟频率 / (CPI*10
6
)= (40*10
6
) / (2.12*10
6
)=18.9
2.1 2.3 已知 SP2 并行计算机的通信开销表达式为:t(m)=46+(0.035)m ,试计算:
①渐近带宽 r
∞
=?
②半峰值信息长度 = ? [提示:t
o
=46μs]
解:(1)渐近带宽 r
∞
=1 / 0.035=28.6MB/S
(2) 半峰值消息长度 m
1/2
=to* r
∞
=46us*28.6MB/S=1315.6B
2.4 并行机性能评测的意义。
答:意义有:
1)发挥并行机长处,提高并行机的使用效率。
![](https://csdnimg.cn/release/download_crawler_static/88954417/bg3.jpg)
编辑版 word
2)减少用户购机盲目性,降低投资风险 。
3)改进系统结构设计,提高机器的性能 。
4)促进软/硬件结合,合理功能划分 。
5)优化 “结构-算法-应用”的最佳组合。
6)提供客观、公正的评价并行机的标准。
2.5 如何进行并行机性能评测
答:1)机器级性能评测:CPU 和存储器的某些基本性能指标;并行和通信开销分析;并行
机的可用性与好用性以及机器成本、价格与性/价比。
2)算法级性能评测:加速比、效率、扩展性。
3)程序级性能评测:Benchmark。
2.6 简述 Gustafson 定律的出发点
答:1)对于很多大型计算,精度要求很高,即在此类应用中精度是个关键因素,而计算时
间是固定不变的。此时为了提高精度,必须加大计算量,相应地亦必须增多处理器数才能维
持时间不变。
2)除非学术研究,在实际应用中没有必要固定工作负载而计算程序运行在不同数目的
处理器上,增多处理器必须相应地增大问题规模才有实际意义。
2.7 已知一程序可并行代码占比例为 80%,将其在有 10 个处理器的系统中运行,求其加速
比?并求其极限加速比?并分析其结构带来的影响
解:加速比=1/(20%+80%/10)=1/(0.2+0.08)=3.57。
极限加速比,即处理器个数无穷大的时候呈现的加速比=1/20%=5。
这个极限加速比,换个角度说是,Amdahl 定律在很长一段时间影响了人们对开发并行
计算机的信心,对于本例,因为就算你把处理器做到无穷也只能得到 5 倍的加速比,同时有
一点更明显,就是处理器数目增加到一定程度后,加速比的增长非常缓慢。
2.8 简述影响加速的因素
答:1)求解问题中的串行分量。
2)并行处理器所引起的额外开销。
3)加大的处理器数超过的算法的并发程度。
2.9 为什么增加问题规模可以在一定程度提高加速
答:1)较大的问题规模可提高较大的并发度。
2)额外开销的增加可能慢于有效计算的增加。
3)算法中串行分量的比例不是固定不变的。
2.10 进行可扩放行研究的主要意义
答:1)确定解决某类问题用某类并行算法和某类并行体系结构结合,可以有效的利用大量
的处理器。
2)对于运行于某种体系结构的并行机的某种算法当移到大规模处理机上的性能。
3)对于某类固定规模的问题,确定在某类并行机上的最优处理器数目和最大的加速比。
4)用于指导改进并行算法和并行体系结构,以使并行算法能尽可能充分利用可扩充的。
大量的处理器。
第三章 互连网络
3.1 对于一颗 K 级二叉树(根为 0 级,叶为 k-1 级),共有 N=2^k-1 个节点,当推广至 m-元
树时(即每个非叶节点有 m 个子节点)时,试写出总节点数 N 的表达式。
答:
推广至 M 元树时,k 级 M 元树总结点数 N 的表达式为:
N=1+m^1+m^2+...+m^(k-1)=(1-m^k)*1/(1-m);
剩余16页未读,继续阅读
资源评论
![avatar-default](https://csdnimg.cn/release/downloadcmsfe/public/img/lazyLogo2.1882d7f4.png)
![avatar](https://profile-avatar.csdnimg.cn/451f5792121d424eb7995705fa13f06d_qq_55930097.jpg!1)
会举重的薯片
- 粉丝: 2966
- 资源: 21
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![voice](https://csdnimg.cn/release/downloadcmsfe/public/img/voice.245cc511.png)
![center-task](https://csdnimg.cn/release/downloadcmsfe/public/img/center-task.c2eda91a.png)
安全验证
文档复制为VIP权益,开通VIP直接复制
![dialog-icon](https://csdnimg.cn/release/downloadcmsfe/public/img/green-success.6a4acb44.png)