并行体系结构(陈国良版)课后答案资源-CSDN文库

计算机课程

需积分: 5 97 浏览量 2024-03-13 01:13:53 上传评论收藏 539KB DOC 举报

资源推荐

资源详情

资源评论

编辑版 word

习题设计

计划

1．指导思想

　　要求学生理解高端并行计算机系统设计技术，高端 MPP、

DSM、CLUSTER 等大规模并行计算机的关键设计理论和实现技

术，包括互连网络技术、存储架构和高可用技术等。为此，必须

用适量的作业、习题，启发学生独立思考以及熟练掌握一些基础

知识和基本技能。

2．作业安排

　　本教材每一章都附有大量的习题，根据教学进度和学时，合

理选择书上习题，以达到进一步加深理解课堂讲授的内容。每一

章讲授结束，收一次作业，给出成绩，并作一次集体答疑，讲解

作业中的共性问题。作业成绩记入总成绩内。

第一章绪论

1.1 什么是并行计算机？

答：简单地讲，并行计算机就是由多个处理单元组成的计算机系统，这些处理单元相互通信

和协作，能快速高效求解大型的复杂的问题。

1.2 简述 Flynn 分类法：

答：根据指令流和数据流的多重性将计算机分为：

1）单指令单数据流 SISD

2）单指令多数据流 SIMD

3）多指令单数据流 MISD

4）多指令多数据流 MIMD

1.3 简述当代的并行机系统

答：当代并行机系统主要有：

1）并行向量机（PVP）

2）对称多处理机（SMP）

3）大规模并行处理机（MPP）

4）分布式共享存储（DSM）处理机

5）工作站机群（COW）

1.4 为什么需要并行计算机？

答：1）加快计算速度

2）提高计算精度

3）满足快速时效要求

4）进行无法替代的模拟计算

1.5 简述处理器并行度的发展趋势

答：1）位级并行

2）指令级并行

3）线程级并行

1.6 简述 SIMD 阵列机的特点

答：1）它是使用资源重复的方法来开拓计算问题空间的并行性。

2）所有的处理单元（PE）必须是同步的。

3）阵列机的研究必须与并行算法紧密结合，这样才能提高效率。

编辑版 word

4）阵列机是一种专用的计算机，用于处理一些专门的问题。

1.7 简述多计算机系统的演变

答：分为三个阶段：

1）1983-1987 年为第一代，代表机器有：Ipsc/1、Ameteks/14 等。

2）1988-1992 年为第二代，代表机器有：Paragon、Intel delta 等。

3）1993-1997 年为第三代，代表机器有：MIT 的 J-machine。

1.8 简述并行计算机的访存模型

答：1）均匀存储访问模型（UMA）

2）非均匀存储访问模型（NUMA）

3）全高速缓存存储访问模型（COMA）

4）高速缓存一致性非均匀访问模型（CC-NUMA）

1.9 简述均匀存储访问模型的特点

答：1）物理存储器被所有处理器均匀共享。

2）所有处理器访问任何存储字的时间相同。

3）每台处理器可带私有高速缓存。

4）外围设备也可以一定的形式共享。

1.10 简述非均匀存储访问模型的特点

答：1）被共享的存储器在物理上分布在所有的处理器中，其所有的本地存储器的集合构成

了全局的地址空间。

2）处理器访问存储器的时间不一样。

3）每台处理器可带私有高速缓存，外备也可以某种的形式共享。

第二章性能评测

2.1 使用 40MHZ 主频的标量处理器执行一个典型测试程序，其所执行的指令数及所需的周

期数如表 2.13 所示。试计算执行该程序的有效 CPI、MIPS 速率及总的 CPU 执行时间。

解：CPI=total cycles / total instructions

=（45000*1+32000*2+15000*2+8000*2）/（45000+32000+15000+8000）

=1.55

MIPS=时钟频率 / (CPI*10

)=(40*10

) / (1.55*10

)=25.8

CPU 执行时间= total cycles /时钟频率=0.00375s

2.2 欲在 40MHZ 主频的标量处理器上执行 20 万条目标代码指令程序。假定该程序中含有 4

种主要类型之指令，各指令所占的比例及 CPI 数如表 2.14 所示，试计算：

①在单处理机上执行该程序的平均 CPI。

②由①所得结果，计算相应的 MIPS 速率。

解：（1）CPI=1*60%+2*18%+4*12%+8*10%

=2.12

（2）MIPS=时钟频率 / (CPI*10

)= (40*10

) / (2.12*10

)=18.9

2.1 2.3 已知 SP2 并行计算机的通信开销表达式为：t（m）=46+（0.035）m ，试计算：

①渐近带宽 r

∞

②半峰值信息长度 = ? [提示：t

=46μs]

解：（1）渐近带宽 r

∞

=1 / 0.035=28.6MB/S

(2) 半峰值消息长度 m

1/2

=to* r

∞

=46us*28.6MB/S=1315.6B

2.4 并行机性能评测的意义。

答：意义有：

1）发挥并行机长处，提高并行机的使用效率。

编辑版 word

2）减少用户购机盲目性，降低投资风险。

3）改进系统结构设计，提高机器的性能。

4）促进软/硬件结合，合理功能划分。

5）优化 “结构-算法-应用”的最佳组合。

6）提供客观、公正的评价并行机的标准。

2.5 如何进行并行机性能评测

答：1）机器级性能评测：CPU 和存储器的某些基本性能指标；并行和通信开销分析；并行

机的可用性与好用性以及机器成本、价格与性/价比。

2）算法级性能评测：加速比、效率、扩展性。

3）程序级性能评测：Benchmark。

2.6 简述 Gustafson 定律的出发点

答：1）对于很多大型计算，精度要求很高，即在此类应用中精度是个关键因素，而计算时

间是固定不变的。此时为了提高精度，必须加大计算量，相应地亦必须增多处理器数才能维

持时间不变。

2）除非学术研究，在实际应用中没有必要固定工作负载而计算程序运行在不同数目的

处理器上，增多处理器必须相应地增大问题规模才有实际意义。

2.7 已知一程序可并行代码占比例为 80%，将其在有 10 个处理器的系统中运行，求其加速

比？并求其极限加速比？并分析其结构带来的影响

解：加速比=1/(20%+80%/10)=1/(0.2+0.08)=3.57。

极限加速比，即处理器个数无穷大的时候呈现的加速比=1/20%=5。

这个极限加速比，换个角度说是，Amdahl 定律在很长一段时间影响了人们对开发并行

计算机的信心，对于本例，因为就算你把处理器做到无穷也只能得到 5 倍的加速比，同时有

一点更明显，就是处理器数目增加到一定程度后，加速比的增长非常缓慢。

2.8 简述影响加速的因素

答：1）求解问题中的串行分量。

2）并行处理器所引起的额外开销。

3）加大的处理器数超过的算法的并发程度。

2.9 为什么增加问题规模可以在一定程度提高加速

答：1）较大的问题规模可提高较大的并发度。

2）额外开销的增加可能慢于有效计算的增加。

3）算法中串行分量的比例不是固定不变的。

2.10 进行可扩放行研究的主要意义

答：1）确定解决某类问题用某类并行算法和某类并行体系结构结合，可以有效的利用大量

的处理器。

2）对于运行于某种体系结构的并行机的某种算法当移到大规模处理机上的性能。

3）对于某类固定规模的问题，确定在某类并行机上的最优处理器数目和最大的加速比。

4）用于指导改进并行算法和并行体系结构，以使并行算法能尽可能充分利用可扩充的。

大量的处理器。

第三章互连网络

3.1 对于一颗 K 级二叉树（根为 0 级，叶为 k-1 级），共有 N=2^k-1 个节点，当推广至 m-元

树时（即每个非叶节点有 m 个子节点）时，试写出总节点数 N 的表达式。

答：

推广至 M 元树时，k 级 M 元树总结点数 N 的表达式为：

N=1+m^1+m^2+...+m^（k-1）=(1-m^k)*1/(1-m);

剩余16页未读，继续阅读

评论收藏

内容反馈

会举重的薯片

粉丝: 2966
资源: 21

并行体系结构(陈国良版)课后答案

[并行计算——结构·算法·编程].陈国良.文字版

并行计算机体系结构-硬件-软件方法.pdf

陈国良并行计算机体系结构

并行计算机体系结构.zip

并行多核体系结构基础_课后习题

并行计算体系结构(陈国良版)课后答案

并行计算(陈国良版)课后答案.pdf

计算机体系结构量化分析第六版课后答案

并行计算——结构·算法·编程习题答案

并行程序设计导论课后答案_2.7z

计算机体系结构课后习题-部分答案.pdf

《并行计算》电子版 陈国良编写

并行程序设计导论课后答案（英文版含代码）

并行算法实践 陈国良版

计算机体系结构课后习题原版答案

计算机系统结构张晨曦版课后答案.pdf

计算机体系结构试题及答案

计算机体系结构课后答案

相关实用应用程序（Windows可用）

李飞飞自传 我看见的世界 The World I see

ChatGPT使用总结：150个ChatGPT提示词模板（完整版）

chromedriver-win64.zip

全国计算机二级WPSoffice精选350道选择题题库（含答案）.pdf

哈尔滨工业大学-ChatGPT调研报告-2023.3.6-94页.pdf

智联招聘：2024年大学生就业力调研报告.pdf

4个亲测好用的ChatGPT4渠道

AI大模型-基于深度学习的神经网络模型语言模型图像识别自然语言处理

学术海报模板+论文科研+研究生

北森能力测评题库.zip

最新资源

《并行计算》电子版陈国良编写

并行算法实践陈国良版

李飞飞自传我看见的世界 The World I see