没有合适的资源?快使用搜索试试~ 我知道了~
第六章 并行处理机和互联网络6.1 并行处理机的原理并行处理机是并行处理计算机中的一种重要结构, 它主要通过资源重复实现同时性并行。并行处理 机也 称为 阵列处
资源详情
资源评论
资源推荐
第六章 并行处理机和互联网络
6.1 并行处理机的原理
并行处理机是并行处理计算机中的一种重要结构, 它主要通过资源重复实现同时性并行。
并行处理 机也 称为 阵列处理机。
6.1.1 并行处理机的定义及特点
1. 并行处理机定义:
重复设置多个同样的处理单元(PE),并将它们按照 一定方式互相连接,在统
一的控制部件(CU) 作用下,各自对分配的数据并行地完成同一条指令所规定
的操作,实现操作级并行的 SIMD 计算机。
2. 并行处理机由五个部分组成:
一个控制器 CU 、多个处理单元 PE 、多个存储器模块 M 、一个互连网络 ICN、
一台输入输出处理机 IOP
�从 CU 看,指令是串行执行的。
�从 PE 看,数据是并行处理的。
3. 并行处理机的主要特点:
速度快、模块性好、可靠性高、效率低(与流水线、向量处理机相比)、依赖互
连网络和并行算法、需要有高性能的标量处理机。
�
a) 速度快 ,而且潜力大
b) 模块性好 ,生产和维护方便。
c) 可靠性高 ,容易实现容错和重构。
d) 效率低 (与流水线处理机、向量处理机等比较)。通常作为 专用计算机 ,
因此,在很大程度上依赖于并行算法。
e) 依赖于互连网络和并行算法。互连网络决定了 PE 之间的连接模式,也决
定了并行处理机能够适应的算法。
f) 需要有一台高性能的标量处理机。使向量计算与标量计算平衡。
6.1.2 阵列处理机基本构形与特点
1. 根据存储器组成方式的不同 阵列处理有 两种基本构形:
�分布式存储器 的阵列处理机 集中式共享存储器 的阵列处理机
2. 分布式存储器的阵列处理机:
a) 每个 PE 有自己的局部存储器 PEM;PEM 只能被本 PE 访问;
b) 整个系统在 CU 控制下运行;
c) 所有指令都在CU 中译码。译码后把适合于并行处理的向量类指令“播送”给各个 PE,
让处于“活跃”的那些 PE 并行地执行。因此 CU 中的指令基本上是单指令流;
d) CU 也可以采用流水线工作方式 进一步让多条向量指令在时间上重叠执行;
e) 为了有效地对向量数据进行高速处理要求能把数据合理地预分配到各个 PEM 中;
PE 之间通过互连网络 ICN 来交换数据
f) 这种构形是 SIMD 的主流
�比较容易构成 MPP(Massively Parallel Processor),几十万个 PE。
�必须依靠并行算法来提高 PE 的利用率。因此,应用领域很有限。
3. 集中式共享存储器的阵列处理机
a) 与分布式存储器的阵列处理机相比 有两处不同 :
i. 系统存储器由 K 个存储体构成 经互连网络 ICN 为全部 N 个 PE 所共享 。
为使各个 PE 对长度为 N 向量的各个元素同时处理存储体数 K 应等于或大
于 PE 数 N 即 K>=N 。 为避免访存冲突 需要合适的算法将数据合理地分
配到各个存储体中.
ii. ICN 的作用不同 。 ICN 用于在 PE 和 MM 之间构建数据通路 使各个 PE
可以高速 、灵活 、 动态地 与不同的存储体相连 。 因此有时被称为 对准
网络
4. 阵列处理机的特点:�
a) 阵列机以单指令流多数据流方式工作。
b) 阵列机采用资源重复方法引入空间因素.即在系统中设置多个相同的处
理单元来实现并行性 这与利用时间重叠的向量流水处理机是不一样的 。
此外 阵列机利用并行性中的同时性 所有处理单元必须同时进行相同的
操作 。
c) 它使用简单而规整的 ICN 来确定 PE 之间的连接模式。ICN 限定了并行处
理机适用的解题算法的类型,也对整个系统的性能产生明显影响。因此
ICN 是设计重点。
d) 阵列机是以某一类算法(如图像处理)为背景的专用计算机。这是由于
阵列机中通常都采用简单、规整的互连网络来实现处理单元间的连接操
作,从而限定了其所适用的求解算法类别。
e) 阵列机的研究必须与并行算法的研究密切结合,以使其求解算法的适应
性更强一些,应用面更广一些。
f) 从处理单元来看 由于结构都相同因而可将阵列机看成是一个同构型并
行机。但其控制器实质上是一个标量处理机而为了完成 I/O 操作及操作
系统管理尚需一个前端机。因此实际的阵列机系统是由上述三部分构成
的一个异构型多处理机系统。
6.2 阵列处理机的并行性算法
ILLIAC IV 是最先采用 SIMD 结构的并行机。
ILLIAC IV 组成: �ILLIAC IV 阵列 及 ILLIAC IV 输入输出系统
ILLIAC IV 是由 3 种类型处理及组成的多机系统:
专门对付数组运算的 处理单元阵列 (processing element array)
阵列控制器 (array control unit),它既是处理单元阵列的控制部分,又可以视为一
台相对独立的小型标量处理机;�
一台 标准的 Burroughs B6700 计算机 ,担负 ILLIACIV 输入 输出系统和操作系
统管理功能。
累加和: log2N 次加法,加速比 N/log2N.( 这种方法也称为 级联求和 或 递归求和 。
�与流水线中采用的方法相同, 它利用结合律来提高并行度。)
SIMD 与向量计算机的区别
6.3 互连网络的基本概念
ICN 限定了并行处理机适用的解题算法的类型,也对整个系统的性能产生明显影响
�ICN 结构复杂性:反映成本
�ICN 结构灵活性:反映性能
6.3.1 互连网络的设计目标与互连函数
1. 互连网络的定义(ICN): 互连网络是一种由开关元件按照一定的拓扑结构和控制方式
构成的网络,用来实现计算机系统内部多个处理机或多个功能部件之间的相互连接。
2. 互连网络的作用:
用来实现计算机系统内部多个处理机或多个功能部件之间的相互连接。互连网络
已经成为并行处理系统的核心组成部分。对整个计算机系统的性价比有决定性影
响。
3. 互连网络的表示方法:
(1)互连函数表示法
(2)图形表示法
(3)输入输出对应表示法
4. 互连网络的主要特性(互连网络是设计重点!)
(1)网络规模:网络中结点个数
(2)结点度:与结点相连接的边数(=入度+出度)
剩余16页未读,继续阅读
无声远望
- 粉丝: 52
- 资源: 298
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0