没有合适的资源?快使用搜索试试~ 我知道了~
自动化专业英文文献翻译2.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 48 浏览量
2023-09-22
13:24:34
上传
评论 1
收藏 64KB DOCX 举报
温馨提示
试读
37页
自动化专业英文文献翻译2.docx
资源推荐
资源详情
资源评论
西 南 交 通 大 学
毕业设计(英文翻译)
节能型机房温湿度远程控制系统测控节点设
计
年 级:
学 号:
姓 名:
专 业:
指导老师:
二零一一年六月
Mosix
Mosix 修改 bsdi 上的 BSD/ OS 来提供电脑上的跨网络的动态负载平衡组和先发
制人进程迁移。这是不错的东西,不只是为并行处理,但对于通常使用一个集群很像
一 个 可 扩 展 的 SMP 。 是 否 有 Linux 版 本 ? 详 细 信 息 , 请 看
http://www.cs.huji.ac.il/mosix/。
NOW (工作站网络)
伯克利工作站网络项目,http://now.cs.berkeley.edu/,已经极大地推广了并行计算
中使用工作站网络,这里还有很多工作在进行中,都致力于“在未来几年内展示一个
实际的 100 处理器系统”。唉,他们不使用 linux。
并行处理使用 linux
并行处理使用 Linux WWW 站点,http://aggregate.org/LDP/,是这些指南和许多相
关文件包括为全日制量身订造的在线幻灯片的家园。除了在报纸项目上,普渡大学电
机与计算机工程系已经是并行处理的领先者,这个网站的设立是为了帮助别人申请并
行处理的 Linux 电脑。
自从普渡大学的第一组 Linux 个人电脑在 1994 年 2 月组装以来,已经诞生了许
多的 Linux PC 集群,有些还包括视频墙。然而这些集群使用 386,486 和奔腾系统
(没有奔腾 Pro 系统),英特尔最近获得普渡大学的捐赠,将允许它的奔腾 II 系统构
建多个大型集群(与单个群集计划多达 165 机)。并且这些集群都将有论文网,也具
有最传统的网络。
奔腾 Pro 集群研讨会
1997
年,
4
月
10-11
日,埃姆斯实验室在得梅因,爱荷华州举行了奔腾
Pro
集群
研 讨 会 。
WWW
在 本 次 研 讨 会 ,
http://www.scl.ameslab.gov/workshops/PPCworkshop.html
,从云集的参加者中收集了很
多丰富的
PC
集群信息。
TreadMarks 帝斯曼(分布式共享内存)
帝斯曼(分布式共享内存)是一种技术,即一个消息传递系统可以出现的行为作
为一个 SMP。有不少这样的系统,其中大部分使用 OS 页故障触发消息传输机制。
TreadMarks,http://www.cs.rice.edu/~willy/TreadMarks/overview.html,是这种系统更有
效地之一,并在 Linux 集群上运行。坏消息是“TreadMarks”正在由一个小成本的大
学和非盈利机构的分配。欲了解更多有关该软件,请联系 treadmarks@ece.rice.edu 信
息。
U 型网 (用户级网络接口架构)
U 型 网 ( 用 户 级 网 络 接 口 架 构 ) 在 康 奈 尔 大 学 ,
http://www2.cs.cornell.edu/U-Net/Default.html,项目试图提供低延迟,高带宽的网络硬
件使用商品由虚拟的网络接口,以便应用程序可以发送和接收邮件没有作业系统的干
预。在 Linux 上运行的 U 型网,使用 DECchip DC21140 的快速以太网卡或前置系统
的主成分- 200(不常设仲裁法院-200E)ATM 卡。
WWT (威斯康星风洞)
的确有相当多集群相关的工作在威斯康星州。该 WWT 的(威斯康星风洞)项目,
http://www.cs.wisc.edu/~wwt/,正在致力于对发展的“标准”之间的并行编译器和底
层硬件接口各项工作。还有就是威斯康星牛(集群工作站),合作共享内存和暴风雨
的 Paradyn 并行性能工具等,不幸的是关于 Linux 的不是很多。
4. 在 A 寄存器的 SIMD (例如,使用 MMX 公司)
在 A 寄存器的 SIMD(单指令流多数据流)(SWAR)并不是一个新想法。给定
一个有 k 位寄存器,数据路径和功能单元机,人们早已知道,普通的寄存器操作可以
像 SIMD 一样并行操作 n,n/k 位,整数字段值。然而,这只是由于对多媒体最近有
SIMD 推动的 2 倍到 8 倍加速技术已成为主流计算的关注。大多数微处理器 1997 的
版本包括硬件 SWAR 支持:
AMD 的 K6 型 MMX 公司(多媒体扩展)
Cyrix 的货币供应 M2 MMX 公司(多媒体扩展)
数字 Alpha 马克斯(多媒体扩展)
惠普的 PA - RISC 的最大(多媒体加速扩展)
英特尔奔腾 II 和奔腾 MMX 公司与(多媒体扩展)
Microunity Mediaprocessor SIGD(单一数据组指令上)
MIPS 的数字媒体扩展(MDMX,发音疯狂的麦克斯)
的 Sun SPARC V9 的 VIS(视觉指令集)
还有一些新的微处理器提供了一个由硬件支持的几洞,怪癖像场大小只支持一些
操作一些。 重要的是要记住,但是,你不需要任何 SWAR 经营的硬件有效的支持。
例如,位操作是不会被寄存器逻辑分区影响的。
4.1 SWAR:有什么优势?
虽然每个现代处理器至少具有一些并行执行能力的 SWAR,不幸的是,即使是最
好的 SWAR 增强指令集不支持非常通用并行。事实上,许多人已经意识到,奔腾与
“带 MMX 技术的奔腾”之间性能上的差异通常都是由巨大的 L1 缓存存在 MMX 造
成的。因此,实际上,什么是 SWAR(或 MMX)的优势呢?
仅整数,越小越好。 两个 32 位值可安装在 64 位 MMX 寄存器,但这样做的八
单字节字符,更或者是一个完整的国际象棋板上的一位。注:将会有一个浮点版本的
MMX , 虽 然 在 此 篇 文 章 中 很 少 提 及 。 Cyrix 已 经 发 布 了 一 些 幻 灯 片 ,
ftp://ftp.cyrix.com/developr/mpf97rm.pdf
其中包括一些 MMFP 的评论。显然,MMFP 将支持两个 32 位浮点数字装入到一
个 64 位的 MMX 寄存器,结合这两个 MMFP 管道将产生四个单精度每时钟触发器。
SIMD 或向量式并行。相同的操作同事应用到各个领域。有许多办法来废止选定
域的作用(即相当于掩蔽的 SIMD),但它会带来更为复杂的编码和性能的损害。
本地化,有规律的(完美的包装),内存参考模式。SWAR 在一般情况下,特别
是 MMX,在随机存取方面很可怕;聚集一个相当昂贵的 x[y]向量(其中 y 是一个索
引阵列)。
这些都是严重的限制,但这种类型的并行算法,发生在许多并行而不只是多媒体
应用。对于算法的正确类型,SWAR 比 SMP 或并行群集更效率得多,而且它不需要
任何费用。
4.2 SWAR 编程导论
SWAR 的基本概念,在 A 寄存器里的 SIMD,是指在字长寄存器的操作能被用
于加速由 SIMD 在 n,k/n 位表上的操作运算。然而,使用 SWAR 技术可能会难以处
理,并且一些 SWAR 操作确实比串行序列比昂贵的多,因为他们需要额外的指令以
执行实地划分。
为了说明这一点,让我们考虑一个大大简化的 SWAR 模型,管理每一个 32 位寄
存器里的 4 个 8 位字段。两个寄存器中的值可以表示为:
PE3 PE2 PE1 PE0
+-------+-------+-------+-------+
Reg0 | D 7:0 | C 7:0 | B 7:0 | A 7:0 |
+-------+-------+-------+-------+
Reg1 | H 7:0 | G 7:0 | F 7:0 | E 7:0 |
+-------+-------+-------+-------+
这个模型表明每一个寄存器都被有必要地视为一个包含 4 个独立的 8 位整型的
向量。另外,把 A 和 E 作为 Reg0 和 Reg1 来处理元素 0(PE0),把 B 和 F 视为 PE1
的寄存器,等等。
本文档的其余部分简要回顾这些整数向量的 SIMD 并行操作的基本类型如何将
这些功能都可以实现。
多态操作
有些 SWAR 操作可以很一般地使用普通的 32 位整型操作,而不必担心这个操作
是真的打算在这些 8 位的字段上并行操作。我们呼吁任何 SWAR 操作多态性,因为
该功能并未受到字段类型(大小)的影响。
测试如果任何字段是非零是多态的,因为都是按位逻辑运算。例如,一个普通的
位与操作(C 的&操作符)执行按位与,无论这个字段的大小。一个简单的寄存器位
与实例如下:
PE3 PE2 PE1 PE0
剩余36页未读,继续阅读
资源评论
南抖北快东卫
- 粉丝: 72
- 资源: 5584
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功