没有合适的资源?快使用搜索试试~ 我知道了~
分布式并行绘制集群节点可以配置多核CPU和多个GPU构建节点内多CPU多GPU系统。现有的节点内并行绘制模型既没有充分发挥多核CPU的强大计算能力,还将绘制、读回和合成阶段串行耦合在一起导致了大量的GPU闲置停顿,严重影响了节点内并行绘制性能。提出了一种节点内高效的并行绘制模型,通过软件绘制与硬件绘制相结合的方法将硬件绘制与图像合成分离,同时利用DMA异步传输机制,构建了节点内绘制、读回和合成三段并行绘制流水线。与现有节点内并行绘制模型相比,并行混合绘制模型不但降低GPU资源闲置率,而且提高了CPU资源使用率。理论分析与实验表明相同应用采用并行混合绘制模型的性能可以达到现有模型的3~4倍,并且具有更好的数据扩展性、性能扩展性。
资源推荐
资源详情
资源评论
第 24 卷第 1 期
系统仿真学报©
Vol. 24 No. 1
2012 年 1 月 Journal of System Simulation Jan., 2012
面向多核 CPU 多 GPU 的节点内并行混合绘制模型
刘华海,王攀,蔡勋,曾亮,王文珂,李思昆
(国防科学技术大学 计算机学院,长沙 410073)
摘 要:分布式并行绘制集群节点可以配置多核 CPU 和多个 GPU 构建节点内多 CPU 多 GPU 系统。
现有的节点内并行绘制模型既没有充分发挥多核 CPU 的强大计算能力,还将绘制、读回和合成阶
段串行耦合在一起导致了大量的 GPU 闲置停顿,严重影响了节点内并行绘制性能。文章提出了一
种节点内高效的并行绘制模型,通过软件绘制与硬件绘制相结合的方法将硬件绘制与图像合成分
离,同时利用 DMA 异步传输机制,构建了节点内绘制、读回和合成三段并行绘制流水线。与现有
节点内并行绘制模型相比,并行混合绘制模型不但降低 GPU 资源闲置率,而且提高了 CPU 资源使
用率。理论分析与实验表明相同应用采用并行混合绘制模型的性能可以达到现有模型的 3~4 倍,并且具有更好的数
据扩展性、性能扩展性。
关键词: Multi-GPU;Multi-CPU;分布式并行绘制;异步合成;DMA
中图分类号:TP391.4 文献标识码:A 文章编号:1004-731X (2012) 01
Hybrid Rendering Model for Multi-CPU Multi-GPU Distributed Parallel
Rendering Cluster Node
Huahai Liu, Pan Wang, Xun Cai, Liang Zeng, Kewen Wang, Sikun Li
(College of Computer Science and Technology, National University of Defense Technology, Changsha, 410073)
Abstract: Distributed parallel rendering cluster nodes can accommodate multi-core CPU and multi-GPU. But the
present parallel rendering models of node do not full use the multi-core CPU computing power and serially join the
rendering, readback and composition stages together. This damages system performance and frequently makes GPUs
stall. In this paper, we introduce a novel efficient parallel rendering model. It decouples the hardware rendering and
composition stage with hybrid rendering. With asynchronous DMA transfer, we construct a parallel rendering pipeline
with the three stages in one node. Comparing with the present models, our model not only decreases GPU stall and
improves the multi-core CPU usage. Theoretical analysis and experiment results show that our model performance is
3~4 times of the presents model and has much better data and performance scalability.
Key word: multi-GPU; multi-CPU; asynchronous composition; DMA; distributed parallel rendering;
引 言
∗
当前分布式并行绘制节点可以配置多核 CPU 和多个
显卡构建节点内多 CPU 多 GPU 并行绘制系统。系统内的
每个计算单元都具有强大的计算能力,许多研究和应用表
明,充分发挥节点内多 CPU 和多 GPU 协同计算性能,既
是提高单机图形绘制效率的有效技术途径,又是构建大规
基金项目:国家“973”项目资助(2009CB723803), 国家自然科学基金
项目资助(61170157)。
作者简介:刘华海(1983-),男,山东人,博士生,研究方向为科学计算可
视化;王攀(1977-),男,内蒙古人,博士生,研究方向为科学计算可视化;
李思昆(1941-),男,山东人,教授,博士生导师,研究方向为虚拟现实与
可视化,嵌入式系统与 SoC 设计方法学等.
模复杂场景高效分布式并行绘制系统的重要基础
[1]
。采用
易配置、可扩展、高效能的节点内并行绘制模型则是绘制
系统充分发挥和提高节点计算能力前提和关键。
传统的并行绘制模型并不能充分发挥节点内多核
CPU 和多 GPU 的计算能力。一方面受当时 CPU 计算能力
和体系结构的限制,系统节点内 CPU 计算资源较少,绘
制模型研究并未考虑节点内多核 CPU 强大的并行计算能
力。另一方面受当时 GPU 体系结构和接口带宽的限制,
传统分布式并行绘制系统节点内一般只配置一个 GPU,绘
制模型并没有考虑节点内多 GPU 并行绘制问题。当前的
大多数并行绘制系统都采用了传统的并行绘制系统模型,
http:∥www.china-simulation.com
• 79 •
资源评论
weixin_38502916
- 粉丝: 2
- 资源: 942
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- CMake 入门实战的源代码
- c7383c5d0009dfc59e9edf595bb0bcd0.zip
- 柯尼卡美能达Bizhub C266打印机驱动下载
- java游戏之我当皇帝那些年.zip开发资料
- 基于Matlab的汉明码(Hamming Code)纠错传输以及交织编码(Interleaved coding)仿真.zip
- 中国省级新质生产力发展指数数据(任宇新版本)2010-2023年.txt
- 基于Matlab的2Q-FSK移频键控通信系统仿真.zip
- 使用C++实现的常见算法
- travel-web-springboot【程序员VIP专用】.zip
- 基于Matlab, ConvergeCase中部分2D结果文件输出至EXCEL中 能力有限,代码和功能极其简陋.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功