支持OpenCL的嵌入式DSP并行系统研究.pdf

所需积分/C币:28 2019-06-27 12:56:02 21.33MB PDF
76
收藏 收藏
举报

支持OpenCL的嵌入式DSP并行系统研究,文章里面涉及了一个基于openCL的DSP并行系统研究。
Research on Embedded DSP Parallel System Supporting Open cl A Dissertation Submitted for the Degree of Doctor of Philosophy Candidate: Tian Li Supervisor: Prof Zhou Fugen Vice-Supervisor: Associate Prof Meng Cai School of astronautics Beihang University, Beijing, China 中图分类号:TP391 论文编号:10006BY1015133 博士学位论文 支持 Open Cl的嵌入式DSP并行系统研究 作者姓名 田立 申请学位级别工学博士 指导教师姓名周付根 职称 教授 学科专业模式识别与智能系统 研究方向多DSP并行图像处理 学习时间自2010年9月1日 起至 年月日止 论文提交日期年月日 论文答辩日期年月日 学位授予单位北京航空航天大学 学位授予日期年月日 关于学位论文的独创性声明 本人郑重声明:所呈交的论文是本人在指导教师指导下独立进行研究工作所取得的 成果,论文中有关资料和数据是实事求是的。尽我所知,除文中已经加以标注和致谢外, 本论文不包含其他人已经发表或撰写的研究成果,也不包含本人或他人为获得北京航空 航天大学或其它教育机构的学位或学历证书而使用过的材料。与我一同工作的同志对研 究所做的任何贡献均已在论文中作出了明确的说明。 若有不实之处,本人愿意承担相关法律责任 学位论文作者签名: 日期: 年月日 学位论文使用授权书 本人完全同意北京航空航天大学有权使用本学位论文(包括但不限于其印刷版 和电子版,使用方式包择不限于:保留学位论文,按规定向国家有关部门(机构 送交学位论文,以学术交流为自的赠送和交换学位论文,允许学位论文被查阅、借 阅和复印,将学位论文的全部或部分内容编入有关数据库进行检索,采用影印、缩 印或其他复制手段保存学位论文。 保密学位论文在解密后的使用授权同上。 学位论文作者签名: 日期: 年月日 指导教师签名: 日期: 年月日 摘要 嵌入式DSP系统在预警探测、情报处理、精确制导等国防电子系统中具有重要作 用。但对于高帧频高分辨率视频的快速目标跟踪等应用场合,现有的单DSP系统已经 无法满足需求,需要硏究更为高效的并行处理系统。为解决数据传输低延迟和快速处理 的问题,论文基于T16678设计了可扩展的双多核DSP高速处理系统,利用SRIO完成 多处理器间的快速数据传输,实现了多DSP的高效并行处理。随着硬件复杂度的增加, 并行算法开发变得极为困难,为降低算法实现难度,论文还研究解决了多DSP系统对 Open CL并行编程模型的支持问题,提高了算法开发效率,同时显著提升了并行系统的 效能。 针对数据低延迟和快速处理的要求,论文设计了支持 OpenCL并行编程模型并可进 行板级互联的双T16678DSP并行处理系统,实现双DSP的多核并行处理,构成16核处 理器,通过ⅤPX和QSFP接口实现板级互连,可重构成Nx2T6678系统(N≤5),完成 Nx16核的并行处理。利用高速的SRIO链路实现多处理器间数据传输的低延迟;针对 OpenCL并行编程模型的支持需要,在系统设计中引入 PowerPC处理器作为hos(主控), 完成程序调度和加载;在多DSP核调度方式上采用引入FPGA,完成集中式调度,从而 在硬件设计上实现对 OpenCL并行编程模型的支持。 针对多处理器负载平衡问题, OpenCL的执行模型中采用了按细粒度动态调度的方 法,但一般由主控通过互连链路如sRIO来调度多个DSP,由于调度开销很大且链路延 迟不确定,从而影响调度效率。本文采用高效的FPGA作为中央调度器,以中断和总线 直接访问相结合的方式来调度多个DSP核,显著提高细粒度调度方法的效率,能够更 好保持负载平衡。 针对 OpenCL工作组内多个工作单元之间切换慢的问题,本文提出了增加二级调度 器的方法。通过研究DSP的C66内核并行结构,设计了运行于SYS/BIOS系统之上的 二级任务调度器,该调度器的切换效率是SYS/BIOS效率的6倍,显著提高了 OpenCL 工作单元切换效率和算法的执行效率 针对 OpenCL内核( kernel)不能在DSP上编译和加载的问题,本文利用开源编译 器LLⅤM实现源代码的转换,解决代码编译问题;通过增加代码产生模块提取内核中 的路障( Barrier)调用等信息,与底层运行库(Run- Time Library)配合,实现高效调度。 在内核程序加载上,设计了动态模块加载器,对 OpenCL内核中访问的全局符号和函数 地址进行重定位,解决了主机控制内核在设备上运行的问题。 最后本文对硬件系统及其 OpenCL支持进行了测试,首先用来自NVDA、AMD、 Parboil I以及NPB的测试算法进行测试验证,结果显示系统完全支持 OpenCl并能达到 比较高的加速比。其次,用基于BVH的三维渲染算法进行测试验证,通过双板互联在 共32个DSP核的系统中渲染1024*1024的图像,速度达到了1秒,比PC提高了30倍。 最后,用常用的互相关目标跟踪算法进行测试验证,对测试目标的跟踪能在2毫秒内完 成,满足500帧高帧频目标跟踪场景的要求 关键词:并行系统;多DSP并行系统; OpenCL;嵌入式 OpenCL;多处理器调度

...展开详情
试读 127P 支持OpenCL的嵌入式DSP并行系统研究.pdf
立即下载
限时抽奖 低至0.43元/次
身份认证后 购VIP低至7折
一个资源只可评论一次,评论内容不能少于5个字
您会向同学/朋友/同事推荐我们的CSDN下载吗?
谢谢参与!您的真实评价是我们改进的动力~
  • 签到新秀

  • 分享精英

关注 私信
上传资源赚钱or赚积分
最新推荐
支持OpenCL的嵌入式DSP并行系统研究.pdf 28积分/C币 立即下载
1/127
支持OpenCL的嵌入式DSP并行系统研究.pdf第1页
支持OpenCL的嵌入式DSP并行系统研究.pdf第2页
支持OpenCL的嵌入式DSP并行系统研究.pdf第3页
支持OpenCL的嵌入式DSP并行系统研究.pdf第4页
支持OpenCL的嵌入式DSP并行系统研究.pdf第5页
支持OpenCL的嵌入式DSP并行系统研究.pdf第6页
支持OpenCL的嵌入式DSP并行系统研究.pdf第7页
支持OpenCL的嵌入式DSP并行系统研究.pdf第8页
支持OpenCL的嵌入式DSP并行系统研究.pdf第9页
支持OpenCL的嵌入式DSP并行系统研究.pdf第10页
支持OpenCL的嵌入式DSP并行系统研究.pdf第11页
支持OpenCL的嵌入式DSP并行系统研究.pdf第12页
支持OpenCL的嵌入式DSP并行系统研究.pdf第13页
支持OpenCL的嵌入式DSP并行系统研究.pdf第14页
支持OpenCL的嵌入式DSP并行系统研究.pdf第15页
支持OpenCL的嵌入式DSP并行系统研究.pdf第16页
支持OpenCL的嵌入式DSP并行系统研究.pdf第17页
支持OpenCL的嵌入式DSP并行系统研究.pdf第18页
支持OpenCL的嵌入式DSP并行系统研究.pdf第19页
支持OpenCL的嵌入式DSP并行系统研究.pdf第20页

试读结束, 可继续阅读

28积分/C币 立即下载