没有合适的资源?快使用搜索试试~
我知道了~
文库首页
人工智能
深度学习
基于OpenCL并行加速算法研究及其FPGA实现_彭新显
基于OpenCL并行加速算法研究及其FPGA实现_彭新显
异构并行计算
opencl
需积分: 9
18 下载量
11 浏览量
2018-01-18
15:21:01
上传
评论
收藏
2.22MB
CAJ
举报
温馨提示
立即下载
基于OpenCL并行加速算法研究及其FPGA实现(彭新显),异构并行计算的好东西
资源推荐
资源评论
一种基于OpenCL的高能效并行KNN算法及其GPU验证.pdf
浏览:143
一种基于OpenCL的高能效并行KNN算法及其GPU验证.pdf
FPGA异构计算 ,基于OpenCL的开发方法
浏览:177
近年来,异构计算得到了业界的普遍关注。作为高性能计算的一种主流解决方案,CPU+GPU的异构计算模式已经得到了产业界和学术界的广泛关注。从2011年Altera公司发布支持利用OpenCL来开发FPGA的SDK工具以后,采用CPU+FPGA构成异构计算系统成为另一种具有竞争力的解决方案。本书主要介绍了FPGA异构计算系统的基本架构和开发方法,并以多个不同的案例为读者展示了如何利用几种常用的优化方法
基于OpenCL的异构系统并行编程
浏览:51
4星 · 用户满意度95%
对异构处理器在传统通用计算中利用率低的问题,提出基于开放计算语言OpenCL(opencomputing language)的新的通用计算技术,它提供了统一的编程模型。介绍了OpenCL的特点、架构及实现原理等,并提出OpenCL性能优化 策略。将OpenCL与计算统一设备架构CUDA(computeunified device architecture)及其它通用计算技术进行对比。对比 结果表明
基于OpenCL的若干机器学习算法GPU实现及优化_王伟俨.pdf
浏览:76
基于OpenCL的若干机器学习算法GPU实现及优化_王伟俨.pdf
基于OpenCL机器视觉算法GPU实现.pdf
浏览:121
基于OpenCL机器视觉算法GPU实现.pdf
OpenCL规范1.2正体中文版 beta1
浏览:158
5星 · 资源好评率100%
上次传的有点问题,现重新上传 OpenCL 規範 1.2 中文正體版 beta1 經過對 context 的艱苦學習,終於略有小成,也為了兌現我之前的承諾,現將 1.2 發出進行公測 目前已知問題: 1. 幾個插圖還未做,正在學習metapost 2. 附錄的標題編號以及附錄中的交叉引用還有點問 3. 没有封皮 個人blog: https://niqingliang2003.wordpres
opencl 2.0 语言标准协议
浏览:93
opencl 2.0语言标准协议,看了下语言真的很简单。合适FPGA开发选择。
基于小型Zynq SoC硬件加速的改进TINY YOLO实时车辆检测算法实现
浏览:173
5星 · 资源好评率100%
针对TINY YOLO车辆检测算法计算量过大,且在小型嵌入式系统中难以达到实时检测要求的问题。利用小型Zynq SoC系统的架构优势以及TINY YOLO的网络权值中存在大量接近零的权值参数这一特点,提出硬件并行加速的改进算法,称为浓缩小型深度网络(Xerantic-TINY YOLO,X-TINY YOLO)车辆检测算
论文研究-基于改进YOLOv3的快速车辆检测方法.pdf
浏览:56
对图像或视频数据中的车辆进行检测是城市交通监控中非常重要并且具有挑战性的任务。该任务的难度在于对复杂场景中相对较小的车辆进行精准地定位和分类。针对这些问题,提出了一个单阶段的深度神经网络(DF-YOLOv3),实现城市交通监控中不同类型车辆的实时检测。DF-YOLOv3对传统的YOLOv3算法进行改进,首先增强深度残差网络提取车辆特征,然后设计6个不同尺度的卷积特征图,并与残差网络中相应尺度的特征
OpenCL规范中文版
浏览:35
5星 · 资源好评率100%
更新: 目前正在使用context重新排版(已更新至第四章),并跟进至1.1,请参考http://code.google.com/p/opencl-spec-zh/source/checkout 但由于对context还不熟悉,所以排版很糟糕,见谅 经过近半年的埋头码字,终于得成正果,最近又根据最新的revision48做了修正,保留了附录中的例子 NOTE:仅校对了前几章,后面的还未进行校对,
改进的并行CORDIC算法研究及其FPGA实现
浏览:154
在介绍基本CORDIC算法原理的基础上,介绍了其改进的并行算法原理。对并行CORDIC算法进行了详细叙述,并且使用Verilog HDL描述了该算法。通过模块复用,并且采用两相门控时钟等方法,节省了FPGA资源,保持了信号的同步性。最后在Quartus II下进行了综合、仿真,取得了良好的仿真结果。
一种基于OpenCL的高能效并行KNN算法及其GPU验证
浏览:130
近年来数据分类技术已经被广泛应用于各类问题中,作为最重要的分类算法之一,K最近邻法(KNN)也被广泛使用。在过去的近50年,人们就如何提高KNN的并行性能做出巨大努力。基于CUDA的KNN并行实现算法——CUKNN算法证明KNN在GPU上的并行实现比在CPU上串行实现的速度提升数十倍,然而,CUDA在实现过程中包含了大量的冗余计算。提出了一种并行冒泡的新型KNN并行算法,并通过OpenCL,在以G
归一化积相关算法并行加速方法研究及FPGA实现.pdf
浏览:151
归一化积相关算法并行加速方法研究及FPGA实现.pdf
基于OpenCL与FPGA异构模式的Sobel算法研究-论文
浏览:190
基于OpenCL与FPGA异构模式的Sobel算法研究
OpenCL并行加速三维地形生成示例
浏览:76
OpenCL并行加速三维地形生成,对于科研论文有极大帮助
基于GPU计算的并行PLS算法研究与实现.pdf
浏览:156
基于GPU计算的并行PLS算法研究与实现.pdf
基于CUDA并行架构AES算法的研究与实现1
浏览:88
摘要随着计算机网络应用的普及和发展,信息安全作为新兴学科日益受到重视。受CPU串行体制的限制,传统的串行密码算法已经越来越不能满足信息安全对运算速度和系统安全性
基于Hadoop平台的Apriori算法的并行化研究与实现.docx
浏览:122
5星 · 资源好评率100%
基于Hadoop平台的Apriori算法的并行化研究与实现.docx
LDPC码并行译码算法的研究及其基于CUDA的实现.pdf
浏览:115
LDPC码并行译码算法的研究及其基于CUDA的实现
LDPC码并行译码算法的研究及其基于CUDA的实现
浏览:145
LDPC码并行译码算法的研究及其基于CUDA的实现
基于云计算的神经网络并行实现及其学习方法研究
浏览:15
基于云计算的神经网络并行实现及其学习科研项目, 基于云计算的神经网络并行实现及其学习科研项目
论文研究-基于FPGA的并行RANSAC算法 .pdf
浏览:160
基于FPGA的并行RANSAC算法,江洁,凌思睿,RANSAC(RANdom SAmple Consensus, 随机抽样一致)算法在数据量大、局外点比例高、模型复杂等情况下运算速度低,形成了性能瓶颈。本文提出��
基于FPGA的反投影算法并行化实现.pdf
浏览:130
5星 · 资源好评率100%
基于FPGA的反投影算法并行化实现.pdf
基于FPGA的反投影算法并行化实现
浏览:102
基于FPGA的反投影算法并行化实现
基于GPU的并行加速渲染算法的研究.pdf
浏览:115
基于GPU的并行加速渲染算法的研究.pdf
一种基于FPGA的SOM神经网络算法的并行实现
浏览:55
摘 要:分析了SOM神经网络算法在FPGA实现过程中要考虑的2个主要问题:并行性和有限字长效应。通过分析,提出了一种实现该算法的高并行体系结构并给出了该体系结构中关键模块的具体实现电路。根据计算机仿真以及在FPGA上的实现所得到的结果表明,该体系结构在保证神经网络性能的同时,可以使电路具有较高的处理速度
中文多模式匹配算法及其并行化研究与实现.pdf
浏览:101
中文多模式匹配算法及其并行化研究与实现
基于OpenMP的LDPC并行译码算法研究与实现.pdf
浏览:139
基于OpenMP的LDPC并行译码算法研究与实现
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
lowkey159357
粉丝: 2
资源:
19
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
基于Neo4j+springboot+vue+d3.js知识图谱构建和可视化
基于 C++实现的避免死锁的银行家算法
战域知映射化战场空象.txt
适用于天堂2-6章的L2J地图Geodata
战域信映射化战场空象.txt
战域数映射化战场空象.txt
战域信映射化战场时象.txt
战域知映射化战场时象.txt
realvncarm架构
战域数映射化战场时象.txt
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功