没有合适的资源?快使用搜索试试~
我知道了~
文库首页
后端
C++
CUDA编程技术研究
CUDA编程技术研究
CUDA入门
需积分: 7
0 下载量
93 浏览量
2018-02-20
09:14:21
上传
评论
收藏
196KB
PDF
举报
温馨提示
立即下载
CUDA入门必备教材,从简易术语到整体编程,适合有一定基础的程序员
资源推荐
资源评论
论文研究-基于CUDA的2D-3D配准技术的研究.pdf
浏览:41
Nvidia从GeForce8系列开始,在显卡上推出统一计算设备框架技术,使GPU的通用计算(GPGPU)从图形硬件流水线和高级绘制语言中解放出来,开发人员无须掌握图形学编程方法即可在单任务多数据模式(SIMD)下完成高性能并行计算。在医学图像分析中,图像配准通常是一个耗时的过程,不利于临床应用,为了加速医学图像的2D-3D配准过程,研究了CUDA的设计思想和编程方式,提出了一种基于CUDA并行编
论文研究-静场Poisson方程的CUDA并行计算 .pdf
浏览:172
静场Poisson方程的CUDA并行计算,周振华,赖生建,本文研究了静场问题中采用CUDA编程进行并行数值计算,即静场Poisson方程中用有限差分法形成的代数方程组,将求解方程组的Jacobi迭代计�
基于CUDA的红外图像快速增强算法研究
浏览:4
针对红外图像边缘模糊,对比度低的问题,文中研究了改进的中值滤波和改进的Sobel边缘检测对红外图像进行处理。在对处理后图像的特征进行分析的基础上,研究了改进的Laplace金字塔分解的图像融合算法,并基于CUDA并行处理技术,在可编程GPU上实现了红外图像快速增强的目的。该算法结合GPU的内存特点,应用纹理映射、多点访问、并行触发技术,优化数据的存储结构,提高数据处理速度,适用于对红外图像增强的实
论文研究-基于CUDA的数字化放射图像重建算法.pdf
浏览:71
为了提高重建图像的速度及质量,利用CUDA(compute unified device architecture)架构下GPU(graphic processing unit)的多核并行运算能力,将光线投射的几何变换、场景遍历和渲染三个步骤在可编程图像硬件中实现,降低模拟所需的时间;利用3D纹理、光线程基元的同步遍历机制及不透明度提前终止,在不影响成像质量的前提下,减少生成最终模拟效果所需的时间
CS6354_Computer_Architecture:CS6354 计算机架构研究生课程 CUDA 编程
浏览:66
CS6354_计算机_架构 CS6354 计算机架构研究生课程关于 CUDA 编程。 此代码的目的是在给定的随机大小向量中找到最大值。 通过使用 CUDA 来并行化搜索过程,可以观察到 GPU 在不考虑内存传输时间的情况下明显优于 CPU。 包括二进制减少、共享内存和扭曲发散减少在内的几种技术用于加速程序。
CUDA及其编程技术
浏览:54
GPU中CUDA及其编程技术 ,gpu与cpu的功能对比,表述了CUDA的编程要点
CUDA并行计算的应用研究
浏览:91
CUDA并行计算的应用研究
基于CUDA的NPVR技术基础研究
浏览:63
基于CUDA的NPVR技术基础研究
CUDA并行程序的内存访问优化技术研究
浏览:144
CUDA并行程序的内存访问优化技术研究CUDA并行程序的内存访问优化技术研究
CUDA并行计算的应用研究.pdf
浏览:53
统一设备架构(CUDA) 是NV ID IA公司提出的一个基于GPU通用计算的开发环境, 它 针对GPU多处理单元的特性, 通过并行计算提高大规模运算的速度。根据CUDA技术的特点, 提出了基于CUDA的并行图像锐化、中值滤波和字符搜索算法, 并论述其关键技术和基本执行 流程。试验结果表明, 提出的方法相对于CPU方法在运算速度上有不同程度的提高和下降。这 同时体现了CUDA的优势和局限性, 为其
基于GPU的数字影像的正射纠正技术的研究
浏览:94
本文简述了CUDA 编程模型高性能并行计算的特性,在实现了基于GPU 的数字影像正射纠正的基础 上,阐述了基于GPU 的加速技术在数字影像处理方面的应用情景。
面向程序访存特征的存储优化技术研究
浏览:43
性能的提高一直是计算机研究人员孜孜不倦追求的目标。...分析CUDA编程框架和相应GPU的结构特点,将窗口原理应用到GPU 中以warp为单位的访存过程上,实验表明矩阵行列交替访问的存储性能提高了1 倍。
基于GPU的内存数据库索引技术研究
浏览:52
1. 对目前内存数据库索引技术的研究成果进行总结归纳,并且对 GPU 的硬件特点和编程技术做了相关综述。 2. 提出一种基于 GPU T-树索引的并行计算方案,该方案通过分析 T-树的节点间的父子关系,在 GPU 上实现对 T-...
GPU加速技术在治疗计划系统剂量计算中的应用 (2012年)
浏览:14
基于CUDA编程技术,研究了如何将NVIDIA的GPGPU模型应用于剂量计算,并首次将该技术应用于基于点核卷积/迭加模型的三维放射治疗计划系统商业化产品。本工作对原有剂量计算模型做了改进,使其可以在device端进行并行处理...
基于CUDA架构矩阵乘法的研究
浏览:182
首先介绍了CUDA架构特点,在GPU上基于CUDA使用两种方法实现了矩阵乘法,并根据CUDA特有的软硬件架构对矩阵乘法进行了优化。然后计算GPU峰值比并进行了分析。实验结果表明,基于CUDA的矩阵乘法相对于CPU矩阵乘法获得了很高的加速比,最高加速比达到1 079.64。GPU浮点运算能力得到有效利用,峰值比最高达到30.85%。
高级CUDA编程技术
浏览:62
高级CUDA编程技术,对于GPU程序的优化以及对CUDA程序优化有很大的帮助
论文研究-基于CUDA的图像匹配算法.pdf
浏览:91
为解决目前已有的图像匹配算法不适用于对实时性要求很强的应用,提出了PLS(Partial Least Squares)与余弦定理相结合的并行化图像匹配算法。该算法在CUDA架构下,对图像矩阵分块,分块后每个小块图像存入共享存储器处理并提取每个小块图像特征,通过合并后图像特征采用余弦定理计算图像的相似度,从而找出匹配图像。实验表明,CUDA架构下可以实现图像的并行匹配,与CPU上串行匹配相比,时效性
基于CUDA平台的伪随机数产生器系统研究1
浏览:135
摘要:针对线性同余算法在产生海量随机数序列时,速度较慢的情况,文中提出并实现了一种产生伪随机数的改进方法,即基于 CUDA 平台的并行线性同余法,测试证明改进算
CUDA的案例研究(来自官方的资料)
浏览:73
这个是无意中找到的一个关于cuda开发案例的分析和研究,对于已经有基础的或者是希望能深入理解开发的人员来说,是一个值得借鉴的资料,希望能对大家有所帮助
论文研究 - 利用可编程图形硬件有效加速求解毛细管复合圆柱中第二类边界条件的传热传质方程。
浏览:200
nVidia计算统一设备体系结构(CUDA)编程模型提供了一种应用并行计算对图形处理单元进行编程的好方法。 本文显示了性能的良好改进,同时解决了第二种边界条件在GPU上数值运行的毛细管多孔复合材料圆柱体的传热和传...
论文研究 - 利用可编程图形硬件有效加速求解第一类边界条件下的毛细管多孔径向复合圆柱体中的传热和传质方程
浏览:201
nVidia计算统一设备架构(CUDA)编程模型提供了将并行计算应用于具有图形处理单元的应用程序的正确方法。 本文提出了一种真正的性能改善方法,同时解决了具有第一类边界条件的毛细管多孔径向复合材料圆柱体的传热和...
WDXpeak-Note:个人笔记本
浏览:154
完整的复制没有意义,有目的才是正道这是我整理个人笔记本的方式计算机:关于计算机科学的基础和重要知识算法:准备面试工具:提高效率的编程工具面部表情研究:2015年Spring研究笔记cuda : cuda 编程笔记openmp:...
论文研究-GPU加速的高精度数字地面模型建模方法.pdf
浏览:183
利用并行化加速的高精度曲面建模算法使用英伟达公司的统一计算开发架构(CUDA)编程实现,GPU采用该公司的Quadro 2000。分别应用该算法进行了数值实验和实际项目区数字高程模型(DEM)模拟实验。实验结果表明,充分...
基于GPU的遥感图像融合并行算法研究
浏览:145
基于通用GPU并行计算技术,结合遥感图像数据融合处理特点,利用NVIDIA公司的CUDA编程框架,在其 GPU平台上对BROVEY变换和YIQ变换融合算法进行了并行研究与实现。实验结果表明,随着遥感图像融合算法的计算复杂度、...
基于CUDA的图像预处理并行化研究
浏览:115
基于CUDA的图像预处理并行化研究
CUDA和OpenCV图像并行处理方法研究
浏览:106
4星 · 用户满意度95%
CUDA和OpenCV图像并行处理方法研究,希望对研究并行计算的朋友们有帮助!
基于CUDA的加速MATLAB计算研究.zip
浏览:123
基于CUDA的加速MATLAB计算研究
GPGPU编程技术++从GLSL、CUDA到OpenCL.rar
浏览:103
GPGPU编程技术++从GLSL、CUDA到OpenCL.rar
GPGPU编程技术 从GLSL、CUDA到OpenCL
浏览:14
4星 · 用户满意度95%
GPGPU编程技术 从GLSL、CUDA到OpenCL,对CUDA 及 Opencl学习与实践者,不错的选择
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
weibaili
粉丝: 0
资源:
1
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
88音符111111111
20240426UMtr6yiz-1.zip
新建 文本文档.zip
PictureUnlock_s_678376.pictureunlock
error408(Fixed)病毒
615套机械原理动画.zip
专升本 C 语言历年考试题及答案 第一章与第三章练习题.docx
毕设绝技车辆车位租赁系统ssm开发方案
基于STC15W4K16S4+DS3231S+DS18B20单片机开发板硬件(原理图+PCB+封装库)工程文件.zip
Python情人节主题爱心代码及使用介绍.docx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功