没有合适的资源?快使用搜索试试~
我知道了~
文库首页
操作系统
Linux
GPU上 多种方法的矩阵乘法
GPU上 多种方法的矩阵乘法
GPU
矩阵乘法
需积分: 50
25 下载量
131 浏览量
2013-11-16
16:18:43
上传
评论
收藏
11KB
CPP
举报
温馨提示
立即下载
GPU上使用多种方法的矩阵乘法,让你在用到 矩阵乘的时候有更为简洁的方法
资源推荐
资源评论
GPU矩阵相乘
浏览:40
CUDA程序,GPU上实现的两个矩阵相乘,并与CPU相乘进行对比
GPU上矩阵乘法快速实现
浏览:113
GPU上矩阵乘法的设计与实现,对于在cuda上做编程优化的同学有一定的参考价值。
在GPU上实现混合并行矩阵乘法及其性能分析.pdf
浏览:54
实现 ATI 平台上的 CPU-GPU 混合并行 DGEMM,采用在 GPU 和 CPU 上同时进行计算的方法来提高运算性能。实验结果证明,当矩阵规模较大时,在 AMD Phenom II X4 940 和 ATI FireStream 9270 平台上,混合 DGEMM 性能相对于单独使用 GPU 平均提升了 16%。通过实验验证了混合 DGEMM 性能、加速比、任务分配比例的估算方法,并探讨了
用图形处理器(GPU)实现矩阵乘法的方法.pdf
浏览:128
用图形处理器(GPU)实现矩阵乘法的方法.pdf
矩阵乘法:使用Cuda在GPU中执行的矩阵矢量乘法
浏览:41
矩阵乘法 稀疏矩阵与向量相乘(向量中的所有初始项均为1),结果存储在同一向量中,以进行下一次迭代。 迭代次数应指定为参数参数。 具有稀疏矩阵的.txt文件也应作为参数提供 如果要查看结果,则应将第三个参数parameter初始化为1
用gpu实现矩阵相乘,加速比达500
浏览:141
4星 · 用户满意度95%
用GPU实现两矩阵相乘,与串行算法相比,加速比达到了500多。
GPU并行加速矩阵乘法
浏览:83
GPU并行加速矩阵乘法,有详细的程序、结果及分析
matlab实现矩阵乘法代码-cuda-matrix-multiply-mex:可以在nvidiagpu上执行矩阵乘法的mex函数,取决于可用
浏览:76
5星 · 资源好评率100%
matlab实现矩阵乘法代码CUDA矩阵乘以MEX 可以在nvidia gpu上执行矩阵乘法的mex函数,取决于可用的硬件,其性能可能会大大提高。 不需要Matlab的并行计算工具箱。 这是通过分别编译一个执行矩阵乘法的cuda函数和一个将来自Matlab的数据输入读取到对象然后将它们链接在一起的mex函数来工作的。 Matlab对cuda一无所知,反之亦然。 包含的compile_matrix_
opencl 多gpu矩阵数组运算
浏览:190
1:opencl 多gpu运算; 2:opencl 矩阵运算; 3:opencl 数组运算;
CUDA矩阵乘法计算
浏览:199
5星 · 资源好评率100%
CUDA实现的矩阵乘法,运用了共享内存,纹理内存。
LightSpMV:基于GPU的轻量级稀疏矩阵矢量乘法(SpMV)-开源
浏览:70
LightSpMV是一种使用标准压缩稀疏行(CSR)存储格式的新颖CUDA兼容稀疏矩阵矢量乘法(SpMv)算法。 我们已经使用各种稀疏矩阵评估了LightSpMV,并将其与最新的CUSP和cuSPARSE中基于CSR的SpMV子程序进行了比较。 性能评估表明,在单个Tesla K40c GPU上,LightSpMV优于CUSP和cuSPARSE,与CUSP相比,分别提高了2.60和2.63,与cu
基于GPU的矩阵乘法优化研究_殷建.caj
浏览:136
以稠密矩阵向量乘法、稀疏矩阵向量乘法作为规则核心算法与非规则应用核心算法的代表进行研究。采用面向众核GPU的高速缓存分块方法设计更优的基于众核GPU稠密矩阵向量乘算法。
CPU与GPU上几种矩阵乘法的比较与分析.pdf
浏览:105
CPU与GPU上几种矩阵乘法的比较与分析.pdf
GPU上的矩阵乘法的设计与实现.pdf
浏览:12
GPU上的矩阵乘法的设计与实现.pdf
矩阵乘法的GPU实现.pdf
浏览:187
矩阵乘法的GPU实现.pdf
cpu版矩阵乘法和cuda矩阵乘法 GPU加速
浏览:132
5星 · 资源好评率100%
此程序是关于矩阵乘法的,有cuda矩阵乘法和cpu矩阵乘法的对比,可以作为参考
论文研究-CPU与GPU上几种矩阵乘法的比较与分析.pdf
浏览:161
描述了矩阵乘法在CPU上的三种实现方法和在GPU上基于CUDA架构的四种实现方法,分析了高性能方法的原由,发现它们的共同特点都是合理地组织数据并加以利用,这样能有效地减少存取开销,极大地提高算法的速度。...
稀疏矩阵-矩阵乘法 (SpMM) 的 新批处理算法_cuda_代码_下载
浏览:70
5星 · 资源好评率100%
该库为 GPU 提供高性能批量稀疏矩阵乘法 (SpMM) 内核。目标矩阵很小,行(或列)数为几十或几百。这种操作可以在图卷积网络的应用中找到。Batched SpMM 算法的详细信息可以在论文 (1) 中找到。 (1) Yusuke Nagasaka...
一种在GPU上高精度大型矩阵快速运算的实现
浏览:196
3星 · 编辑精心推荐
设计了一种在图形处理器(GPU)上完成大型矩阵快速运算的方法,主要通过使用Kahan求和公式来确 保计算精度,根据GPU特点设计矩阵分块方式和内存分配机制来减少对数据访问频次,以发挥GPU的并行体系结构 特性来提高计算...
缓存结构GPU矩阵乘法算法的自动优化.pdf
浏览:170
缓存结构GPU矩阵乘法算法的自动优化.pdf
面向GPU的通用矩阵乘法计算的容错研究.pdf
浏览:145
面向GPU的通用矩阵乘法计算的容错研究.pdf
几个cuda源代码示例
浏览:50
5星 · 资源好评率100%
几个cuda源代码示例 1.cuda矩阵例子.cu 2.实现矩阵的乘法.cu 3.... /*****************************************************************************************/ /核心代码部分,实现了矩阵的乘法运算/核心代码部分,实现了矩阵的乘法运算 /************************
一种稀疏矩阵-矩阵乘法的GPU算法_cuda_代码_下载
浏览:164
使用 GPU 张量核加速稀疏矩阵-矩阵乘法 在这个存储库中,我们提供了加速稀疏矩阵-矩阵乘法 (SpGEMM) 实现的源代码
矩阵乘法并行CUDA程序
浏览:40
矩阵乘法 GPU并行 CUDA程序 MATLAB + CUDA+C 亲测可运行
面向GPU的通用矩阵乘法计算的容错研究.docx
浏览:20
面向GPU的通用矩阵乘法计算的容错研究.docx
GPU上基于稀疏矩阵-矢量乘法统计的性能预测
浏览:188
作为线性代数中最重要和最重要的运算之一,近年来,稀疏矩阵矢量乘法(SpMV)在GPU上的性能预测越来越受到关注。 在2012年,Guo和Wang提出了一个新的想法来预测SpMV在GPU上的性能。 但是,他们没有完全考虑矩阵的...
CPU-GPU并行矩阵乘法的实现与性能分析.pdf
浏览:43
CPU-GPU并行矩阵乘法的实现与性能分析.pdf
GPU矩阵乘法和FFT算法的性能优化.pdf
浏览:145
GPU矩阵乘法和FFT算法的性能优化.pdf
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
u010436981
粉丝: 0
资源:
5
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
11111111111111
统信系统ARM64依赖openssl-1.0.2版本的libssl.so.10和libcrypto.so.10文件
奥比中光python sdk
冯超楠17.py
OCR识别-基于视觉注意力机制Attention实现的OCR识别算法-附项目源码-优质项目实战.zip
Java 使用蒙特卡洛方法估算PI的近似值(源代码)
main.cpp
电子木鱼小程序源码电子木鱼小程序源码
logback-plus.xml
ctf re 脱壳,的软件挺好的
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功