没有合适的资源?快使用搜索试试~ 我知道了~
FastishFourierTransforms:完全围绕单个用例优化的GPU FFT例程:wavy_dash:
共8个文件
py:2个
cu:1个
cpp:1个
需积分: 9 0 下载量 68 浏览量
2021-04-10
05:49:26
上传
评论
收藏 9KB ZIP 举报
温馨提示
快速傅立叶变换 GPU非常擅长FFT,而Nvidia提供的(闭源)cuFFT库完成了在CUDA设备上实现高效R2C FFT的艰巨任务。 但是我们可以做得更好吗?!? 几乎可以肯定。 无论如何,我将在此仓库中针对我遇到的一个非常特殊的用例进行尝试,该用例可能会通过cuFFT进行优化处理: cuFFT期望数据以“突发为主”形式(每个突发中的相邻元素在内存中相邻),而我们的数据以“批量为主”形式(来自批次中相邻突发中的相同元素在内存中相邻),因此需要一个预处理步骤,该步骤需要使用良好的合并内存访问来转置数据。 相反,该项目将使经纱中的相邻线程直接访问相邻的批处理元素。 cuFFT期望浮点数(或__halfs)作为输入,但是我们的传入数据是实值uint8s。 这或者需要另一个预处理步骤(折叠到上述的转置内核中),并且使全局内存带宽达到所需的4倍(或2倍),或者需要使用cufft回调来转换读
资源推荐
资源详情
资源评论
收起资源包目录
FastishFourierTransforms-main.zip (8个子文件)
FastishFourierTransforms-main
FiFT.cu 13KB
prototype.py 7KB
progress.txt 489B
FiFT.h 755B
main.cpp 2KB
validate_outputs.py 2KB
Makefile 464B
README.md 2KB
共 8 条
- 1
资源评论
龙窑溪
- 粉丝: 31
- 资源: 4520
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功