没有合适的资源?快使用搜索试试~ 我知道了~
CUDA-Quicksort:CUDA-Quicksort:快速排序算法的基于GPU的实现-开源
4星 · 超过85%的资源 需积分: 45 19 下载量 14 浏览量
2021-05-29
06:56:25
上传
评论 2
收藏 2.75MB GZ 举报
温馨提示
共178个文件
gitignore:24个
h:19个
prefs:12个
CUDA-quicksort 是一种基于 GPU 的快速排序算法实现。 CUDA-quicksort 旨在利用现代 NVIDIA GPU 的计算能力。 “文献中介绍了两种基于 GPU 的快速排序实现:GPU 快速排序,一种计算统一设备架构 (CUDA) 迭代实现,以及 CUDA 动态并行 (CDP) 快速排序,一种由 NVIDIA 公司提供的递归实现。” [*]。 CUDA-quicksort 是快速排序算法的基于 GPU 的迭代实现。 “在六个排序基准分布上执行的实验表明,CUDA-quicksort 比 GPU-quicksort 快四倍,比 CDP-quicksort 快三倍。”[*]。 *版权所有 :copyright: 2015 John Wiley & Sons, Ltd. Concurrency Computat.: Pract. 专家。 (2015) DOI: 10.1002/cpe.3611 如需更多信息,请参阅相应出版物:http://onlinelibrary.wiley.com/doi/10.1002/cpe.3611/abstract
资源推荐
资源详情
资源评论
收起资源包目录
CUDA-Quicksort:CUDA-Quicksort:快速排序算法的基于GPU的实现-开源 (178个子文件)
libmergeSort.a 119KB
libmergeSort.a 119KB
libbitonicSort.a 114KB
libbitonicSort.a 114KB
libgpuqsort.a 61KB
libgpuqsort.a 61KB
libcdp-quicksort.a 37KB
specs.c 1B
main.cpp 13KB
mergeSort_host.cpp 12KB
dists.cpp 10KB
main.cpp 7KB
main.cpp 5KB
main.cpp 4KB
sortingNetworks_validate.cpp 4KB
mergeSort_validate.cpp 4KB
specs.cpp 1B
.cproject 18KB
.cproject 14KB
.cproject 11KB
CUDA-Quicksort.cu 20KB
mergeSort.cu 18KB
gpuqsort_kernels.cu 16KB
scan.cu 15KB
gpuqsort.cu 11KB
bitonicSort.cu 10KB
bitonic.cu 9KB
testSorter.cu 7KB
oddEvenMergeSort.cu 6KB
simpletimer.cu 1KB
sortingNetworks_common.cuh 1010B
oddEvenMergeSort.d 9KB
bitonicSort.d 9KB
mergeSort.d 9KB
bitonic.d 9KB
main.d 8KB
main.d 7KB
mergeSort_validate.d 2KB
mergeSort_host.d 2KB
sortingNetworks_validate.d 2KB
cudart64_42_9.dll 603KB
cudart64_42_9.dll 603KB
cudart32_42_9.dll 437KB
cudart32_42_9.dll 437KB
cuda-quickSort.exe 1.84MB
Fast_GPUquickSort.exp 883B
.gitignore 0B
.gitignore 0B
.gitignore 0B
.gitignore 0B
.gitignore 0B
.gitignore 0B
.gitignore 0B
.gitignore 0B
.gitignore 0B
.gitignore 0B
.gitignore 0B
.gitignore 0B
.gitignore 0B
.gitignore 0B
.gitignore 0B
.gitignore 0B
.gitignore 0B
.gitignore 0B
.gitignore 0B
.gitignore 0B
.gitignore 0B
.gitignore 0B
.gitignore 0B
.gitignore 0B
helper_image.h 28KB
helper_cuda.h 27KB
helper_string.h 16KB
helper_timer.h 15KB
scan.h 7KB
exception.h 5KB
randomDistr.h 5KB
gpuqsort.h 3KB
CUDA-Quicksort.h 3KB
cdpQuicksort.h 3KB
gpuqsort.h 2KB
mergeSort_common.h 2KB
mergeSort_common.h 2KB
scan_common.h 2KB
sortingNetworks_common.h 2KB
sortingNetworks_common.h 2KB
helper_functions.h 1KB
dists.h 265B
defs.h 44B
properties.index 104B
version.ini 26B
mergeSort.lib 1.45MB
bitonicSort.lib 1.2MB
gpuquicksort_cederman.lib 609KB
Fast_GPUquickSort.lib 2KB
.lock 0B
.log 2KB
.log 162B
.log 0B
.log 0B
共 178 条
- 1
- 2
资源评论
- Honkhat2023-11-07不使用cdp理论上更快,实际上在相同的计算逻辑下也确实更快,在我的RTX3070上,相比启用cdp,提速1倍,100w的数据量耗时2-3ms,代码比较乱,好在由干货,研究一下不适用cdp的算法~
梦想是世界和平
- 粉丝: 19
- 资源: 4625
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功