没有合适的资源?快使用搜索试试~ 我知道了~
程序员为什么还要刷题-transpose-timing-tests:转置时间测试
共90个文件
dat:36个
png:17个
pdf:9个
需积分: 9 0 下载量 21 浏览量
2021-07-07
15:03:36
上传
评论
收藏 50.79MB ZIP 举报
温馨提示
程序员常刷题分析 GPU 上时序位矩阵转置的结果 我们目前正在试验使用 GPU 作为快速 2D 渲染的通用设备。 特别是,我们的渲染内核之一需要快速转置 32x32 位矩阵。 通常,可以使用两种类型的程序在 GPU 上解决位矩阵转置问题: 基于经典线程组(“warp”、“工作组”)的程序,依赖于线程组中处理器(“线程”)可用的共享内存。 基于 SIMD (“子组”、“波前”)的程序依赖于 SIMD 组中处理器(“通道”)之间寄存器存储的快速共享。 我们研究了使用 SIMD 技术的内核与“经典”线程组技术的性能比较。 通过性能,我们特指时间性能:矩阵可以多快转置? 我们的结果提供了有关使用 SIMD 技术提高性能如何取决于设备选择和算法选择的见解。 SIMD 简介 1966 年,Michael J. Flynn 提出了计算机体系结构的分类(“Flynn 的分类法”)。 这个分类有四类: 单指令流、单数据流 (SISD) 单指令流、多数据流 (SIMD) 多指令流、单数据流 (MISD) 多指令流、多数据流(MIMD) 一个计算设备是 SISD,如果在每个 ,它从单个指令流中获取一条指令,
资源详情
资源评论
资源推荐
收起资源包目录
transpose-timing-tests-master.zip (90个子文件)
transpose-timing-tests-master
ref-docs
GeForce_GTX_1080_Whitepaper_FINAL.pdf 3.04MB
06-subgroups.pdf 1.3MB
The-Compute-Architecture-of-Intel-Processor-Graphics-Gen9-v1d0.pdf 2.83MB
Intel-Graphics-Architecture-ISA-and-microarchitecture.pdf 6.68MB
NVIDIA-Turing-Architecture-Whitepaper.pdf 16MB
NVIDIA_Fermi_Compute_Architecture_Whitepaper.pdf 856KB
Citadel-Nvidia-Turing-whitepaper.pdf 3.75MB
gdc_2018_sponsored_taking_the_red_pill.pdf 9.28MB
Pascal_Tuning_Guide.pdf 1.45MB
Cargo.lock 20KB
src
main.rs 3KB
file_utils.rs 378B
task.rs 7KB
gpu.rs 34KB
bitmats.rs 6KB
Cargo.toml 851B
plots
dedicated_simd_tg_comparison.png 134KB
vk-Shuffle8-Radeon RX 570 Series.dat 647KB
dedicated_simd_tg_ballot_comparison.png 162KB
vk-Threadgroup1d8-Radeon RX 570 Series.dat 272KB
dedicated_hybrid_tg_comparison.png 149KB
vk-Threadgroup1d32-Radeon RX 570 Series.dat 544KB
vk-Threadgroup1d8-Intel(R) HD Graphics 630.dat 273KB
vk-Threadgroup2d32-GeForce GTX 1060.dat 650KB
vk-Threadgroup2d8-Intel(R) HD Graphics 520.dat 326KB
tg8_shuffle8_loading_comparison.png 194KB
vk-Threadgroup2d32-GeForce RTX 2060.dat 649KB
vk-Threadgroup1d8-GeForce RTX 2060.dat 269KB
vk-Threadgroup2d32-Radeon RX 570 Series.dat 652KB
integrated_hybrid_tg_comparison.png 132KB
vk-HybridShuffle32-Intel(R) HD Graphics 630.dat 269KB
vk-Ballot32-Radeon RX 570 Series.dat 655KB
shuffle_8vs32_comparison.png 127KB
vk-Ballot32-GeForce RTX 2060.dat 648KB
vk-HybridShuffle32-Intel(R) HD Graphics 520.dat 269KB
vk-Threadgroup1d8-Intel(R) HD Graphics 520.dat 270KB
vk-HybridShuffle32-Radeon RX 570 Series.dat 544KB
vk-Threadgroup1d32-Intel(R) HD Graphics 520.dat 270KB
vk-Threadgroup2d8-Radeon RX 570 Series.dat 325KB
vk-Shuffle8-GeForce RTX 2060.dat 638KB
tg_dim_comparison.png 166KB
vk-HybridShuffleAdaptive32-Intel(R) HD Graphics 520.dat 271KB
vk-Shuffle32-GeForce RTX 2060.dat 644KB
vk-Threadgroup1d32-Intel(R) HD Graphics 630.dat 268KB
vk-Threadgroup1d32-GeForce RTX 2060.dat 590KB
intel_loading_comparison.png 288KB
vk-Threadgroup2d32-Intel(R) HD Graphics 520.dat 324KB
vk-Shuffle32-Radeon RX 570 Series.dat 650KB
plot.py 11KB
vk-Shuffle32-GeForce GTX 1060.dat 645KB
vk-Shuffle8-Intel(R) HD Graphics 520.dat 325KB
vk-HybridShuffle32-GeForce RTX 2060.dat 539KB
hybrid_shuffle.png 219KB
amd_vs_nvd_loading_comparison.png 135KB
intel_8vs32_comparison.png 128KB
vk-Threadgroup2d8-GeForce GTX 1060.dat 323KB
vk-Ballot32-GeForce GTX 1060.dat 657KB
vk-Shuffle8-GeForce GTX 1060.dat 642KB
vk-Threadgroup2d8-GeForce RTX 2060.dat 324KB
vk-HybridShuffle32-GeForce GTX 1060.dat 537KB
vk-Threadgroup1d32-GeForce GTX 1060.dat 542KB
vk-Shuffle8-Intel(R) HD Graphics 630.dat 324KB
vk-HybridShuffleAdaptive32-Intel(R) HD Graphics 630.dat 271KB
vk-Threadgroup1d8-GeForce GTX 1060.dat 267KB
.gitignore 24B
diagrams
threadgroup-model.svg 121KB
bit-matrix-transposition-strategy-0.svg 957KB
bit-matrix-transposition-strategy-1.png 696KB
bit-matrix.svg 32KB
bit-matrix-transposition-strategy-0.png 642KB
memory-hierarchy.png 137KB
bit-matrix.png 634KB
bit-matrix-transposition-strategy.svg 906KB
bit-matrix-transposition-strategy.png 713KB
bit-matrix-transposition-strategy-1.svg 962KB
memory-hierarchy.svg 111KB
threadgroup-model.png 41KB
POST.md 16KB
README.md 34KB
kernels
templates
transpose-Threadgroup1d32-template.comp 2KB
transpose-Threadgroup1d8-template.comp 2KB
transpose-HybridShuffle32-template.comp 2KB
transpose-Shuffle8-template.comp 2KB
transpose-Ballot32-template.comp 2KB
transpose-HybridShuffleAdaptive32-template.comp 2KB
transpose-Threadgroup2d32-template.comp 2KB
transpose-Shuffle32-template.comp 3KB
transpose-Threadgroup2d8-template.comp 2KB
spv
.gitignore 14B
comp
.gitignore 14B
共 90 条
- 1
weixin_38727980
- 粉丝: 3
- 资源: 931
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 《能源转型投资展望:2025年及长远规划》.pdf
- PPTAAD DADAA
- SM2258XT-BGA144-4BGA180-6L-R1019 三星KLUCG4J1CB B0B1颗粒开盘工具 , EC, 3A, 94, 43, A4, CA 七彩虹SL300这个固件有用
- 基于Java开发的日程管理FlexTime应用设计源码
- 基于JavaScript、CSS、HTML的简易DOM版飞机游戏设计源码
- 【C++初级程序设计·配套源码】第1期-语法基础
- 基于华为消费者业务官网的仿制前端首页设计源码
- 影驰战将PS3111 东芝芯片TT18G23AIN开卡成功分享,图片里面画线的选项很重要
- 基于Java和Vue的kopsoftKANBAN车间电子看板设计源码
- 基于Go语言的SharpWxDump微信取证信息分析设计源码
- 基于C语言的USB光盘资料操作教学源码
- 基于GitHub的TypeScript文档中文翻译设计源码
- 【C++初级程序设计·配套源码】第2期-基本数据类型
- 基于Vue和SpringBoot的企业员工管理系统2.0版本设计源码
- 没用333333333333333333333333333333
- C++ STL 高级教程深入浅出版.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0