没有合适的资源?快使用搜索试试~ 我知道了~
GemmKernels.jl:Julia中灵活高效的GEMM内核
共39个文件
jl:23个
sh:4个
yml:3个
需积分: 9 0 下载量 47 浏览量
2021-05-15
23:37:45
上传
评论
收藏 179KB ZIP 举报
温馨提示
宝石核 Julia中灵活高效的GEMM内核 茱莉亚(Julia) CI 1.6晚 每夜 该软件包包含一个框架,用于实例化灵活的高性能GEMM(通用矩阵乘法)内核。 它将GEMM内核分解为正交分量: 参数确定GEMM内核的切片大小和启动配置。 切片大小以逻辑坐标指定,即具有用户指定的含义。 布局将图块的逻辑坐标转换为内存中的物理偏移量。 转换用于将任意的Julia函子应用于GEMM的输入或输出。 它们在每次加载之后和每个商店之前应用。 运算符负责自己执行矩阵乘法。 它们从共享内存中加载图块,执行矩阵乘法,然后将结果图块存储回共享内存中。 结语将所得矩阵的图块复制到全局存储器,并且可以用于执行任意后处理,例如将偏差向量添加到所得矩阵。 这些组件中的每一个对应于具有预定接口的一组功能。 用户可以通过Julia的多个调度功能来自定义这些功能。 该软件包包括2个面向用户的界
资源推荐
资源详情
资源评论
收起资源包目录
GemmKernels_jl-master.zip (39个子文件)
GemmKernels.jl-master
Project.toml 568B
CITATION.bib 251B
.gitignore 1B
media
performance-wmma-gemm.png 150KB
src
blas.jl 3KB
kernel.jl 19KB
tiling.jl 9KB
GemmKernels.jl 222B
layout.jl 10KB
epilogue.jl 3KB
launch.jl 1KB
operator.jl 10KB
config.jl 10KB
transform.jl 431B
LICENSE 2KB
.github
workflows
TagBot.yml 364B
CompatHelper.yml 370B
README.md 4KB
.buildkite
pipeline.yml 1KB
benchmarks
.gitignore 12B
diagonal
benchmark.jl 2KB
complex-dual
cudajl_complex.jl 989B
gemmkernels_complex.jl 3KB
plot.jl 2KB
profile-cutlass.sh 834B
gemmkernels_dual.jl 3KB
profile-julia.sh 1KB
README.md 3KB
operator-fusion
benchmark.jl 7KB
wmma
plot.jl 2KB
gemmkernels.jl 964B
cublas.jl 1KB
profile-cutlass.sh 1KB
profile-julia.sh 1KB
test
Project.toml 311B
blas.jl 2KB
tiling.jl 3KB
matmul.jl 13KB
runtests.jl 459B
共 39 条
- 1
资源评论
摔了个呆萌
- 粉丝: 28
- 资源: 4676
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于JavaScript和CSS的随寻订购网页设计源码 - web-order
- 基于MATLAB的声纹识别系统设计源码 - VoiceprintRecognition
- 基于Java的微服务插件集合设计源码 - wsy-plugins
- 基于Vue和微信小程序的监理日志系统设计源码 - supervisionLog
- 基于Java和LCN分布式事务框架的设计源码 - tx-lcn
- 基于Java和JavaScript的茶叶评级管理系统设计源码 - tea
- IMG_5680.JPG
- IMG_0437.jpg
- 基于Java的JAVA项目分析工具设计源码 - JAVAProjectAnalysis
- top888.json
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功