没有合适的资源?快使用搜索试试~ 我知道了~
拉伸:为GEMM和张量收缩扩展GPU性能
共1350个文件
yaml:839个
hpp:96个
py:89个
需积分: 13 0 下载量 84 浏览量
2021-02-23
06:38:12
上传
评论
收藏 12.12MB ZIP 举报
温馨提示
用于为GEMM,类似于GEMM的问题(例如批处理的GEMM),N维张量收缩以及将GPU上的两个多维对象相乘的其他事物创建基准驱动的后端库的工具。 有关文档,请参见 。
资源推荐
资源详情
资源评论
收起资源包目录
拉伸:为GEMM和张量收缩扩展GPU性能 (1350个子文件)
dockerfile-build-hip-hcc-ctu-ubuntu-16.04 2KB
dockerfile-tensile-hip-hcc-ctu-ubuntu-16.04 2KB
winners.awk 2KB
.clang-format 3KB
EnableWarnings.cmake 9KB
TensileConfig.cmake 9KB
TensileCreateLibrary.cmake 7KB
FindOpenCL.cmake 6KB
FindHIP.cmake 4KB
TensileConfigVersion.cmake 3KB
FindHCC.cmake 2KB
FindROCmSMI.cmake 2KB
TensileLibrary_gfx908.co 0B
TensileLibrary_gfx803.co 0B
TensileLibrary_gfx906.co 0B
TensileLibrary_gfx1011.co 0B
TensileLibrary_gfx900.co 0B
TensileLibrary_gfx1010.co 0B
ContractionProblem.cpp 50KB
ContractionSolution.cpp 46KB
CachingLibrary_test.cpp 35KB
main.cpp 30KB
Reference.cpp 30KB
RunGEMMKernel_test.cpp 30KB
ConvolutionProblem.cpp 26KB
ReferenceValidator.cpp 25KB
MathTemplates.cpp 20KB
DataInitialization.cpp 17KB
Client.cpp 15KB
HardwareMonitor.cpp 15KB
ContractionProblem_test.cpp 14KB
HipSolutionAdapter.cpp 13KB
DataInitialization_test.cpp 12KB
RunGEMMKernelTileSelection_test.cpp 11KB
ResultFileReporter.cpp 11KB
ClientProblemFactory.cpp 10KB
LibraryPerformance_test.cpp 9KB
SolutionIterator.cpp 9KB
MetaRunListener.cpp 8KB
TensorDescriptor_test.cpp 8KB
example_gemm_ext2-tn.cpp 8KB
BenchmarkTimer.cpp 8KB
ContractionSelectionLibrary_test.cpp 8KB
ProjectedPerformance_test.cpp 7KB
PerformanceReporter.cpp 7KB
HipSolutionAdapter_test.cpp 7KB
DataTypes.cpp 6KB
DataTypes_test.cpp 6KB
SolutionHelper.cpp 6KB
LLVMYAMLContraction_test.cpp 6KB
ProgressListener.cpp 6KB
CSVStackFile.cpp 6KB
MessagePack.cpp 5KB
KernelLanguageTypes.cpp 5KB
KernelArguments_test.cpp 5KB
ArithmeticUnitTypes.cpp 4KB
HardwareMonitorListener.cpp 4KB
Tools.cpp 4KB
KernelArguments.cpp 4KB
TensorDescriptor.cpp 4KB
TestData.cpp 4KB
KernelLanguagePredicate_test.cpp 4KB
ArithmeticUnitPredicate_test.cpp 4KB
Tensile.cpp 4KB
Loading.cpp 4KB
TensorOps.cpp 3KB
Debug.cpp 3KB
ContractionLibraryLoading_test.cpp 3KB
AMDGPU.cpp 3KB
hipModuleLoadTiming.cpp 3KB
Utils_test.cpp 3KB
DeterministicModePredicate_test.cpp 3KB
EmbeddedData_test.cpp 3KB
TimingEvents.cpp 3KB
ContractionFitness_test.cpp 3KB
ResultReporter.cpp 2KB
HipHardware.cpp 2KB
TestData_test.cpp 2KB
EmbeddedLibrary.cpp 2KB
Utils.cpp 2KB
test.cpp 2KB
CopyTensor_test.cpp 2KB
EmbeddedData.cpp 1KB
FindSolution.cpp 1KB
YAML.cpp 118B
deep_bench_nn_batched.csv 3KB
deep_bench_nn.csv 2KB
deep_bench_tn_batched.csv 1KB
deep_bench_tn.csv 1KB
deep_bench_nt_batched.csv 186B
deep_bench_nt.csv 156B
Dockerfile 1KB
dockerfile-build-centos-7 2KB
dockerfile-build-nvidia-cuda-8 3KB
dockerfile-build-ubuntu-rock 3KB
dockerfile-run-centos-7 2KB
dockerfile-tensile-rocm-terminal 2KB
dockerfile-tensile-tuning-slurm 4KB
Doxyfile 106KB
.dir-locals.el 851B
共 1350 条
- 1
- 2
- 3
- 4
- 5
- 6
- 14
资源评论
佳同学
- 粉丝: 28
- 资源: 4583
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功