没有合适的资源?快使用搜索试试~ 我知道了~
FlexTensor:张量计算的自动进度表探索和优化框架
共265个文件
py:209个
txt:25个
cu:7个
需积分: 17 1 下载量 185 浏览量
2021-05-15
17:35:27
上传
评论
收藏 4.24MB ZIP 举报
温馨提示
FlexTensor FlexTensor移至 引言 张量计算在广泛的领域中发挥着至关重要的作用,包括机器学习,数据分析和科学计算。 张量计算的广泛采用及其巨大的计算成本,导致对在异构硬件加速器(例如GPU和FPGA)上实现灵活,可移植且高性能的库实现的高需求。 但是,当前的张量库实现主要要求程序员手动设计低级实现并从算法,体系结构和编译角度进行优化。 这样的手动开发过程通常需要数月甚至数年,这远远落后于应用算法的快速发展。 我们介绍FlexTensor,它是用于异构系统上张量计算的计划探索和优化框架。 FlexTensor可以在没有人为干扰的情况下优化张量计算程序,从而允许程序员仅在不考虑硬件平台细节的情况下进行高级编程抽象。 FlexTensor系统地探索由针对不同硬件的许多不同计划组成的优化设计空间。 然后,FlexTensor结合了不同的探索技术,包括启发式方法和机器学习方法,以
资源推荐
资源详情
资源评论
收起资源包目录
FlexTensor:张量计算的自动进度表探索和优化框架 (265个子文件)
taco-gemm.c 5KB
yolo_conv11_opencl_autate.cl 219KB
yolo_conv11_opencl_autotvm.cl 16KB
conv_example.cl 2KB
complex-gemm.cl 2KB
simple-gemm.cl 2KB
network.cpp 7KB
simple_conv.cpp 7KB
profile_autate_yolo_b8_conv11.cu 196KB
profile_autotvm_yolo_b8_conv11.cu 17KB
cublas_gemm.cu 13KB
cudnn_conv.cu 11KB
block_matrix_circulant_baseline.cu 8KB
cublas_batch_gemm.cu 7KB
profile_flextensor_yolo_b1_conv3.cu 0B
.gitignore 58B
helper_cuda.h 33KB
helper_string.h 23KB
LICENSE 1KB
Makefile 434B
Makefile 428B
Makefile 422B
tutorial.md 7KB
README.md 6KB
README.md 2KB
test_report.md 1KB
README.md 804B
Makefile.old 11KB
gemm_model.pkl 2.03MB
conv2d_model.pkl 2.03MB
scheduler.py 97KB
ops.py 65KB
train-language-modeling.py 42KB
conv2d_config.py 37KB
gatedPixelCNN_baseline.py 24KB
test_ops.py 22KB
task.py 21KB
model.py 19KB
train.py 18KB
conv2d_baseline.py 18KB
tune_nnvm_cuda.py 16KB
lenet-CEloss-new-api.py 16KB
pixelCNN_baseline.py 16KB
build.py 16KB
test_ir_visit_print.py 15KB
test_conv2d_cuda_different_schedule.py 15KB
space.py 15KB
space.py 15KB
tune_depthwise_cuda.py 15KB
tune_relay_cuda.py 14KB
lenet.py 14KB
opt_gemm.py 13KB
schedule_shift_cuda.py 13KB
single_operation.py 13KB
layers.py 13KB
tune_conv2d_nchw_cuda.py 12KB
train.py 12KB
gemmini-ttm-spike.py 11KB
lenet-CEloss.py 11KB
gemmini-conv2d-3x3-nhwc-zync.py 11KB
gemmini-conv2d-3x3-nhwc-spike.py 11KB
nnvm-mobilenet-v2.py 11KB
schedule_gemm_conv2d_x86.py 11KB
depthwise_conv2d_test.py 10KB
tune_conv2d_cuda.py 10KB
model.py 10KB
cross_compilation_and_rpc.py 10KB
test_ir_visit.py 10KB
gemmini-gemv-spike.py 9KB
optimize_gemm_conv2d.py 9KB
get_feature.py 9KB
lltm.py 9KB
run_experiments.py 9KB
optimize_conv2d.py 9KB
tune_relay_x86.py 9KB
optimize_conv2d.py 8KB
utils.py 8KB
opt_conv_cuda.py 8KB
optimize_pixelCNN.py 8KB
opt_conv_cuda.py 8KB
lstm.py 8KB
utils.py 8KB
optimize_shift_conv2d.py 8KB
optimize_unpooling1d.py 8KB
optimize_unpooling2d.py 8KB
optimize_gatedPixelCNN.py 8KB
tune_batch_conv2d_cuda.py 8KB
optimize_depthwise_conv2d.py 7KB
optimize_gemm.py 7KB
test_conv2d_cuda_behavior.py 7KB
softmax_issue.py 7KB
config_yolo1_cuda.py 7KB
nnvm-mobilenet-v1.py 7KB
conv.py 7KB
unpooling2d_baseline.py 7KB
schedule_conv2d_1x1.py 7KB
config_yolo24_cuda.py 7KB
lenet.py 6KB
mlp.py 6KB
variant_scale.py 6KB
共 265 条
- 1
- 2
- 3
资源评论
NinglingPan
- 粉丝: 19
- 资源: 4645
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功