没有合适的资源?快使用搜索试试~ 我知道了~
Forward:一个用于在NVIDIA GPU上进行高性能深度学习推理的库
共987个文件
h:281个
cpp:124个
cuh:87个
需积分: 29 1 下载量 190 浏览量
2021-03-12
16:33:26
上传
评论
收藏 73.11MB ZIP 举报
温馨提示
转发-用于在NVIDIA GPU上进行高性能深度学习推理的库 [] 向前 Forward是一个用于在NVIDIA GPU上进行高性能深度学习推理的库。 它提供了一个精心设计的方案,可以直接将Tensorflow / PyTorch / Keras模型解析为基于的高性能引擎。 与TensorRT相比,它易于使用且易于扩展。 到目前为止,Forward不仅支持CV,NLP和Recommend领域的主流深度学习模型,还支持一些高级模型,例如BERT,GAN,FaceSwap和StyleTransfer。 特征 利用TensorRT API和定制的运算符进行高性能的深度学习推理。 不但支持CV,NLP和“推荐”领域中的主流深度学习模型,还支持BERT,GAN,FaceSwap,StyleTransfer等高级模型。 易于使用:直接加载Tensorflow(.pb)/ PyTorch(.pth)
资源推荐
资源详情
资源评论
收起资源包目录
Forward:一个用于在NVIDIA GPU上进行高性能深度学习推理的库 (987个子文件)
VS2019.bat 371B
VS2017.bat 227B
meson.build 552B
gtest.cc 213KB
gtest-death-test.cc 57KB
gtest-port.cc 43KB
gtest-printers.cc 15KB
gtest-filepath.cc 14KB
gtest-typed-test.cc 4KB
gtest-test-part.cc 4KB
gtest-all.cc 2KB
gtest_main.cc 2KB
setup.cfg 312B
CHANGES 6KB
.clang-format 315B
.clang-tidy 736B
internal_utils.cmake 13KB
pybind11Tools.cmake 9KB
FindPythonLibsNew.cmake 8KB
FindTensorRT.cmake 3KB
FindEigen3.cmake 3KB
FindCatch.cmake 2KB
CONTRIBUTORS 1KB
fused_multihead_attention_v2_int8_192_64_kernel.sm75.cpp 1.45MB
fused_multihead_attention_v2_int8_128_64_kernel.sm72.cpp 1.44MB
fused_multihead_attention_v2_int8_256_64_kernel.sm72.cpp 1.43MB
fused_multihead_attention_v2_int8_384_64_kernel.sm72.cpp 1.4MB
fused_multihead_attention_v2_int8_384_64_kernel.sm75.cpp 1.34MB
fused_multihead_attention_v2_int8_384_64_kernel.sm80.cpp 1.23MB
fused_multihead_attention_v2_int8_192_64_kernel.sm72.cpp 1.14MB
fused_multihead_attention_v2_int8_128_64_kernel.sm75.cpp 1.13MB
fused_multihead_attention_v2_int8_192_64_kernel.sm80.cpp 1.07MB
fused_multihead_attention_v2_int8_128_64_kernel.sm80.cpp 1.06MB
fused_multihead_attention_v2_int8_256_64_kernel.sm75.cpp 1022KB
fused_multihead_attention_v2_int8_256_64_kernel.sm80.cpp 956KB
fused_multihead_attention_v2_fp16_128_64_kernel.sm75.cpp 481KB
fused_multihead_attention_v2_fp16_128_64_kernel.sm80.cpp 444KB
fused_multihead_attention_v2_fp16_384_64_kernel.sm80.cpp 439KB
fused_multihead_attention_v2_fp16_256_64_kernel.sm75.cpp 423KB
fused_multihead_attention_int8_128_64_kernel.sm75.cpp 415KB
fused_multihead_attention_v2_fp16_256_64_kernel.sm80.cpp 397KB
fused_multihead_attention_int8_128_64_kernel.sm80.cpp 377KB
fused_multihead_attention_v2_fp16_384_64_kernel.sm75.cpp 344KB
fused_multihead_attention_int8_384_64_kernel.sm80.cpp 314KB
fused_multihead_attention_fp16_128_64_kernel.sm75.cpp 312KB
fused_multihead_attention_int8_384_64_kernel.sm75.cpp 310KB
fused_multihead_attention_fp16_128_64_kernel.sm80.cpp 263KB
fused_multihead_attention_fp16_384_64_kernel.sm75.cpp 209KB
fused_multihead_attention_v2_fp16_96_64_kernel.sm75.cpp 208KB
fused_multihead_attention_v2_fp16_96_64_kernel.sm80.cpp 203KB
fused_multihead_attention_fp16_384_64_kernel.sm80.cpp 191KB
fused_multihead_attention_fp16_96_64_kernel.sm75.cpp 176KB
fused_multihead_attention_fp16_96_64_kernel.sm80.cpp 171KB
fused_multihead_attention_v2_fp16_64_64_kernel.sm80.cpp 120KB
fused_multihead_attention_v2_fp16_64_64_kernel.sm75.cpp 118KB
fused_multihead_attention_fp16_64_64_kernel.sm75.cpp 105KB
fused_multihead_attention_fp16_64_64_kernel.sm80.cpp 103KB
qkv_to_context_plugin.cpp 33KB
skip_layer_norm_plugin.cpp 31KB
test_methods_and_attributes.cpp 23KB
emb_layer_norm_plugin.cpp 20KB
normalization_plugin.cpp 18KB
test_virtual_functions.cpp 17KB
test_class.cpp 17KB
test_eigen.cpp 16KB
test_smart_ptr.cpp 16KB
test_numpy_dtypes.cpp 16KB
test_factory_constructors.cpp 16KB
wcwidth.cpp 14KB
fold_floor_divide.cpp 13KB
embedding_bag_plugin.cpp 13KB
trt_fwd_engine.cpp 13KB
grid_sampler_plugin.cpp 13KB
index_plugin.cpp 13KB
trt_fwd_builder.cpp 13KB
upsample_bilinear_2d.cpp 13KB
test_numpy_array.cpp 12KB
constant_pad_plugin.cpp 12KB
adaptive_lin_plugin.cpp 12KB
test_sequences_and_iterators.cpp 12KB
adaptive_pooling_plugin.cpp 12KB
reduce_plugin.cpp 11KB
test_stl.cpp 11KB
split_plugin.cpp 11KB
fuse_transformer_encoder.cpp 11KB
norm_plugin.cpp 10KB
reflection_padding_plugin.cpp 10KB
trt_keras_parser.cpp 10KB
test_interpreter.cpp 10KB
torch_engine.cpp 10KB
trt_creator_manager.cpp 9KB
cast_plugin.cpp 9KB
torch_module_parser.cpp 9KB
test_copy_move.cpp 9KB
gelu_plugin.cpp 9KB
tf_graph_parser.cpp 9KB
test_pytypes.cpp 9KB
test_builtin_casters.cpp 9KB
test_multiple_inheritance.cpp 9KB
keras_cpp_api.cpp 9KB
共 987 条
- 1
- 2
- 3
- 4
- 5
- 6
- 10
资源评论
普通网友
- 粉丝: 30
- 资源: 4570
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 2024数据要素资产化白皮书.pdf
- 基于python的某大学学生影响力分析系统源代码(python毕业设计完整源码+LW).zip
- Linux操作系统实验教程.pdf
- 基于python的人信息管理系统及安全策略分析源代码(python毕业设计完整源码+LW).zip
- 基于python的手写数字识别系统源代码(python毕业设计完整源码+LW).zip
- 基于STM32宠物智能项圈源码资料-定位+计步+充电显示源码(亲测可用)
- 电话自动组装产线全套技术资料100%好用.zip
- 基于MPC的轨迹跟踪控制器设计,采用MATLAB m脚本编程方式,完成了车辆的圆形和直线的轨迹跟踪,横摆角速度和前轮转角的控制输入,包含车辆二自由度动力学模型推导,模型线性化,模型离散化,基于模型的M
- 舵机sw19可编辑全套技术资料100%好用.zip
- Verilog HDL示例代码之03-各种计数器
- 基于STM32宠物智能项圈源码资料-定位+计步+充电显示-项目源码
- 多层储物架sw18可编辑全套技术资料100%好用.zip
- 快速开发平台 WebBuilder 10.5 all for Windows
- 宝贵的人生建议 (凯文·凯利) .pdf
- 基于贝叶斯(Bayes)优化-BiLSTM 神经网络数据预测模型 多输入单输出 预测模型均可 开发语言matlab开发语言
- Verilog HDL示例代码之04-各类加法器
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功