Forward:一个用于在NVIDIAGPU上进行高性能深度学习推理的库资源-CSDN文库

共987个文件

h：281个

cpp：124个

cuh：87个

deep-learning

neural-network

tensorflow

gpu

cuda

需积分: 29 190 浏览量 2021-03-12 16:33:26 上传评论收藏 73.11MB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

Forward:一个用于在NVIDIA GPU上进行高性能深度学习推理的库（987个子文件）

VS2019.bat 371B

VS2017.bat 227B

meson.build 552B

gtest.cc 213KB

gtest-death-test.cc 57KB

gtest-port.cc 43KB

gtest-printers.cc 15KB

gtest-filepath.cc 14KB

gtest-typed-test.cc 4KB

gtest-test-part.cc 4KB

gtest-all.cc 2KB

gtest_main.cc 2KB

setup.cfg 312B

CHANGES 6KB

.clang-format 315B

.clang-tidy 736B

internal_utils.cmake 13KB

pybind11Tools.cmake 9KB

FindPythonLibsNew.cmake 8KB

FindTensorRT.cmake 3KB

FindEigen3.cmake 3KB

FindCatch.cmake 2KB

CONTRIBUTORS 1KB

fused_multihead_attention_v2_int8_192_64_kernel.sm75.cpp 1.45MB

fused_multihead_attention_v2_int8_128_64_kernel.sm72.cpp 1.44MB

fused_multihead_attention_v2_int8_256_64_kernel.sm72.cpp 1.43MB

fused_multihead_attention_v2_int8_384_64_kernel.sm72.cpp 1.4MB

fused_multihead_attention_v2_int8_384_64_kernel.sm75.cpp 1.34MB

fused_multihead_attention_v2_int8_384_64_kernel.sm80.cpp 1.23MB

fused_multihead_attention_v2_int8_192_64_kernel.sm72.cpp 1.14MB

fused_multihead_attention_v2_int8_128_64_kernel.sm75.cpp 1.13MB

fused_multihead_attention_v2_int8_192_64_kernel.sm80.cpp 1.07MB

fused_multihead_attention_v2_int8_128_64_kernel.sm80.cpp 1.06MB

fused_multihead_attention_v2_int8_256_64_kernel.sm75.cpp 1022KB

fused_multihead_attention_v2_int8_256_64_kernel.sm80.cpp 956KB

fused_multihead_attention_v2_fp16_128_64_kernel.sm75.cpp 481KB

fused_multihead_attention_v2_fp16_128_64_kernel.sm80.cpp 444KB

fused_multihead_attention_v2_fp16_384_64_kernel.sm80.cpp 439KB

fused_multihead_attention_v2_fp16_256_64_kernel.sm75.cpp 423KB

fused_multihead_attention_int8_128_64_kernel.sm75.cpp 415KB

fused_multihead_attention_v2_fp16_256_64_kernel.sm80.cpp 397KB

fused_multihead_attention_int8_128_64_kernel.sm80.cpp 377KB

fused_multihead_attention_v2_fp16_384_64_kernel.sm75.cpp 344KB

fused_multihead_attention_int8_384_64_kernel.sm80.cpp 314KB

fused_multihead_attention_fp16_128_64_kernel.sm75.cpp 312KB

fused_multihead_attention_int8_384_64_kernel.sm75.cpp 310KB

fused_multihead_attention_fp16_128_64_kernel.sm80.cpp 263KB

fused_multihead_attention_fp16_384_64_kernel.sm75.cpp 209KB

fused_multihead_attention_v2_fp16_96_64_kernel.sm75.cpp 208KB

fused_multihead_attention_v2_fp16_96_64_kernel.sm80.cpp 203KB

fused_multihead_attention_fp16_384_64_kernel.sm80.cpp 191KB

fused_multihead_attention_fp16_96_64_kernel.sm75.cpp 176KB

fused_multihead_attention_fp16_96_64_kernel.sm80.cpp 171KB

fused_multihead_attention_v2_fp16_64_64_kernel.sm80.cpp 120KB

fused_multihead_attention_v2_fp16_64_64_kernel.sm75.cpp 118KB

fused_multihead_attention_fp16_64_64_kernel.sm75.cpp 105KB

fused_multihead_attention_fp16_64_64_kernel.sm80.cpp 103KB

qkv_to_context_plugin.cpp 33KB

skip_layer_norm_plugin.cpp 31KB

test_methods_and_attributes.cpp 23KB

emb_layer_norm_plugin.cpp 20KB

normalization_plugin.cpp 18KB

test_virtual_functions.cpp 17KB

test_class.cpp 17KB

test_eigen.cpp 16KB

test_smart_ptr.cpp 16KB

test_numpy_dtypes.cpp 16KB

test_factory_constructors.cpp 16KB

wcwidth.cpp 14KB

fold_floor_divide.cpp 13KB

embedding_bag_plugin.cpp 13KB

trt_fwd_engine.cpp 13KB

grid_sampler_plugin.cpp 13KB

index_plugin.cpp 13KB

trt_fwd_builder.cpp 13KB

upsample_bilinear_2d.cpp 13KB

test_numpy_array.cpp 12KB

constant_pad_plugin.cpp 12KB

adaptive_lin_plugin.cpp 12KB

test_sequences_and_iterators.cpp 12KB

adaptive_pooling_plugin.cpp 12KB

reduce_plugin.cpp 11KB

test_stl.cpp 11KB

split_plugin.cpp 11KB

fuse_transformer_encoder.cpp 11KB

norm_plugin.cpp 10KB

reflection_padding_plugin.cpp 10KB

trt_keras_parser.cpp 10KB

test_interpreter.cpp 10KB

torch_engine.cpp 10KB

trt_creator_manager.cpp 9KB

cast_plugin.cpp 9KB

torch_module_parser.cpp 9KB

test_copy_move.cpp 9KB

gelu_plugin.cpp 9KB

tf_graph_parser.cpp 9KB

test_pytypes.cpp 9KB

test_builtin_casters.cpp 9KB

test_multiple_inheritance.cpp 9KB

keras_cpp_api.cpp 9KB

共 987 条

评论收藏

内容反馈

普通网友

粉丝: 30
资源:
4570

Forward:一个用于在NVIDIA GPU上进行高性能深度学习推理的库

一个用于在NVIDIA GPU上进行高性能深度学习推理的库。-C/C++开发

Forward 是一款腾讯研发的 GPU 高性能推理加速框架

iptables之forward

TensorRT是一个C ++库，用于在NVIDIA GPU和深度学习加速器上进行高性能推理。-C/C++开发

TensorRT：TensorRT是一个C ++库，用于在NVIDIA GPU和深度学习加速器上进行高性能推理

tkDNN:深度神经网络库和工具包可在NVIDIA Jetson平台上进行高性能推理

一个高性能、轻量级、灵活性强且易于扩展的深度学习推理框架，定位于支持包括移动端、嵌入式以及边缘端在内的多种硬件平台

带你从零实现一个高性能的深度学习推理库，支持Unet、Yolov5、Resnet等模型的推理

DWR(Resouce Forward)

释放潜能：在PyTorch中全面利用GPU

c# emgucv4.6.0版本gpu推理yolov7-tiny，darknet版本

C# 运用emgucv调用gpu，推理yolov7和yolov7-tiny。darknet版本80分类原始weights和cfg

c# 通过emgucv调用gpu推理yolov7和yolov7-tiny，darknet版本。

QtTest_Qt识别界面_深度学习_QT_图像界面_Qt图像_

mindspore:MindSpore是一个新的开源深度学习培训推理框架，可用于移动，边缘和云场景

JProGraM:一个用于创建、学习和对有向和无向概率图形模型进行推理的 Java 库

catboost：决策树上的快速，可扩展，高性能的梯度增强库，用于对Python，R，Java，C ++进行排名，分类，回归和其他机器学习任务。 支持CPU和GPU上的计算

深度学习使用浅析

win7配置深度学习环境1

探索 PyTorch 中的 TorchScript：解锁深度学习的灵活性与性能

深度学习框架pytorch入门与实践源代码.rar

电子-DLwithGPUs.pdf

models:Neuralet边缘深度学习模型库。 Neuralet是一个用于GPU，TPU等上的边缘深度学习模型的开源平台

快速，可扩展，高性能的“决策树上的梯度提升”库，用于对Python，R，Java，C ++进行排名，分类，回归和其他机器学习任务。 支持在CPU和GPU上进行计算。-C/C++开发

DirectML:DirectML是用于机器学习的高性能，硬件加速的DirectX 12库。 DirectML通过广泛支持的硬件和驱动程序为常见的机器学习任务提供GPU加速，包括来自AMD，Intel，NVIDIA和Qualcomm等供应商的所有支持DirectX 12的GPU

使用 NVIDIA Jetson 和 ROS 进行深度学习：用于将预训练神经网络部署到 NVIDIA Jetson 硬件并将生成的库与 ROS 一起使用的示例文件。-matlab开发

吴恩达深度学习作业代码官方答案.pdf

开源的深度学习库PyTorch介绍说明

最新资源

catboost：决策树上的快速，可扩展，高性能的梯度增强库，用于对Python，R，Java，C ++进行排名，分类，回归和其他机器学习任务。支持CPU和GPU上的计算

快速，可扩展，高性能的“决策树上的梯度提升”库，用于对Python，R，Java，C ++进行排名，分类，回归和其他机器学习任务。支持在CPU和GPU上进行计算。-C/C++开发