支持多层输出的TensorRT_tensorrt有多个输出,tensorrt多输出资源-CSDN文库

共53个文件

h：18个

cpp：13个

cu：9个

TensorRT

多层输出

5星 · 超过95%的资源需积分: 37 105 浏览量 2018-10-17 17:18:49 上传评论 1 收藏 52MB ZIP 举报

**TensorRT概述** TensorRT是由NVIDIA开发的一款高性能深度学习推理（Inference）优化库，它主要用于加速深度学习模型在GPU上的运行速度。TensorRT通过解析模型的计算图，进行静态分析和优化，生成高效的CUDA代码，从而实现对深度学习模型的高速执行。在处理复杂的神经网络模型时，TensorRT能够显著提升推理速度，降低延迟，同时保持精度。 **多层输出的TensorRT** 在深度学习模型中，有时我们不仅关心最终的分类或预测结果，还可能需要中间层的特征输出。例如，在图像识别任务中，我们可能需要在识别过程中提取图像的特征用于其他应用，如人脸识别或目标检测。TensorRT提供了一种支持多层输出的功能，允许用户获取模型中的任意一层的输出，而不仅仅是最后一层。要实现多层输出，首先需要在构建网络时明确指定感兴趣的输出层。TensorRT API提供了添加输出层的方法，这样在推理阶段就可以获取到这些特定层的激活结果。在构建网络时，可以通过`addOutput()`方法将需要的层添加为网络的输出。 **Face-Recognition-master项目** 在提供的文件列表"Face-Recognition-master"中，虽然没有具体的内容，但根据名字可以推测这是一个人脸识别项目。通常，人脸识别系统会包含多个步骤，如人脸检测、特征提取和特征匹配等。在这样的系统中，TensorRT可能被用来加速特征提取部分，例如通过预训练的卷积神经网络（CNN）模型，如VGGFace或FaceNet。 **TensorRT与人脸识别** 在人脸识别中，多层输出可能非常有用。例如，我们可以使用一个预先训练好的模型（如ResNet或MobileNet）的中间层特征来表示人脸，这些特征被称为“face embeddings”。这些嵌入向量可以捕获人脸的高级特征，用于后续的相似度计算或识别任务。在TensorRT中，我们可以通过设置多层输出来获取这些嵌入向量，然后用它们来进行人脸识别。 **使用TensorRT实现多层输出的步骤** 1. **模型导入**：加载预训练的深度学习模型，例如ONNX或TensorFlow模型，到TensorRT的网络定义中。 2. **添加输出层**：在TensorRT的网络定义中，使用API指定需要作为输出的中间层。 3. **构建引擎**：使用优化器和构建配置来创建一个执行引擎，该引擎将执行多层输出的模型。 4. **分配输入和输出内存**：为输入数据和所有输出层分配内存。 5. **执行推理**：使用引擎执行推理，获取所有指定层的输出。 6. **处理输出**：根据需要处理和分析获取的多层输出结果。 TensorRT的多层输出功能使得在深度学习推理中获取中间层特征成为可能，这对于需要对模型不同层次信息进行利用的应用，如人脸识别，是非常有用的。通过有效的优化和内存管理，TensorRT能够高效地处理这些复杂的任务，提高整体系统的性能。

资源推荐

资源详情

资源评论

收起资源包目录

Face-Recognition-master.zip （53个子文件）

Face-Recognition-master

face-recognition

CMakeLists.txt 226B

face-recognition.cpp 9KB

CMakePreBuild.sh 715B

kernel.cu 6KB

script

merge_model.py 1KB

rename_model.py 919B

pluginImplement.h 5KB

tensorNet.h 2KB

CMakeLists.txt 3KB

util

display

glUtility.h 3KB

glDisplay.h 1KB

glDisplay.cpp 7KB

glTexture.cpp 8KB

glTexture.h 1KB

loadImage.cpp 5KB

commandLine.cpp 3KB

camera

gstCamera.cpp 12KB

v4l2Camera.cpp 11KB

v4l2-console

v4l2-console.cpp 3KB

CMakeLists.txt 178B

gstUtility.h 448B

gst-camera

gst-camera.cpp 3KB

CMakeLists.txt 168B

v4l2Camera.h 2KB

v4l2-display

CMakeLists.txt 178B

v4l2-display.cpp 2KB

gstCamera.h 2KB

gstUtility.cpp 6KB

cuda

cudaYUV-YUYV.cu 6KB

cudaUtility.h 2KB

cudaNormalize.h 440B

cudaYUV-YV12.cu 5KB

cudaNormalize.cu 1KB

cudaMappedMemory.h 695B

cudaOverlay.h 593B

cudaYUV.h 4KB

cudaYUV-NV12.cu 15KB

cudaRGB.cu 1KB

cudaFont.h 1KB

cudaResize.cu 2KB

cudaFont.cu 4KB

cudaRGB.h 381B

cudaOverlay.cu 2KB

cudaResize.h 624B

loadImage.h 2KB

commandLine.h 2KB

README.md 1KB

data

labels.txt 36KB

fontmapA.png 13KB

merge.caffemodel 55.85MB

deploy.prototxt 74KB

pluginImplement.cpp 14KB

tensorNet.cpp 4KB

Face-Recognition =========================== This sample targets for demonstrating TensorRT2.1 Plugin API We leverage most of the functions from jetson_inference; please check it first if you need more DL samples: <https://github.com/dusty-nv/jetson-inference> *** ## Environment Jetson TX2 JetPack-3.1 ## Build ```C $ sudo apt-get install git cmake $ git clone https://github.com/AastaNV/Face-Recognition $ cd Face-Recognition $ mkdir build $ cd build $ cmake .. $ make ``` ## Run ```C $ cd aarch64/bin $ ./face-recognition ``` ## Plugin Layer **BboxMergeLayer** This plugin layer demonstrate how to implement a CPU-based Plugin layer 1. Make required tensor as output 2. Allocate unified memory: CPU pointer== GPU pointer **DataRoiLayer** This plugin layer demonstrate how to implement a GPU Plugin layer 1. Got input/output data pointer in enqueue function 2. Launch GPU kernel with same cuda stream **RecognitionLayer** This plugin layer demonstrate more complicated handling of Plugin layer 1. This class can handle two differient layers: selectBbox and summaryLabel 2. Define some shared variable to make between layers communication easier ## Support Please rise your problem in our forum to get immediately support. https://devtalk.nvidia.com/default/board/189/jetson-tx2/

评论收藏

内容反馈