【免费】Shape层1资源-CSDN文库

需积分: 0 127 浏览量 2022-08-03 18:50:41 上传评论收藏 259KB PDF 举报

在TensorRT中，`Shape`层是一种特殊的层，用于获取输入张量的形状信息，并将其作为输出返回。这个层对于处理动态或静态形状的模型尤其有用，因为它可以动态地提供张量维度的详细信息。在给定的代码示例中，我们看到如何在TensorRT的不同版本中使用`Shape`层。让我们了解TensorRT中的静态形状和动态形状模式： 1. **静态形状模式**：在TensorRT7之前的版本中，模型的输入和输出形状通常在构建网络时是固定的，这被称为静态形状。这意味着在编译时必须知道所有张量的确切尺寸。 2. **动态形状模式**：从TensorRT7开始，引入了动态形状支持，允许模型处理不同大小的输入，这在处理变长序列或不确定尺寸的数据时非常有用。现在，我们来详细分析给定的代码片段： ```python shapeLayer = network.add_shape(inputT0) ``` 这一行代码创建了一个`Shape`层，它将`inputT0`作为输入。`add_shape()`函数返回一个`ILayer`对象，表示`Shape`层。这个层的输出是一个4维张量，包含了输入张量`inputT0`的形状信息（NCHW格式）。 ```python network.mark_output(shapeLayer.get_output(0)) ``` 这行代码将`Shape`层的输出标记为网络的输出。这意味着在执行网络时，会计算并返回这个形状信息。接下来，代码创建了引擎并执行了推理： ```python engine = builder.build_serialized_network(network, config) context = engine.create_execution_context() ... context.execute_async_v2([int(inputD0), int(outputD0)], stream) ``` 这部分代码首先根据网络和配置构建了一个引擎，然后创建了一个执行上下文。`execute_async_v2()`函数执行网络，并将输入和输出的设备内存地址作为参数传递。输出结果被拷贝回主机并打印出来： ```python cudart.cudaMemcpyAsync(outputH0.ctypes.data, outputD0, outputH0.nbytes, cudart.cudaMemcpyKind.cudaMemcpyDeviceToHost, stream) cudart.cudaStreamSynchronize(stream) print("inputH0 :", data.shape) print("outputH0:", outputH0.shape) print(outputH0) ``` 这段代码将设备上的输出数据拷贝回主机内存，并打印出输入和输出的形状以及输出数据。`outputH0`的形状应该与`inputT0`的形状相同，因为`Shape`层返回的是输入的形状信息。总结来说，`Shape`层在TensorRT中是一个关键组件，它能够提供输入张量的形状信息，这对于处理形状动态变化的模型至关重要。通过在网络中添加`Shape`层，我们可以获取到模型运行时输入张量的实际维度，这对于理解和调试模型行为，以及实现形状相关的操作非常有帮助。在TensorRT的不同版本中，使用方法可能略有差异，但核心功能保持一致。

资源详情

资源评论

资源推荐

Shape

层

初

始

⽰

例

代

码

（

TensorRT8

中

的

⽤

法

）

TensorRT7 + static shape

模

式

中

的

⽤

法

TensorRT7 + dynamic shape

模

式

中

的

⽤

法

TensorRT6

中

的

⽤

法

（

已

废

弃

）

[TODO]

初

始

⽰

例

代

码

（

TensorRT8

中

的

⽤

法

）

import numpy as np

from cuda import cudart

import tensorrt as trt

nIn, cIn, hIn, wIn = 1, 3, 4, 5 #

输

⼊

张

量

NCHW

data = np.arange(cIn, dtype=np.float32).reshape(cIn, 1, 1) * 100 + np.arange(hIn).reshape(1, hIn, 1) *

10 + np.arange(wIn).reshape(1, 1, wIn) #

输

⼊

数

据

data = data.reshape(nIn, cIn, hIn, wIn).astype(np.float32)

np.set_printoptions(precision=8, linewidth=200, suppress=True)

cudart.cudaDeviceSynchronize()

logger = trt.Logger(trt.Logger.ERROR)

builder = trt.Builder(logger)

network = builder.create_network(1 << int(trt.NetworkDefinitionCreationFlag.EXPLICIT_BATCH))

config = builder.create_builder_config()

inputT0 = network.add_input('inputT0', trt.DataType.FLOAT, (nIn, cIn, hIn, wIn))

#---------------------------------------------------------- --------------------#

替

换

部

分

shapeLayer = network.add_shape(inputT0)

#---------------------------------------------------------- --------------------#

替

换

部

分

network.mark_output(shapeLayer.get_output(0))

engineString = builder.build_serialized_network(network, config)

engine = trt.Runtime(logger).deserialize_cuda_engine(engineString)

context = engine.create_execution_context()

_, stream = cudart.cudaStreamCreate()

inputH0 = np.ascontiguousarray(data.reshape(-1))

outputH0 = np.empty(context.get_binding_shape(1), dtype=trt.nptype(engine.get_binding_dtype(1)))

_, inputD0 = cudart.cudaMallocAsync(inputH0.nbytes, stream)

_, outputD0 = cudart.cudaMallocAsync(outputH0.nbytes, stream)

cudart.cudaMemcpyAsync(inputD0, inputH0.ctypes.data, inputH0.nbytes,

cudart.cudaMemcpyKind.cudaMemcpyHostToDevice, stream)

context.execute_async_v2([int(inputD0), int(outputD0)], stream)

cudart.cudaMemcpyAsync(outputH0.ctypes.data, outputD0, outputH0.nbytes,

cudart.cudaMemcpyKind.cudaMemcpyDeviceToHost, stream)

cudart.cudaStreamSynchronize(stream)

print("inputH0 :", data.shape)

print(data)

print("outputH0:", outputH0.shape)

print(outputH0)

cudart.cudaStreamDestroy(stream)

cudart.cudaFree(inputD0)

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余4页未读，立即下载

评论收藏

内容反馈

StoneChan

粉丝: 31
资源: 321

Shape层1

评论0

最新资源

Shape层1

评论0

Shape.class

Shape Game

Shape_Viewer

Shape Context

C++编写Shape类

CLINE或者LINE转变为SHAPE.rar

编写一个抽象类Shape

drawable之shape的学习

Android_shape

delphi拖动Shape

C#画各种Shape

Shape From Shading

Shape.java

shape_predictor_68_face_landmarks.dat

android shape样式

android shape

ADO +SHAPE语句实例

shape 标签

Java Shape

0491-极智开发-解读设置在netron中查看onnx的每一层的shape

shape dataset_神经网络_聚类_数据集_

Allegro shape实用功能应用指南

世界地图（shape文件）

最新资源