【免费】ConvolutionNd层（Convolution层）1资源-CSDN文库

numpy

需积分: 0 96 浏览量 2022-08-03 16:22:07 上传评论收藏 758KB PDF 举报

资源详情

资源评论

ConvoutionNd

层

（

Convolution

层

）

括

号

中

的

层

名

和

参

数

名

适

⽤

于

TensorRT8

及

之

前

版

本

，

TensorRT9

及

之

后

被

废

弃

初

始

⽰

例

代

码

num_output_maps & kernel_size_nd (kernel_size) & kernel & bias

stride_nd (stride)

padding_nd (padding)

pre_padding

post_padding

padding_mode

dilation_nd (dilation)

num_groups

三

维

卷

积

的

⽰

例

set_input

⽤

法

初

始

⽰

例

代

码

import numpy as np

from cuda import cudart

import tensorrt as trt

nIn, cIn, hIn, wIn = 1, 1, 6, 9 #

输

⼊

张

量

NCHW

cOut, hW, wW = 1, 3, 3 #

卷

积

权

重

的

输

出

通

道

数

、

⾼

度

和

宽

度

data = np.tile(np.arange(1, 1 + hW * wW, dtype=np.float32).reshape(hW, wW), (cIn, hIn // hW, wIn //

wW)).reshape(1, cIn, hIn, wIn) #

输

⼊

数

据

weight = np.power(10, range(4, -5, -1), dtype=np.float32).reshape(cOut, hW, wW) #

卷

积

权

重

bias = np.zeros(cOut, dtype=np.float32) #

卷

积

偏

置

np.set_printoptions(precision=8, linewidth=200, suppress=True)

cudart.cudaDeviceSynchronize()

logger = trt.Logger(trt.Logger.ERROR)

builder = trt.Builder(logger)

network = builder.create_network(1 << int(trt.NetworkDefinitionCreationFlag.EXPLICIT_BATCH))

config = builder.create_builder_config()

inputT0 = network.add_input('inputT0', trt.DataType.FLOAT, (nIn, cIn, hIn, wIn))

#---------------------------------------------------------- --------------------#

替

换

部

分

convolutionLayer = network.add_convolution_nd(inputT0, cOut, (hW, wW), weight, bias)

#---------------------------------------------------------- --------------------#

替

换

部

分

network.mark_output(convolutionLayer.get_output(0))

engineString = builder.build_serialized_network(network, config)

engine = trt.Runtime(logger).deserialize_cuda_engine(engineString)

context = engine.create_execution_context()

_, stream = cudart.cudaStreamCreate()

inputH0 = np.ascontiguousarray(data.reshape(-1))

outputH0 = np.empty(context.get_binding_shape(1), dtype=trt.nptype(engine.get_binding_dtype(1)))

_, inputD0 = cudart.cudaMallocAsync(inputH0.nbytes, stream)

_, outputD0 = cudart.cudaMallocAsync(outputH0.nbytes, stream)

cudart.cudaMemcpyAsync(inputD0, inputH0.ctypes.data, inputH0.nbytes,

cudart.cudaMemcpyKind.cudaMemcpyHostToDevice, stream)

context.execute_async_v2([int(inputD0), int(outputD0)], stream)

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余8页未读，立即下载

评论收藏

内容反馈

ConvolutionNd层（Convolution 层）1

评论0

最新资源

ConvolutionNd层（Convolution 层）1

评论0

最新资源

相关推荐

Convolution.m

Convolution_speech_

Convolution.java

UFLDL exercise9 Convolution and Pooling

SIMD_Convolution：超快速卷积

caffe加速:合并BatchNorm层和Scale层到Convolution层

Active Convolution Learning the Shape of Convolution for Image Classification

convnfft.zip_FFT Convolution_convolution_convolution fft_zip

coursera 吴恩达 -- 第四课 卷积神经网络 ：第一周 Convolution model - Application - v1 数据集（全）

Convolution_Batch.rar_batch

Convolution_model_Application.json

Convolution Reconstruction Algorithm

Convolution_Demo_Signals

Seismic-Convolution-master.zip

matlab开发-convolution

卷积时Convolution1D和Convolution2D的不同

Convolution arithmetic tutorial

Gait recognition using multichannel convolution neural networks

image_convolution.rar_matlab convolution

Convolution filtering 褶积滤波

Convolution:简单的 OpenCL 卷积核

Convolution Neural Network (CNN)

Convolution and ReLu

Dynamic Convolution

UFLDL Exercise: Convolution and Pooling 卷积和池化

Keras Convolution1D与Convolution2D区别说明

convolution_Filter.rar_convolution filter_filter_filter convolut

Deep Convolution Generative Adversarial Networks 源码

Invariant Scattering Convolution Networks.pdf

coursera 吴恩达 -- 第四课卷积神经网络：第一周 Convolution model - Application - v1 数据集（全）