【免费】TopK层1资源-CSDN文库

numpy

.net

需积分: 0 55 浏览量 2022-08-03 11:33:17 上传评论收藏 289KB PDF 举报

资源详情

资源评论

TopK

层

初

始

⽰

例

代

码

axes

初

始

⽰

例

代

码

import numpy as np

from cuda import cudart

import tensorrt as trt

np.random.seed(97)

nIn, cIn, hIn, wIn = 1, 3, 4, 5 #

输

⼊

张

量

NCHW

data = np.random.permutation(np.arange(nIn * cIn * hIn * wIn, dtype=np.float32)).reshape(nIn, cIn, hIn,

wIn) #

输

⼊

数

据

np.set_printoptions(precision=8, linewidth=200, suppress=True)

cudart.cudaDeviceSynchronize()

logger = trt.Logger(trt.Logger.ERROR)

builder = trt.Builder(logger)

network = builder.create_network(1 << int(trt.NetworkDefinitionCreationFlag.EXPLICIT_BATCH))

config = builder.create_builder_config()

config.max_workspace_size = 1 << 30

inputT0 = network.add_input('inputT0', trt.DataType.FLOAT, (nIn, cIn, hIn, wIn))

#---------------------------------------------------------- --------------------#

替

换

部

分

topKLayer = network.add_topk(inputT0, trt.TopKOperation.MAX, 2, 1 << 1)

#---------------------------------------------------------- --------------------#

替

换

部

分

network.mark_output(topKLayer.get_output(0))

network.mark_output(topKLayer.get_output(1))

engineString = builder.build_serialized_network(network, config)

engine = trt.Runtime(logger).deserialize_cuda_engine(engineString)

context = engine.create_execution_context()

_, stream = cudart.cudaStreamCreate()

inputH0 = np.ascontiguousarray(data.reshape(-1))

outputH0 = np.empty(context.get_binding_shape(1), dtype=trt.nptype(engine.get_binding_dtype(1)))

outputH1 = np.empty(context.get_binding_shape(2), dtype=trt.nptype(engine.get_binding_dtype(2)))

_, inputD0 = cudart.cudaMallocAsync(inputH0.nbytes, stream)

_, outputD0 = cudart.cudaMallocAsync(outputH0.nbytes, stream)

_, outputD1 = cudart.cudaMallocAsync(outputH1.nbytes, stream)

cudart.cudaMemcpyAsync(inputD0, inputH0.ctypes.data, inputH0.nbytes,

cudart.cudaMemcpyKind.cudaMemcpyHostToDevice, stream)

context.execute_async_v2([int(inputD0), int(outputD0), int(outputD1)], stream)

cudart.cudaMemcpyAsync(outputH0.ctypes.data, outputD0, outputH0.nbytes,

cudart.cudaMemcpyKind.cudaMemcpyDeviceToHost, stream)

cudart.cudaMemcpyAsync(outputH1.ctypes.data, outputD1, outputH1.nbytes,

cudart.cudaMemcpyKind.cudaMemcpyDeviceToHost, stream)

cudart.cudaStreamSynchronize(stream)

print("inputH0 :", data.shape)

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余3页未读，立即下载

评论收藏

内容反馈

TopK层1

评论0

最新资源

TopK层1

评论0

最新资源

相关推荐

TopK优化思路

leetcode不会-MostCommonSequences:NewRelic代码挑战的TopK频繁词算法的一种方法

TopKTestsS21:用于PS 3，CSIS 225、2021年Spring的TopK数据结构的测试用例

PHP利用二叉堆实现TopK-算法的方法详解

两层无线传感器网络中的有效可验证Top-k查询

论文研究-两层传感器网络中基于位表的隐私保护top-.pdf

两层传感器网络中安全Top-k查询处理技术综述

面向隐私保护的两层传感网Top-k查询处理方法

est:大量数据的快速基数和TopK估计的Shell程序

求TopK的Fagin’s Algorithm和Threshold Algortihm-附件资源

Java~三种重写compare方法的PriorityQueue、TopK问题的解决思想附练习题（查找最小的K对数字与最后一块石头重量）

numpy.argpatition() 应用详解 + TopK值

两层传感器网络中安全Top-k查询协议

两层传感器网络中基于位表的隐私保护top-k查询算法

EVTQ：两层无线传感器网络中的高效可验证Top-k查询处理

多层传感器网络中细粒度的top-k查询的一种新的验证方案。

NCF数据集和python代码实现

TopK问题(大顶堆 + 快排)

Java实现TopK问题的方法

无线传感器网络中基于数据分布表的Top-K查询协议* (2010年)

论文研究-位图连接索引服务机制研究.pdf

海面对流边界层垂直结构的数值模拟* (1992年)

第七章-《大数据导论》大数据处理平台.pdf

多数据源上Top - k中间模式的产生算法 (2011年)

protel2004封装

主动学习推荐系统的实现