使用ONNXRuntime推理模型.pdf_onnxruntime-gpu怎么读取CUDA的资源-CSDN文库

版权申诉

104 浏览量 2024-04-15 10:05:22 上传评论收藏 4.61MB PDF 举报

资源推荐

资源详情

资源评论

使用ONNX Runtime推理模型

作者：李玉冰

指导老师：杨威



1 简介

官方网站：https://onnxruntime.ai/

　　ONNX Runtime （ORT）是机器学习模型的加速器，具有多平台支持和灵活的接口，可与特定于硬

件的库集成。ONNX Runtime 可与来自 PyTorch、Tensorflow/Keras、TFLite、scikit-learn 和其他框架

的模型一起使用。ONNX Runtime是针对ONNX模型的以性能为中心的引擎，可在多个平台和硬件

（Windows，Linux和Mac以及CPU和GPU上）高效地进行推理。ONNX运行时已被证明大大增加了多种

型号的性能。

　　ONNX 运行时推理为 Office、Azure、Bing 以及数十个社区项目的关键 Microsoft 产品和服务中的

机器学习模型提供支持。ONNX运行时推理的示例用例包括：

提高各种 ML 模型的推理性能；

在不同的硬件和操作系统上运行；

在 Python 中训练但部署到 C#/C++/Java 应用程序中；

使用在不同框架中创建的模型训练和执行推理。



2 基本使用方法



2.1 前提准备



参考：https://pytorch.org/tutorials/advanced/super_resolution_with_onnxruntime.html

　　使用前先准备一个onnx的模型，参考Pytorch的官方教程，运行 export_onnx_model.py 文件（可

在2.2.3 Pytorch官方示例小节中找到）中的 export_onnx_model() 函数，可以导出ONNX模型

super_resolution.onnx 。该模型接收形状为[batch_size，1、224、224]的输入，输出形状为[1, 1,

672, 672]。

　　注：[batch_size，1、224、224]表示batch_size张通道数为1、高度为224，宽度为224的图像。

　　本篇文章仅讲述ONNX RT的使用，不讲述Pytorch导出过程。



2.2 Python使用

　　ONNX Runtime提供Python接口。根据ONNX RT的官方文档（Python API页面），ONNX

Runtime兼容的Python版本为 Python 3.6-3.9 ，注意安装匹配的Python版本。



2.2.1 安装

　　调用ONNX Runtime的Python接口需要安装onnxruntime的CPU版或GPU版，安装命令如下：

　　注：在查阅资料时发现CPU版可能和GPU版不兼容，如果调试时报错，可以只保留需要使用的版本

进行尝试。



2.2.2 快速开始

　　ONNX Runtime的Python接口进行推理主要分三步：

　　（1）导入onnxruntime包；

　　（2）创建InferenceSession，参数为需要进行推理的 onnx 模型字节串或模型路径，其他参数的含

义见下面的 InferenceSession 小节；

　　（3）用run方法进行推理，参数为输出列的名称 list 和输入的名称-输入值的 dict ，输入值的形

状与模型能接受的形状相同，其他参数的含义见下面的 Session.run 小节。返回值是一个由 ndarray

组成的 list ，形如 [ array([[[...]]]), array([[[...]]]), ...] ，array的形状应该（待测）与

该模型的输出形状一致。

　　注：onnx模型的网络结构可以通过onnx可视化工具看到，如：https://lutzroeder.github.io/netro

n/，可以通过此工具查看模型输入形状和输出形状。



源代码：https://onnxruntime.ai/docs/api/python/modules/onnxruntime/capi/onnxruntime_i

nference_collection.html

InferenceSession

　　InferenceSession继承自Session类，包括初始化参数及其含义，具体定义如下：

$ pip install onnxruntime

$ pip install onnxruntime-gpu

import onnxruntime

sess = onnxruntime.InferenceSession('YouModelPath.onnx')

output = sess.run([output_name,...], { input_name: input_value })

class InferenceSession(Session):

 """

 This is the main class used to run a model.

 """

 def __init__(self, path_or_bytes, sess_options=None, providers=None,

provider_options=None):

   """

   :param path_or_bytes: filename or serialized ONNX or ORT format model in

a byte string

   :param sess_options: session options

   :param providers: Optional sequence of providers in order of decreasing

     precedence. Values can either be provider names or tuples of

     (provider name, options dict). If not provided, then all available

     providers are used with the default precedence.

   :param provider_options: Optional sequence of options dicts

corresponding

     to the providers listed in 'providers'.

   The model type will be inferred unless explicitly set in the

SessionOptions.

   To explicitly set:

    so = onnxruntime.SessionOptions()

    so.add_session_config_entry('session.load_model_format', 'ONNX') or

    so.add_session_config_entry('session.load_model_format', 'ORT') or

   A file extension of '.ort' will be inferred as an ORT format model.

   All other filenames are assumed to be ONNX format models.

   'providers' can contain either names or names and options. When any

options

   are given in 'providers', 'provider_options' should not be used.

   The list of providers is ordered by precedence. For example

['CUDAExecutionProvider', 'CPUExecutionProvider']

   means execute a node using CUDAExecutionProvider if capable, otherwise

execute using CPUExecutionProvider.

   """

   Session.__init__(self)

   if isinstance(path_or_bytes, str):

     self._model_path = path_or_bytes

     self._model_bytes = None

   elif isinstance(path_or_bytes, bytes):

     self._model_path = None

     self._model_bytes = path_or_bytes # TODO: This is bad as we're

holding the memory indefinitely

   else:

     raise TypeError("Unable to load from type

'{0}'".format(type(path_or_bytes)))

   self._sess_options = sess_options

   self._sess_options_initial = sess_options

   self._enable_fallback = True

   self._read_config_from_model =

os.environ.get('ORT_LOAD_CONFIG_FROM_MODEL') == '1'

   try:

     self._create_inference_session(providers, provider_options)

   except RuntimeError:

     if self._enable_fallback:

       print("EP Error using {}".format(self._providers))

       print("Falling back to {} and

retrying.".format(self._fallback_providers))

       self._create_inference_session(self._fallback_providers, None)

       # Fallback only once.

       self.disable_fallback()

     else:

       raise

 def _create_inference_session(self, providers, provider_options):

   available_providers = C.get_available_providers()

剩余15页未读，继续阅读

评论收藏

内容反馈

版权申诉

百态老人

粉丝: 2191
资源: 2万+

使用ONNX Runtime推理模型.pdf

最新资源

使用ONNX Runtime推理模型.pdf

onnxruntime-1.5.2.jar

基于YOLOV5部署性能比较 opencvDNN、ONNX onnxruntime Openvion源码.zip

基于QT实现的缺陷检测系统c++源码(含图像检测+目标检测支持ONNXRuntime加速).zip

基于QT的缺陷检测系统c++源码（包括图像检测+目标检测两部分，支持ONNXRuntime加速）.zip

onnxruntime-1.5.2.zip

Microsoft.ML.OnnxRuntime.ResNet50v2Sample.7z

onnxruntime-1.10.0-1.5.7-API文档-中文版.zip

树莓派自己编译的64位的onnxruntime-1.14.1 python3.9的whl轮子

onnxruntime-1.5.3.zip

onnxruntime-1.10.0-1.5.7-API文档-中英对照版.zip

golang+onnxruntime-win-x64-static-lib-1.16.3加载yolov8的模型

PyPI 官网下载 | onnxruntime_tools-1.3.0.1007.tar.gz

Python库 | onnxruntime_gpu-1.7.0-cp36-cp36m-win_amd64.whl

算法部署-基于C++和Python使用ONNXRuntime部署RT-DETR目标检测算法-附项目源码-优质项目实战.zip

分别使用OpenCV与ONNXRuntime部署yolov5旋转目标检测源码+模型(c++和python两个版本程序).zip

onnxruntime 1.3版本

使用onnxruntime部署yolov5.zip

相关实用应用程序（Windows可用）

李飞飞自传 我看见的世界 The World I see

ChatGPT使用总结：150个ChatGPT提示词模板（完整版）

chromedriver-win64.zip

全国计算机二级WPSoffice精选350道选择题题库（含答案）.pdf

哈尔滨工业大学-ChatGPT调研报告-2023.3.6-94页.pdf

智联招聘：2024年大学生就业力调研报告.pdf

4个亲测好用的ChatGPT4渠道

2024年俄罗斯陶瓷餐具市场机会及渠道调研报告Sample.pdf

第十九届研电赛-技术论文模板

学术海报模板+论文科研+研究生

北森能力测评题库.zip

最新资源

李飞飞自传我看见的世界 The World I see