没有合适的资源?快使用搜索试试~ 我知道了~
ubuntu18.04视觉智能检测
需积分: 6 0 下载量 145 浏览量
2022-10-14
09:04:48
上传
评论
收藏 73.94MB DOCX 举报
温馨提示
试读
33页
ubuntu18.04视觉智能检测
资源推荐
资源详情
资源评论
机器人视觉人工智能技术
1 相关知识——基于 yolox 的人工智能检测技术
在 YOLO 诞生之前,目标检测领域热门的深度学习模型是 R-CNN 系列模
型,这一类的模型被称之为二阶段模型(two-stage),其大致思路就是先找出
可能含有物体的区域,进而再细致的找出这片区域内的物体是什么,在哪个位
置。
这一类模型的特点就是准确率较高,但是速度较慢,难以做到实时检测。
而这时候,YOLO V1应运而生,它的特点就是速度快,在牺牲部分模型性能的
情况下,能做到实时检测。
YOLO 直接从图片中去寻找可能存在物体的位置,因此也被称为单阶段模
型(one-stage)。
以目前应用较广的 yolox 为例:
(1)YOLOX-L 和 YOLOv4-CSP、YOLOv5-L 有差不多参数量的情况下,
YOLOX-L 在 COCO 上取得 50.0%AP(比 YOLOv5-L 高出 1.8%的 AP),且
YOLOX-L 在单张 Tesla V100 上(TeslaV100 是史上规模最庞大的 GPU,拥有超
过 210 亿个晶体管,是上代 Tesla P100 的 1.37 倍,核心面积达到了创纪录的 815
平方毫米。此外,Tesla V100 还增加与深度学习高度相关的 Tensor 单元。)能
达到 68.9FPS。COCO 数据集、Tesla V100 如图 1、图 2 所示。
图 1 COCO 数据集
图 2 Tesla V100
(2)YOLOX-Tiny 和 YOLOX-Nano(只有 0.91M 参数量和 1.08G FLOPs)
比对应的 YOLOv4-Tiny 和 NanoDet3 分别高出 10% AP 和 1.8% AP。注:FLOPS
(即“每秒浮点运算次数”,“每秒峰值速度”)是“每秒所执行的浮点运算
次数”(floating-point operations per second)的缩写。它常被用来估算电脑的执
行效能,尤其是在使用到大量浮点运算的科学计算领域中。
(3)在 Streaming Perception Challenge(Workshop on Autonomous Driving at
CVPR 2021) 使用 YOLOX-L 模 型 取 得 第 一 名 。 CVPR 是 IEEE Conference on
Computer Vision and Pattern Recognition 的缩写,即 IEEE 国际计算机视觉与模式
识别会议。该会议是由 IEEE 举办的计算机视觉和模式识别领域的顶级会议,如
图 3 和图 4 所示。
图 3 yolox 与主流检测方法性能对比
图 4 基于 yolox 的猴脸目标检测
Yolox 的优势:
(1)代码已开源。
https://github.com/Megvii-BaseDetection/YOLOX
( 2 ) 源 码 提 供 了 开 放 神 经 网 络 交 换 ONNX ( Open Neural Network
Exchange)格式,是一个用于表示深度学习模型的标准,可使模型在不同框架
之间进行转移。ONNX 是一种针对机器学习所设计的开放式的文件格式,用于
存储训练好的模型);TensorRT 是 NVIDIA 开发的一个高性能的深度学习推理
(Inference)优化器,可以为深度学习应用提供低延迟、高吞吐率的部署推理,
可用于对超大规模数据中心、嵌入式平台或自动驾驶平台进行推理加速;
NCNN 为腾讯优图实验室首个开源项目,是一个为手机端极致优化的高性能神
经网络前向计算框架;Openvino(Open Visual Inference & Neural Network
Optimization)是 Intel 于 2018 年发布的开源、商用免费,主要应用于计算机视
觉、实现神经网络模型优化和推理计算(Inference)加速的软件工具套件,能
减少很多部署所需要的时间,对工业界相当友好。推荐使用 TensorRT 可以大
大提高目标识别的效率,如图 5 和图 6 所示。
图 5 加速前目标识别速度
图 6 使用 tensorRT 加速后目标识别速度
2 实验过程
2.1 实验 1:人工智能检测
2.1.1 实验目的
1)了解人工智能环境搭建
2)学习视觉图像采集,结合 yolox 实现相机检测
2.1.2 实验设备与道具
1)realsense D435i 相机;
2)图像采集及相关程序;
3)虚拟机软件,vscode 及 conda 环境。
2.1.3 实验内容
1)学习搭建视觉识别相关的相机驱动及 OpenCV 库;
2)编写程序实现视觉图像的采集;
3)编写程序实现基于内参的 3D 图像获取。
2.1.4 实验步骤
2.1.4.1 环境搭建
实验环境:实验室提供 Ubuntu 20.04 虚拟机(conda+pytorch+yolox+ros)
建议自行配置:
1)如已有虚拟机,则检查虚拟机磁盘空间。建议 100G,如 20G,则参考
https://www.bilibili.com/video/BV15V4y1x7ed?spm_id_from=333.337.search-
card.all.click 扩容,如图 7 所示。
图 7 虚拟机磁盘空间扩展
剩余32页未读,继续阅读
资源评论
weixin_49698153
- 粉丝: 0
- 资源: 1
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于python的机械设计实用计算器,可计算电动机,传动装置,V带轮,齿轮,轴,轴承的几何或者力,运动学参数数值+源码+开发文档
- 基于HTML +JavaScript的元旦倒计时代码.docx
- 【Unity资源免费分享】孩子益智小游戏unity 5x系列Baby Doll House Cleaning
- 【资源免费分享】集市游戏(uniyt案例)
- 数据整理结果 2023-12-7 192544 6.dta
- 5.22前端基础(2)
- 糖尿病风险因素分析数据
- matlab项目源码基于matlab的声源定位广义互相关算法的实现.zip
- 基于Go的Dory-Engine应用上云引擎命令行客户端设计源码
- dotnet-core-uninstall-1.7.521001 github上下载下来,从github下载不下来时,可以使用这
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功