基于python+yolov5角点检测+PnP的视觉SLAM项目+源码+项目说明+开发文档说明（毕业设计&课程设计&项目开发）

共92个文件

py：35个

pyc：24个

yaml：8个

版权申诉

毕业设计

python

角点检测

yolov5

5星 · 超过95%的资源 179 浏览量 2024-03-20 21:27:38 上传评论 3 收藏 55.55MB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

基于yolov5角点检测.zip （92个子文件）

基于yolov5角点检测

visionLocalization-master

.DS_Store 6KB

localizationV1.gif 5.69MB

.vscode

settings.json 65B

mvcamera.py 4KB

localizationV3.gif 10.69MB

getPicture.py 526B

detection.py 6KB

新建文本文档.txt 0B

best.pt 14.04MB

utils

__init__.py 0B

mvcamera.py 4KB

google_utils.py 5KB

loss.py 8KB

metrics.py 8KB

autoanchor.py 7KB

general.py 18KB

activations.py 2KB

google_app_engine

Dockerfile 821B

app.yaml 173B

additional_requirements.txt 105B

function.py 1KB

plots.py 15KB

datasets.py 37KB

__pycache__

general.cpython-37.pyc 13KB

function.cpython-37.pyc 1KB

plots.cpython-37.pyc 14KB

datasets.cpython-37.pyc 28KB

autoanchor.cpython-37.pyc 6KB

google_utils.cpython-37.pyc 3KB

metrics.cpython-37.pyc 7KB

torch_utils.cpython-37.pyc 9KB

__init__.cpython-37.pyc 133B

loss.cpython-37.pyc 5KB

torch_utils.py 9KB

mvsdk.py 87KB

cordinate.png 148KB

localizationV2.gif 9.11MB

models

hub

yolov5-panet.yaml 1KB

yolov3-spp.yaml 1KB

yolov5-fpn.yaml 1KB

__init__.py 0B

export.py 4KB

yolov5m.yaml 1KB

yolov5s.yaml 1KB

yolov5l.yaml 1KB

common.py 10KB

experimental.py 6KB

__pycache__

yolo.cpython-37.pyc 10KB

experimental.cpython-37.pyc 7KB

__init__.cpython-37.pyc 134B

common.cpython-37.pyc 12KB

yolov5x.yaml 1KB

yolo.py 12KB

detect.py 8KB

.gitignore 50B

cornerfinding

__init__.py 0B

.vscode

settings.json 65B

mvcamera.py 4KB

36.txt 37B

tagDetection.py 963B

tagVisual.py 11KB

tagFamilies.py 22KB

example3.png 737KB

apriltag.py 5KB

tagUtils.py 3KB

testcam.py 2KB

__pycache__

mvsdk.cpython-37.pyc 78KB

mvcamera.cpython-37.pyc 3KB

tagFamilies.cpython-37.pyc 16KB

tagDetection.cpython-37.pyc 1KB

__init__.cpython-37.pyc 155B

apriltag.cpython-37.pyc 3KB

cornerfinding.cpython-37.pyc 9KB

test.py 79B

README.md 81B

cornerfinding.py 15KB

mvsdk.py 87KB

相机标定

Camera MV-SUA133GC#0001-0019-Snapshot-20210112154302-232814268600.BMP 3.75MB

Camera MV-SUA133GC#0001-0019-Snapshot-20210112154309-232882878487.BMP 3.75MB

Camera MV-SUA133GC#0001-0019-Snapshot-20210112154303-232823141443.BMP 3.75MB

Camera MV-SUA133GC#0001-0019-Snapshot-20210112154254-232738694545.BMP 3.75MB

camParams.mat 3KB

Camera MV-SUA133GC#0001-0019-Snapshot-20210112154307-232865174961.BMP 3.75MB

Camera MV-SUA133GC#0001-0019-Snapshot-20210112154259-232791739891.BMP 3.75MB

picture.PNG 12KB

__pycache__

function.cpython-37.pyc 1023B

mvsdk.cpython-37.pyc 78KB

mvcamera.cpython-37.pyc 3KB

README.md 10KB

Data

040050820060.mvdat 14KB

grabFrame.py 5KB

mvsdk.py 87KB

# CornerPointDetection YanjieZe(the Last Refugee) # 项目说明使用two-stage algorithm识别tag进而标定相机位置。首先，使用yolov5进行目标检测，获得bounding box。然后，对bounding box区域单独处理，使用轮廓提取与角点检测的算法获得四个角点的位置，进而求解PnP问题获得相机位置。进度：大概完成80%吧还需完成的事情：标定数据量较大的数据集，并进行调试 # 目录 [Ⅰ Use method](https://github.com/YanjieZe/visionLocalization#%E2%85%B0-use-method) [Ⅱ Process Log](https://github.com/YanjieZe/visionLocalization#%E2%85%B1-process-log) [Ⅲ Bug log](https://github.com/YanjieZe/visionLocalization#%E2%85%B2-bug-log) # Ⅰ Use method ## 1 use mindvision cam for detection > py detect.py --weights best.pt --source 0 --view-img ## 2 Collect frame as the raw dataset, using mindvision camera > py grabFrame.py --collection 1 --reponum (the numbe your want) --framenum (the number you want) example: > py grabFrame.py --collection 1 --reponum 4 --framenum 100 ## 3 Use mindVision camera,just for a look > python grabFrame.py --collection 0 ## 4 use mindVison camera for detection this python file is in another folder.So you should first: > cd cornerfinding then: > python cornerfinding.py --mode camera # Ⅱ Process Log ## **2020.11.13** start to write the code structure and detection algorithm 初步使用电脑自带的webcam进行检测。 ## **2020.12.13** finish training YOLOV5 model 使用自己标定的数据集 ## **2020.12.17** finish the collection module(grabFrame.py): **connect the mindvision camera and auto collect frame as the raw dataset** ## **2021.01.09** start to modify the code but then decide to write **corner detection** first 开始自己尝试写角点检测算法。第一个想法是先把他切割出来，就是用yolo分割的结果做一个切割。简单的**getCropped()**实现一下。第二个想法是用这个tag最明显的位置来进行角点的推算，有两个很容易检测的位置：中间的字母，右下角的一个小方块。那么我就先把轮廓提取出来，再把这两个的轮廓拿出来，求一下中心点的位置，就可以得到描述这个tag的两个特征。先把这个想法实现一下吧。得到这两个中心点的坐标后tag的四个角点坐标基本就出来了。把轮廓面积排了一下，莫名和预计中的不一样。但是可以确定的是，可以用面积筛选方法得到中间字符的位置，不过要得到右下角小方块的位置用面积筛选的方法不怎么具有鲁棒性，因此找小方块另寻方法。第三个想法：小方块是方形的，可以用一种匹配形状的方法把他找到吗？这个想法让我使用检测形状的方法来找出小方块，即轮廓逼近法。写了一下，效果还可以，不过结果竟然有两个，其中一个很奇怪，是边缘的一个角点，应该是有一个很小的矩形轮廓，应该是误判了。因此第四个想法，再进一步优化一下，将轮廓逼近法之后再用面积比较法筛选一下试一试。 ## **2021.01.10** continuing modifying 昨天的第四个想法实现之后，开始用mind vision camera进行实时检测。发现在实时检测之中，有可能出现找不到矩形框的情况。做了一些优化。目前尚存在的问题：可能会检测出很小的轮廓。考虑在面积筛选的时候做一些优化。做完优化后，可以找到点，但是会有很多点在飘，接下来考虑要么使用目标跟踪的算法，要么重新优化原来的算法。在新的图片中我发现tag的红色十分明显，考虑从这一步入手先试一试。原先的**findCorner**可以先不改，对于轮廓提取做出改进就行。第五个想法，颜色分割+轮廓识别重调。颜色分割的结果意外地好。开始进行轮廓的识别和位置的计算。面积筛选和中心点计算已完成，效果很好！详情见**redContourExtract** ![](localizationV1.gif) 接下来就是增强鲁棒性。 1. 原图高曝光，红色更容易识别，但是在不同场景下会失效。考虑如何提高这一方面的颜色适应性。 2. 算法中的颜色区域可能不够精准，考虑通过实时返回的hsv值对要识别的区域进行标定。第六个想法，通过实时获得hsv值对想要得到的区域进行标定，再进行检测，即部分自动参数设置功能。写好了一个取参数的函数**autoHSVget**。使用**auotoHSVget**进行了参数调节，获得了正常曝光度情况下的结果，还不错！ ![](localizationV2.gif) ## **2021.01.11** continuing modifying 为提高精度，开始尝试用apriltag算法。附上一个靠谱的链接：[apriltag算法讲解](https://blog.csdn.net/han784851198/article/details/90261197?ops_request_misc=%25257B%252522request%25255Fid%252522%25253A%252522161033232116780258054111%252522%25252C%252522scm%252522%25253A%25252220140713.130102334.pc%25255Fall.%252522%25257D&request_id=161033232116780258054111&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~first_rank_v2~rank_v29-1-90261197.pc_search_result_cache&utm_term=apriltag) 一个上午在看apriltag的算法和实现代码。首先直接使用了一下代码，发现效果不好，然后想了一下具体问题在于：这个算法用了凸包算法，但是我要检测的tag上只有一个算是凸包，还有三个是凹陷的。因此这个算法用来检测二维码还不错，检测这种奇怪的凹下去的形状就不太行了。因此，在尝试了一上午后，还是决定用自己昨天写的算法，再借鉴apriltag算法中的一些东西做一下优化。 RedContourExtract算法优化进行中。出现的问题：轮廓重识别。解决方法：在计算中心点时进行判断，若有两个轮廓的中心点相邻很近，排除。但是直接通过优化面积的算法解决了。优化以后，效果：**fps=34.5** 添加了一个新的超参数：minArea，对于筛选面积时是十分重要的。出现的问题：对于远距离识别，minArea要小，不然就找不到轮廓。对于近距离识别，minArea要大，不然就轮廓太多，会有噪声。 ## **2021.01.12** start writing **PnP** 优化暂时到此为止，这几天的主要任务是写PnP算法，求解相机位置。很久没有碰过PnP了。上午看了一下知乎和博客，回顾了**对极几何**和**PnP**。附上一个还不错的讲解：[视觉SLAM:搞定坐标系、三角测量、PnP](https://zhuanlan.zhihu.com/p/80921759) 下午写一下算法进行实战。首先对目前使用的mindvision相机进行标定，为方便，就用matlab了。内参矩阵： 1557.90406532275 0 0 0 1543.49983613257 0 680.204169094410 644.295104426977 1 径向畸变： -0.152787687060218 0.275768296110960 切向畸变： 0 0 具体数据保存在**camParams.mat**里可以用P3P算法解这个问题，即提供三个点的像素坐标和空间坐标。目前我的算法能勉强检测出三个坐标，过会再调调参数，优化一下，现在先写好用P3P算法解决问题。出现问题：三个点或四个点的世界坐标要进行测量。我自己先这样建世界坐标系了，把右下角的角点作为原点。大概测量一下，记录测量结果：右下角方块角点：（0，0，0）右上角：（16，0，0）左下角：（0，21，0）左上角：（16，21，0） **这个没有精确测量，暂时先看一下算法能不能用。** 出现问题：在实际应用中，返回的角点除了右下角方块角点可以确定对应面积最大的轮廓中心点，其他的点并不能确定。 **所以需要算法进行判定这四个点的相对位置！** 暂时还是得用四个点解PnP问题。在用solvePnP求得旋转矩阵和平移矩阵后，再计算相机位置。出现问题：solvePnP函数报�

评论收藏

内容反馈

版权申诉