毕设&课程作业_基于深度学习的单目深度估计总结.zip

共73个文件

pdf：23个

py：20个

pyc：11个

版权申诉

深度学习

python

5星 · 超过95%的资源 13 浏览量 2024-01-16 17:04:00 上传评论 2 收藏 100.7MB ZIP 举报

：“毕设&课程作业_基于深度学习的单目深度估计总结.zip”提示我们，这个压缩包可能包含了一位学生在毕业设计或课程作业中对于深度学习应用于单目图像深度估计的研究成果。单目深度估计是计算机视觉领域的一个重要课题，它涉及通过单个摄像头图像来估算场景中各个点的深度信息。深度学习在此任务中通常扮演关键角色，通过训练神经网络模型，学习从二维图像到三维深度的映射规律。这种技术广泛应用在自动驾驶、机器人导航、3D重建等领域。：“计算机类毕设&课程设计源码”表明，压缩包中的内容不仅有理论分析，还可能包括实际编程实现的源代码。这可能涵盖了使用Python或C++编程语言实现的深度学习框架，如TensorFlow、PyTorch或Caffe等，这些框架广泛用于构建和训练深度学习模型。：“深度学习”、“python”、“c++”、“系统”进一步细化了项目的内容。深度学习是机器学习的一个分支，它利用多层神经网络来学习复杂的数据表示。Python作为数据科学和机器学习的主要编程语言，其丰富的库如NumPy、Pandas、Matplotlib和Scikit-learn等为数据预处理和模型构建提供了便利。C++则可能用于实现计算密集型的部分，如模型的优化和推理，因为它提供了更高效的执行速度。而“系统”可能指的是整个深度学习系统的架构，包括数据流、模型训练、验证和部署等环节。压缩包内的“Graduation Design”文件可能包含了项目的完整文档，包括研究背景、相关工作、方法介绍、实验结果和讨论等部分。其中，学生可能详细阐述了他们是如何利用深度学习技术解决单目深度估计问题的，包括选择的网络结构（如FCN、U-Net、ResNet等）、损失函数（如L1、L2或SSIM）、训练策略（如数据增强、批规范化、学习率调度）以及性能评估指标（如绝对误差、相对误差、均方根误差等）。这个压缩包提供了一个全面了解深度学习在单目深度估计应用的实例，涵盖了从理论到实践的全过程。学生可以通过阅读源代码学习如何搭建和训练模型，通过文档理解算法设计和实验分析，从而提升对深度学习和计算机视觉的理解。同时，这也为其他研究者提供了一个参考模板，可以借鉴其方法和实现来发展自己的深度学习项目。

资源推荐

资源详情

资源评论

收起资源包目录

毕设&课程作业_基于深度学习的单目深度估计总结.zip （73个子文件）

Graduation Design

dibr相关

gpu-rgb-d.caj 3.99MB

基于改进的 DIBR 算法的 2D-3D 图像转换系统.caj 897KB

基于深度图的虚拟视点绘制技术研究.pdf 0B

Research on Virtual View Rendering Based on DIBR.pdf 1.84MB

A Novel DIBR 3D Image Watermarking Algorithm Resist to Geometrical Attacks 757KB

3D Video Conversion Method Based on the Depth of the Image Description 877KB

Hole-Filling for DIBR Based on Depth andGradient Information.pdf 573KB

递进填充线算法对DIBR虚拟图像的修复.pdf 2.29MB

基于相对深度2015.6

Learning Ordinal Relationships for Mid-Level Vision.pdf 8.75MB

6489-single-image-depth-perception-in-the-wild(1).pdf 5.84MB

db878f58e70dec1daee567bc5ea84f9ca2a5.pdf 819KB

Multi-scale的卷积网络结构2015

Predicting Depth, Surface Normals and Semantic Labelswith a Common Multi-Scale Convolutional Architecture.pdf 8.98MB

Depth Map Prediction from a Single Imageusing a Multi-Scale Deep Network.pdf 6.27MB

依靠于深度信息本身的性质

除了语义分割信息有没有其他信息和深度信息也相似的？

SURGE_ Surface Regularized Geometry Estimationfrom a Single Image.pdf 5.34MB

场景中语义分割信息相似的物体所拥有的深度信息是相似的

Towards Unified Depth and Semantic Prediction from a Single Image.pdf 9.35MB

把预测深度当做一个分类问题更好解_

SINGLE IMAGE DEPTH ESTIMATION BY DILATED DEEP RESIDUAL CONVOLUTIONALNEURAL NETWORK AND SOFT-WEIGHT-SUM INFERENCE.pdf 1.23MB

1Estimating Depth from Monocular Images asClassification Using Deep Fully ConvolutionalResidual Networks.pdf 1.11MB

2Dto3Dconversionalgorithms.pdf 1018KB

非监督学习2016.7

Unsupervised Monocular Depth Estimation with Left-Right Consistency.pdf 6.88MB

Semi-Supervised Deep Learning for Monocular Depth Map Prediction.pdf 11.31MB

Unsupervised CNN for Single View DepthEstimation_ Geometry to the Rescue.pdf 8.11MB

基于CRF的方法2015

Multi-Scale Continuous CRFs as Sequential Deep Networksfor Monocular Depth Estimation.pdf 4.39MB

Depth and surface normal estimation from monocular images using regression on deep features andhierarchical CRFs.pdf 299KB

Deep Convolutional Neural Fields for Depth Estimation from a Single Image.pdf 2.64MB

images

fcrn-faces2.png 857KB

senet-faces1.png 767KB

fcrn-faces1.png 728KB

senet-faces2.png 841KB

senet-faces3.png 664KB

fcrn-faces3.png 686KB

3d-image-waring.pdf 584KB

README.md 6KB

code

faces_detect_depth

1606.00373.pdf 5.74MB

faces_depth.py 8KB

1803.08673.pdf 3.37MB

fcrn_run.py 5KB

loaddata.py 3KB

nyu_transform.py 10KB

NYU_FCRNmodels

__init__.py 33B

network.py 15KB

fcrn.pyc 7KB

network.pyc 15KB

__init__.pyc 201B

fcrn.py 11KB

senet_run.py 5KB

demo_transform.py 3KB

define_size.py 372B

model_path.py 106B

cv_glabcut.py 7KB

pytorch_models

__init__.py 0B

modules.pyc 9KB

net.pyc 2KB

senet.pyc 15KB

senet.py 16KB

__init__.pyc 199B

modules.py 7KB

resnet.pyc 8KB

densenet.py 6KB

resnet.py 7KB

densenet.pyc 8KB

net.py 882B

define_size.pyc 652B

loaddata_demo.py 2KB

faces_depth

senet-faces2.jpg 192KB

fcrn-faces2.jpg 194KB

senet-faces3.jpg 138KB

senet-faces1.jpg 167KB

fcrn-faces3.jpg 142KB

fcrn-faces1.jpg 163KB

loaddata_demo.pyc 2KB

README.md 2KB

sobel.py 764B

3d-image-waring.odt 1.01MB

# PrectictingDepth-DeepLearn-pdf ################################################################### 参考：https://blog.csdn.net/qq_39732684/article/details/80936492 其原文说明：作者：知乎用户链接：https://www.zhihu.com/question/53354718/answer/209398048 来源：知乎 ################################################################## 说明：根据总结，下载了所述论文，并分类 ################################################################# 原文：我觉得近几年采用深度学习来解决深度估计的思路可以分为好几类：第一类仅仅依靠深度学习和网络架构得到结果最近这部分文章我较为详细的总结在了专栏里：深度学习之单目深度估计 (Chapter.1)：基础篇 1. 引用最多、最早的是Eigen组的两篇文章，相对于简单粗暴的使用卷积神经网络回归来得到结果，主要卖点是采用Multi-scale的卷积网络结构（2015年）： Predicting Depth, Surface Normals and Semantic Labels with a Common Multi-Scale Convolutional Architecture Depth Map Prediction from a Single Image using a Multi-Scale Deep Network 2. 之后在2016年，Laina依靠更深层次的网络和一个“novel”的逆卷积结构再加上一个"novel"的loss来得到结果。其实我认为这篇文章的贡献点不是很大，主要是pretrain的ResNet-50帮了很大的忙。这个方法被他们组改进然后用到了之后CVPR2017用来重建SLAM的文章中。 Deeper Depth Prediction with Fully Convolutional Residual Networks （3DV 2016） CNN-SLAM: Real-time dense monocular SLAM with learned depth prediction（2017 CVPR）第二类依靠于深度信息本身的性质 1. 深度信息和语义分割信息具有很强的相关性：场景中语义分割信息相似的物体所拥有的深度信息是相似的。 Towards Unified Depth and Semantic Prediction From a Single Image (CVPR 2015) 2. 之后接下来又有文章试图去做了语义分割和深度信息的升级版：除了语义分割信息有没有其他信息和深度信息也相似的？ SURGE: Surface Regularized Geometry Estimation from a Single Image（NIPS 2016） 3. 深度信息本就是一个从远到近一层一层的分类，是不是把预测深度当做一个分类问题更好解一点，搜文章的时候搜到了这两篇用到了这个思路： Estimating Depth from Monocular Images as Classification Using Deep Fully Convolutional Residual Networks Single image depth estimation by dilated deep residual convolutional neural network and soft-weight-sum inference 第三类基于CRF的方法 CRF之前一直在语义分割问题上表现的很好，包括CRFasRNN，DeepLab等等，几乎成为了这种回归问题的标配。这一类的方法采用CRF是因为通常CNN用来做回归时产生的图都比较糊(blur), CRF可以通过条件概率建模的方法将糊的图片变得不糊。这是一种纯数学解决问题的方法，与深度信息本身的物理性质关系不大。 Deep Convolutional Neural Fields for Depth Estimation from a Single Image（2015 CVPR） Depth and surface normal estimation from monocular images using regression on deep features and hierarchical CRFs(2015 CVPR) Multi-Scale Continuous CRFs as Sequential Deep Networks for Monocular Depth Estimation (2017 CVPR) 第四类基于相对深度接下来介绍的这一类是我觉得最有意思的一个方法。总的来说就是利用了深度信息的基本特征：图片中的点与点之间的是有相对远近关系的。NIPS2016这篇文章自己构建了一个相对深度的数据库，每张图片之中仅仅标注两个随机点之间的相对远近关系，通过一个神经网络的训练就能得到原图之中的相对深度信息。而且，一般的方法通常是针对某个数据库的数据范围的（NYUv2用来做室内深度预测，深度的ground truth 是 0~10m，KITTI用来处理行车道路信息，深度的ground truth 是 0~70m）,这篇文章的深度是没有这种限制的。这篇文章得到的深度信息感觉是很amazing的一件事，为这篇文章打call！但是缺点也很明显，由于是相对深度信息仅仅得到的数据表示了当前图片中物体的远近关系和真实深度信息有很大的区别。 Single-Image Depth Perception in the Wild (NIPS2016) 当然这种相对关系的想法第一个提出来应该是下面这篇文章。不过我觉得这篇文章生成的图看起来太“超像素”了，不太smooth（因为它训练的时候就是使用的是图片中超像素的中点）： Learning Ordinal Relationships for Mid-Level Vision（2015ICCV）第五类非监督学习最近这部分文章我较为详细的总结在了专栏里：深度学习之单目深度估计 (Chapter.2)：无监督学习篇所谓使用非监督学习来训练就是利用不知道ground truth的输入图片训练来得到深度信息。既然没有深度的ground truth那肯定有来自于其他地方的约束，比如使用stereo image。stereo image是来自两个相机（或者双目相机）在同一水平线上左右相距一定位置得到的两幅图片。这种图片获取的代价要比深度的ground truth 低一些。这些方法利用了深度信息和场景之间的一些物理规律来约束，感觉得到了很不错的结果，这三个方法可以说是一脉相承： Unsupervised CNN for Single View Depth Estimation: Geometry to the Rescue（2016 ECCV) Unsupervised Monocular Depth Estimation with Left-Right Consistency (2017 CVPR) Semi-Supervised Deep Learning for Monocular Depth Map Prediction （2017 CVPR）总结其实感觉同样是image to image 的转换，深度信息相比于语义分割关注的人要少很多，很多语义分割方面的方法就会有可能直接用到深度预测方面。比如Estimating Depth from Monocular Images as Classification Using Deep Fully Convolutional Residual Networks 这篇文章其实就和CRFasRNN很像。

评论收藏

内容反馈

版权申诉