没有合适的资源?快使用搜索试试~ 我知道了~
机器视觉关键技术应用及其发展与学习指导
需积分: 9 13 下载量 154 浏览量
2017-11-13
09:07:02
上传
评论 2
收藏 381KB PDF 举报
温馨提示
试读
35页
对于学习机器视觉的人有巨大帮助,主要介绍了机器视觉领域各个经典的技术应用,并附有作者个人学习感悟,能够帮助读者清晰地了解到视觉领域的发展情况。
资源推荐
资源详情
资源评论
图像处理与计算机视觉基础,经典以及最近发
展
By xdyang(杨晓冬 xdyang.ustc@gmail.com)
1. 一 绪论
1. 为什么要写这篇文章
2. 图像处理和计算机视觉的分类
3. 图像处理和计算机视觉开源库以及编程语言选择
4. 本文的特点和结构以及适合的对象
2. 二 图像处理与计算机视觉相关的书籍
1. 数学
2. 信号处理
1. 经典信号处理
2. 随机信号处理
3. 小波变换
4. 信息论
3. 模式识别
4. 图像处理与计算机视觉的书籍推荐
5. 小结
3. 三 计算机视觉中的信号处理与模式识别
1. Boosting
2. Clustering
3. Compressive Sensing
4. Decision Trees
5. Dynamical Programming
6. Expectation Maximization
7. Graphical Models
8. Hidden Markov Model
9. Independent Component Analysis
10. Information Theory
11. Kalman Filter
12. Pattern Recognition and Machine Learning
13. Principal Component Analysis
14. Random Forest
15. RANSAC
16. Singular Value Decomposition
17. Sparse Representation
18. Wavelet
4. 四 图像处理与分析
1. Bilateral Filter
2. Color
3. Compression and Encoding
4. Contrast Enhancement
5. Deblur Restoration
6. Dehazing and Defog
7. Denoising
8. Edge Detection
9. Graph Cut
10. Hough Transform
11. Image Interpolation
12. Image Matting
13. Image Modeling
14. Image Quality Assessment
15. Image Registration
16. Image Retrieval
17. Image Segmentation
18. Level Set
19. Pyramid
20. Radon Transform
21. Scale Space
22. Snake
23. Super Resolution
24. Thresholding
25. Watershed
5. 五 计算机视觉
1. Active Appearance Models
2. Active Shape Models
3. Background modeling and subtraction
4. Bag of Words
5. BRIEF
6. Camera Calibration and Stereo Vision
7. Color and Histogram Feature
8. Deformable Part Model
9. Distance Transformations
10. Face Detection
11. Face Recognition
12. FAST
13. Feature Extraction
14. Feature Matching
15. Harris
16. Histograms of Oriented Gradients
17. Image Distance
18. Image Stitching
19. KLT
20. Local Binary Pattern
21. Low-Level Vision
22. Mean Shift
23. MSER
24. Object Detection
25. Object Tracking
26. OCR
27. Optical Flow
28. Particle Filter
29. Pedestrian and Human detection
30. Scene Classification
31. Shadow Detection
32. Shape
33. SIFT
34. SLAM
35. Texture Feature
36. TLD
37. Video Surveillance
38. Viola-Jones
6. 六 结束语
一、
绪论
1.
为什么要写这篇文章
从 2002 年到现在,接触图像快十年了。虽然没有做出什么很出色的工作,不
过在这个领域摸爬滚打了十年之后,发现自己对图像处理和计算机视觉的感情越来
越深厚。下班之后看看相关的书籍和文献是一件很惬意的事情。平常的一大业余爱
好就是收集一些相关的文章,尤其是经典的文章,到现在我的电脑里面已经有了几
十 G 的文章。写这个文档的想法源于我前一段时间整理文献时的一个突发奇想,既
然有这个多文献,何不整理出其中的经典,抓住重点来阅读,同时也可以共享给大
家。于是当时即兴写了一个《图像处理与计算机视觉中的经典论文》。现在来看,
那个文档写得很一般,所共享的论文也非常之有限。就算如此,还是得到了一些网
友的夸奖,心里感激不尽。因此,一直想下定决心把这个工作给完善,力求做到尽
量全面。
本文是对现有的图像处理和计算机视觉的经典书籍(后面会有推荐)的一个补充。
一般的图像处理书籍都是介绍性的介绍某个方法,在每个领域内都会引用几十上百
篇参考文献。有时候想深入研究这个领域的时候却发现文献太多,不知如何选择。
但实际上在每个领域都有那么三五篇抑或更多是非读不可的经典文献。这些文献除
了提出了很经典的算法,同时他们的 Introduction 和 Related work 也是对所在的领
域很好的总结。读通了这几篇文献也就等于深入了解了这个领域,比单纯的看书收
获要多很多。写本文的目的就是想把自己所了解到的各个领域的经典文章整理出来,
不用迷失在参考文献的汪洋大海里。
2.
图像处理和计算机视觉的分类
按照当前流行的分类方法,可以分为以下三部分:
A.图像处理:对输入的图像做某种变换,输出仍然是图像,基本不涉及或者很少涉
及图像内容的分析。比较典型的有图像变换,图像增强,图像去噪,图像压缩,图
像恢复,二值图像处理等等。基于阈值的图像分割也属于图像处理的范畴。一般处
理的是单幅图像。
B.图像分析:对图像的内容进行分析,提取有意义的特征,以便于后续的处理。处
理的仍然是单幅图像。
C.计算机视觉:对图像分析得到的特征进行分析,提取场景的语义表示,让计算机
具有人眼和人脑的能力。这时处理的是多幅图像或者序列图像,当然也包括部分单
幅图像。
关于图像处理,图像分析和计算机视觉的划分并没有一个很统一的标准。一般的来
说,图像处理的书籍总会或多或少的介绍一些图像分析和计算机视觉的知识,比如
冈萨雷斯的数字图像处理。而计算机视觉的书籍基本上都会包括图像处理和图像分
析,只是不会介绍的太详细。其实图像处理,图像分析和计算机视觉都可以纳入到
计算机视觉的范畴:图像处理->低层视觉(low level vision),图像分析->中间层
视觉(middle level vision),计算机视觉->高层视觉(high level vision)。这是一
般的计算机视觉或者机器视觉的划分方法。在本文中,仍然按照传统的方法把这个
领域划分为图像处理,图像分析和计算机视觉。
3.
图像处理和计算机视觉开源库以及编程语言选择
目前在图像处理中有两种最重要的语言:c/c++和 matlab。它们各有优点:
c/c++比较适合大型的工程,效率较高,而且容易转成硬件语言,是工业界的默认
语言之一。而 matlab 实现起来比较方便,适用于算法的快速验证,而且 matlab 有
成熟的工具箱可以使用,比如图像处理工具箱,信号处理工具箱。它们有一个共同
的特点:开源的资源非常多。在学术界 matlab 使用的非常多,很多作者给出的源代
码都是 matlab 版本。最近由于 OpenCV 的兴起和不断完善,c/c++在图像处理中的
作用越来越大。总的来说,c/c++和 matlab 都必须掌握,最好是精通,当然侧重在
c/c++上对找工作会有很大帮助。
至于开源库,个人非常推荐 OpenCV,主要有以下原因:
(1)简单易入手。OpenCV 进入 OpenCV2.x 的时代后,使用起来越来越简单,接口
越来越傻瓜化,越来越 matlab 化。只要会 imread,imwrite,imshow 和了解 Mat 的基
本操作就可以开始入手了。
(2)OpenCV 有一堆图像处理和计算机视觉的大牛在维护,bug 在逐步减少,每个
新的版本都会带来不同的惊喜。而且它已经或者逐步在移植到不同的平台,并提供了
对 Python 的很好的支持。
(3)在 OpenCV 上可以尝试各种最新以及成熟的技术,而不需要自己从头去写,
比如人脸检测(Harr,LBP),DPM(Latent SVM),高斯背景模型,特征检测,
聚类,hough 变换等等 。而且它还支持各种机器学习方法(SVM,NN,KNN,决
策树,Boosting 等),使用起来很简单。
(4)文档内容丰富,并且给出了很多示例程序。当然也有一些地方文档描述不清楚,
不过看看代码就很清楚了。
(5)完全开源。可以从中间提取出任何需要的算法。
剩余34页未读,继续阅读
资源评论
leo.fan
- 粉丝: 1
- 资源: 3
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功