计算机视觉教程读书笔记模板
计算机视觉是一门研究如何使计算机具备人类视觉能力的科学技术,涉及计算机科学、信息科学、电子工程、模式识别、机器人学等多个领域。本书系统地介绍了计算机视觉的基本原理、典型方法和实用技术,内容包括图像采集、图像预处理、基元检测、目标分割、目标表达和描述、纹理特性分析、形状特性分析、立体视觉、三维景物恢复、运动特性分析、景物识别、广义匹配、时空行为理解、场景解释等。
图像采集是计算机视觉的第一个步骤,包括图像采集装置、采集模型和采集方式等。图像预处理是对采集到的图像进行处理,以提高图像质量和去除噪音,包括坐标变换、灰度映射、直方图修正、空域滤波等。
基元检测是计算机视觉的核心技术之一,包括边缘检测、SUSAN算子、哈里斯兴趣点算子、哈夫变换、椭圆定位和检测、位置直方图技术等。目标分割是将图像分割成不同的目标,包括轮廓搜索、主动轮廓模型、基本阈值技术、特色阈值方法、特征空间聚类等。
目标表达和描述是将目标从图像中提取出来,并对其进行描述,包括基于边界的表达、基于区域的表达、基于边界的描述、基于区域的描述等。纹理分析是研究图像的纹理特性,包括统计描述方法、结构描述方法、频谱描述方法、纹理图像分割等。
形状特性分析是研究图像的形状特性,包括形状描述、形状匹配、形状识别等。立体视觉是研究如何使计算机具备人类的立体视觉能力,包括立体匹配、立体重建等。三维景物恢复是研究如何使计算机具备三维景物恢复能力,包括三维重建、三维模型等。
运动特性分析是研究图像的运动特性,包括运动检测、运动跟踪、运动识别等。景物识别是研究如何使计算机具备景物识别能力,包括基于模板的识别、基于特征的识别等。广义匹配是研究如何使计算机具备广义匹配能力,包括基于特征的匹配、基于模板的匹配等。
时空行为理解是研究如何使计算机具备时空行为理解能力,包括行为检测、行为识别、行为预测等。场景解释是研究如何使计算机具备场景解释能力,包括场景理解、场景描述等。
本书还提供了许多讲解例题,每章均有要点小结、参考文献介绍和练习题(为部分练习题提供了解答)。本书可作为信息科学、计算机科学、计算机应用、信号与信息处理、通信与信息系统、电子与通信工程、模式识别与智能系统等学科大学本科或研究生的专业基础课教材,也可作为远程教育或继续教育中计算机应用、电子技术等专业的研究生课程教材,还可供涉及计算机视觉技术应用行业(如工业自动化、人机交互、办公自动化、视觉导航和机器人、安全监控、生物医学、遥感测绘、智能交通和军事公安等)的科技工作者自学及科研参考。