### 2024年bjtu计算机视觉课程必考知识点汇总 #### 1. 图像滤波(Image Filtering)的三种定义方式:相关、卷积、内积 - **相关**: 在模版覆盖区域内,模版的每个元素与图像对应位置上的像素值逐一相乘并累加,最终得到的结果作为模版中心对应图像位置的新值。 - **卷积**: 将模版旋转180度后,再执行与相关操作相同的步骤。 - **内积**: 将模版和图像对应区域内的像素值按行或列形成两个向量,然后这两个向量逐元素相乘并将结果累加得到一个标量。 #### 2. 图像滤波的三种用途:模板匹配、图像增强、特征提取 - **模板匹配**: 使用一个目标原型创建模板,并与测试图像进行卷积,卷积结果大的位置表示模板与图像匹配度高。例如,手势识别中可利用此方法定位特定手势。 - **图像增强**: 包括图像平滑(如高斯模糊)和图像锐化(如拉普拉斯算子)。图像平滑可用于去除噪声,使图像更清晰;图像锐化则用于增强边缘和细节,提高图像的清晰度和对比度。 - **特征提取**: 提取图像中的重要视觉线索,如边缘、角点等,为后续分析和处理提供基础。例如,Canny边缘检测算法利用高斯偏导核来提取边缘。 #### 3. 解释在kernel的size不同σ相同情况下得到结果类似的原因 - 高斯核的大小通常设定为6σ,这意味着在这个范围内高斯核的值几乎涵盖了所有的权重,因此即使kernel size增大,超出这个范围的权重也非常小,对最终结果的影响有限,因此图像平滑效果类似。 #### 4. 如何设置高斯核的参数 - σ (sigma): 表示高斯分布的标准差,决定了高斯核的宽度和平滑程度。较小的σ会产生较窄的核,较大的σ会产生较宽的核。 - kernel size: 通常为6σ,确保覆盖了绝大部分的权重分布。 #### 5. 高斯偏导核的用途和设计原理 - **用途**: 主要用于计算图像的梯度,帮助提取图像的边缘信息。 - **设计原理**: 通过将高斯核与一阶偏导算子组合,可以在平滑图像的同时计算梯度,有效地减少噪声的影响。 #### 6. Canny算子如何获取“细边缘” - 使用高斯核平滑图像以减少噪声。 - 应用高斯偏导核计算图像梯度的大小和方向。 - 进行非极大值抑制,保留局部最大梯度值作为边缘。 - 应用双阈值处理,结合连通性分析,确定最终边缘。 #### 7. Canny算子的“双阈值”设计思路 - 设置高低两个阈值,低阈值用于确定可能的边缘候选,高阈值用于确定真正的边缘。这种机制能够有效地避免断裂的边缘。 #### 8. 滤波器组(Filter Bank)的组成及其作用 - **组成**: 包括多种类型的滤波器,如高斯滤波器、拉普拉斯滤波器、方向滤波器等。 - **作用**: 多种滤波器可以提取不同的特征,如纹理、边缘方向等,为后续的特征匹配提供丰富的信息。 #### 9. Harris算子的数学原理 - 基于图像灰度变化强度来检测角点,利用结构张量分析图像中局部区域的变化方向和强度,从而确定角点位置。 #### 10. 自动尺度选择的基本思想 - 寻找最适合图像特征的尺度,通常通过构建多尺度空间来实现,寻找图像特征响应最大的尺度。 #### 11. SIFT算子"双塔”结构含义及其简化计算 - “双塔”结构是指SIFT在构建金字塔过程中采用的两个金字塔之间的差分,可以简化计算,同时保持特征的稳定性。 #### 12. SIFT如何为每个关键点确定方向 - 通过计算关键点邻域内像素的梯度直方图,利用投票机制确定主方向。 #### 13. SIFT描述子生成过程 - 对关键点邻域内的像素进行梯度计算。 - 划分子区域,并统计每个子区域的梯度直方图。 - 归一化梯度直方图,生成描述子向量。 #### 14. 构造视觉词典的方法 - 通过聚类算法(如K-means)对SIFT描述子进行聚类,将每个聚类中心视为一个词汇,构成视觉词典。 #### 15. 纹理基元构造过程 - 从训练集中提取纹理特征。 - 通过聚类算法对特征进行分组,每个群组代表一种纹理基元。 #### 16. NB与KNN、LinCls的理论联系 - Naive Bayes(NB)基于概率模型进行分类,而KNN和Linear Classifier(LinCls)则是基于距离或线性决策边界进行分类。三者都可用于模式识别和分类任务,但各自的假设条件和适用场景有所不同。 #### 17. 𝐬 = 𝑓 (𝐱, 𝐖) = 𝐖x 的解释 - **代数视角**: 参数矩阵𝑊与输入𝑥的乘积可以理解为线性变换,𝑊的每一行对应了一个特征空间的方向。 - **几何视角**: 此公式表示的是输入向量在𝑊定义的空间中的投影。 #### 18. 交叉熵损失和铰链损失的数学解释 - **交叉熵损失**: 用于多分类问题,特别是Softmax分类器。衡量预测分布与真实分布之间的差异。 - **铰链损失**: 用于支持向量机(SVM),目的是最大化分类间隔。 #### 19. 确定参数W更新方向 - 使用梯度下降法,沿着负梯度方向更新参数,以最小化损失函数。 #### 20. 批块是否是越小越快 - 不一定,过小的批块会导致计算效率降低,过大的批块又会占用大量内存资源。 #### 21. 小批量更新策略有助于模型训练的原因 - 减少每次更新所需的计算资源。 - 引入更多随机性,有助于跳出局部最优解。 #### 22. 神经网络隐藏层的作用 - 神经网络通过隐藏层来实现非线性映射,使得模型能够拟合复杂的函数关系。 #### 23. 再谈神经网络隐藏层的作用 - 从代数视角看,隐藏层的引入增加了模型的表达能力,使得模型能够逼近更复杂的函数。 #### 24. CNNs 输出卷积核大小和参数数量 - 输出卷积核大小取决于输入大小、卷积核大小、步长和填充。 - 参数数量由卷积核大小和通道数决定。 #### 25. 神经计算视角下的感受野和权值共享 - **感受野**: 指的是某个神经元可以接受的输入区域。 - **权值共享**: 在卷积神经网络中,同一卷积层的所有神经元共享同一组权重。 #### 26. AlexNet的特点 - 使用多个GPU进行训练。 - 采用了ReLU激活函数和Dropout正则化技术。 #### 27. Sigmoid激活函数引发梯度消失的原因 - 当输入接近±∞时,Sigmoid函数的导数接近0,导致梯度消失。 #### 28. 数据增广(augmentation)对于CNN的意义 - 增加训练样本多样性,防止过拟合。 #### 29. Dropout有助于提升CNN预测精度的原因 - 通过随机关闭部分神经元,模拟多个网络结构,提高模型的泛化能力。 #### 30. Momentum的作用 - 加速梯度下降过程,减少振荡,更快收敛到最小值。 #### 31. 小尺寸滤波器的好处 - 减少参数数量,降低计算复杂度,同时保持足够的感受野。 #### 32. 1×1卷积的作用 - 改变通道数,进行特征融合或特征降维。 #### 33. 残差模块的设计思想 - 通过跳接(residual connection)使网络能够更容易地学习残差映射,解决深层网络的退化问题。 #### 34. 训练DNN的指南 - 初始化策略。 - 学习率调整。 - 正则化技术。 #### 35. 从R-CNN到Fast R-CNN的技术演变历程 - R-CNN存在的问题: 训练和推理时间长,依赖外部工具选择候选区域。 - Fast R-CNN改进: 共享卷积特征,引入RoI Pooling层,提高了速度和准确性。 #### 36. 从Fast R-CNN再到Faster R-CNN的技术演变 - Faster R-CNN改进点: 使用RPN代替选择性搜索,进一步提高了速度。 - RPN流程: 生成候选区域,通过共享卷积层提取特征,最终进行分类和回归。 #### 37. NMS如何去除重叠框 - 使用非极大值抑制(NMS)算法,根据预测框的置信度排序,去除重叠率高的框。 #### 38. 如何绘制PR图/计算AP - PR图: 绘制精确率(Precision)与召回率(Recall)的曲线。 - AP计算: 计算平均精确率(Average Precision),通常是在不同的召回率点上计算精确率的平均值。 #### 39. 全卷积网络存在的问题 - 边界信息丢失,分辨率受限。 #### 40. 转置卷积如何解决全卷积网络问题 - 下采样(Downsampling): 降低图像分辨率,减少计算量。 - 卷积操作(Convolution): 提取特征。 - 上采样(Upsampling): 恢复分辨率,补充细节信息。
剩余24页未读,继续阅读
- 粉丝: 988
- 资源: 3
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- windows server 2019 安装net franework3.5.,添加功能-勾选3.5-确认步骤【指定备用源路径】,指定解压后路径,即可成功安装
- win10/win11均可使用
- 二甲基pep基于双光子激发细胞成像中的DNA探针设计
- java校园二手市场源码带本地搭建教程数据库 MySQL源码类型 WebForm
- 后端框架使用Django开发,数据库使用:Sql Server,前端使用Django模板,实现管理员对用户信息的增删改查,图书的增删改查,借阅管理,数据库日志查看,用户可以浏览图书信息,加入书架
- SQLServer-2022-Editions-datasheet.pdf
- EN-US-CNTNT-white-paper-DBMod-Microsoft-SQL-Server-2019-Technical-white-paper.pdf
- 基于Python+Django的交友系统,包括功能发布动态,私信聊天,发起活动,发表评论等
- Python毕业设计基于知识图谱的大学生能力评价与职位推荐系统源码(高分项目)
- java教师教学质量评价管理系统源码数据库 MySQL源码类型 WebForm