学科前沿报告总结
所属课程: 学科前沿
专业名称:
班 级:
学 号:
姓 名:
日期: 2022 年 12 月 1 日
成绩
目 录
1.计算机视觉讲座报告........................................................................................................5
1.1 计算机视觉的背景介绍..........................................................................................5
1.2 计算机视觉的研究进展..........................................................................................5
1.2.1 识别分类 .........................................................................................................6
1.2.2 目标检测 .........................................................................................................7
1.3 计算机视觉的收获总结..........................................................................................8
2.深度学习听讲报告............................................................................................................9
2.1 深度学习的背景介绍..............................................................................................9
2.2 人工神经网络..........................................................................................................9
2.3 深度学习中无监督学习.......................................................................................10
2.4 收获与总结............................................................................................................10
3.行人重识别讲座报告......................................................................................................13
3.1 行人重识别的背景介绍........................................................................................13
3.2 基于对抗生成性网络的行人重识别算法 ..........................................................13
4.总结..................................................................................................................................15
1.计算机视觉讲座报告
1.1 计算机视觉的背景介绍
近年来,随着大数据的发展和深度学习的推进,人工智能逐渐进入大众视野,
不管其是否可以如科幻故事中诉说的那般造福人类,它都正在逐步渗透进人们的
生活。其中,计算机视觉是人工智能落地的最好的领域之一,由于人眼可以包罗万
象,因此计算机视觉的应用也是无处不在。从市政安防、自动驾驶、影视娱乐、
时尚设计,到日常生活中触手可及的人机交互、刷脸认证、扫码支付、相册管理,
再到目前新兴的电商平台领域应用,等等,计算机视觉技术正持续快速地落地与渗
透。
计算机视觉技术与人的肉眼理解图片的方式不同,它以数字矩阵的形式存取
图片。若图片是 RGB 格式,那么每一个像素点颜色便可以用代表 RCB(红绿蓝)的
3 个数值作为 3 个颜色通道,从而整张图片便可以用一个矩阵表示。如图 1-1,人类
肉眼观看到的仅是左侧的一只普通的猫,而在计算机眼里每个像素点都是由 3 个
0~255 之间的数字组成的矩阵。
图 1-1 图像在计算机视觉当中的表示方式
2012 年是计算机视觉发展历史中的重要节点,深度学习在计算机视觉领域
应用越来越广泛,取得的突破性成果也日益增加。传统计算机视觉算法逐步被深
度学习方法所替代,新方法及模型如雨后春笋般快速诞生。
1.2 计算机视觉的研究进展
计 算 机 视 觉 目 前 主 流 的 任 务 有 四 类 : 分 类 ( Classification ) , 检 测
(Detection),识别(Identification),分割(Segmentation)。分类,即对一幅
图片进行一个整体的划分,研究者关注在一个图片中占主要部分的物体的类别。
分类的范围是图片的粒度,常见的公开数据集比如 ImageNet,MNIST 都是以这