没有合适的资源?快使用搜索试试~ 我知道了~
“猫狗分类实验”总结.pdf
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
5星 · 超过95%的资源 3 下载量 91 浏览量
2022-06-16
01:11:24
上传
评论 2
收藏 551KB PDF 举报
温馨提示
试读
14页
“猫狗分类实验”总结.pdf“猫狗分类实验”总结.pdf“猫狗分类实验”总结.pdf“猫狗分类实验”总结.pdf“猫狗分类实验”总结.pdf“猫狗分类实验”总结.pdf“猫狗分类实验”总结.pdf“猫狗分类实验”总结.pdf
资源推荐
资源详情
资源评论
猫狗分类
首先使用的猫狗分类图像一共 25000 张,猫狗分别有 12500 张,我们先来
简单的瞅瞅都是一些什么图片。我们从下载文件里可以看到有两个文件夹:
train 和 test,分别用于训练和测试。以 train 为例,打开文件夹可以看到非
常多的小猫图片,图片名字从 0.jpg 一直编码到 9999.jpg,一共有 10000 张图
片用于训练。而 test 中的小猫只有 2500 张。仔细看小猫,可以发现它们姿态
不一,有的站着,有的眯着眼睛,有的甚至和其他可识别物体比如桶、人混在
一起。同时,小猫们的图片尺寸也不一致,有的是竖放的长方形,有的是横放
的长方形,但我们最终需要是合理尺寸的正方形。小狗的图片也类似,在这里
就不重复了。
猫狗分类之后设置卷积神经网络处理大小为 (28, 28, 1) 的输入张量,我
们向第一层传入参数 input_shape=(28, 28, 1) 来完成此设置。
可以看到,每个 Conv2D 层和 MaxPooling2D 层的输出都是一个形状为
(height, width,channels) 的 3D 张量。宽度和高度两个维度的尺寸通常会随
着网络加深而变小。通道数量由传入 Conv2D 层的第一个参数所控制(32 或
64)。
下一步是将最后的输出张量[大小为 (3, 3, 64) ]输入到一个密集连接
分类器网络中,即 Dense 层的堆叠,你已经很熟悉了。这些分类器可以处理
1D 向量,而当前的输出是 3D 张量。
卷积神经网络具有以下两个性质:
卷积神经网络学到的模式具有平移不变性(translation invariant)。卷
积神经网络在图像,它可以在任何地方识别这个模式,对于密集连接网络来
说,如果模式出现在新的位置,它只能重新学习这个模式。这使得卷积神经网
络在处理图像时可以高效利用数据(因为视觉世界从根本上具有平移不变
性),它只需要更少的训练样本就可以学到具有泛化能力的数据表示。
卷积神经网络可以学到模式的空间层次结构(spatial hierarchies of
patterns)第一个卷积层将学习较小的局部模式(比如边缘),第二个卷积层
将学习由第一层特征组成的更大的模式,以此类推。这使得卷积神经网络可以
有效地学习越来越复杂、越来越抽象的视觉概念(因为视觉世界从根本上具有
空间层次结构)。
对于包含两个空间轴(高度和宽度)和一个深度轴(也叫通道轴)的 3D
张量,其卷积也叫特征图(feature map)。对于 RGB 图像,深度轴的维度大
小等于 3,因为图像有 3 个颜色通道:红色、绿色和蓝色。对于黑白图像(比
如 MNIST 数字图像),深度等于 1(表示灰度等级)。卷积运算从输入特征图
中提取图块,并对所有这些图块应用相同的变换,生成输出特征图
(outputfeature map)。该输出特征图仍是一个 3D 张量,具有宽度和高度,
其深度可以任意取值,因为
输出深度是层的参数,深度轴的不同通道不再像 RGB 输入那样代表特定颜
色,而是代表过滤器(filter)。
从这些图像中都能看出过拟合的特征。训练精度随着时间线性增加,直到
接近 100%,而验证精度则停留在 70%~72%。验证损失仅在 5 轮后就达到最
小值,然后保持不变,而训练损失则一直线性下降,直到接近于 0。
因为训练样本相对较少(2000 个),所以过拟合是你最关心的问题。前面
已经介绍过几种降低过拟合的技巧,比如 dropout 和权重衰减(L2 正则
化)。现在我们将使用一种针对于计算机视觉领域的新方法,在用深度学习模
型处理图像时几乎都会用到这种方法,它就是数据增强(data augmentation)
在编译和训练模型之前,一定要“冻结”卷积基。冻结(freeze)一个
或多个层是指在训练过程中保持其权重不变。如果不这么做,那么卷积基之前学
到的表示将会在训练过程中被修改。因为其上添加的 Dense 层是随机初始化的,
所以非常大的权重更新将会在网络中传播,对之前学到的表示造成很大破坏。项
目属于计算机视觉领域中的图像分类问题。图像分类的过程非常明确:给定已经
剩余13页未读,继续阅读
春哥111
- 粉丝: 1w+
- 资源: 5万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
- 1
- 2
- 3
前往页