“猫狗分类实验”总结.pdf_StanfordDogsDataset数据集的train/val/test资源-CSDN文库

版权申诉

5星 · 超过95%的资源 91 浏览量 2022-06-16 01:11:24 上传评论 2 收藏 551KB PDF 举报

资源推荐

资源详情

资源评论

猫狗分类

首先使用的猫狗分类图像一共 25000 张，猫狗分别有 12500 张，我们先来

简单的瞅瞅都是一些什么图片。我们从下载文件里可以看到有两个文件夹：

train 和 test，分别用于训练和测试。以 train 为例，打开文件夹可以看到非

常多的小猫图片，图片名字从 0.jpg 一直编码到 9999.jpg，一共有 10000 张图

片用于训练。而 test 中的小猫只有 2500 张。仔细看小猫，可以发现它们姿态

不一，有的站着，有的眯着眼睛，有的甚至和其他可识别物体比如桶、人混在

一起。同时，小猫们的图片尺寸也不一致，有的是竖放的长方形，有的是横放

的长方形，但我们最终需要是合理尺寸的正方形。小狗的图片也类似，在这里

就不重复了。

猫狗分类之后设置卷积神经网络处理大小为 (28, 28, 1) 的输入张量，我

们向第一层传入参数 input_shape=(28, 28, 1) 来完成此设置。

可以看到，每个 Conv2D 层和 MaxPooling2D 层的输出都是一个形状为

(height, width,channels) 的 3D 张量。宽度和高度两个维度的尺寸通常会随

着网络加深而变小。通道数量由传入 Conv2D 层的第一个参数所控制（32 或

64）。

下一步是将最后的输出张量［大小为 (3, 3, 64) ］输入到一个密集连接

分类器网络中，即 Dense 层的堆叠，你已经很熟悉了。这些分类器可以处理

1D 向量，而当前的输出是 3D 张量。

卷积神经网络具有以下两个性质：

卷积神经网络学到的模式具有平移不变性（translation invariant）。卷

积神经网络在图像，它可以在任何地方识别这个模式，对于密集连接网络来

说，如果模式出现在新的位置，它只能重新学习这个模式。这使得卷积神经网

络在处理图像时可以高效利用数据（因为视觉世界从根本上具有平移不变

剩余13页未读，继续阅读

内容反馈

版权申诉

AshleyK

2023-06-08

总结既有理论又有实践，让人十分信服。
glowlaw

2023-06-08

作者的思路清晰明了，对实验过程进行了逐一解析。
啊看看

2023-06-08

作者的研究探究了实验的各个方面的细节，让人十分佩服。
林祈墨

2023-06-08

作者撰写此文件的方式非常门道，为读者提供了很多新的视角。
蓝洱

2023-06-08

这份文件非常值得一读，非常生动有趣。

前往

页

春哥111

粉丝: 1w+
资源: 5万+

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip