The CIFAR-10 dataset(原文)
和 是八千万个微小图像数据集的标记子集。它们是由亚历克斯克
里日夫斯基、维诺德奈尔和杰弗里辛顿收集的。
数据集由 个类中的 幅 幅彩色图像组成,每类有 幅图像。
共有 幅训练图像和 张测试图像。
数据集分为五个训练批次和一个测试批次,每个训练批次有 幅图像。测试批次
包含来自每个类的 个随机选择的图像。训练批次按随机顺序包含剩余的图像,但有些
训练批次可能包含来自一个类的图像多于另一个类的图像。在它们之间,训练批次包含来
自每个类的确切的 张图像。
下面是 中的类别,以及来自每个类的 个随机图像:
!
"
#$%
这些类是完全相互不同的类。汽车和卡车之间没有重叠。“汽车”包括轿车,&',诸如
此类的东西。“卡车”只包括大卡车。这两项都不包括皮卡。
如果您要使用此数据集,请在此页的底部引用技术报告。
您可以在 ()
的项目页面上在此数据集上找到一些可复制的基线结果。这些
结果是用卷积神经网络得到的。简单地说,它们是 +,没有数据增强的测试误差和 ,有
数据增强的测试误差。此外,-!% 还发表了一篇新的论文,其中他使用贝叶斯超参
数优化来寻找权重衰减和其他超参数的良好设置,这使他能够使用 +,的网络结构获得
,.不增加数据/的测试错误率。
其他结果:
罗德里戈贝南森.!/在他的网站上收集了 0 和其他数据集的
结果,点击这里查看。