前言:数据是深度学习的血液,本文介绍一下当前非常常见的一些数据集。
1 ImageNet
ImageNet 是一个计算机视觉系统识别项目,是目前世界上图像识别最大
的数据库。是美国斯坦福的计算机科学家李飞飞模拟人类的识别系统建立的。
能够从图片识别物体。目前已经包含 14197122 张图像,是已知的最大的图像
数据库。每年的 ImageNet 大赛更是魂萦梦牵着国内外各个名校和大型 IT 公司
以及网络巨头的心。图像如下图所示,需要注册 ImageNet 帐号才可以下载,
下载链接为 http://www.image-net.org/
2 PASCAL VOC
PASCALVOC 数据集是视觉对象的分类识别和检测的一个基准测试,提
供了检测算法和学习性能的标准图像注释数据集和标准的评估系统。图像如下
图所示,包含 VOC2007(430M),VOC2012(1.9G)两个下载版本。下载
链接为 http://pjreddie.com/projects/pascal-voc-dataset-mirror/