数据集对于深度学习模型的重要性不言而喻,然而根据性质、类型、领域的不同,数据集往往散落在不同的资源平台里,急需人们做出整理
数据集对于深度学习模型的重要性不言而喻,然而根据性质、类型、领域的不同,数据集往往散落在不同的资源平台里,急需人们做出整理。 fast.ai 近期将这些重要的数据集汇总到了一篇文章里,AI 科技评论把文章编译如下 少了数据,我们的机器学习和深度学习模型什么也干不了。这么说吧,那些创建了数据集、让我们可以训练模型的人,都是我们的英雄,虽然这些人常常并没有得到足够的感谢。让人庆幸的是,那批最有价值的数据集后来成了[学术基准线]一被研究人员广泛引用,尤其在算法变化的对比上;不少名字则成为圈内外都耳熟能详的名称,如 MNIST、CIFAR 10 以及Imagenet 等 身为 fast.ai 的一员,我们自觉欠这些数据集的创建者一句真挚的感谢,所以我们决定,通过与 AWS 合作,把些最重要的数据集集中整理在一处,数据集自身采用标准格式,存储服务器也是快速的、可靠的(请参阅下方的完整列表与链接)。如果您在研究中使用了这些数据集,我们希望您记得引用原始论文( 我们已经在表单中提供引用链接 );如果您将它们用作商业或教育项目的一部分,请考虑添加致谢文及数据集原链接 我们之所以经常在教学中引用这些数据