机器学习具体方向领域数据集
图片
Labelme:带注释的大型图像数据集。
ImageNet:大家熟悉的ImageNet,女神李飞飞参与创建,同名比赛影响整个计算机视觉界。
LSUN:场景理解与许多辅助任务(房间布局估计,显着性预测等)
MS COCO:同样也是知名计算机视觉数据集,同名比赛每年都被中国人屠榜。
COIL 100:100个不同的物体在360度旋转的每个角度成像。
视觉基因组:非常详细的视觉知识库。
谷歌开放图像:在知识共享下的900万个图像网址集合“已经注释了超过6000个类别的标签”。
野外标记面:13000张人脸标记图像,可以用于开发涉及面部识别的应用程序。
斯坦福狗子数据集:20580张狗子的图片,包括120个不同品种。
室内场景识别:包含67个室内类别,15620个图像。
情绪分析
多域情绪分析数据集:一个稍老一点的数据集,用到了来自亚马逊的产品评论。
IMDB评论:用于二元情绪分类的数据集,不过也有点老、有点小,有大约25000个电影评论。
斯坦福情绪树库:带有情感注释的标准情绪数据集。
Sentiment140:一个流行的数据集,它