没有合适的资源?快使用搜索试试~ 我知道了~
资源史上最全数据集汇总.pdf
资源推荐
资源详情
资源评论
【资源】史上最全数据集汇总
⽆论是数据挖掘还是⽬前⼤热的深度学习,都离不开“⼤数据”。⼤公司们⼀般会有⾃⼰的数据,但对于创业公司或是⾼校⽼师、学⽣来
说,“Where can I get large datasets open to the public” 是⼀个不得不⾯对的问题。 本⽂将为您提供⼀个⽹站/资源列表,从中你可
以使⽤数据来完成你⾃⼰的数据项⽬,甚⾄创造你⾃⼰的产品。
⼀.如何使⽤这些资源?
使⽤它们最简单的⽅法是进⾏数据项⽬,并在⽹站上发布它们。这不仅能提⾼你的数据和可视化技能,还能改善你的结构化思维。
另⼀⽅⾯,如果你正在考虑/处理基于数据的产品,这些数据集可以通过提供额外的/新的输⼊数据来增加您的产品的功能。
我们已经在不同的部分中划分了这些数据源,以帮助你根据应⽤程序对数据源进⾏分类。⾸先从简单、通⽤和易于处理数据集开始,然后转
向⼤型/⾏业相关数据集。然后,我们为特定的⽬的——⽂本挖掘、图像分类、推荐引擎等提供数据集的链接。这将为您提供⼀个完整的数
据资源列表。
⼆.由简单和通⽤的数据集开始
这是美国政府公开数据的所在地,该站点包含了超过19万的数据点。这些数据集不同于⽓候、教育、能源、⾦融和更多领域的数据。
640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1
这是印度政府公开数据的所在地,通过各种⾏业、⽓候、医疗保健等来寻找数据,你可以在这⾥找到⼀些灵感。根据你居住的国家的不同,
你也可以从其他⼀些⽹站上浏览类似的⽹站。
3.World Bank
世界银⾏的开放数据。该平台提供 Open Data Catalog,世界发展指数,教育指数等⼏个⼯具。
4.RBI
印度储备银⾏提供的数据。这包括了货币市场操作、收⽀平衡、银⾏使⽤和⼀些产品的⼏个指标。
5.Five Thirty Eight Datasets
Five Thirty Eight,亦称作 538,专注与民意调查分析,政治,经济与体育的博客。该数据集为 Five Thirty Eight Datasets 使⽤的数据
集。每个数据集包括数据,解释数据的字典和Five Thirty Eight ⽂章的链接。如果你想学习如何创建数据故事,没有⽐这个更好。
三.⼤型数据集
1.Amazon Web Services(AWS)datasets
Amazon提供了⼀些⼤数据集,可以在他们的平台上使⽤,也可以在本地计算机上使⽤。您还可以通过EMR使⽤EC2和Hadoop来分析云中
的数据。在亚马逊上流⾏的数据集包括完整的安然电⼦邮件数据集,Google Books n-gram,NASA NEX 数据集,百万歌曲数据集等。
640?wx_fmt=png
2.Google datasets
Google 提供了⼀些数据集作为其 Big Query ⼯具的⼀部分。包括 GitHub 公共资料库的数据,Hacker News 的所有故事和评论。
3.Youtube labeled Video Dataset
⼏个⽉前,⾕歌研究⼩组发布了YouTube上的“数据集”,它由800万个YouTube视频id和4800个视觉实体的相关标签组成。它来⾃数
⼗亿帧的预先计算的,最先进的视觉特征。
640?wx_fmt=png
四.预测建模与机器学习数据集
1.UCI Machine Learning Repository
资源评论
苍穹一梦
- 粉丝: 828
- 资源: 2468
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功