没有合适的资源?快使用搜索试试~
我知道了~
文库首页
人工智能
机器学习
10万条新闻数据的数据集
10万条新闻数据的数据集
机器学习数据集
3星
· 超过75%的资源
需积分: 28
125 下载量
67 浏览量
2020-06-30
13:47:59
上传
评论
20
收藏
152.02MB
ZIP
举报
温馨提示
立即下载
开通VIP(低至0.43/天)
买1年送3月
98000多条新闻数据集,包括财经,房产,家居,教育,科技,社会,时政,体育,游戏,娱乐这十个分类。
资源推荐
资源评论
大规模新闻文本分类数据集
浏览:101
大规模新闻文本分类数据集,有多个领域,按文件夹摆放,不仅可以用来做文本分类实验,数据不少甚至可以用来做BERT预训练
【深度学习数据集】新闻文本分类数据集(50000条)
浏览:146
5星 · 资源好评率100%
50000条新闻文本数据集,文本有9类。可用于文本分类模型训练。
20类新闻文本数据集(20w+数据数据非常齐全)
浏览:18
20w+新闻文本数据包含标题,正文,关键字,爬取链接,共20类,种类齐全。
10万条社会类新闻未处理数据集
浏览:17
3星 · 编辑精心推荐
10万条社会类新闻未处理数据集 数据来源:爬取的某网站新闻,仅供科研和学习使用,如用于商业后果自。说明一下本身资源需要积分很少,不知道怎么现在变成这么多
新闻推荐数据集-数据集
浏览:59
数据集 articles.csv testA_click_log.csv train_click_log.csv articles_emb.csv
新闻文本分类数据集-数据集
浏览:141
天池比赛 新闻文本分类数据集 test_a.csv train_set.csv
复旦大学文本分类新闻语料(测试集+训练集)
浏览:190
编码格式为GBK。 是网上流传的测试集和训练集的合并版。 用户获取后要自行清洗语料。
新闻分类数据集sample(thu)
浏览:15
5星 · 资源好评率100%
新闻分类数据集.gz 新闻分类数据集sample(thu)
今日头条新闻数据
浏览:168
今日头条文章数据,共15425条数据,数据全面,丰富!!!!!
新闻标题数据集.zip
浏览:112
新闻正文和摘要数据集,可训练摘要生成模型,包含正文和摘要两个文件。新闻正文和摘要数据集,可训练摘要生成模型,包含正文和摘要两个文件。新闻正文和摘要数据集,可训练摘要生成模型,包含正文和摘要两个文件。新闻正文和摘要数据集,可训练摘要生成模型,包含正文和摘要两个文件。
数据集预处理脚本,预处理脚本,从 raw-user.csv 中提取前 10 万条记录
浏览:59
预处理脚本,从 raw_user.csv 中提取前 10 万条记录,小数据集中包含 id、user_id、 item_id、behavior_type、date、province 等 6 列数据,各字段值之间用\t(占位符)隔开, 小数据集中不包含字段名
10万条数据采用存储过程分页实现(Mvc+Dapper+存储过程)源码
浏览:199
4星 · 用户满意度95%
有时候大数据量进行查询操作的时候,查询速度很大强度上可以影响用户体验,因此自己简单写了一个demo,简单总结记录一下: 技术:Mvc4+Dapper+Dapper扩展+Sqlserver 目前主要实现了两种分页:一种采用 PagedList.Mvc 实现的分页 两外一种采用 ajax异步加载分页 采用比较常用的jquery.pagination 分页插件。
10万条小表数据(id为9万+随机数字)
浏览:168
这里面有10万条小表数据(id为9万+随机数字),可用于学习数据库或者hive测试性能,是个非常不错的数据
movielens数据集(包含全部数据:10万、100万、1000万条评分数据)
浏览:137
movielens数据集(包含全部数据:10万、100万、1000万条评分数据)
danci.xlsx(包含所有英语单词数据10万条数据,英文 中文方便导入库 )
浏览:137
包含所有英语单词数据10万条数据,英文 中文方便导入库 。。。
搜狐新闻数据集.pkl.bz2
浏览:132
来自搜狐网的十类新闻数据,建议用pandas的read_pickle读入。有少量空行数据。使用方法见博客
搜狗新闻文本分类数据集SougoCS
浏览:201
SougoCS数据集,内含11类搜狐新闻文本,近10万条。 搜狗提供的数据为未分类的XML格式。 此资源已经将XML解析并分类完毕,方便使用。
数据集资源0000000000
浏览:171
1. THUCNews 数据集:该数据集来自新浪新闻 RSS 订阅频道,包含74万篇新闻文档,均为 UTF-8 纯文本格式。 2.今日头条新闻文本分类数据集:该数据集来自今日头条客户端,共382688条数据,分布于15个分类中。 3.全网...
5万条10种类型的新闻集(csv版本).rar
浏览:66
5星 · 资源好评率100%
标题中的“5万条10种类型的新闻集(csv版本).rar”表明这是一份压缩文件,其中包含了50,000条不同类型的新闻数据,这些数据以CSV(逗号分隔值)格式存储。CSV是一种常见的数据交换格式,适用于在不同的应用程序之间...
基于python实现的新闻文本分类 - 自实现朴素贝叶斯分类器,文本分类一百万条新闻+源代码+文档说明+数据
浏览:136
本项目利用100万的新闻文本,利用朴素贝叶斯来进行文本分类,新闻包括[car、culture、energy、entertainment、finance、health、house、IT、military、sport]十个类,每个类10w条新闻,并且其中,50万数据用以训练,...
数据集下载渠道00000
浏览:185
* THUCNews 数据集: THUCNews 是根据新浪新闻 RSS 订阅频道 2005~2011 年间的历史数据筛选过滤生成,包含 74 万篇新闻文档(2.19 GB),均为 UTF-8 纯文本格式。 * 今日头条新闻文本分类数据集:共 382688 条,分布...
新闻类中文文本分类数据集
浏览:59
资源为新闻类的中文文本分类数据集,能够满足机器学习,文字分析方面的需求
机器学习算法中自然语言处理常用数据集(新闻数据集news.csv)及jieba_dict字典、停用词等相关文件
浏览:111
机器学习算法中自然语言处理常用数据集(新闻数据集news.csv)及jieba_dict字典、停用词等相关文件,包括以下文件 data/news.csv jieba_dict/dict.txt.big jieba_dict/stopwords.txt jieba_dict/stopwords_s.txt
【深度学习数据集】今日头条38万条新闻数据(标题)
浏览:121
3星 · 编辑精心推荐
今日头条38万条新闻数据,可用于文本分类模型训练,可用LSTM模型训练
新闻分类数据文件
浏览:138
用于机器学习分类算法的新闻分类数据,一共有10大类,统一整理到一个csv文件中。
A Million News Headlines 百万新闻头条-数据集
浏览:56
数据集包含18年内发布的新闻头条数据。源自著名的澳大利亚新闻来源ABC(澳大利亚广播公司)。 abcnews-date-text.csv
UCI Online News Popularity Data Set UCI 在线新闻人气数据集-数据集
浏览:4
此数据集总结了 Mashable 在两年内发表的文章的一组异质特征。目标是预测社交网络(人气)的份额数量。 file/opensearch/documents/93274/OnlineNewsPopularity.csv file/opensearch/documents/93274/UCI Online News Popularity Data Set_datasets.txt
新闻文本分类-数据集
浏览:199
train_set.csv test_a.csv
用存储过程、GetRows()、抽取10万条数据的速度测试
浏览:150
现有10W条数据,Access数据库保存 通过正常提取: 代码如下:<% Set conn= Server.CreateObject(“ADODB.Connection”) c&Server.MapPath(“db2.mdb”) conn.Open connstr Set rs = Server.CreateObject (“ADODB.Recordset”) sql =
评论
收藏
内容反馈
立即下载
开通VIP(低至0.43/天)
买1年送3月
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
nqct1
2021-07-18
内容我觉得OK,用在Bert模型可以
柚咖
粉丝: 196
资源:
11
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
深入解析栈溢出:原因、影响与解决方案
使用Java开发的一个经典小游戏“俄罗斯方块”.zip
fsan 使用说明,方便客户扫描使用
虚拟电脑病毒无害无需资源
探索Python数据可视化:Matplotlib库的深入指南
全站数据爬取技术与实践:方法、代码与策略
微信自动抢红包APP.zip毕业设计参考学习资料
为 Wireshark 能使用纯真网络 IP 数据库(QQwry)而提供的格式转换工具.zip
音频格式转换工具.zip学习资料程序资源
自用固件,合并openwrt和immortalwrt编译AX6(刷机有风险).zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功