没有合适的资源?快使用搜索试试~
我知道了~
文库首页
行业研究
数据集
20_News_Groups_Dataset(20个新闻组数据集)
20_News_Groups_Dataset(20个新闻组数据集)
数据集
3星
· 超过75%的资源
需积分: 38
93 下载量
117 浏览量
2012-05-13
13:31:48
上传
评论
2
收藏
439KB
PDF
举报
温馨提示
立即下载
20_News_Groups_Dataset(20个新闻组数据集)
资源推荐
资源评论
20 Newsgroups数据集(包括20news-19997、20news-bydate和20news-18828三个数据集)
浏览:80
20 Newsgroups数据集是大约20,000个新闻组文档的集合,在20个不同的新闻组中几乎均匀划分。20 Newsgroups数据集已经成为机器学习技术相关实验的常用数据集,例如文本分类和文本聚类实验。
20news 新闻数据数据集
浏览:18
20news是一个英文新闻数据集,包含 20个 类别共 20000篇 新闻文档,可用以进行文档分类和自然语言处理等任务。
20news数据集
浏览:136
5星 · 资源好评率100%
20news-bydate.tar.gz 文本分类 数据集 20news
twenty news DataSet
浏览:105
20news数据集。 The 20 Newsgroups data set is a collection of approximately 20,000 newsgroup documents, partitioned (nearly) evenly across 20 different newsgroups. To the best of my knowledge, it was orig
20newsgroup
浏览:45
5星 · 资源好评率100%
20newsgroup数据集是机器学习中的一个标准数据集。它包含18828个文档,来自于20个不同的新闻组。 该资源包含一个原信息文件和3个目录:test、train和raw。测试和训练目录将整个数据集切分为60%的训练和40%的测试文档。
今日头条中文新闻(文本)分类数据集.zip
浏览:183
今日头条中文新闻(文本)分类数据集.zip
BBC新闻摘要数据集.zip
浏览:55
自然语言处理数据集,想预览内容可私信作者
【深度学习数据集】新闻文本分类数据集(50000条)
浏览:104
5星 · 资源好评率100%
50000条新闻文本数据集,文本有9类。可用于文本分类模型训练。
基于tensorflow、CNN、清华数据集THUCNews的新浪新闻文本分类-附件资源
浏览:185
基于tensorflow、CNN、清华数据集THUCNews的新浪新闻文本分类-附件资源
基于贝叶斯及KNN算法的newsgroup文本分类器
浏览:144
5星 · 资源好评率100%
基于贝叶斯及KNN算法的newsgroup文本分类器,eclipse工程 程序运行方法:用eclipse打开工程,并将newsgroup文档集解压到 F:\DataMiningSample\orginSample目录下,同时在F:\DataMiningSample\ 下建好如附件“F盘DataMiningSample目录下的数据子目录结构”图中的目录, 停用词表也放在"F:/DataMiningS
News Category Dataset-数据集
浏览:59
该数据集包含从HuffPost获得的大约20万条2012年至2018年的新闻头条。在该数据集上训练的模型可用于识别未跟踪新闻文章的标签或识别不同新闻文章中使用的语言类型。 News_Category_Dataset_v2.json
Spark20NewsGroup:朴素贝叶斯 + TFIDF 在 Spark 中的 20 个新闻组数据集
浏览:140
使用 Apache Spark 和斯坦福 NLP 工具实现 TF-IDF + 朴素贝叶斯分类器。 克隆 repo 并 cd 到其中 运行sbt assembly来构建 uber jar 通过从 repo 的根目录运行spark-submit --class com.brokendata.NaiveBayesSpark target/scala-2.10/spark20newsgroup-ass
20-newsgroups_text-classification:“ 20个新闻组”数据集-在Python中使用多项朴素贝叶斯进行文本分类
浏览:66
20-newsgroups_text-classification:“ 20个新闻组”数据集-在Python中使用多项朴素贝叶斯进行文本分类
20-newsgroups-Text-Classification:使用 20 个新闻组数据集,使用 python 实现文本分类算法
浏览:8
20个新闻组文本分类 本笔记本包含使用数据集、使用和库的文本分类实现,以及使用库的一些模型解释。 本笔记本随附的博客文章:
News Aggregator Dataset-数据集
浏览:5
News are grouped into clusters that represent pages discussing the same news story. The dataset includes also references to web pages that, at the access time, pointed (has a link to) one of the news
20类新闻文本数据集(20w+数据数据非常齐全)
浏览:165
20w+新闻文本数据包含标题,正文,关键字,爬取链接,共20类,种类齐全。
新闻类中文文本分类数据集
浏览:162
资源为新闻类的中文文本分类数据集,能够满足机器学习,文字分析方面的需求
大规模新闻文本分类数据集
浏览:137
大规模新闻文本分类数据集,有多个领域,按文件夹摆放,不仅可以用来做文本分类实验,数据不少甚至可以用来做BERT预训练
新闻文本分类-数据集
浏览:196
train_set.csv test_a.csv
20newsgroup python分类聚类
浏览:93
5星 · 资源好评率100%
http://blog.csdn.net/abcjennifer/article/details/23615947
已预处理 NLP 英文语料库 新闻组 20_Newsgroup(单标签英文平衡语料)
浏览:18
5星 · 资源好评率100%
已做预处理:分词、剔除停用词 可直接拿来统计建立文本模型
搜狗新闻的自动文本摘要的数据集
浏览:135
想要学习自动摘要的数据集,可以从这进行下载。里面有生成好的自动摘要
【深度学习数据集】今日头条38万条新闻数据(标题)
浏览:65
3星 · 编辑精心推荐
今日头条38万条新闻数据,可用于文本分类模型训练,可用LSTM模型训练
NLPCC2016 新闻数据集-数据集
浏览:99
NLPCC2016 数据集与流行的新闻数据集不同,使用更多来自新浪微博的非正式文本。 NLPCC2016 新闻数据集_datasets.txt NLPCC2016 新闻数据集_datasets.zip
3万条IT类新闻未处理数据集
浏览:11
3万条IT类新闻未处理数据集 数据来源:爬取的某网站新闻,仅供科研和学习使用,如用于商业后果自负
GTA-IM-Dataset:[ECCV-20] 3D人类场景交互数据集
浏览:179
GTA-IM数据集 具有场景上下文的长期人体运动预测,ECCV 2020(口服) ,, ,, , 。 该存储库维护着我们的GTA室内运动数据集(GTA-IM),该数据集着重于室内环境中的人与场景之间的交互作用。我们从逼真的游戏引擎中收集3D人体运动的高清RGB-D图像序列。该数据集具有清晰的3D人体姿势和相机姿势注解,并且在人的外观,室内环境,相机视图和人类活动方面有很大的差异。 目录 演示
MIND: Microsoft News Recommendation Dataset 介意:Microsoft新闻推荐数据集-数据集
浏览:28
新闻推荐是个性化新闻服务的重要技术。与已被全面研究的产品和电影推荐相比,新闻推荐的研究要有限得多,这主要是由于缺乏高质量的基准数据集。 MIND Microsoft News Recommendation Dataset_datasets..txt MIND Microsoft News Recommendation Dataset_datasets..zip
Ten Thousand German News Articles Dataset 一万篇德国新闻文章数据集-数据集
浏览:140
英语文本分类数据集很常见。 例如大型 AG 新闻、类丰富的 20 个新闻组和用于主题分类的大型 DBpedia 本体论数据集,例如用于情绪分析的常用 IMDb 和 Yelp 数据集。 非英语数据集,尤其是德语数据集,不太常见。 德国情绪分析兴趣小组汇集了一组情绪分析数据集。 然而,据我所知,没有德国主题分类数据集是可用的公众。 Ten Thousand German News Articles
MIND: Microsoft News Recommendation Dataset(思想:Microsoft新闻推荐数据集)-数据集
浏览:105
新闻推荐的MIND数据集是从Microsoft新闻网站的匿名行为日志收集的。 MIND Microsoft News Recommendation Dataset_datasets.txt
Synthetic_Chinese_String_Dataset 中文识别数据集 20
浏览:43
Synthetic_Chinese_String_Dataset 中文识别数据集 1 for https://gitee.com/chenyang918/Lets_OCR
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
wwd0426
2013-07-15
没啥用的文件,顶一下吧
archer_wfsdf
2015-09-05
只是说明文件
rockylk
2012-08-18
文件为_News_Groups_Dataset 实际是个说明文件,没有样本文件。大家不要下了。
皮皮君
2014-06-24
这个是原始的,有没有预处理过的?
lxymine
2013-05-07
好吧,一是个说明文件
1
2
前往
页
xiaobingsss
粉丝: 0
资源:
6
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
app-BlackBox64-.apk
疯狂大西瓜.apk
同态加密python.zip
基于Python的PCA人脸识别算法的原理及实现代码详解+源码+详细代码解析+开发文档+数据(毕业设计&课程设计&项目开发)
Decision tree20240105(1).ipynb
zuoyezuoyezuoye
zuoyezuoyezuoye
机械设计电机转子装配设备sw22非常好的设计图纸100%好用.zip
基于Spring Boot的住宅小区健身房管理系统
公益内核触摸《持续更新》等9个文件.rar
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
- 1
- 2
前往页