没有合适的资源?快使用搜索试试~
我知道了~
文库首页
人工智能
机器学习
搜狐新闻中文语料(已分类整理)
搜狐新闻中文语料(已分类整理)
nlp中文语料
2星
需积分: 48
163 下载量
36 浏览量
2018-02-08
10:32:35
上传
评论
3
收藏
170.59MB
举报
温馨提示
立即下载
开通VIP(低至0.43/天)
买1年送3月
在搜狗实验室下载的搜狐新闻数据整理后的一部分中文分类语料~
资源推荐
资源评论
新闻文章语料库(万篇新闻文章)
浏览:137
5星 · 资源好评率100%
新闻文章语料库(万篇新闻文章)
搜狗新闻语料库
浏览:134
4星 · 用户满意度95%
搜狗的新闻中文语料库,可用于word2vec训练用的。。。。。。。。。。。。。。。。。。。。。。。。
搜狐新闻分类语料库
浏览:8
5星 · 资源好评率100%
搜狐新闻分类语料库,主要包含 0 汽车 1 财经 2 IT 3 健康 4 体育 5 旅游 6 教育 7 招聘 8 文化 9 军事 十个分类,共50多万条记录
新闻语料库
浏览:37
4星 · 用户满意度95%
包含2015年一整年的新闻,文件以txt形式存储,是从各大网站上爬取下来的。希望喜欢
中文新闻类分类语料,共4个类别,分别文化,财经,军事,运动
浏览:133
3星 · 编辑精心推荐
文本分训练和测试集,每个类别2000条新闻,简单做分类,测试效果 是足够了
搜狐2012新闻语料(已分类,utf8格式)
浏览:41
4星 · 用户满意度95%
对搜狗实验室的2012搜狐新闻语料进行切分、格式转换(已转为UTF8),从中抽取了11个新闻类别并分文件夹存储,每个txt文件包含600篇新闻。数据大概共54M,可以用于中文分类。
10万条新闻数据的数据集
浏览:148
3星 · 编辑精心推荐
98000多条新闻数据集,包括财经,房产,家居,教育,科技,社会,时政,体育,游戏,娱乐这十个分类。
复旦大学文本分类新闻语料(测试集+训练集)
浏览:149
编码格式为GBK。 是网上流传的测试集和训练集的合并版。 用户获取后要自行清洗语料。
新闻分类语料
浏览:49
新闻分类语料,9个类别财经,教育,军事,科技,政治等 按新闻标签爬取的。 新闻分类语料,9个类别财经,教育,军事,科技,政治等 按新闻标签爬取的。
新闻推荐数据集-数据集
浏览:138
数据集 articles.csv testA_click_log.csv train_click_log.csv articles_emb.csv
预处理过的搜狐新闻语料,utf-8
浏览:82
搜狐新闻语料,5000条,包括新闻标题、新闻链接、新闻内容、新闻类别。 搜狐新闻语料,5000条,包括新闻标题、新闻链接、新闻内容、新闻类别。
中文文本新闻精简语料
浏览:160
该语料一共九个类,每类500个文档,是我从搜狗Reduced语料中抽取的类内耦合度较大的一部分语料,比较适合聚类。
赛莉®中文语料自动标注_精细切分标注标签展示样例1_新闻
浏览:59
BOTSALLY® 赛莉®中文语料自动标注 精细切分标注标签展示样例1_新闻。在多个标注员协作标注同一个标注任务的需求下,标注的一致性仍然有保证的。可以降低标注员的学习门槛。快速扩充标注团队。测试阶段,每个管理账号可以拥有超过50个独立标注员子账号。
实体识别标签展示样例2_新闻事件_赛莉®中文语料自动标注
浏览:190
BOTSALLY® 赛莉®中文语料自动标注 的实体和事件辅助自动标注系统将实体抽取并标记出来,实体的在事件内的标签是ACE2005的标准,实体在文档切分标注中的标签是GB/T20532-2006标准。全文保持细粒度切分,采用XML的数据格式保存切分数据和切分信息。
基于中文新闻语料训练的生成模型.zip
浏览:194
基于中文新闻语料训练的生成模型.zip
中文文本分类_新闻语料库.zip
浏览:150
5星 · 资源好评率100%
在本案例中,我们有一个专门用于中文新闻文本分类的语料库,它被广泛应用于学术研究和实际应用,例如新闻推荐系统、舆情分析等。 语料库是进行文本分类任务的基础,它的质量直接影响到模型的性能。这个语料库来源于...
word2vec 搜狐新闻中文语料 2012 已分词数据
浏览:66
"word2vec 搜狐新闻中文语料 2012 已分词数据" 这个标题表明我们所讨论的核心技术是 word2vec,它是一种广泛应用于自然语言处理(NLP)领域的算法,用于将词汇转换为连续的向量表示。这里提到的是基于2012年搜狐新闻...
搜狗新闻分类语料
浏览:66
《搜狗新闻分类语料:探索自然语言处理与新闻分类的深度学习之道》 搜狗新闻分类语料库,源自搜狗实验室,是研究自然语言处理(NLP)领域的一个重要资源,尤其在新闻分类任务中具有广泛的应用价值。这个语料库包含...
word2vec 搜狐新闻中文语料 2012 未分词原始json数据
浏览:21
《word2vec与搜狐新闻中文语料:未分词原始json数据详解》 在自然语言处理(NLP)领域,word2vec是一种广泛使用的模型,它通过构建词汇的分布式表示来捕捉词汇之间的语义和语法关系。这个模型的训练需要大量的文本...
搜狗实验室新闻分类语料库
浏览:123
《搜狗实验室新闻分类语料库详解》 搜狗实验室新闻分类语料库是一个重要的数据集,主要用于自然语言处理和机器学习领域的研究,尤其是文本分类和信息检索方面。该语料库包含了丰富的新闻数据,共计50多万条记录,...
文本分类中文语料库
浏览:135
5星 · 资源好评率100%
这是一个文本分类的语料库,主要是用于文本分类,主旨句提取,关键词提取等等应用。
搜狗新闻文本分类数据集SougoCS
浏览:53
SougoCS数据集,内含11类搜狐新闻文本,近10万条。 搜狗提供的数据为未分类的XML格式。 此资源已经将XML解析并分类完毕,方便使用。
搜狗最新文本分类语料库
浏览:160
5星 · 资源好评率100%
搜狗最新文本分类语料库 C000007 汽车 C000008 财经 C000010 IT C000013 健康 C000014 体育 C000016 旅游 C000020 教育 C000022 招聘 C000023 文化 C000024 军事
新闻分类数据文件
浏览:180
用于机器学习分类算法的新闻分类数据,一共有10大类,统一整理到一个csv文件中。
10万条社会类新闻未处理数据集
浏览:20
3星 · 编辑精心推荐
10万条社会类新闻未处理数据集 数据来源:爬取的某网站新闻,仅供科研和学习使用,如用于商业后果自。说明一下本身资源需要积分很少,不知道怎么现在变成这么多
新闻标题数据集.zip
浏览:104
新闻正文和摘要数据集,可训练摘要生成模型,包含正文和摘要两个文件。新闻正文和摘要数据集,可训练摘要生成模型,包含正文和摘要两个文件。新闻正文和摘要数据集,可训练摘要生成模型,包含正文和摘要两个文件。新闻正文和摘要数据集,可训练摘要生成模型,包含正文和摘要两个文件。
新闻网站的数据库
浏览:54
3星 · 编辑精心推荐
详细描述新闻网站的数据库属性,可以直接使用
今日头条新闻数据
浏览:68
今日头条文章数据,共15425条数据,数据全面,丰富!!!!!
搜狗实验室新闻数据整理.zip
浏览:195
其中包含的val(已整理的搜狗实验室新闻文本数据)、stopwords数据来源于网课资源,能够帮助新手尽快完成一次新闻文本分类的实战项目
评论
收藏
内容反馈
立即下载
开通VIP(低至0.43/天)
买1年送3月
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
dimen青枫
2018-04-11
居然是文件格式....,还以为分类了
无名之名·
2020-03-09
谢谢分享, 虽然没帮上啥忙,还是谢谢
ywxxiangge
粉丝: 0
资源:
1
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
第3课时_参观花圃(1).enbx..bin
SQLite学习手册pdfepub格式最新版本
WSDL详解中文word版最新版本
数据库access版选择题题库中文word版最新版本
WAS和DB2调优(参数配置)中文2.1MB最新版本
SQL语言参考大全中文CHM版2.09MB最新版本
matlab深度学习训练部署,caffe,keras,onnx,pytorch深度学习模型转换插件安装包
DB2培训手册中文最新版本
子比主题8.0开心版附带美化插件以及教程.zip
SpringBoot项目用到的代码
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功