没有合适的资源?快使用搜索试试~
我知道了~
文库首页
人工智能
机器学习
搜狗分类新闻
搜狗分类新闻
共16592个文件
txt:16589个
sqlite:1个
suo:1个
需积分: 10
35 下载量
64 浏览量
2017-11-27
15:55:34
上传
评论
2
收藏
26.63MB
ZIP
举报
温馨提示
立即下载
我在csdn下载的搜狗分类新闻,里面有些错误,导致python代码无法读取。我这里删除了有乱码的新闻,大概删除了10%到20%的新闻,不影响使用。
资源详情
资源评论
收起资源包目录
搜狗分类新闻
(16592个子文件)
VSWorkspaceState.json
110B
slnx.sqlite
1.16MB
.suo
29KB
1083.txt
190KB
1372.txt
66KB
1837.txt
63KB
1065.txt
62KB
1675.txt
55KB
191.txt
54KB
903.txt
52KB
439.txt
48KB
1309.txt
47KB
1702.txt
47KB
187.txt
45KB
1406.txt
45KB
942.txt
44KB
1769.txt
44KB
578.txt
44KB
983.txt
42KB
1493.txt
41KB
1909.txt
39KB
240.txt
39KB
806.txt
39KB
1162.txt
38KB
1947.txt
38KB
298.txt
38KB
1775.txt
37KB
518.txt
37KB
1020.txt
36KB
902.txt
36KB
1952.txt
36KB
1492.txt
36KB
1945.txt
36KB
588.txt
35KB
1423.txt
34KB
1894.txt
34KB
1833.txt
34KB
484.txt
34KB
445.txt
33KB
1776.txt
32KB
490.txt
32KB
1868.txt
32KB
275.txt
31KB
852.txt
31KB
1428.txt
30KB
1328.txt
30KB
401.txt
30KB
1410.txt
29KB
1761.txt
29KB
1907.txt
29KB
1966.txt
29KB
25.txt
28KB
172.txt
28KB
146.txt
28KB
783.txt
28KB
1697.txt
27KB
1070.txt
27KB
627.txt
27KB
700.txt
27KB
1072.txt
27KB
565.txt
27KB
1898.txt
27KB
1860.txt
27KB
592.txt
27KB
1215.txt
26KB
1409.txt
26KB
1323.txt
26KB
1783.txt
26KB
1058.txt
26KB
1890.txt
26KB
1327.txt
26KB
71.txt
25KB
1899.txt
25KB
1952.txt
25KB
1321.txt
25KB
1937.txt
25KB
626.txt
25KB
1793.txt
25KB
283.txt
25KB
1204.txt
24KB
1422.txt
24KB
845.txt
24KB
1875.txt
24KB
1830.txt
24KB
1579.txt
24KB
379.txt
24KB
854.txt
23KB
1218.txt
23KB
1032.txt
23KB
706.txt
23KB
1724.txt
23KB
591.txt
23KB
106.txt
23KB
648.txt
22KB
962.txt
22KB
1400.txt
22KB
1946.txt
22KB
1494.txt
22KB
448.txt
22KB
813.txt
22KB
共 16592 条
1
2
3
4
5
6
166
评论
收藏
内容反馈
立即下载
评论0
去评论
最新资源
摄像头图像采集系统.pages
笔趣阁_1.0.2.apk
20张在不同场景中拍摄的红绿灯图片
Design1.ms13
用html、js、css内联样式编写了一个以母亲节祝福为的主题网页,包含烟花、爱心元素
微信小程序 - 东航订机票源码.zip
微信小程序 - 电影推荐源码.zip
pyorbbecsdk.cp311-win-amd64.pyd
使用 LangGraph 实现邮件智能处理系统来处理客户咨询notebook代码
整合canal监听mysql
织网者Eric
粉丝: 7735
资源:
13
私信
上传资源 快速赚钱
前往需求广场,查看用户热搜
相关推荐
text-classification-cn:中文文本分类实践,基于搜狗新闻语料库,采用传统机器学习方法以及预训练模型等方法
文字分类 文本分类(文本分类)是自然语言处理中的一个重要应用技术,根据文档的内容或主题,自动识别文档所属的预先定义的类别标签。文本分类是很多应用场景的基础,某些垃圾邮件识别,舆情分析,情感识别,新闻自动分类,智能客服机器人的合并分类等等。此处分为两个部分: 第1部分:基于scikit学习机器学习的Python库,对比几个传统机器学习方法的文本分类 第2部分:基于预训练词向量模型,使用Keras工
5星 · 资源好评率100%
搜狗新闻分类语料
整理自搜狗实验室中的新闻分类。含有金融、体育、军事等11个分类集。
新闻分类(文本分类)
采用深度学习,cnn,rnn 两种方式对新闻类信息。进行分类预测。。。。仅供初学者练习使用
4星 · 用户满意度95%
搜狗新闻文本分类数据集SougoCS
SougoCS数据集,内含11类搜狐新闻文本,近10万条。 搜狗提供的数据为未分类的XML格式。 此资源已经将XML解析并分类完毕,方便使用。
新闻分类语料
新闻分类语料,9个类别财经,教育,军事,科技,政治等 按新闻标签爬取的。 新闻分类语料,9个类别财经,教育,军事,科技,政治等 按新闻标签爬取的。
搜狗新闻语料库
搜狗的新闻中文语料库,可用于word2vec训练用的。。。。。。。。。。。。。。。。。。。。。。。。
4星 · 用户满意度95%
搜狗实验室新闻分类语料库
搜狗实验室新闻分类语料库,主要有10个分类,共50多万条记录 0 汽车 1 财经 2 IT 3 健康 4 体育 5 旅游 6 教育 7 招聘 8 文化 9 军事
机器学习中搜狗实验室发布的搜狗新闻数据集
机器学习中搜狗实验室发布的搜狗新闻数据集
搜狗实验室新闻数据整理.zip
其中包含的val(已整理的搜狗实验室新闻文本数据)、stopwords数据来源于网课资源,能够帮助新手尽快完成一次新闻文本分类的实战项目
SogouC.mini
文本分类现成语料库,是SogouC.mini.20061127.zip格式的,可用于web数据挖掘-Off-the-shelf text classification corpus is SogouC.mini.20061127.zip format, can be used for web data mining
5星 · 资源好评率100%
搜狗实验室新闻数据 文本分类
搜狗实验室新闻数据 文本分类
搜狗1.4G 新闻集
搜狗1.4G 新闻语料集
搜狗网页分类语料
搜狗实验室提供的免费实验语料。用于进行网页分类研究。
3星 · 编辑精心推荐
搜狗实验室文本分类语料库
文本分类语料库来源于Sohu新闻网站保存的大量经过编辑手工整理与分类的新闻语料与对应的分类信息。其分类体系包括几十个分类节点,网页规模约为十万篇文档。 语料库统计的意义:提供一个较大规模的标准中文文本分类测试平台。 应用案例:中文文本分类,主题跟踪与检测等。
5星 · 资源好评率100%
搜狗实验室 文本分类语料库
搜狗实验室 文本分类语料库。可用于进行文本开发等相应实验练习
5星 · 资源好评率100%
新闻分类数据文件
用于机器学习分类算法的新闻分类数据,一共有10大类,统一整理到一个csv文件中。
搜狗实验室文本(整理版)
搜狗实验室1个月数据,我已经整理过,做好了分类,并且去除了无用数据
4星 · 用户满意度95%
搜狗文本分类语料库-中文文本分类
实现文本分类的主要包括几个步骤文本分词处理,特征选择,特征权重计算,文本特征向量表示,基于训练文本的特征向量数据训练SVM模型,对于测试集进行特征向量表示代入训练得到的svm模型中进行预测分类,达到93%的准确率
搜狗互联网语料库2.0
网页链接关系分析,基于互联网语料的中文信息处理研究等
4星 · 用户满意度95%
SogouC.mini.20061102.rar
SogouC.mini.20061102.rar是一个简单的数据集,用来测试NLP算法的,为了大家的方便,故上传于此。
搜狗新闻的自动文本摘要的数据集
想要学习自动摘要的数据集,可以从这进行下载。里面有生成好的自动摘要
搜狗语料库-应用于文本分类
搜狗语料库-应用于文本分类搜狗语料库-应用于文本分类搜狗语料库-应用于文本分类搜狗语料库-应用于文本分类搜狗语料库-应用于文本分类搜狗语料库-应用于文本分类搜狗语料库-应用于文本分类搜狗语料库-应用于文本分类
3星 · 编辑精心推荐
搜狐新闻中文语料(已分类整理)
在搜狗实验室下载的搜狐新闻数据整理后的一部分中文分类语料~
搜狐2012新闻语料(已分类,utf8格式)
对搜狗实验室的2012搜狐新闻语料进行切分、格式转换(已转为UTF8),从中抽取了11个新闻类别并分文件夹存储,每个txt文件包含600篇新闻。数据大概共54M,可以用于中文分类。
4星 · 用户满意度95%
搜狗语料库(已分词)
搜狗语料库,自己用结巴分词分好的。(为什么摘要必须大于50个字)
4星 · 用户满意度95%
搜狗中文文本分析语料库
搜狗实验室新闻数据精简版,将xml文本进行处理后分类如下: 奥运 5595个txt 房产 14695 个txt 互联网 2200个txt 健康 1153个txt 教育 2075个txt 旅游 1802个txt 汽车 1405个txt 商业 12465个txt 时尚 3490 个txt 体育 17237 个txt 文化 628个txt 娱乐 6757个txt 招聘 18
5星 · 资源好评率100%
搜狗实验室文本分类语料
搜狗实验室用于文本分类的语料库,包含财经、互联网、健康、教育、军事、旅游、体育、文化、招聘9个类别文本数据,每个类别包含1990篇文本。
3星 · 编辑精心推荐
搜狗语料库搜狗语料库
搜狗语料库,经验证非常好用。欢迎下载。搜狗语料库,经验证非常好用。欢迎下载。搜狗语料库,经验证非常好用。欢迎下载。
4星 · 用户满意度95%
SogouC.rar
中文新闻分类数据集
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0
最新资源