没有合适的资源?快使用搜索试试~
我知道了~
文库首页
后端
Python
机器学习中搜狗实验室发布的搜狗新闻数据集
机器学习中搜狗实验室发布的搜狗新闻数据集
数据集
需积分: 50
38 下载量
87 浏览量
2022-06-13
16:55:13
上传
评论
1
收藏
366.47MB
TGZ
举报
温馨提示
立即下载
机器学习中搜狗实验室发布的搜狗新闻数据集
资源推荐
资源评论
大数据数据分析机器学习-搜狗新闻行业分类-数据集-训练集-验证集-机器学习数据分析师必备
浏览:188
5星 · 资源好评率100%
1. 资源内容:大数据数据分析机器学习-搜狗新闻行业分类-数据集-训练集-验证集-机器学习数据分析师必备 2. 使用目标:数据分析,机器学习学习用数据集 3. 应用场景:数据分析,机器学习学习 4. 特点:学习 5. 适用人群:学生,算法工程师,研究生 6. 使用说明:压缩包,里面有6个文件,分别是训练集测试集和验证集。分别有文本文件格式和Excel格式。两种格式内容一样。可以根据自己的需求重新划
搜狗实验室新闻数据整理.zip
浏览:98
其中包含的val(已整理的搜狗实验室新闻文本数据)、stopwords数据来源于网课资源,能够帮助新手尽快完成一次新闻文本分类的实战项目
搜狗实验室新闻数据 文本分类
浏览:65
搜狗实验室新闻数据 文本分类
搜狗实验室新闻分类语料库
浏览:161
搜狗实验室新闻分类语料库,主要有10个分类,共50多万条记录 0 汽车 1 财经 2 IT 3 健康 4 体育 5 旅游 6 教育 7 招聘 8 文化 9 军事
整理后的搜狗实验室全网新闻数据样例(word2vec用)
浏览:153
用来测试word2vec的数据样本,从搜狗实验室全网新闻数据库http://www.sogou.com/labs/resource/list_news.php 下载并提取出新闻内容的数据。
搜狗新闻文本分类数据集SougoCS
浏览:29
SougoCS数据集,内含11类搜狐新闻文本,近10万条。 搜狗提供的数据为未分类的XML格式。 此资源已经将XML解析并分类完毕,方便使用。
搜狗实验室文本(整理版)
浏览:176
4星 · 用户满意度95%
搜狗实验室1个月数据,我已经整理过,做好了分类,并且去除了无用数据
搜狗新闻分类语料
浏览:51
整理自搜狗实验室中的新闻分类。含有金融、体育、军事等11个分类集。
搜狗实验室(用户查询日志)
浏览:108
4星 · 用户满意度95%
搜狗实验室(用户查询日志)SogouQ.reduced,用于做大数据分析的数据
搜狗新闻的自动文本摘要的数据集
浏览:98
想要学习自动摘要的数据集,可以从这进行下载。里面有生成好的自动摘要
基于搜狗新闻语料库,采用传统机器学习方法以及预训练模型等方法+源代码+文档说明
浏览:60
<项目介绍> 该资源内项目源码是个人的毕设,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演
自然科学类搜狗词库-数据集-机器学习训练材料大全-87万条-用于机器训练.txt
浏览:92
5星 · 资源好评率100%
自然科学类词库-数据集-机器学习训练材料大全-87万条-用于机器训练.txt
text-classification-cn:中文文本分类实践,基于搜狗新闻语料库,采用传统机器学习方法以及预训练模型等方法
浏览:77
5星 · 资源好评率100%
文字分类 文本分类(文本分类)是自然语言处理中的一个重要应用技术,根据文档的内容或主题,自动识别文档所属的预先定义的类别标签。文本分类是很多应用场景的基础,某些垃圾邮件识别,舆情分析,情感识别,新闻自动分类,智能客服机器人的合并分类等等。此处分为两个部分: 第1部分:基于scikit学习机器学习的Python库,对比几个传统机器学习方法的文本分类 第2部分:基于预训练词向量模型,使用Keras工
sougou-corpus-lda:有感于自己学习LDA的时候没有一个完整的从语料到分类结果的例子,决定开一小项目来实现,原始的数据是搜狗实验室提供的新闻语料
浏览:30
sougou-corpus-lda 有感于自己学习LDA的时候没有一个完整的从语料到分类结果的例子,决定开一小项目来实现,原始的数据是搜狗实验室提供的新闻语料
爬取的搜狐新闻数据
浏览:142
4星 · 用户满意度95%
爬取的搜狐新闻数据,一共有12个类别,分好类了
机器学习算法中自然语言处理常用数据集(新闻数据集news.csv)及jieba_dict字典、停用词等相关文件
浏览:89
机器学习算法中自然语言处理常用数据集(新闻数据集news.csv)及jieba_dict字典、停用词等相关文件,包括以下文件 data/news.csv jieba_dict/dict.txt.big jieba_dict/stopwords.txt jieba_dict/stopwords_s.txt
搜狗1.4G 新闻集
浏览:52
搜狗1.4G 新闻语料集
搜狗实验室 文本分类语料库
浏览:21
5星 · 资源好评率100%
搜狗实验室 文本分类语料库。可用于进行文本开发等相应实验练习
搜狗实验室文本分类语料库
浏览:189
5星 · 资源好评率100%
文本分类语料库来源于Sohu新闻网站保存的大量经过编辑手工整理与分类的新闻语料与对应的分类信息。其分类体系包括几十个分类节点,网页规模约为十万篇文档。 语料库统计的意义:提供一个较大规模的标准中文文本分类测试平台。 应用案例:中文文本分类,主题跟踪与检测等。
搜狗分类新闻
浏览:48
我在csdn下载的搜狗分类新闻,里面有些错误,导致python代码无法读取。我这里删除了有乱码的新闻,大概删除了10%到20%的新闻,不影响使用。
搜狐新闻中文语料(已分类整理)
浏览:177
在搜狗实验室下载的搜狐新闻数据整理后的一部分中文分类语料~
10万条新闻数据的数据集
浏览:62
3星 · 编辑精心推荐
98000多条新闻数据集,包括财经,房产,家居,教育,科技,社会,时政,体育,游戏,娱乐这十个分类。
搜狗实验室文本分类语料
浏览:18
3星 · 编辑精心推荐
搜狗实验室用于文本分类的语料库,包含财经、互联网、健康、教育、军事、旅游、体育、文化、招聘9个类别文本数据,每个类别包含1990篇文本。
搜狐新闻数据(SogouCS)版本:2012-数据集
浏览:92
来自搜狐新闻2012年6月—7月期间国内,国际,体育,社会,娱乐等18个频道的新闻数据,提供URL和正文信息。
SogouC.rar
浏览:161
中文新闻分类数据集
【深度学习数据集】新闻文本分类数据集(50000条)
浏览:82
5星 · 资源好评率100%
50000条新闻文本数据集,文本有9类。可用于文本分类模型训练。
新闻类中文文本分类数据集
浏览:151
资源为新闻类的中文文本分类数据集,能够满足机器学习,文字分析方面的需求
10万条社会类新闻未处理数据集
浏览:174
3星 · 编辑精心推荐
10万条社会类新闻未处理数据集 数据来源:爬取的某网站新闻,仅供科研和学习使用,如用于商业后果自。说明一下本身资源需要积分很少,不知道怎么现在变成这么多
《点燃我温暖你》中李峋的同款爱心代码
浏览:33
5星 · 资源好评率100%
python做的《点燃我温暖你》中李峋的同款爱心代码,最还原的
122版本Chrome最新驱动-122.0.6261.58
浏览:38
适用于最新的谷歌浏览器版本 122.0.6261.58, 主要用于selenium自动化操作,Python调试脚本,经测试可正常使用。
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
qq_42227321
粉丝: 0
资源:
9
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
个人用了8年的Java工程师简历
基于5G的衣柜智能控制系统,第八版,四种模式切换+多级菜单+ESP+温湿度+光敏+LED+空气质量传感器+继电器
基于大数据的房产估价.doc
基于大数据的房产估价.doc
同态加密的概念.doc
同态加密的概念.doc
时间复杂度大小比较.doc
时间复杂度大小比较.doc
jena语义网络开发框架
基于c语言的职工资源管理系统.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功