没有合适的资源?快使用搜索试试~
我知道了~
文库首页
云计算
微服务
搜狗新闻的自动文本摘要的数据集
搜狗新闻的自动文本摘要的数据集
共12个文件
txt:12个
自动摘要
2星
需积分: 46
97 下载量
28 浏览量
2017-12-25
20:50:40
上传
评论
4
收藏
13KB
ZIP
举报
温馨提示
立即下载
想要学习自动摘要的数据集,可以从这进行下载。里面有生成好的自动摘要
资源推荐
资源详情
资源评论
搜狗新闻文本分类数据集SougoCS
浏览:189
SougoCS数据集,内含11类搜狐新闻文本,近10万条。 搜狗提供的数据为未分类的XML格式。 此资源已经将XML解析并分类完毕,方便使用。
中文文本自动摘要
浏览:131
5星 · 资源好评率100%
我的专业工作案例可以从以下链接下载: http://pan.baidu.com/s/1dDIlXXB 需要预先安装同一目录下的VB6运行环境,然后才可以安装应用程序。 安装和测试过程中有问题可以直接联系我。 中英文文本自动摘要、自动校对、自动分类、相关性与相似性聚类、主题词与标签自动生成、微博(短文本)聚类和情感分析。我的研究成果,欢迎下载传播。
新闻类中文文本分类数据集
浏览:6
资源为新闻类的中文文本分类数据集,能够满足机器学习,文字分析方面的需求
【深度学习数据集】新闻文本分类数据集(50000条)
浏览:132
5星 · 资源好评率100%
50000条新闻文本数据集,文本有9类。可用于文本分类模型训练。
爬取的搜狐新闻数据
浏览:33
4星 · 用户满意度95%
爬取的搜狐新闻数据,一共有12个类别,分好类了
今日头条中文新闻(文本)分类数据集.zip
浏览:178
今日头条中文新闻(文本)分类数据集.zip
新闻分类数据集sample(thu)
浏览:152
5星 · 资源好评率100%
新闻分类数据集.gz 新闻分类数据集sample(thu)
BBC新闻摘要数据集.zip
浏览:43
自然语言处理数据集,想预览内容可私信作者
AG News 新闻文章数据集.7z
浏览:193
5星 · 资源好评率100%
AG News Dataset 拥有超过 100 万篇新闻文章,其中包含 496,835 条 AG 新闻语料库中超过 2000 个新闻源的文章,该数据集仅采用了标题和描述字段,每种类别均拥有 30,000 个训练样本和 1900 个测试样本。 该数据集由康奈尔大学于 2004 年发布,相关论文有《Ranking a stream of news. In Proceedings of 14th I
10万条社会类新闻未处理数据集
浏览:64
3星 · 编辑精心推荐
10万条社会类新闻未处理数据集 数据来源:爬取的某网站新闻,仅供科研和学习使用,如用于商业后果自。说明一下本身资源需要积分很少,不知道怎么现在变成这么多
自动文本摘要研究综述
浏览:201
近年来,互联网技术的蓬勃发展极大地便利了人类的日常生活,不可避免的是互联网中的信息呈井喷式爆发,如何从中快速有效地获取所需信息显得极为重要.
text-summariser:自动文本摘要器
浏览:65
文本摘要器 自动提取文本摘要器 对于摘要汇总步骤1:首先,通过使用Web抓取和beautifulsoup工具,我们从Wikipedia或任何其他可靠的站点获得了所需的文章,该站点在用户从Wikipedia输入主题之后提供了纪录片以及最大长度和句子数:预处理(删除停用词,非字母字符,转为小写字母)这是算法的第一阶段,其中将整个文本转换为小写字母以保持统一性,并删除了非字母字符。 使用nltk的停用词
internet上文本的自动摘要技术
浏览:176
internet上文本的自动摘要技术 internet上文本的自动摘要技术
文本自动摘要技术
浏览:180
早期论文 Luhn. The Automatic Creation of Literature Abstracts (1958) 研究50多年,取得一定进展,但仍不能令人满意 困难在哪里? 摘要撰写是一项高度智能,同时也很”自由”的任务 机器写摘要vs.专家写摘要 代表性系统 NewsInEssenceby University of Michigan NewsBlasterby
自动文本摘要研究综述.docx
浏览:109
自动文本摘要研究综述.docx
基于统计的自动文摘(中文)
浏览:25
4星 · 用户满意度95%
IK中文分词,将句子重要程度化为所含词的重要程度来考虑,主要考虑词语的词频、文中位置、句中位置三方面的权重。 (修改版,非原创)
新闻标题数据集.zip
浏览:105
新闻正文和摘要数据集,可训练摘要生成模型,包含正文和摘要两个文件。新闻正文和摘要数据集,可训练摘要生成模型,包含正文和摘要两个文件。新闻正文和摘要数据集,可训练摘要生成模型,包含正文和摘要两个文件。新闻正文和摘要数据集,可训练摘要生成模型,包含正文和摘要两个文件。
3万条IT类新闻未处理数据集
浏览:44
3万条IT类新闻未处理数据集 数据来源:爬取的某网站新闻,仅供科研和学习使用,如用于商业后果自负
20类新闻文本数据集(20w+数据数据非常齐全)
浏览:194
20w+新闻文本数据包含标题,正文,关键字,爬取链接,共20类,种类齐全。
10万条新闻数据的数据集
浏览:88
3星 · 编辑精心推荐
98000多条新闻数据集,包括财经,房产,家居,教育,科技,社会,时政,体育,游戏,娱乐这十个分类。
今日头条新闻数据
浏览:62
今日头条文章数据,共15425条数据,数据全面,丰富!!!!!
文档摘要资源合集
浏览:165
从最基础的统计方法到前沿的应用深度学习、强化学习的文档摘要方法。还包括性能优化策略。(附:开源代码)
新闻视频自动摘要生成算法
浏览:10
新闻视频自动摘要生成算法,跟视频检索有关方面相关的论文
文本自动摘要工具TextTeaser.zip
浏览:116
5星 · 资源好评率100%
TextTeaser是一个自动摘要算法,结合了自然语言处理的力量和机器学习产生好结果。 标签:TextTeaser
TextRank:适用于PHP8的TextRank(自动文本摘要)
浏览:194
文字排名 此源代码是PHP7严格模式下TextRank算法(自动汇总)的实现。 它可以将文本,文章总结为一个简短的段落。 在开始汇总之前,它会删除在Stopwords命名空间中定义的垃圾字。 可以用其他语言扩展它。 TextRank或自动汇总 自动汇总是使用计算机程序缩减文本文档以创建保留原始文档最重要要点的摘要的过程。 可以做出连贯摘要的技术会考虑变量,例如长度,写作风格和语法。 自动数据汇总
Internet上文本的自动摘要技术 (2006年)
浏览:143
主要研究了Internet上的文本自动摘要,介绍了自动摘要的主流技术;讨论Inteinet上文本摘要的新需求以及网页上与自动摘要相关的信息,介绍了摘要处理过程和当前自动摘要的主要评估方法;对Internet上文本的自动摘要作出了总结和展望。
机器学习中搜狗实验室发布的搜狗新闻数据集
浏览:69
机器学习中搜狗实验室发布的搜狗新闻数据集
新闻推荐数据集-数据集
浏览:73
数据集 articles.csv testA_click_log.csv train_click_log.csv articles_emb.csv
新闻个性化推荐算法训练集数据
浏览:144
5星 · 资源好评率100%
新闻个性化推荐算法需要用到的一些训练集数据包含用户编号、新闻编号、浏览时间、新闻标题、详细内容、发表时间
情感分析数据集(正面10000条,负面5000条)
浏览:51
4星 · 用户满意度95%
吸收了 谭松波 非平衡酒店评论语料库(7000条正面,3000条负面,有部分重复数据),加上我从携程上抓取的数据,经过繁简转换、去重、去掉4字以下过短评论,形成最终的评论数据集(10000条正面,5000条负面,文本中每行为一个评论),欢迎下载使用!ps.数据正负面归类是按照携程上“值得推介”和“有待改善”栏目做初步区分,然后再经过人工筛选剔除归类错误的数据形成,因此难免会有错误,欢迎修正!358
收起资源包目录
26.zip
(12个子文件)
26
wsrank
1
file.txt
759B
4
4.txt
1KB
2
2.txt
1KB
3
3.txt
1KB
lexrank
1
file.txt
891B
4
4.txt
1KB
2
2.txt
946B
3
3.txt
1KB
my
1
file.txt
792B
4
4.txt
1KB
2
2.txt
1KB
3
3.txt
1KB
共 12 条
1
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
zys_1
2018-03-09
还行。。。
倾听花开雨落
2018-01-24
还不错,不错不错
艾伦·布拉德
2018-12-25
垃圾,什么玩意,标题狗
菜是菜菜
2018-08-23
很垃圾,根本不值25个积分
_Gerald
2019-11-28
一点用处也没有,浪费积分
1
2
前往
页
小熊猫奥
粉丝: 2
资源:
1
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
无人售货机零售项目ECharts展现(最全!!)
母亲节c语言程序代码 程序
母亲节c语言程序代码 程序
程序母亲节c语言程序代码
(自适应手机端)响应式高端摄影网站pbootcms模板 黑色酷炫数码摄影网站源码下载.zip
linux内核 linux.iso
(自适应手机端)响应式风景民宿pbootcms网站模板 大气全屏旅游景区网站源码下载.zip
前端蓝色旋转地球宇宙动态背景
0002、C与VB语言联合在proteus上仿真.zip
基于STM32F103C8T6的电子闹钟PCB设计
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
- 1
- 2
前往页