没有合适的资源?快使用搜索试试~
我知道了~
文库首页
人工智能
深度学习
中文-长文本-摘要-数据集
中文-长文本-摘要-数据集
共2个文件
csv:2个
NLP
数据集
深度学习
需积分: 14
9 下载量
103 浏览量
2022-02-22
19:42:15
上传
评论
1
收藏
56.05MB
ZIP
举报
温馨提示
立即下载
1. 中文数据集 2. 长文本数据集 3. 摘要生成、摘要抽取任务数据集
资源推荐
资源详情
资源评论
LCSTS: A Large-Scale Chinese Short Text Summarization Dataset LCSTS:大型中文短文本摘要数据集-数据集
浏览:38
该数据集为大型中文短文本摘要数据集。 Application form.pdf LCSTS A Large-Scale Chinese Short Text Summarization Dataset_datasets.txt
New-Pytorch-Chinese:中文文本摘要,基于pytorch,采用LCSTS数据集
浏览:148
5星 · 资源好评率100%
基于Pytorch的中文文本摘要生成 开这个仓库的主要目的是记录一下自己实验过程和数据。 参考文本摘要领域大佬写的两篇论文: and ,然后参考另一位大佬修改的代码. 另外,在这里还是要感谢一下。这里的所有内容基本上没做什么修改(python读取文件的时候出现编码问题,我的猜想是大佬用的mac系统,类linux,所以对编码不敏感,我用windows的话就报错了。),最多修改了一下超参数,刚开始在
NLPCC中文摘要5W条数据,最长文本8000多字
浏览:182
NLPCC中文摘要5W条数据,最长文本8000多字
中文文本摘要生成
浏览:183
python,中文文本,摘要,自动生成,提取,抽取
中文文本自动摘要
浏览:100
5星 · 资源好评率100%
我的专业工作案例可以从以下链接下载: http://pan.baidu.com/s/1dDIlXXB 需要预先安装同一目录下的VB6运行环境,然后才可以安装应用程序。 安装和测试过程中有问题可以直接联系我。 中英文文本自动摘要、自动校对、自动分类、相关性与相似性聚类、主题词与标签自动生成、微博(短文本)聚类和情感分析。我的研究成果,欢迎下载传播。
中文文本摘要生成.rar
浏览:172
中文自动文摘,基于jieba分词,全Java代码。给定文本输出自定义长度的文摘
基于seq2seq+attention实现文本摘要任务-数据集
浏览:78
5星 · 资源好评率100%
基于seq2seq+attention实现文本摘要任务——数据集基于seq2seq+attention实现文本摘要任务——数据集基于seq2seq+attention实现文本摘要任务——数据集基于seq2seq+attention实现文本摘要任务——数据集基于seq2seq+attention实现文本摘要任务——数据集基于seq2seq+attention实现文本摘要任务——数据集基于seq2se
论文研究-基于改进Sequence-to-Sequence模型的文本摘要生成方法.pdf
浏览:77
基于循环神经网络和注意力机制的Sequence-to-Sequence模型神经网络方法在信息抽取和...采用中文摘要数据集LCSTS为数据源进行实验,结果表明所提方法能够有效地提高生成摘要的准确率,可应用于自动文本摘要提取任务。
机器学习-金融客服相关场景下的50组中文普通话对话文本语料-机器学习数据处理必看-数据集.rar
浏览:6
5星 · 资源好评率100%
机器学习-金融客服相关场景下的50组中文普通话对话文本语料-机器学习数据处理必看-数据集.rar
短文本-摘要-数据集-NLP
浏览:129
1. 短文本摘要数据集 2. NLP 摘要生成、摘要抽取任务训练数据 3. 中文 NLP 数据集
文档摘要资源合集
浏览:98
从最基础的统计方法到前沿的应用深度学习、强化学习的文档摘要方法。还包括性能优化策略。(附:开源代码)
NLP:使用s2s+指针网络完成中文文本摘要.zip
浏览:97
5星 · 资源好评率100%
基于Seq2Seq+指针网络的文本摘要 数据比较多,数据集链接在说明里,大概全部数据用8批次要两个多小时一轮,选取大约1/5数据后测试,经过200轮训练大概loss从5点几到了0.3
python实现的一个中文文本摘要程序.pdf
浏览:103
#!/user/bin/python # coding:utf-8 __author__ = 'yan.shi' import nltk import numpy import jieba import codecs N=100#单词数量 CLUSTER_THRESHOLD=5#单词间的距离 TOP_SENTENCES=5#返回的top n句⼦ #分句 def sent_tokenizer(tex
Java 中文文本摘要生成
浏览:124
中文自动文摘,基于jieba分词,全Java代码。给定文本输出自定义长度的文摘。
Python实现各大文本摘要模型-中文文本可运行的解决方案
浏览:126
本项目的两大任务:1. 集成各重要文本摘要模型的中文输入数据解决方案,优先集成已写好的代码,在此基础上用原生PyTorch和一些常用包来集成自己的代码。2. 集成目前网络上公开的中文文本摘要数据集,提供预处理的工具。 (另外我还准备用PyTorch统一集成各种摘要生成模型,但是这个flag比较大,以后再拔吧) 本项目是由于作者太菜,一直困于如何将原本在英文文本数据上运行的各文本摘要模型转换为中文可
Text_Summarization:UMBC数据科学硕士Data690-进行文本摘要
浏览:77
文字摘要 UMBC数据科学硕士Data690-进行文本摘要 实施说明 对于代码的实现,我们建议您具有以下库:
text-summarization-tensorflow:文本摘要
浏览:165
text-summarization-tensorflow 代码来自: 这个是关于英文文本的介绍,然后自己尝试应用在中文文本上,效果不是很理想。。 中文数据集来自:
LCSTS中文数据集解析与处理
浏览:153
train.src (训练集的输入(短文本)) train.tgt (训练集的输出(摘要)) test.src (测试集的输入(短文本)) test.tgt (测试集的输出(摘要)) vaild.src (验证集的输入(短文本)) vaild.tgt (验证集的...
面向微博的中文新闻摘要数据集.zip
浏览:85
数据集已公开发布。 目前,短新闻摘要这些是由人工编辑提供的。研究新浪新闻发布与传播中的新闻摘要技术是一个非常有趣的问题。因此,面向微博的中文新闻摘要的共同任务定义为自动生成给定中文摘要的任务新闻文章,...
基于NN-Attention的中文短文本摘要
浏览:103
在以往的Attention模型中, 只采用了Bidirectional-RNN, BRNN对上下文信息是有效的, ... 实验采用CSTSD数据集, 并用TensorFlow完成模型的构建. 实验结果表明, 该模型在CSTSD数据集中可以较好地实现文本摘要的自动生成.
搜索所有中文NLP数据集,附常用英文NLP数据集
浏览:74
中英文NLP数据集 NER QA 情感分析 文本分类 文本匹配 文本摘要 机器翻译 知识图谱 语料库 阅读理解
清洗过的文本摘要数据集nlpcc
浏览:101
清洗过的文本摘要数据集nlpcc,长文本摘要数据集
chinese_abstractive_corpus 抽象式自动摘要中文语教育培训行业抽象式自动摘要中文语料库-数据集
浏览:126
该数据集为教育培训行业抽象式自动摘要中文语料库。 chinese_abstractive_corpus_datasets.txt
Python-TextRank4ZH从中文文本中自动提取关键词和摘要
浏览:168
TextRank4ZH可以从文章中提取摘要和关键字, TextRank4ZH 则是能用 TextRank 的算法处理中文文章
DeepMind Q&A Dataset: CNN/Daily Mail Stories 文本摘要数据集 百度云
浏览:123
DeepMind Q&A Dataset: CNN/Daily Mail Stories 文本摘要数据集 百度云 https://cs.nyu.edu/~kcho/DMQA/
curation-corpus:获取Curation语料库抽象文本摘要数据集的代码
浏览:127
用于抽象文本摘要的策展语料库 策展语料库是40,000种新闻报道的专业摘要的集合,并带有新闻本身的链接。该存储库提供了一个刮板来访问它们。如果您对商业用途或访问更广泛的Curation数据目录感兴趣,包括更多的150,000多个专业编写的摘要以及可扩展的按需内容抽象API(由人或AI驱动),请进入触碰。有关我们希望该版本如何帮助NLP社区的想法,请参阅我们。 文件资料 执照 平均摘要长度(字) 平
葡萄牙语母语识别数据集
浏览:134
该数据集包括由欧洲葡萄牙语学习者撰写的1868篇学生散文,其母语为以下L1:中文,英文,西班牙文,德文,俄文,法文,日文,意大利文,荷兰文,德顿文,阿拉伯文,波兰文,韩文,罗马尼亚文, 和瑞典语。...
NLPCC 2017-数据集
浏览:188
第六届CCF自然语言处理和中文计算会议(NLPCC 2017)
收起资源包目录
text_summary_final.zip
(2个子文件)
train.csv
112.19MB
test.csv
27.8MB
共 2 条
1
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
芝士AI吃鱼
粉丝: 750
资源:
7
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
南京邮电大学数学实验.zip
人工智能辅助设计详述.pptx
人工智能辅助诊疗技术.pptx
人工智能驱动的软件质量保证.pptx
python实现嵌入Word2vec词向量的CNN中文文本分类.zip
什么是DVI接口?DVI接口定义、类型、图片.doc
从Oracle到国产数据库迁移实践.docx
从运维的角度看数据库的可观测性.docx
仓库管理软件操作手册.doc
企业从传统数据库迁移到国产或开源数据库的六个重要阶段.docx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功