没有合适的资源?快使用搜索试试~ 我知道了~
summarization-datasets:预处理并在某些情况下下载“深度学习模型摘要中的内容选择”论文的数据集。
共9个文件
py:7个
gitignore:1个
md:1个
需积分: 13 0 下载量 82 浏览量
2021-05-30
10:24:49
上传
评论
收藏 15KB ZIP 举报
温馨提示
汇总数据集 预处理并在某些情况下下载“深度学习模型摘要中的内容选择”论文的数据集。 需要 python 3.6 或更高版本。 要安装运行: $ python setup.py install 如果您之前没有在当前环境中安装 spacy,您还应该运行: python -m spacy download en 此外,将您的 OMP 线程数设置为较小的数量可能会很好,例如export OMP_NUM_THREADS=2 CNN/DailyMail 数据集 跑步: python summarization-datasets/preprocess_cnn_dailymail.py \ --data-dir data/ 这将在目录data/cnn-dailymail创建 CNN/DM 数据。 这个数据集非常大,需要一段时间来预处理。 来杯咖啡! 纽约时报数据集 您必须从 LDC
资源推荐
资源详情
资源评论
收起资源包目录
summarization-datasets-master.zip (9个子文件)
summarization-datasets-master
preprocess_reddit.py 9KB
preprocess_pubmed.py 1KB
preprocess_duc_sds.py 7KB
preprocess_nyt.py 7KB
preprocess_ami.py 1KB
setup.py 527B
README.md 3KB
.gitignore 1KB
preprocess_cnn_dailymail.py 12KB
共 9 条
- 1
资源评论
Craig林
- 粉丝: 33
- 资源: 4459
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于esp8266和dht11温湿度传感器制作的远程温湿度监控程序,温度、湿度通过mqtt协议方式上传OneNet平台
- 人染色体长度表(数据来自bilibili:基因学苑)
- 基于ASP.NET简易博客网站的设计与实现(源代码+论文).rar
- 在PyCharm中配置Python环境步骤
- 在PyCharm中配置Python环境步骤
- Lightroom-Premium-v9.2.2_build_710902200-Mod.apk
- 拾放机构3D 拾放机构3D
- Spring整合Mybatis+Spring事务快速入门(纯注解)
- 1990-2024年1月上证 深证指数日线行情
- html/css练习作业摇晃的桃子
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功