【免费】作业二自动摘要1资源-CSDN文库

自然语言处理

需积分: 0 3 浏览量 2022-08-03 13:20:22 上传评论收藏 146KB PDF 举报

资源详情

资源评论

自然语言处理与文本挖掘作业二

自动摘要

2020.04.09

本次实验希望大家理解和应用常见的自动摘要方法。

数据集说明：

我们使用 LCSTS

数据集的 Part I 部分来进行模型的巡礼和测试。该数据集包含

了 200 万真实的中文短文本数据和每个文本作者给出的摘要，同时作者团队也手动标

注了 10666 份文本的摘要。

./DATA/PART_I.txt 包含 2,400,591 个(short_text, summary)对，示例如下：

合理划分训练、验证和测试集后，可将<short_text>字段用作模型输入，<summary>字

段用作 ground_truth，训练模型，进而完成实验。

数据集中还包含了原作者的工作 paper，供大家参考。其他具体描述详见

http://icrc.hitsz.edu.cn/Article/show/139.html。

结果评价指标应至少包括 ROUGE-2、ROUGE-L，自行实现测试结果评价脚本。

作业提交说明：

需要提交的内容有：报告文档（包括结果数据，分析等，见题目具体要求），程

序源代码及其运行方法（可以复现报告中的结果数据）

编程所使用的语言不限。

1. 基于特征打分排序的抽取式方法

实现一种基于特征打分排序的抽取式文本自动摘要方法，例如：SumTF-IDF、

SumBasic 等（特征选择不局限于 TF-IDF），并在测试数据上评价其性能。从

特征和排序方法两方面讨论如何提高方法的性能，实验验证你的想法。

2. 基于图排序的抽取式方法

实现一种基于图排序的抽取式文本自动摘要方法，例如：PageRank、TextRank

等，并在测试数据上评价其性能。比较该类方法与特征打分排序方法的不同。

3. （选做）基于神经网络的概括式方法

实现一种基于神经网络的概括式文本自动摘要模型，给出你的模型设计、训练

和测试的流程，以及测试集上的性能指标，尝试分析注意力机制的作用，并与

前面两个模型进行比较，分析不同模型的特点。

Hu B, Chen Q, Zhu F. LCSTS: A Large Scale Chinese Short Text Summarization Dataset[C]//Proceedings of

the 2015 Conference on Empirical Methods in Natural Language Processing. 2015: 1967-1972.

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余0页未读，立即下载

评论收藏

内容反馈

作业二自动摘要1

评论0

最新资源

作业二 自动摘要1

评论0

最新资源

相关推荐

自动摘要

自动摘要算法

中文文本自动摘要

文章自动生成摘要

6神经网络自动摘要1

NLP摘要大作业nlp大作业任务为文本摘要源码.zip

课程作业基于UniLM的中文文本摘要生成python源码.zip

基于Python的抽取式文本自动摘要的实现.zip

NLP算法实现关键词、命名实体、自动摘要、文本相似度比较功能python源码+项目说明.zip

自动视频摘要的一篇论文

中英文自动摘要源码

文本自动摘要技术

text-summariser:自动文本摘要器

自动文本摘要研究综述

自动化集装箱码头装卸工艺系统应用现状与展望_何继红1

自动化集装箱码头岸边装卸与堆场作业的耦合_辛永宝1

数据挖掘大作业1

自动化集装箱码头岸桥-堆场作业均衡调度研究_丁一1

基于启发式算法的自动化跨运车作业调度_尧雨琴1

万小军论文_自动摘要

自动文本摘要方法 (2008年)

自动文摘（摘要）程序（Perl）

PHP版自动生成文章摘要

基于机器学习的自动音乐生成软件项目源码+设计文档（python期末大作业）.zip

自动化集装箱码头全自动堆垛机(ASC)大车定位技术_张连钢1

JSP+sql网络远程作业处理系统(系统+论文+开题报告+中英文摘要+封面+目录+资料)

自动化集装箱码头堆场规划设计_耿卫宁1

自动化集装箱码头总平面布局设计_张连钢1

作业二自动摘要1