文档摘要和关键短语提取是IR和NLP字段中的两个相关任务,它们都旨在从单个文本文档中提取压缩表示。 用于单个文档摘要和关键字短语提取的现有方法通常仅使用指定文档中包含的信息。 本文建议在假定邻居文档可以提供更多知识和更多线索的前提下,使用少量最近邻居文档来改进指定文档的文档摘要和关键短语提取。 通过在文档附近添加一些邻居文档,将指定的文档扩展为一个小的文档集,然后将基于图的排名算法应用于扩展的文档集,以利用指定文档中的本地信息和邻居文档中的全局信息。 在文档理解会议(DUC)基准数据集中的实验结果证明了我们提出的方法的有效性和鲁棒性。 扩展文档集中的跨文档句子关系经过验证,有利于单文档摘要;相邻文档中的单词共现关系经验证对单文档关键词提取非常有帮助。 ? 2010 ACM。