国科大-自然语言处理-2019年.pdf

所需积分/C币:12 2019-07-09 318KB PDF
评分

国科大,宗成庆、赵军、张家俊老师自然语言处理,2019年春季期末考试真题
付于抽取式多文档自动摘任务,其核心模块是计算每个句子的重要性得分。假设输入三篇 文档,第一篇文档包含3个句子,第二篇文档包含6个句子,第三篇文档含有3个句子,如果每 个句子作为一个节点、例如d1s1表示第一篇文档的第一个句子),句子之间的相似度作为边的权 重(表1给出了任意两个句子之间的相似度得分),从而构成一个图(如上面的图1所示)。假设 每个句子的重要性得分都初如化为01,即S()=0.1.其中v表示图中任意的节点(句子)。那么, 根据上述信息写出基于图的自动摘要方法 Tewt Rank中句子重要性得分的选代计算公式,并计算 1s1和d3s1经过第一次选代后的重要性得分 四,计算题(满分10分) 实体铁的核心问题是计算将消实体之间的相似度,该相似度主要由待消歧实体上下文的 语义关决定,其中,上下文为待消歧实体所在句子中的主要词语。例如,给定如下句子及词语 s1:果是一京离料按的公司 2.1mh0m是果公司的主要产品 单果营富。味道美 0.6 03 0.8 昌种技 会司 图2:513词语的语义 在句子S1,S2、S3中,“平果”是待消歧实体,下息线词语是句子中的主要词语(例如:S1 科技”。如果要计算S1与52中的“草果”之同的相似度,需要计算S1与82中的主 要活“高料技”和“ iphone”之间的语义相似度 主要语对和的语义相似度(5m)计算公式如下 0.5×(5r(=1)+Sr(→0 5(-)-a+B∑a 其中,5 文上的义关,M是与节点,节点接相 的词语节点 合(如图2所示,与两节点“公司”、“高科技”都巨接相的词培节点集合为“ Iphone” 产品”1),A是语又中两节点和,边的权重(如点“营养”与“产品”之间边的权重 为0.5),d是节点的度(在无向图中,节点的度指图中与其相连的节点个数,如图2中节点“高 科技”的度为4),0和是加权项,a=0.6,B=1 (1)请计算S1与S2中“苹果”的相似度Sm2(即计算“高科技”与“ iphone"的语义相似度) 最终计算结果保留两位小数) 与中学相度5,(计算结果位小 共3页 第3页

...展开详情
立即下载 最低0.43元/次 身份认证VIP会员低至7折
举报 举报 收藏 收藏
分享
img
iworldt

关注 私信 TA的资源

上传资源赚积分,得勋章
相关内容推荐