没有合适的资源?快使用搜索试试~ 我知道了~
基于混合神经网络的实体与关系联合抽取模型.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 105 浏览量
2022-12-15
14:16:29
上传
评论
收藏 289KB DOCX 举报
温馨提示
试读
8页
基于混合神经网络的实体与关系联合抽取模型.docx
资源推荐
资源详情
资源评论
实体抽取及关系抽取是构建大规模知识图谱的关键技术
[1]
,对于深度理解自然语言和
实现知识图谱的自动问答具有重要研究价值
[2]
。实体和关系的联合抽取是根据预定义的关
系类别,从句子中抽取实体对及其关系。实体关系的信息表述可形式化为三元组
t=(s, r, o),其中 s 表示主实体,o 表示目标实体,r 表示预定义关系类别中主实体与目标实
体之间的关系。
早期对关系抽取的研究主要是管道(pipeline)方法
[3-5]
。首先,研究者提出使用命名实体
识别
[6]
(named entity recognition, 简称 NER)模块来识别实体,然后将得到的实体成对组合,
使用关系分类(relation classification, 简称 RC)模块对其关系进行分类
[7]
。经过这 2 个连续步
骤,最终得到有效的三元组。然而,流水线方法面临着误差传播问题,即 NER 模块中的误
差会被引入后续的 RC 模块。联合方法
[8-9]
旨在通过 NER 和 RC 的任务组合直接获得三元
组,从而解决这一问题。与流水线方法相比,联合方法可同时提取和利用实体与关系之间
的深层关联。
当前诸多研究中提出的实体与关系联合抽取任务存在较大改进空间。为缓解关系重叠
问题对抽取效果的影响,提出了一个基于混合神经网络的实体与关系联合抽取模型(mixed
neural network model for entity and relation extraction, 简称 MNN-RE),MNN-RE 的核心是实
体抽取任务与关系抽取任务共享一个膨胀卷积编码层,通过共享编码参数,获得实体抽取
任务与关系抽取任务之间更丰富的关联信息。此外,该模型采用门控线性单元(gated linear
units, 简称 GLU)并引入注意力机制(attention mechanism)来捕获任意词之间的关系和提取局
部信息,从而实现信息的多通道融合。
1. 相关工作
由于文本中存在重叠的三元组,但联合抽取模型不能抽取重叠的三元组,导致抽取效
果不佳。以表 1 的实体对重叠例子为参考,联合模型
[8]
中的关系分类模块只能预测到“离
开”和“张宇”的三元组,不能得到正确的关系,以及 2017 年 Zheng 等
[9]
的标记方案,无法在
一个标签中标记“歌手”和“作曲”。这类句子不仅使关系分类模块急需改进,而且使原有的
顺序标注方案陷入困境。2018 年 Zeng 等
[10]
率先认识到重叠三元组问题,并将三元组重叠
的句子分为实体对重叠(entity problem overlapped, 简称 EPO)和单实体重叠(single entity
overlapped, 简称 SEO)。为了解决这一问题,人们提出了一些新的标注方案来处理这些句
子,但是这些模型花费了大量的时间,且仍不能通过有限数量的标记来保存句子中的所有
三元组。例如,2019 年 Dai 等
[11]
建立了一个大型模型,用标签填充(sequence
length×sequence length)表标记关系,但仍然只能预测一个实体对的单一关系类别,无法处
理单关系实体重叠问题。
表 1 关系重叠类型示例
资源评论
罗伯特之技术屋
- 粉丝: 3663
- 资源: 1万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功