没有合适的资源?快使用搜索试试~ 我知道了~
基于Transformer和图卷积神经网络的隐喻识别.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
5星 · 超过95%的资源 1 下载量 16 浏览量
2022-06-26
15:01:27
上传
评论
收藏 227KB DOCX 举报
温馨提示
试读
13页
基于Transformer和图卷积神经网络的隐喻识别.docx
资源推荐
资源详情
资源评论
1 引言
隐喻在自然语言中无处不在即便有时人们并没有意识到它的存在但是它却
能帮助人们建立对这个世界的理解。隐喻是一种非字面意义的表达方式 它将一
个词语或短语与一个对象或行为进行比较而该对象或行为可能与当前句子语义
并不相符合但却有助于人们更轻松地理解句子所要表达的含义
。隐喻广泛存在
于所有类型的文学和著作中尤其是在诗歌和歌曲中可以有效地将文本中描述的
复杂情绪和视觉效果传达给读者。
隐喻识别是一项非常有挑战性的任务。一方面 句子中词语的隐喻表达和非
隐喻表达之间的语义差异往往是微妙的
。例如
中的“就是隐喻表达把白发比喻成了白雪。但是
中“就是非隐喻表达只是说明她的头发是白色的这个事实。另一方
面某些词单独出现在句子中时表现为非隐喻表达但是当它与其他词形成一个组
合出现在句子中时可能就会形成隐喻表达。例如 数据集中的句子“
!!"
#。”!"或“作为形容词单独出现在句子中修饰其他词时通
常表现为非隐喻表达但是当“!"和“组合出现在句子中时!"就是
隐喻表达。
为解决隐喻识别问题先前的研究大部分都聚焦于目标词和其周围的词语希
望通过其周围的词语来判断目标词是否为隐喻表达 但是忽略了句子中词与词之
间的依赖关系从而不能很好地识别由多个词语共同引发的隐喻表达。大量的语
料库语言学研究成果表明隐喻的产生和理解受到情景信息和更广泛的话语属性
的影响
$
。所以本文提出一种基于图卷积神经网络和 % 的隐喻识别模
型 既 能 有 效 识 别 单 词 隐 喻 又 能 解 决 多 个 词 语 共 同 引 发 的 隐喻 表 达 。 通 过
% 结构提取句子的全局上下文信息和局部上下文信息并使用多头注意
力聚合这两种上下文语义信息&利用依存句法树构建依存信息图通过图卷积神经
网络学习词与词之间的依赖关系获取词的句法信息表示提取潜在隐喻特征信息&
最后融合目标词的上下文语义表示和句法信息表示通过分类层判断目标词是隐
喻表达还是非隐喻表达。
2 相关研究
在自然语言处理领域隐喻识别任务引起了学者广泛的研究兴趣。隐喻识别
任务可以大致分为两类:第一类涉及预测给定的单词或短语是否是隐喻表达
'
第
二类可以表述为预测句子是否含有隐喻用法的句子分类任务
(
。
本文的主要工作是基于第一类任务展开的。早期隐喻识别任务采用基于规
则或知识库的方法。)* 等
+
和 ,*- 等
.
在基于规则的算法上进行探索
聚焦于名词、形容词和动词三种表达类型的隐喻识别任务。基于关联聚类原则
构建隐喻识别模型针对某一种词性类型的词进行隐喻识别。比如以动词的主语
为目标词通过词的关联语言邻域对词进行聚类以此识别词的隐喻。更进一步
地/!- 等
0
使用具像性特征以及对训练样本重新加权的方式来训练监督机
器学习系统。经过训练的系统能够将文本中的所有目标词自动分为两组:隐喻
性和非隐喻性。对于一些结构简单的句子很容易通过具体的规则提取出句子中
的隐喻信息 例如“ 1 通过一些简单的规则能够发现“ ! 和
“分别属于不同的概念域可以很容易地判断出该句子出现了隐喻。但是
对于一些具有复杂句法结构的句子例如“1*"*"
! # # - * 2*
*345 如果采用规则或知识库的方法识
别句子中的隐喻就会发现6"*#7这组词对并不能仅通过概念域判断其
是否为隐喻表达。另外一方面知识库中所包含的知识是不完全的人工制定的规
则始终是有限的所以需要新的方法去解决这种困境。
随着神经网络研究的兴起基于深度学习的隐喻识别得到广泛的探索。词语
在句子中的上下文语境对于隐喻识别起着重要作用利用深度神经网络学习句子
中词语上下文语境的相关信息然后利用词语与上下文语境的不一致可以解决隐
喻识别问题。8 等
9
将词嵌入信息输入双向 3,%: 网络中捕捉词语两个方向
上的语义信息用于词级别的隐喻分类。: 等
;
在隐喻识别过程理论
和选择
偏好理 论
的启发下提出 了两个隐 喻识别模 型。两种模型 均通过 8
$
和
<3:
'
语言模型获取句子中词语的词嵌入信息并将词嵌入信息输入双向长短时
记忆网络进行上下文编码最终输出到分类层进行分类。苏传东等
(
提出基于词
嵌入的语义优先中断理论利用循环神经网络对文本进行序列化建模提高隐喻识
别的准确性。
大规模预训练语言模型的出现使深度神经网络可以获取具有丰富语义信息
的词嵌入表示极大促进了隐喻识别任务的研究进展。1<=%
+
及其衍生模型的出
现将隐喻识别任务的基线指标提高了大约 ;>。张冬瑜等
.
使用 1<=% 模型对
词进行词向量编码编码后的语义表示同时包含词与词之间的位置关系等信息利
用 % 模型对其进行特征提取并通过神经网络分类器完成识别。3 等
0
通过 31<=% 模型提取文本特征再利用双向长短时记忆网络得到上下文表示
然 后 输 入 ,:? 分 类 层 输 出 最 终 的 预 测 结 果 。 8" 等
9
通 过 结 合 由
=1<=%
;
生成的语境化表示和外部语言特征从而利用句子中的语境和语言特
征信息并采用集成方法降低预测的方差提高隐喻识别模型的性能。
最近图卷积神经网络(8#-*)*)8))被广
泛运用在自然语言领域中。尽管自然语言表现出顺序性但是它们也可能包含一
个内部图结构例如依存句法树。依存句法树定义了句子中单词之间的句法关系。
3* 等
和 )"* 等
将图卷积神经网络应用于事件提取这里使用的图是依存
句法树。," 等
$
将图卷积神经网络用于阅读理解、抽象含义图到文本的生成
任务和关系提取等任务上。大量的研究表明各项自然语言处理任务在使用图卷
积神经网络模型后结果都出现了一定的提升。相比传统的序列化建模方式图卷
积神经网络能够挖掘出文本中非线性的复杂语义关系。
采用 % 提取句子中目标词的深层语义表示并使用图卷积神经网
络提取句法结构信息对目标词的隐喻特征进行补充进一步提高隐喻识别的准确
性。
3 方法研究
为解决现有模型无法有效识别多词隐喻的问题 本文提出一种基于图卷积神
经网络和 % 的隐喻识别模型如图
所示。
图
图 1基于 Transformer 和图卷积神经网络的隐喻识别模型
Fig.1Metaphor Recognition Model Based on Transformer and Graph
Convolutional Neural Network
()采用 % 结构对句子进行上下文语义计算利用 =1<=% 模
型获得词语的语义表示并加入词语的词性信息作为补充信息丰富语义表示。
()使用依存句法树构建图通过图卷积神经网络学习句子中词与词的依赖
关系从而得到词语的句法结构表示。
($)将上下文语义表示与句法结构表示联合输入分类层预测目标词是否是
隐喻表达。
$5基于 % 的上下文语义计算
,* 等
'
提出的局部上下文概念还存在些许不足之处。如果是一个没有标点
符号分割的长句子那么局部上下文就可能变成全局上下文显然不符合局部上下
文的概念。所以通过限定窗口大小 k规范局部上下文的概念获得细粒度的局部
上下文。
给定句子 S={w1,w2,…,wn},@ABC和目标词 wt首先以目
标 词 wt 为 中 心 在 k 大 小 的 窗 口 内 构 建 子 句 q={wt−k,…,wt,
…,wt+k}2@ADBBEC 。 例 如 对 于 句 子 “
剩余12页未读,继续阅读
资源评论
- sdfj_yeda2023-01-07资源内容详细,总结地很全面,与描述的内容一致,对我启发很大,学习了。
罗伯特之技术屋
- 粉丝: 3548
- 资源: 1万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功