没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
北川、大学芋'报
1
1'
1
然科学版)很
51
卷第
4
)9
J
2015
年
7
月
Acla Scientiarum Naluralium Universitatis
P
巳
kincnsis
,
VoL
51
, No. 4 (J uly 2015)
doi:
10.13209
心
0479-8023.2015.054
融合词义消歧的汉语句法分析方法研究
李冬晨张献涛樊扬吴垒宏
1
北京大学言语昕觉研究中心,北京大学机器感知与智能教育部重点实验奈,北京
100871
;
↑通信作者,
E-mai
1:
wxh@cis.pku.edu.cn
摘要
将句法分析与词义消歧相结合,根据层次化语义知识的句法分析框架,在句法分析训练过程中,利用
句法结构信息对文法模型进行调整解决了引人语义时所面对的歧义问题构建一种句法分析和词义消歧的
一体化方法。实验表明,在句法分析过程中进行词义消歧处理,使句法分析的性能显著提升,同时也获得词
义消歧能力。
关键词
句法分析;词义消歧,一体化
中国分类号
TP391
Chinese Syntactic Parsing with W
ord
Sense Disambiguation
LI
Dongchen
, ZHANG
Xiantao
, FAN
Yang
, WU
Xihong'
Speech
and
Hearing Research Center, Key Laboratory of Machine Perception
(MO
日,
Peking
Universit)
几
B
巳
ijing
100871;
r Corresponding author, E-mail: wxh@cis.pku.edu.cn
Abstract
This
paper
proposes
an
integrated
parsing
and
word
sense
disambiguation
system.
Th
巳
ambiguity
problem
is
solved
wh
巳
n
introducing
semantic
knowledge
into
the
parser
by
modifying
the lexical
grammar
lt
巳
rati
飞
rely.
Syntactic
information
is
us
巳 d
to
deal
with
polysemous
words
in
the
training process.
The
experim
巳
ntal
resu
Jt
s show that
th
巳
new
method
not
only
improves
th
巳
parsing
performanc
巳,
but
also
has a
good
performance
on
word
sense disambiguation.
Key
words
parsing;
word
sense disambiguation;
integration
句法分析在机器翻译、问答系统、信息抽取以
及语音合成等系统中具有广泛的应用,一直都是自
然语言处理研究的重点和难点之一。自动句法分析
是指在给定词序列的情况下,根据一定的语法体系,
分析句子所包含的语法单元与这些语法单元之间的
关系,将线性词序列转化为一棵带有层次化结构的
语法树。图
I
为对应于给定输入"议会暂时终止实
施法律条文"的句法分析树。句法树中的终结符节
点(如"议会")是输入的词序列,预终结符节点(如
"NN"(Noun
,名词))对应于每个终结符节点的词性
标记,非终结符节点。日
"NP"(Nominal
Phrase
,名词
性短语))代表句法树中的句法成分。
句法分析和语义分析作为自然语言处理中的两
个重要层面,它们之间存在密切联系,要实现对一
句话的理解,不仅要分析它的句法结构,还要了解
其中每个词的语义。研究表明,句法分析和语义分
析这两个层面的任务可以互相帮助。针对汉语的特
点,将句法分析和语义分析相结合,有助于对汉语
的处理。另一方面,自然语言处理的难点就在于歧
义问题,句法分析中需要解决句法结构上的歧义现
象,而语义分析中的词义消歧,需要根据上下文处
理多义词的歧义。这两个歧义问题中任一问题的解
决,对另一项任务都会有很大帮助,如果能够将它
们在同一个过程中解决,就能够充分利用它们之间
l
萄家重点基础研究发展讨划
(2013CB329304)
、公益健康行业研究专项
(201202001)
、国家社会科学基金
(12&ZDlI9)
和国家自然科学基金
。
1120001)
资助
收梢
8
J
þJ:
2014-04-02;
修|国
ß!
驹:
2014-05-20;
网络
H~
版日期
2015-07-13
577
Jl
!;{大学学恨(
(1
然科学
Jili
ì
写\
'i
l
卷
1~
'j
4
!t月
201:
i
:I'-7
Ji
f
飞
p
-ï
/'\
NN
飞
DV
I'
VP
/八\\
议会
八
D
VV
I1
>
暂时终止
VP
-------\\\
VV
N
I'
/\
实施
NN
~N
法律
条文
图
1
旬子"议会暂时终止实施法律条文"对应的旬法树
Fig_
1
An
illustration of a syntactic
tr
的联系,使两者同时受益。
目前词义消歧系统一般以句法分析结果作为输
入特征。当前对句法分析的研究主要集中在利用机
器学习技术优化模型结构
[1--6]
。近年来已经有→些
利用语义信息提升句法分析性能的研究
[7-8]
然而,
仍然存在的问题是,汉语巾一词多义的现象相当普
遍
[9]
。在句法分析过程中,通过词汇引入语义时,
必然面对歧义问题。如果不能选择正确的语义,必
然会对后续在语义知识指导下的句法分析的训练过
程造成干扰。英文方面,
Agirr
巳等
[8]
尝试利用一个
统一的模型,结合句法分析和词义消歧任务,在词
义消歧任务中获得一定程度的改进,不过在句法分
析性能上没有改善。此外,
Agiηe
等
[8]
利用前置的
词义消歧模块给句法分析提供消歧后的输入序列,
然而这种串行的处理模式没有取得理想效果。
Lin
等
[10]
以层次化标记细化的句法分析方法为出发点,
将语义知识引人其中,在
i
吾义的约束下,对部分语
义相关的词性标记进行细化,实现句法和语义的结
合,但是对于歧义问题,只是简单采用首义选择的
方式。
本文将句法分析和词义消歧相结合,并根据层
次化语义知识的句法分析框架,通过使用句法信息,
为每个多义词实例选择其最可能对应的词性子标
记,在句法分析训练过程中,不断调整词汇文法,
从而在句法训练的过程中解决歧义问题。在对多义
词实例进行处理时\采用一种增量式的处理策略
c
同时,通过对词汇文法的调整,强化其中词性子标
记之间的话义区分性,从而使训练得到的文法模型
578
(1
包含
~JJ
挝、
{ι
白、
1'1'0
同
时也1'1-千
1
--店的同义
íf
1
í
歧功
能
J
这样,在句法分析
(1
0
1'[(
组
lf.
向建-
,
;f
t
lr1iHl
分析和同义Wj
J
陡的一体化
IitL.
1
相关工作
1.
1
层次化语义知识库
HowNet
简介
X10IIgi
宁
j7]
手
11
Lin
可
:1101
采
JH
{知|同
Y
(HowN
巳
t)
作为
&h
义知识惊飞
《知|叫》描述
f
概念与概念之
间的关系
[11-12J
HowNet
rl1
描述
r
多种天系(包拈
1-
-f'1ti
关系
L
表{i1:了概念直接由粗到细、叶
l
具体
到泛化的关系,构成义原之间的层次结构。所有概
念义原被分为
4
类:实体、事件、属性和
1
属性值,
每一类都构成一棵义原树。
在
HowNet
巾,以"冗
entlt
刚
y
川|实体
件
4
个顶层上位义原作为根节点,构成
4
棵义原树,
这些义原树阵由|上到下生长由越来越细的义原,义原
树的内部结构反映义原间的关系,其中包含本文利
用的层次化语义知识。
1.
2
利用层次化语义知识指导旬法训练的
方法
研究表明,句法分析和语义分析这两个层面的
任务可以互相帮助
O
近年来已经有一些将语义与句
法分析相结合的研究,利用
i
含义知识帮助句法消歧,
从而提高句法分析性能
[7--9]
0
Lin
等
[10]
从一个全新
的角度出发,以层次化的标记自动分裂合并方法为
基础,利用层次化的语义知识,指导文法标记的细
化过程,将数据驱动方法与知识驱动方法相结合,
有效提升了模型的推广能力
G
在层次化的标记自动
细化的句法分析方法训练过程中,引入语义知识分
为两个步骤。首先,在层次化标记分裂开始前,将
最粗一层的语义直接标记在词性节点上,以此来细
化词性节点,并且通过为词性层提供一个更好的初
始化,以缩小训练过程巾
EM
算法的搜索空间。然
后,在每一层次的标记自动分裂后,根据
HowNet
巾的层次化语义,判断是否需要进行下一层次的标
记细化。在具体实现过程中,某个词性标记或其子
标记是否细化,是由其对应的
HowNet
义原树巾对
应的义原节点决定
c
如果该义原节点存在更细的义
原子节点,则表示该子标记仍然可以在语义上继续
执行细分,然后进入下一层次的标记细化,如果对
应的义原节点不包含更细的下位义原子节点,就不
对该同性子标记进行细化
c
这样,而义相关词性节
剩余7页未读,继续阅读
资源评论
weixin_38519387
- 粉丝: 3
- 资源: 931
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功