北川、大学芋'报
1
1'
1
然科学版)很
51
卷第
4
)9
J
2015
年
7
月
Acla Scientiarum Naluralium Universitatis
P
巳
kincnsis
,
VoL
51
, No. 4 (J uly 2015)
doi:
10.13209
心
0479-8023.2015.054
融合词义消歧的汉语句法分析方法研究
李冬晨张献涛樊扬吴垒宏
1
北京大学言语昕觉研究中心,北京大学机器感知与智能教育部重点实验奈,北京
100871
;
↑通信作者,
E-mai
1:
wxh@cis.pku.edu.cn
摘要
将句法分析与词义消歧相结合,根据层次化语义知识的句法分析框架,在句法分析训练过程中,利用
句法结构信息对文法模型进行调整解决了引人语义时所面对的歧义问题构建一种句法分析和词义消歧的
一体化方法。实验表明,在句法分析过程中进行词义消歧处理,使句法分析的性能显著提升,同时也获得词
义消歧能力。
关键词
句法分析;词义消歧,一体化
中国分类号
TP391
Chinese Syntactic Parsing with W
ord
Sense Disambiguation
LI
Dongchen
, ZHANG
Xiantao
, FAN
Yang
, WU
Xihong'
Speech
and
Hearing Research Center, Key Laboratory of Machine Perception
(MO
日,
Peking
Universit)
几
B
巳
ijing
100871;
r Corresponding author, E-mail: wxh@cis.pku.edu.cn
Abstract
This
paper
proposes
an
integrated
parsing
and
word
sense
disambiguation
system.
Th
巳
ambiguity
problem
is
solved
wh
巳
n
introducing
semantic
knowledge
into
the
parser
by
modifying
the lexical
grammar
lt
巳
rati
飞
rely.
Syntactic
information
is
us
巳 d
to
deal
with
polysemous
words
in
the
training process.
The
experim
巳
ntal
resu
Jt
s show that
th
巳
new
method
not
only
improves
th
巳
parsing
performanc
巳,
but
also
has a
good
performance
on
word
sense disambiguation.
Key
words
parsing;
word
sense disambiguation;
integration
句法分析在机器翻译、问答系统、信息抽取以
及语音合成等系统中具有广泛的应用,一直都是自
然语言处理研究的重点和难点之一。自动句法分析
是指在给定词序列的情况下,根据一定的语法体系,
分析句子所包含的语法单元与这些语法单元之间的
关系,将线性词序列转化为一棵带有层次化结构的
语法树。图
I
为对应于给定输入"议会暂时终止实
施法律条文"的句法分析树。句法树中的终结符节
点(如"议会")是输入的词序列,预终结符节点(如
"NN"(Noun
,名词))对应于每个终结符节点的词性
标记,非终结符节点。日
"NP"(Nominal
Phrase
,名词
性短语))代表句法树中的句法成分。
句法分析和语义分析作为自然语言处理中的两
个重要层面,它们之间存在密切联系,要实现对一
句话的理解,不仅要分析它的句法结构,还要了解
其中每个词的语义。研究表明,句法分析和语义分
析这两个层面的任务可以互相帮助。针对汉语的特
点,将句法分析和语义分析相结合,有助于对汉语
的处理。另一方面,自然语言处理的难点就在于歧
义问题,句法分析中需要解决句法结构上的歧义现
象,而语义分析中的词义消歧,需要根据上下文处
理多义词的歧义。这两个歧义问题中任一问题的解
决,对另一项任务都会有很大帮助,如果能够将它
们在同一个过程中解决,就能够充分利用它们之间
l
萄家重点基础研究发展讨划
(2013CB329304)
、公益健康行业研究专项
(201202001)
、国家社会科学基金
(12&ZDlI9)
和国家自然科学基金
。
1120001)
资助
收梢
8
J
þJ:
2014-04-02;
修|国
ß!
驹:
2014-05-20;
网络
H~
版日期
2015-07-13
577