协同设计环境下基于语义的本体建立方法
凌玲胡于进王学林等
协同设计环境下基于语义的本体建立方法
凌玲胡于进王学林李成刚
华中科技大学,武汉,
430074
摘要:分析了获取概念及其关系是本体建立的瓶颈的原因,提出一种在协同设计环境下基
于语义的本体建立方法。各
Agent
抽取的术语集合经过预处理,以
WordNet
提供的术语语义
为基础,经过基于语义的聚类,生成概念集;再根据术语语义关系与概念关系之间的映射规则
建立概念的关联,从而构造概念树并建立本休。这种半自动的本体建立方法避免了因对概念
理解不统一而产生的不一致性,得到的本体易于扩展。
关键词:多
Agent
系统;本体;概念生成;概念关联;基于语义;
WordNet
中图分类号:
TP182
文章编号:
1004-132
X
(2005)
19
一
1757
一
05
\
A
Semantic-
based
Approach
for
Ontology
Construction
in
a
Collaborative
Design
Environment
Ling
Ling
Hu
Yujin
Wang
Xuelin
Li
Chenggang
Huazhong
University
of
Science
and
Technology
,
Wuhan
,
430074
Abstract:
The
reasons
why
capturing
domain
concepts
was
the
bottleneck
of
ontology
construction
were
analyzed.
Then
a
semantic
-
based
approach
for
ontology
construction
in
a co
l1
aborative
design
environment
was
presented.
Firstly
,
terms
were
extracted
from
documents
of
multi
-
agent
systems
and
congregated
a
term
set
after
pretreatments.
Then
the
concept
set
was
built
via
semantic
-
based
clustering
according
to
semanteme
of
terms
provided
by
WordNet.
Next
, a
concept
tree
was
construc
ted
in
terms
of
mapping
rules
between
semanteme
relationships
and
concept
relationships.
The
ontolo-
gy
was
constructed
in
an
incremental
way.
A
semi
-
automatic
approach
can
avoid
non
-
consistence
due
to
knowledge
engineers
having
different
understandings
of
the
same
concep
t.
The
obtained
ontolo-
gy
is
easily
to
be
expanded.
Key
words:
multi
-
agent
system;
ontology;
concept
generation;
concept
relationship;
semantic
based;
W
ordN
et
O
引言
协同设计环境是由若干具有不同领域知识和
问题求解能力的设计主体组成的多
Agent
系统,
知识共享和集成是各
Agent
实现互操作、共同完
成设计任务的必要条件。本体论是目前公认的实
现知识共享的基础[l
J
。本体是关于共享概念化的
协议
[2]
,通过详细定义领域概念及其之间的关系,
为不同知识源之间的知识共享、互用、集成提供标
准的词汇表和映射规则。本体的建立主要包括领
域概念获取、建立概念关联、本体形式化、本体评
价、本体扩展等步骤。识别、定义领域概念及其之
间的关联是建立本体的关键。本体的建立方法主
要有英国爱丁堡大学的
Enterprise
Ontology
模
式、加拿大多伦多大学的
TOVE
方法、西班牙马
德里大学的
Methonotology
模式等。如同知识获
取是知识工程的瓶颈一样,领域概念的获取是本
体建立的瓶颈,其主要原因如下:①不同的知识工
程师对同一概念或概念之间的关系可能有不同的
观点,所以构造的本体存在不一致性,影响了本体
的扩展、共享和应用以];②目前建立本体主要是
于工劳动,占用大量的时间和成本。
收稿日期
:2004-10-14
为了提高概念获取的准确性和效率,应用机
器学习技术实现自动或半自动地获取领域概念是
一种可行的方法,如
OntoLearn[4J
和
ROD[5J
能够
从非结构化文档通过机器学习或统计方法自动获
取领域概念;
MOMIS[6
,7]能够将关系型数据库和
XML
文档中的术语经聚类建立公共辞典,并在电
子商务中得到应用。以上系统中,为了判断不同
文档中的术语是否指向同一概念,主要的依据是
它们在上下文中的语义是否相同。
协同设计环境中各个设计主体拥有自己的术
语集合,采用基于语义的方法,将其中语义相同或
相近的术语通过聚类生成概念是获取概念的可行
方法。本文主要研究协同设计环境本体的定义、
生成概念的聚类方法及基于语义关系建立概念关
联的方法。
1
本体定义方法
协同设计环境可看作→个多
Agent
系统。
多
Agent
系统
(MAS)
是定义在领域
0=0
1
U
02U
… U
0"
上的多个具有自主行为能力的
Agent
的集合。定义
MAS
的本体为
()nt
=
CC
,
R)
R =
{r
I r =
f:
Ci -
C}
,
Ci
巨=
C ,c) E
C}
•
1757
•