论文研究-基于本体的语义分析过程与方法的研究应用.pdf

所需积分/C币:10 2019-07-22 19:17:41 618KB .PDF
28
收藏 收藏
举报

为了提高信息化环境下语义分析能力,将本体引入语义分析。通过对典型本体构建方法的比较与综合,形成一种持续优化的本体构建方法,在此基础上进行概念分析、关系推理。进一步对比基于本体的语义分析和其他语义分析方法,指出基于本体的语义分析更具系统性、针对性,推理能力强。最后,将基于本体的语义分析应用到软件缺陷分析系统中。结果表明,本方法能够集成到原有系统中并有效进行关系推理和冲突识别。
第3期 张文秀,等:基于本体的语义分析过程与方法的研究应用 963· 析、基于规则的语义分析不针对明确的领域,仅有一些简单般由多个功能模块组成,对软件缺陷管理系统来说,它一般 规则。 有缺陷跟踪、査询统计、e-mail通知等模块。语义分析程序的 b)推理性能高。潜在语义分析通过建立复杂的奇异值分工作流程是:a)获取用户的语义分析需求,将用户需求进行语 解和降维因子,从中提取关键词和潜在的语义结构,方法机械义标注;b通过读取领域本体得到领域概念和关系的明确描 而计算量大;而领域本体的引入和构建是知识工作者和领域专述;c)借助本体解析器如Jena进行KDF语义解析;d)在本体 家协作和迭代的成果,基于本体的语义分析比通过机械计算得推理机如Raer的帮助下,利用各和规则和概念网络,对软件 到的关键词一句子语义空间更能揭示语义关系与知识 缺陷信息中所涉及的概念和术语进行语义推理,发现隐含的关 )适用领域广泛。潜在语义分析、基于规则的语义分析系和规律;e)将分析结果按照用户的需求提交至表示层,并添 特别适用于文本,而基于本体的语义分析适用于多种形式的客加到基础层的领域本体中 观对象 3)衣示层是面向一般用户和语义分析用户的界面接 口,它将功能昃所实现的包括语义分析在内的各种系统功能向 3基于本体的语义分析应用 用户提供简单、直观的表现和支持。在这一层中,用户可以提 本研究将本体的语义分析应用到软件缺陷信息分析中。交语义分析需求、设定各种语义分析限制条件等。 软件缺陷是指可运行软件产品中会导致软件失效的瑕疵。3.2基于本体的软件缺陷语义分析应用 利用本体的标准化、形式化特点和推理功能,可以有效解决软 本体推理有多方面应用,如获得本体中的语义含义并运用 件缺陷信息的规范表示、共享与分析推理等关键问题,更对软本体的语义来发现规律解决问题,还可以检测冲突、优化表达 件缺陷分析有显著扩展,使缺陷分析不再仅限于缺陷密度、缺和本体融合。本文以软件缺陷信息为语义分析对象,进行 陷成长等简单分析,而能进行更广泛、更深人的缺陷语义分析,关系推理和冲突识别。 把隐含在显式定义和声明中的语义关系和规律通过推理提取3.2.1推理未知关系 出来,将软件缺陷信息有效地转换为组织可共享的知识 本体在构建的过程中会定义大量概念、属性以及它们之间 3.1基于本体的软件缺陷语义分析系统 的关系,而有些潜在的关系是未定义的,甚至是未被发现的, 基于本体的语义分析在应用时应以有效、集成为原则,即体就可以根据已定义的关系进行推理,从而得到术定义的关 尽可能在原有领域应用程序的基础上集成语义分析使其发挥系。这样的推理对于本体的构建者来说可以完善本体概念中 作用,而不是重新架构一套全新的系统。囚此,可在原有系统的关系定义,对丁本体的使用者来说可以进行知识发现等。 屮增加领域夲体库和语义分析模块。从最上层来看,基于不体 本研究是在IBM的缺陷正交分类法( orthogonal defect 的语义分析系统采用简洁的分层体系结构,共分为基础层、功 classification,ODC) 和美国国土安全部( United States Depart 能层、表示层层,如图2所示。 ment of Homeland Security,DHl)发布的常见缺陷列衣( common 用户接口 CWE)2的基础上建立起的软件缺陷领 表示层 == 域核心概念集,如图3所示。对概念集中的概念及其关系进行 功能层:领 语义分析 完善,梳理出分类和层次,并定义类,剩余的概念就是类的属 语义标注 培义推理 性。这一定义类和创建属性的过程就是本体的表示,即采用建 用 模工具和描述语言定义类和创建属性来建立本体。 程 本体读取 RD解析1 Defect mmm 基础层 领域本体 数、[本体编→本体管理 Activity) rigger Protege+OWL Sot Req est 从属关系 操作系统 LateralCompatibility 关联关系 图2基于本体的语义分析系统的结构 →推理的关系 1)基础层包括系统运行所需的操作系统、数据库和领 图3软件缺陷领域概念集(部分) 域体。对软件缺陷信息管理而言,需在现有应用程序的操作 在软件缺陷领域本体中有一个具体实例,如下: 系统和数据库的基础上,在领域专家和本体工作者的协作下 owl: Class rdf: ID="Design"> 参照本体的构建方法学,利用Pmge等本体编辑器和0W.本 rdfs. sub Classof 体描述语言,构建并管理软件缺陷领域本体。含有丰富语义的 0w1: Class rdf:D=" Activity”/〉 〈/rdfs: ub Classof) 缺陷信息管理领域本体能够为软件组织的信息组织、知识发现(ow1:cCks 与共享提供支持,为利用本体的语义分析能力揭示隐藏在大量 owl: Class rdf: ID="LateralCompatibility ") (rdfs: sub ClassOf) 缺陷信息背后的知识和规律做好前期祚备。 〈owl: Class rdf:ID=" Trigger"/〉 /rdfs. sub Classof 2)功能层是在利用现有领域应用程序的同时,增加语 (/owl: Class) 义分析引擎,以实现基于本体的语义分析功能。领域应用程序〈rds: subClassof 964 计算机应用研究 Kowl: Restriction Kowl: onProperty 4结束语 owl: Transitive Property rdf: about="#has_member owl: on Pronert 基于本体的语义分析方法是信息化环境下开展语义层面 〈owl: allvaluesfrom〉 Kowl: Class rdf: ID="LateralCopjatibilily"/> 信息分析的有力方法。本文探讨了基于本体的语义分析方法 K/owl: allvalues Fruml 的基本过程,主要包括本体构建和语义推理两大步骤。本体构 (/rdfs: sub ClassOf 建时需要领域专家和本体工作者采用适当的方法协同构建领 A Dwl: Transitive Property rdf: about ="*hs 域本体。语义推理则是在领域本体的基础上根据用户需求进 Kowl Transitive Property rdf: about="#is_member_of"/ 行概念分析、关系校验和推理等。基于本体的语义分析方法在 〈/owl: inverseof 应用时,应尽可能地在现有应用系统的基础上增加语义功能模 (/owl: Transitive Property> 块,并且有意识地不断完善领域本体,加强语义分析 这是用OWL定义的软件缺陷信息管理领域本体中的四 随着人们对信息服务要求的不断提升以及语义网的快速 个类和两个属性。四个类是atty及其子类 design,migr及发展,基于本体的语义分析具有广阔的研究与应用前景,今后 其子类 lateralcompatibility,两个属性是has_ member和is 应进一步研究本休的进化、自动化语义标注、语义推理模型等。 member,这两个属性之间的关系是imeo这段owL代参考文献 码还描述了 design“has_ member" lateralcompatibility,即 design [1 NERLICH B, CLARKE D. Semantic fields and frames: historical c 有一个成员是 lateralcompatibility,因为之前已定义 has member plorations of the interface between language, action and cognition 和 is member of为互逆关系,于是推理出: lateralcompatibility [J. Journal of Pragmatics, 2000, 32(2): 125-150 “ is member of" design。所推理出的关系如图3所示。 12 LEE T B. HENDLER J, LASSILA O. The semantic Wcbl J. Scien 3.2.2识别木体构建与应用过程中的冲突 tific American, 2001, 284(5): 34-43 构建的本体应该是正确的、一致的,然而,种种原因可能造3]张玉峰,艾丹祥,金燕,基于 semanTic Wel的个性化网络导航机制 成本体定义中存在冲突,而这种冲突可能会导致更加致命的错 J」.情报学报,2005,24(4):438-444 误,所以可以利用本体的推理能力来检测这种冲突13冲突4]李景本体理论在义献检索系统中的应用研究M]北京:北京图 书馆出版社,2005:111 检验的基本原理如图4所示,它是根据已定义的冲突识别目标 5」袁媛.领淢本体建设的方沄论和工具研究[D」.北京:中国人民大 读取本休库中相关的类和实例等,对规则等进行解析并在此基 础上利用RDF推理应有的关系。然后,将推理出的关系与已[61 LANDAUER T K, FOLTZ P W, LAHAM D. Introduction to latent 定义的关系进行排序和比较,经过筛选过滤,发现不一致之处 semantic analysisl J. Discourse Processes, 1998, 27( 25): 259 后,雨进一步验证,最终确认后抽取该冲突的相关信息并报告。 284 个基本的应用就是检测一个类是否是另一个类的子类。通7 DEERWESTER S, DUMAIS S T. An indexing hy latent semantic 过检测本体中所有的类,可以达到识别和消除冲突的目的。 analysis J. Joumal of the Society for Information Science 90,41(6):391-407 需求处理 本体读取 关系推理 语义标识 实例获取 规则解析 [8 KHOSHGOFTAAR T M. SELIYA N. Tree-based softw are quality es timation models for fault prediction C 1//Proc of the Sth IEEE Inter- 目标定义 类的读取 RDF推理 national Symposium on Software Metrics. Washington DC: IEEE Com puter Society, 2002: 123-128 国囗量国回 冲突处理 系检验 9 NIKORA A P, MUNSON J C. Developing fault predictors for evolving 冲突验证 相关度排序 software systems[ C]//Proc of the 9th IEEE International Symposium 冲突抽取 关系筛选 on Software Metrics. Washington DC: IFFF Computer Society, 2003 338-350. 图4基于本体的冲突识别机制 [10]高琦,陈华钧.互联网 ontology语言和推理的比铰和分析[J].计 在本体的应用过程中,由于用户差异,还可能因对本体中 概念理解的不充分而造成应用冲突。例如:软件缺陷领域本体[11 BM Research Center far Software Engineering: Orthogonal defec 中的类 target(即目标)对应在软件生命周期中缺陷的注入阶 classification[eb/olj.(2002-02-01)[2007-04-12]httP: //Www research ihm. com/'snfteng/ODC/ODC. HTM 段, activity(即活动)、 remove(即排除)分别对应缺陷的发现阶 12] Homeland Security. CWE-common weakness enumeration[EB/OL] 段和排除阶段。已定义规则是三者之间有在顺序的逻辑关系 (2010-08-12)201008-14」.htp://ewe,mtre.org/ 缺陷的发现阶段不能早于其注人阶段,缺陷的排除阶段不能早13] HORRIDGE M, KNUBLAUCH H, RECTOR A practical 于其注入的阶段和发现的阶段。若一条缺陷记录中lrwl的 uide to building OWL ontologies using the protege-OWL plugin and 属性为 design, activity的属性为test,则 remove的属性应该是 CO-ODE tools edition 1. OM.LS.1.: The University of Manchester est或 using,如果用户试图使 remove的属性对应成 design就 and Stanford University, 2004 会造成冲突,基于本体的语义分析就能识别出此冲突并且不接[141李永超,罗钧,语义W山中的本体推理研究[冂].计算机技术与 发展,2007,17(1):101-103 受这样的信息。 [15]张文秀,朱庆华。基于本伓的信息分析研究——以软牛缺陷信息 以上是基于本体的语义推理分析的基本应用。在本体的 管理为例[冂].情报杂志,2008,27(3):43-45 实际应用中,根据用户需求还可以定义很多附加规则来实现更16」杜小勇,马文峰,武文娟学科领域本体的构建与进化——以经济 加复杂的推理分析。 学领域本体为例[J.现代图书情报技术,2007,148(3):7-12

...展开详情
试读 4P 论文研究-基于本体的语义分析过程与方法的研究应用.pdf
立即下载
限时抽奖 低至0.43元/次
身份认证后 购VIP低至7折
一个资源只可评论一次,评论内容不能少于5个字
您会向同学/朋友/同事推荐我们的CSDN下载吗?
谢谢参与!您的真实评价是我们改进的动力~
  • 至尊王者

关注 私信
上传资源赚钱or赚积分
最新推荐
论文研究-基于本体的语义分析过程与方法的研究应用.pdf 10积分/C币 立即下载
1/4
论文研究-基于本体的语义分析过程与方法的研究应用.pdf第1页

试读结束, 可继续读1页

10积分/C币 立即下载