论文研究-基于语义的网格服务匹配研究.pdf

所需积分/C币:5 2019-07-22 18:27:28 350KB .PDF
收藏 收藏
举报

随着网格技术的发展,网格服务匹配成为了新的研究热点。服务匹配是有效提高网格资源利用的关键技术。分析了服务匹配中广泛存在的服务提供方与服务请求方往往无法做到事先沟通的原因,提出了将语义引入服务描述语言以及服务匹配算法的基于语义的网格服务匹配技术,并结合服务匹配的具体应用,提出了相应的解决方案。
第5期 刘梅梅,等:基于语义的网格服务匹配研究 1609 以上所列的不足。 GWSDL用 portType扩展(通过使用 extends 该算法在确定匹配程度上通过建立语义分类树( taxonomy 属性)来定义标准操作 tre来确定概念间的匹配程度。首次提出了基于服务能力的 3)OWLs它是一种描述Web服务的本体语言,含有语义匹配方法,通过建立语义分类树来判断概念之间的关系, 语义信息。图2是OWLS结构图。 从而实现模糊匹配,并且经过实验证明能提高服务查准率。但 resource provides service 是该算法仍然存在一些问题:(a)该算法采用语义分类树来判 supports 断概念的匹配程度,就需要在发布服务时手工建立该分类树 presents describedby i service Grounding 并旦每当有新的服务发布时,就需要更新该分类树,因此将消 What the service does erviceMode How to access it 耗系统运作时间;(b)匹配等级的划分粗糙,容易出现众多属 How it works 于同一匹配类型的Web服务,因此不能很好地区分Weh服务 图2OWLS结构图 匹配程度;(c)仅把输∧/输出参数作为服务匹配的依据,服务 其中, resource代表提供服务的资源; service作为服务本体分类匹配范围粒度偏大,查询效率不高。 的根节点,代表服务白身。OWLS结构是根据 service的pre 2)利用 RACER推理机的 DAML-S服务匹配 sents, describedby和 supports三个属性来构造的。这三个属性 Li等人在JADE(一种 agent实现平台)平台上利用 分别涉及网格服务的三个最基本的问题:此服务提供什么样的 RACER推理机进行基于 DAML-S Profile的服务匹配。他们主 服务、服务具体是怎样工作的,以及如何访问这些服务 要提出以下三个方面的建议: Service profile描述一个服务所要包含的信息:服务提供者 a)指出 DAML-S0.9版存在的一些间题,并给出修改方 的白页和黄页信息,如服务提供者的联系方式;服务的功能信案,如指出 provided By和 requested By将影响服务的匹配,并建 息。Iuts和 ouTputs是指服务的输入和输出; precondition和议将这两个属性移出 profile, fcts是指服务的前提条件和效果,即服务执行前应该满足的 b)该工作在服务配的处理方式上对 Paolucci等人的工 条件和服务执行后实际产牛的效果,可以理解为状态的改变。作进行了改进。首先是改进了 exact的定义;其次是引入了 Service Model主要是服务提供者用来描述服务的内部流种新的匹配等级 intersection(相父匹配),即概念C与C2有语 程。一个 service通常被称之为一个 process(过程)。 Process义关联,记为C1∩C2≠②,匹配结果记为 Intersection(C1,C2)。 分为 atomic process、 composite process和 simple process三类。 c)该工作给出了一些重要的实践经验和参考数据。如提 tomie process原子过程)是不可再分的过程,可以直接被调倡定义子类而不是定义实例,因为Ahox(实例断言)的推理要 用,每一个原子过程都必须提供一个 grounding信息,用于描述慢于Thox(断言);证实了在往现有类层次中插入新类的时间 如何去访问这个过程; composite process(复合过程)是由若干复杂度要远远高于进行类层次化的构建(大约为O(n),并 个原子和复合过程构成的过程; simple process是一个抽象概提出在类数目较多时采用离线创建类层次的方式等。 念,它不能被直接调用,也不能与 grounding绑定。 3.2基于相似度计算的匹配 ervicegrounding是涉及到服务的具体规范。简单来说, 1)基于几何距离的相似度算法 它描述了如何访问一个服务的细节,如制订消息格式、通信协 领域本体中各概念之间的关系可以表示成一个有向图。 议和服务端口等。 基于几何距离的相似度算法的基本思想就是用两个概念在本 3服务匹配算法 体有向图中的几何距离来衡量语义相关度,距离越短则相关度 越高。几何距离等于路径及其权重的乘积。概念间可能存在 服务匹配算法的基本作用就是根据服务的功能参数从己多条路径,而符合算法要求的是两点间的最短路径。最简单的 发布的所有候选服务中选取满足匹配需求的服务,并将匹配的计算方法就是把所有父类与子类节点之间的权重简化为1,这 结果返回给用户。目前,学术界已对服务匹配算法进行广泛样最短距离就等于两个节点间有向边的数量。式(1)表示两 们深人的研究,主要分为基于推理和基于相似度计算的两类匹个概念基于集合距离的语义相关度: 配方法 sin(c1,c2)=[2(H-1)-L]/[2(H-1)] 3.1基于推理的匹配 其中:H为本体网络的最大深度;L为概念c1、c2之间有向边的 数量。两个概念间的距离越远,那么它们之间的语义相似度就 1)基于DAMS的服务匹配 越小;反之则越大。此算法的优点就是匹配精度高,但是匹配 基于推理的匹配是建立在领域本体概念间的层次关系之 的效率不高。 上的,使用措述逻辑进行推理的四配方法。 Paolucci等人”提 2)基于属性的相似度算法20 出了一种基于 DAML-S(0WLS的前身)的服务匹配方法。它 该算法是根据比较各概念间相同的和不同属性的多少来 根据请求服务与广告服务的输人输出的匹配情况将服务匹配确定两者的相似度。两个概念间相同的属性越多,不同的属性 程度分为四种 越少,则它们越相似。 Tversky提出」这种基于属性的算法 n)Eac(精确匹配),即概念G1和C2,如果G1与C是本假设存在两个概念n和n,那么它们的相似度计算式为 体屮的相同概念,或当C2是C1的直接子类时,则匹配结果为 (n1,n2)=0f(n1∩n2)-cf( Bf( exact( CI, C2) 其中:,B,0≥0;(n1∩n2)为n1和n2共有的属性;(n1-n2)为 b)Pgn(插入匹配)。如果概念C2包含C1,或者说C2可m1有而m2没有的属性;参数a、B、6为概念m1与m2之间相同 以完全满足C1,则匹配结果为 plugIn(C1,C2) 属性和不同属性而赋的不同权重。之所以要对不同属性赋予 c) Subsumes(包含匹配)。如果概念C包含C2,即C2部不同权重,是因为考虑到相同的属性和不同属性在区别不同概 分满足C,则匹配结果记为 subsumes(C1,C2) 念的过程中所起的重要性不一样。 d)Fil(不匹配),即概念C1与C2完全没有语义关联,则 3)基于信息容量的相似度算法 匹配结果记为fail(C1,C2) 基于信息容量的算法是出 Resnik提出的,基本思想是两 1610 计算机应用研究 个概念的相似度由它们共同拥有的那韶分概念所决定。由于 c)服务调度。它是指从多个提供相同功能的服务节点中 每个概念都是由其祖先概念节点继承而来,继承了祖先节点的选择合适的服务来执行。网格服务是动态变化且自治的,这使 信息,两个概念间的相似度可由它们最近的共同祖先节点所包得具体的服务组合在实例化过程中往往是由于某个服务实例 含的信息容量来确定,共享的信息越多,相似度越大。概念的的变化而无法正常执行。为了避免服务变化对服务组合执行 信息容量可用统计的方法,计算概念在特点领域文集屮出现的的影响,进一步实现服务组合流程的重用,需要提供良好的服 概率。概念间的相似度(n1和n2为两个概念)为 务替换机制,即能在服务执行过程中及时对“坏死”的服务进 sim(ni, n,)=-log( P(lso(ni, n2))) (3)行替换。在网格环境下,服务由不同的组织发布和维护,调度 其中:SO(n1,n2)是n1和n的最近共有祖先;P(n)是概念n器想要寻找一个与被替代服务完全匹配的服务是很困难的。 在特定领域本体库(大样本空间)中岀现的概率。它们的语义目前,服务调度仅精确到服务功能层次,并未考虑非常重要的 相关度取决于它们共同祖先节点中含有信息谷量最多的一个,出入口参数的语义差异以及约束条件等因素 体现在本体中,就是等于最近的共同祖先节点的信息容量。若4.2基于语义的网格服务匹配算法的设计 存在多重继承的情况,那么对于两个概念在本体中可能存在多 针对服务匹配在当前应用中出现的问题,可以考虑从以下 个共同的最近祖先。在所有的共同最近祖先节点中选取信息几个方面来解决: 容量值最大的一个。 a)为服务描述添加语义信息。鉴于目前很多描述语言的 3.3两种匹配方式的比较 语义缺乏,虽然WSDL在XSD(Ⅹ ML schemas definition)中定义 综合3.1和3.2节的分析可知,从婧度上,基于推理的匹了输人/输出类型的概念,但是并不支持输入/输出参数之间的 配方法的等级划分相对较低,容易出现大量匹配程度相同的结逻辑约束定义,所以在服务的发现和调用支持方面不及OWL 果,且在某些情况下( plugIn和 subsumes)同级别内部不能进,但OwLS表达不了wSDL的绑定信息。由于OWLS是基 步区分结果的匹配程度;基丁相似度计算的匹配方法可以清于XML的,很容易对WsDL作出扩展来支持OWS,同样在 楚地区分这种差别。从匹配的效率上,基于推理的服务匹配的OW-S中也有相应的机制来访问WsD.的结构。 Service 个好处是可以在匹配之前对本体库过行预处理,如为每个概 Grounding提供Wwm到OW-S的一致性映射,因此,可以把 念建立匹配等级列表,从而可以将计算的复杂性转移到预处理0WLS与WSDL融合在一起,用OWL类表达WSDL中抽象类 阶段,匹配时只需在列表中査找对应的概念,可获得线性的时型的声明,使用WsDL的绑定结构来表达消息的格式。文献 间复杂度;基于相似度计算的服务匹配算法本身就比较复杂,[23]中对网格服务的上层本体( service profile)进行两方面的 加之不能进行类似的预处理,算法的复杂性仝部集中在匹配阶扩展来描述网格服务的特性:a)为使OwLS能适应动态服务 段,如基于几何距离的最短路径算法,在最坏情况下(本体规的状况,引人一个布尔型属性 adYnamic;(b)考虑网格服务的 模很大,概念间相似度却很小或根本不匹配)将会导致糟糕的服务数据,增加 servicedata类。 响应时间。从复杂度上,基于推理的匹配比较简单;而基于相 b)实现自动聚类的功能。按照服务的功能自动聚类,把 似度的匹配要复杂很多,实现难度也较大 具有相同功能的、但服务约束不完全相同的服务抽象出来形成 一类,并向用户提供统一的接口。将服务的出入口参数等信息 4关键技术分析 保存在数据库中,在进行服务查找时,只需在其所属的类别中 进行匹配即可,无须到所有服务中进行检索,因而可大嗝度地 4.1服务匹配的应用 提高匹配效率。具体算法如下: 在网格服务应用环境下,服务匹配技术主要应用在以下 Clustering clustering( Service SA) 个场景中 a)服务发现。网格中的服务种类繁多、功能各异。网格应 float sim=0;/*遍历所有已存在的分类* 该为用户提供一种功能,能够根据用户的需求从网格服务中找 for each adv in adv category data base 到满足用户需求的资源。服务发现功能的强弱,直接决定了网 米计算服务分类的和似度* 格的使用效率和友好程度。在服务提供者向服务注册中心发 sim= Match(SA service Cate gory, adv service Cate gory 出査询请求时,服务注卅中心将请求映射为服务请求描述,并 if( sim>=adv. getExpectedSim(i) 与广告描述过行匹配。于是,服务发现的问题就转换为请求描 /*满足期望值的添加到某类的链表里*/ 述与广告描述之间的匹配问题。服务匹配是服务发现的一个 resultList. add(SA) 关键问题,但目前的研究成果大多都是基于关键字的查询。 UDDI是众多发展和攴持服务的解决方案中最受瞩目的一个 UDDI上的服务发现,是通过对UDD上的服务注册信息进行 关键词精确匹配实现的,主要是对服务I或名称,或是服务的 有限属性值进行匹配。这种方式无法提供足够的灵活性和推 c)综合匹配算法。本文3.3节中已经对现有的基于推理 理能力,服务的查准率和查全率不高。 的匹配和基于相似度计算的匹配方法进行了比较,并得出了各 b)服务组合21。随着网格服务技术的成熟,越来越多的自的优缺点。基于推理的服务匹酷比较简单、运行效率高,但 稳定易用的服务共享在网格上,但单个服务能够提供的功能有存在匹配精度不足的同题基于相似度计算的服务匹配有很好 限。为了更加充分地利用共享的服务,有必要将共享的服务组的匹配精度,但算法较复杂执行效率不高。因此,可以考虑 合起来,提供更为强大的服务功能加快系统开发的速度,快速种基丁推理与相似度计算相结合的匹配策略。首先采用简单 满用户需求。单个子服务之间具有相互约束关系,这些都是的推理匹配,当匹配结果为 exact或fai时,无须进一步训算相 服务组合在查找满是服务时需要注意的问题,也是服务组合的似度;当结果是 plugIn或 subsumes时,需要进一步计算后再比 难点所在。 较。通过对本休库进行预处理,为概念问的匹配关系维护 第5期 刘梅梅,等:基于语义的网格服务匹配研究 1611 exact plugIn、 subsumes三个列表,从而将基于算法的计算复杂[2]LETB, HENDLER J, LASSILA O. The semantic WeblJ.scen 性转移到预处理阶段。算法中CR表示请求服务的概念;CA tific american,2001,284(5):34-43 表示广告服务的概念。算法如下 [3] broWn M C. What's semantic grid [ e.R/ol.].(2005).hTtp: // Mix Match Match( Concept CR, Concept CA) www.ibi.cut/ueveloperworks/cl/grid/gr-semgrid 14」明春明,怀进鹏,孙海龙.基于Web服务的网格体系结构及其攴 /*结果为 Exact时,无须进步计算相似度* 撑环境研究[J].软件学报,2004,15(7):1066-1068 if( FindInExact( Concept CR, Concept CA)) [5 TAN Y S, VELLANKI V, WANG Shou-hui, et aL. Service domain return I; [eb/Olj.(2003).http://www.ibm.com/developerwarks/cn/ /*结果为 plugIn或 subsumes时,需进一步计算相似度本 else if( findIn PlugIn( Concept CR, Concept CA lI [6 CHRISTENSEN E, CURBERA F, MEREDITH C, ct aL. Web ser findIn Subsumes( Concept CR, Concept CA)) vices description language( wsdl )1. ileb/olj.(2001). hTtp:// return getSimilarity(CR. CA www.w3.org/tr/2001/noTe-wSdl-20010315 eturn o [7]罗洋,曾国荪,基于本体语义的网格服务的 Web serv ices[J].情 报坦论与实践,204,27(1):52-54 d)建立分层匹配模型。文献匹型过程分为四81梁,梁开建,杨扬一种网格服务能力匹配方法[J].计算机应 步:输入匹配、输出匹配、轮廓匹配;这三步匹配的结果与第四 用,2004,24(9):28-30 步用户定义的匹配结合形成总的匹配结果。文献[24]把服务 [9 PAOLUCCI M, KA WAMURA T, RPAYNE T, et al. Semantic matc hing of Web services capabilities C//Iroc of the I st International 匹配模型分为服务分类匹配层和服务接口匹配层。但文献 Semantic Web Conference. Sardinia: Springer, 2002: 34-43 24]中缺乏对描述服务能力的另外两个重要属性,即前提和(101 MARK B, GRIT D, JERRY H. DAML0.9 draft release[Er/OL 效果的匹配,这大大限制了匹配的精度。囚此,在建立匹配模 http://www.dami.org/services/daml-s/0.9/ 型时,应加入这两个属性。图3为本义提出的改进分层匹配模[1 AEGER M O, ROJEC-GOLDMANN G, LIEBETRUTH C,eai 型。第一层为匹配服务分类( servicelategory)匹配层,筛选出 Ranked matching for service descriptions using OWL-S[C//Proc of 满足要求的服务集,进人第二层匹配;该模型的第二层包括两 CAiSE Workshops. 2004: 217-228 部分:部分是输人/输出接口匹配,另一部分为前提效果匹112」 BAADER E, HORROCKS I, SATTLER U. Deseription logic as on 配,两部分结果为 a match(In,Out)+(1-a) Match(Pre,Ef)。 tology languages for the semantic Web[ Cl// Lecture Notes in Artifi 其中a为设置的权值(0~1的小数)。最后得到最终的匹配结 cial Intelligence.[.L.: Springer-Verlag, 2003: 228-248 果集。 [ 13] Mds2 white paper[ eb/0l.].(2003).hTtp: //www globus org/mds/ [所 有广告服务 服务 分类 师选后的服务集 [14IndexserviceEb/oL].(2003).hllp://www.globusurg/ogsa/re- 请求服务}匹 leases/final/docs/infosvcs/indexsvc-ug html 输入/输出 前提条件/效果 15」陈谦.用GT3开发客户端图形界面J」.宁夏工程技术,2006,5 (网格服务匹配箅法〗《网格服务匹配算法) 75 最终结果集,「 Match(In, Out)+ I(1-a)Match(Pre, Etf) [16owl-s i. I release[ eb/ol].(2004). htTp www.daml.orrr/ser 图3服务分层匹配模犁 此外,考虑到输人/输出参数的匹配过程最为复杂,相对17]邓志鸿,唐世渭.Omog研究综述[.北京大学学报,202,38 耗时,需要大量的逻辑推理,且与本体库交替频繁,因此可以考 (5):730-728 虑并行处理。建立分层匹配模型的优点是,通过逐层匹配,不181LLei, HORROCKS I. A software frame work for malchin aking based 断淘汰不满足的服务,缩小查找范围,提高服务查准率。 on semantic Web technology [C/Proc of the 12th International World Wide Web Conference. I. 1.: ACM Press, 2003: 331-339. 5结束语 [19 HIRST G, STONGE D. Lexical chains as representations of conte for the detection and correction of malapropisms[C//FELLBAUM 随着网格服务的不断发展,网格上可供选择的服务呈几何 C. Word Net: an eleetronic lexical datalnuse and some of its applica 级增长,如何快速有效地找到所需的服务成为学术界和业界普 tions[S1.l: MIT Press, 1997: 305-332 遍关注的问题。口前,对服务的语义措述和匹配的研究虽然很[20 TVERSKY A. Fealures of si ilarily[ J. Psychological Review 多,但是仍然属于一个探索的阶段,并没有充分发挥浯义的潜 1977,84(4):327-352 能。如何基于语义准确地发现网格服务,如何准确产生满足应121 RESNIK P. Using information content to evaluate sem antic similarity 用需求及相应约束的服务组合方案,如何对网格服务匹配进行 n a taxanomy[ C]//Proc of the 14 th Internatianal Joint Conference on 评估、优化.以及相应的服务调度和容错处理都是网格服务匹 Artificial Intelligenee. San Francisco: Morgan Kaufmann Publishers 配领域有待深入研究旳问题。本文针对当前的网格环境,分析 1995:448-453 了网格服务匹配应用要解决的问题,并就其关键问题提出了解 22]高岩,那悛,张斌,等.文持动态服务组合的Web服务三层组织模 型[J].小型徽型计算机系统,2006,27(10):1881-1882 决的方法和思路。 「23郭英,粟君,陆莉康,基于语义的网格服务优化匹配「J1.计算机 参考文献: 工程,2007,33(20):94-96 ] FOSTER I, KESSELMAN C. The grid2: blue print for a new compu-[24]王玉影.基于语义相关度评价的Web服务匹配技木研究[D].大 ting infrastructure[M].[S 1.: Morgan Kaufmann Publisher, 2004 连:大连理工大学,2006

...展开详情
试读 5P 论文研究-基于语义的网格服务匹配研究.pdf
立即下载 低至0.43元/次 身份认证VIP会员低至7折
    抢沙发
    一个资源只可评论一次,评论内容不能少于5个字
    上传资源赚积分,得勋章
    最新推荐
    论文研究-基于语义的网格服务匹配研究.pdf 5积分/C币 立即下载
    1/5
    论文研究-基于语义的网格服务匹配研究.pdf第1页
    论文研究-基于语义的网格服务匹配研究.pdf第2页

    试读已结束,剩余3页未读...

    5积分/C币 立即下载 >