融合多维信息的Web服务表征方法.docx资源-CSDN文库

版权申诉

201 浏览量 2022-11-28 20:29:49 上传评论收藏 212KB DOCX 举报

资源详情

资源评论

随着面向服务体系结构（service-oriented archi-tecture,SOA）技术的发

展 ,Web 服务被广泛应用于各个领域。截至 2020 年 6 月 24

日,ProgrammableWeb 网站上所包含的 Web 服务已经达到了 31 154 个,要从

这样一个大规模的服务集合中快速有效地找到满足开发者需求的 Web 服务犹

如大海捞针。已有研究表明：对 Web 服务进行分类或聚类,再将用户的搜索请

求定位到指定的服务类簇中,能够有效地减小 Web 服务搜索空间,提升 Web 服

务的搜索效率

[1]

。

目前,针对 Web 服务划分已有大量的研究。这些研究通常是将 Web 服务

映射为一个固定长度的表征向量,该表征向量包含 Web 服务的主要信息,之后

在其上使用聚类或分类算法实现对 Web 服务的划分。如 Liu 等人使用 LDA

（latent Dirichlet allocation）主题模型和支持向量机相结合,实现了对 Web 服

务的自动标注

[2]

。Chen 等人利用 LSA（latent semantic analysis）模型对移动

服务文本进行全局主题建模 ,再通过 BiLSTM（bi-directional long short-term

memory）模型对服务进行分类

[3]

。这类方法的效果高度依赖主题模型所生成的

Web 服务表征向量的质量。但是由于 Web 服务描述文档篇幅较短,LDA 主题

模型无法有效地从短文本中获得丰富的主题信息,进而导致服务聚类效果较差。

与此同时,有些研究考虑将 Web 服务的附加信息,如标签

[4]

、先验知识加入

到 Web 服务表征向量的生成过程中,以提高 Web 服务聚类的精度。例如,Shi

等人使用概率主题模型获得 Web 服务描述文档中隐含的主题表征向量,之后使

用 K-means++对其进行聚类,在这过程中加入了额外的先验知识用于提升聚类

的准确性

[5]

。Xiao 等人考虑到 Web 服务描述文本长度较短,所包含信息量较少

的情况,通过使用维基百科相似词扩充的方法,对原始的 Web 服务进行扩充,使

用 HDP（hierarchical Dirichlet processes）主题模型获得 Web 服务表征向量,

进而实现 Web 服务聚类

[6]

。Cao 等人将 Web 服务语义信息以及 Mashup 服务

与 API（application programming interface）服务之间的调用关系相结合,实现

了 API 服务的划分

[7]

。这些方法在一定程度上提高了 Web 服务聚类和分类的

精度,但是仍然存在以下一些问题：

（1）尽管有些工作采用增强文本内容、引入先验知识等方法,用来丰富

Web 服务所包含的信息,同时通过改进主题模型以提高模型的主题建模能力,但

由于主题模型与 Web 服务描述文档固有的矛盾,主题模型难以从篇幅较短的

Web 服务文档中获得有效的主题表征,实验效果提升有限。

（2）Web 服务数据利用率不高。已有的方法往往只考虑一种类型的 Web

服务数据,如从 Web 服务描述文本中抽取出的主题信息,而没有考虑使用 Web

服务的附加信息, 如标签信息、Web 服务流行度、 Web 服务共现信息。实际

上,Web 服务的附加信息也能够提高 Web 服务聚类和分类的准确性。

针对以上两个问题,本文提出了一种融合多维信息的 Web 服务表征方法

（ multi-dimensional informa-tion-based Web service representation

method,MISR）。该方法综合考虑了 Web 服务的功能信息以及其他属性信息。

该方法首先使用高斯混合模型和 Word2Vec 模型生成了包含主题信息和语义

信息的 Web 服务表征向量。之后通过融合 Web 服务所包含的多维信息,获得

包含多维信息的 Web 服务表征向量。最后,在真实的 Web 服务数据集上进行

Web 服务分类和 Web 服务聚类两个任务,验证该表征方法的有效性。实验结果

验证了所提出方法的有效性。

本文工作主要贡献有以下两点：

（1）提出了一种 Web 服务表征方法,该表征方法能够获得 Web 服务主题

信息与功能语义信息,可以有效地提高 Web 服务聚类和分类的精度。

（2）在真实数据上进行 Web 服务聚类和分类对比实验,验证了 Web 服务

中所包含的多维信息能够用于提升 Web 服务聚类和分类的效果。

1 相关工作

随着服务计算和云计算的发展,互联网上出现了大量网络服务,Web 服务发

现成为一个热门的研究方向。精确高效地对 Web 服务进行分类能够有效提高

Web 服务发现的性能

[1]

。其关键技术在于如何对 Web 服务进行建模,获得有效

的 Web 服务表征向量用于 Web 服务分类。现有的 Web 服务表征技术可以分

为两类：一类是基于服务质量（quality of service,QoS）的表征技术,一类是基

于功能语义的表征技术。

基于服务质量的服务表征技术主要将 Web 服务的服务质量特征作为 Web

服务的表征向量,包括服务的吞吐量、可用性、执行时间等。Xia 等人使用 Web

服务质量属性,将 Web 服务聚到不同的类中

[8]

。Michael 等人提出了一种基于

QoS 参数和 KNN（K-nearest neighbors）算法的 Web 服务选择方法,使用并

行分类模型对 Web 服务进行分类

[9]

。这类方法的缺点在于仅仅使用 Web 服务

一部分特征作为 Web 服务的表征,所获得的表征向量包含的信息有限。

基于 Web 服务功能语义的表征技术 , 通常是利用主题模型（如 LDA、

HDP）将 Web 服务功能描述文档转换为给定长度的表征向量。Liu 等人使用

LDA 主题模型和支持向量机相结合,实现了 Web 服务的自动标注

[2]

。李征等人

提出一种领域服务聚类模型,对 Web 服务进行面向主题的聚类,把特定领域内

具有相似功能的服务聚合为主题类簇

[10]

。

有些工作通过改进主题模型抽取信息的能力,能够获得更有效的 Web 服务

表征向量。Cao 等人提出了双层主题模型用于获得 Web 服务功能内容和结构

内容的表征向量,进而完成对 Web 服务的聚类

[11]

。Shi 等人使用 Word2Vec 模

型对 Web 服务中包含的词汇进行聚类,用于增强的 LDA 主题模型,以获得信息

更加丰富的 Web 服务表征向量

[12]

。这些工作使用主题模型及其变形从 Web 服

务功能文档中抽取出 Web 服务的功能信息,但由于 Web 服务功能描述文档内

容单一,所包含信息有限,也没有很好地解决问题。

还有一些工作使用基于机器学习的方法。如 Cao 等人使用注意力机制生

成包含 Web 服务功能描述文档语义信息的 Web 服务表征向量,实现对 Web 服

务的分类任务

[13]

。肖勇等人考虑 API 服务于 Mashup 服务之间的结构信息,使

用随机游走和 SkipGram 方法获得 Mashup 服务的表征向量,之后使用支持向量

机实现 Web 服务分类

[14]

,但由于其需要考虑众多服务之间的结构关系,在实际应

用中会比较复杂。

2 方法介绍

本章将对提出的方法 MISR 进行详细的介绍。本文提出的 Web 服务表征

向量生成方法主要包括以下四个步骤。

（1）主题信息增强的词向量生成。使用 Word2Vec 模型生成 Web 服务功

能描述文档中所有词汇对应的词向量。通过高斯混合模型对所有词向量进行聚

类,获得每个词的词向量属于不同主题簇类的概率。词向量与该概率相结合,生

成主题信息增强的 Web 服务词向量。

剩余15页未读，继续阅读

评论收藏

内容反馈

版权申诉

融合多维信息的Web服务表征方法.docx

评论0

最新资源

融合多维信息的Web服务表征方法.docx

评论0

最新资源

相关推荐

Web服务器配置方法.docx

(完整版)JAVA+WEB毕业课程设计.docx

嗅探原理与反嗅探技术详解WEB安全电脑资料.docx

(完整word版)基于Java的web网上书城设计.docx

基于UDDI的Web服务注册中.docx

基于VAE-WGAN的多维时间序列异常检测方法.docx

基于形态非抽样小波的实时图像融合方法.docx

基于软件无线电平台的电磁信号数据表征方法.docx

跨谱段SAR散射中心多维参数解耦和估计方法.docx

多层胶接结构胶层均匀性的太赫兹时域表征方法.docx

一种面向公众教育的滑坡灾害可视化视觉表征方法.docx

win7下利用iis搭建web服务器的方法.docx

网络安全向安全运维服务融合是大势所趋 (2).docx

基于WebRTC的浏览器端Web服务器的设计与实现.docx

微信小程序线上线下融合教学平台设计与实现.docx

移动云网融合应用场景解决方法.docx

基于改进型PCA和LDA融合算法的人脸图像识别.docx

《信息安全技术-云计算服务安全能力评估方法》.docx

相关实用应用程序（Windows可用）

免费可用的ChatGPT网页版.zip

ChatGPT使用总结：150个ChatGPT提示词模板（完整版）

chromedriver-win64.zip

全国计算机二级WPSoffice精选350道选择题题库（含答案）.pdf

民宿网站

桌面聊天室

哈尔滨工业大学-ChatGPT调研报告-2023.3.6-94页.pdf

2023泛娱乐社交出海手册-ZEGO即构科技

4个亲测好用的ChatGPT4渠道

HAI-2024斯坦福AI指数报告（中文译版）.pdf