一种基于神经网络聚类优化的Web服务发现的实现方法

文档序号:7702425阅读:262来源:国知局
专利名称:一种基于神经网络聚类优化的Web服务发现的实现方法
技术领域
本发明涉及一种基于神经网络聚类优化的语义Web服务发现的实现方法,主要用 于解决开放网络环境下快速、准确和高效地发现满足用户需求的Web服务的问题,属于分 布式计算领域。
背景技术
随着互联网技术的快速发展与普及,如何在开放、动态的网络环境下实现各类资 源的共享和集成已经成为计算机软件技术面临的重要挑战之一。近年来,越来越多的企业 将其核心业务转移到互联网上,电子商务技术已从简单的Web信息发布发展到互联网范围 内的数据共享和信息集成。越来越多的应用表明,Web服务作为一种新型的分布式计算模 型,实现了面向服务的架构,具有良好的封装性和广泛适用性,强调开放的标准和协议规 范,采用了通用的数据格式,软件资源的服务接口完全公开,解决了软件跨平台和跨防火墙 访问等问题。通过软件资源的集成松散耦合,Web服务支持动态的电子商务与应用集成,使 得网络应用为人们提供服务的能力大大增强,正在成为企业信息规划、动态电子商务和应 用集成的重要支撑技术。主要的信息技术供应商和应用企业,均已对Web服务提供支持。 例如,SAP、Oracle、IBM、Microsoft、HP等提供了面向服务架构的业务平台,IBM和HP在其 “适需商务”和“自适应企业”中,倡导使用Web服务作为信息基础设施的软构件;Amazon、 Google、Yahoo和eBay等发布了构建网上书店、搜索工具和拍卖的Web服务。然而,由于 Web服务是由分布于网络上的众多组织和个人独立开发,其数量众多且增长迅速,只有发现 满足用户需求的服务,才使得Web服务的组合、调用和监控成为可能。Web服务发现的结果 和效率将直接影响到上层应用系统的功能和质量。因此,如何快速、准确、高效地发现用户 所需的Web服务成为了制约Web服务发展的一个关键性问题。基于语义技术的Web服务发现技术,目前已是Web服务领域的研究热点之一。 Web服务的语义表示是基于语义技术的Web服务发现技术的前提,一些研究者把Web服务 和语义Web技术融合在一起,提出了许多基于本体的语义Web服务表示方法。如OWL-S (Ontology-based Web Language—Service)、WSMO (Web Service Model Ontology)、SffSO (Semantic Web Service Ontology)>DSD(Diane Service Description)^SAffSDLCSemantic Annotation for WSDL)等,其中前四种语言抛弃了现有的 WSDL(Web Service Description Language)架构,而SAWSDL是在WSDL基础上,使用本体标注信息对其进行扩展,以支持语义 信息。在这几种语言中,OWL-S与WSMO受到广泛关注,是目前两种主流的语义Web服务描 述语言。虽然这些基于本体的Web服务描述方法丰富了 Web服务的语义信息,消减了服务 表示的歧义,使得服务请求者可以利用语义匹配算法查询所需服务,改善了服务发现的精 度。但是各领域本体库的构建和维护需要领域专家的参与,需要耗费大量的人力和物力,而 且更为重要的是,迄今为止仍然缺乏整合和重用现有本体库的标准,没有一个统一的基于 本体的语义Web服务语言。因此,若完全抛弃WSDL,而采用全新的语言描述Web服务,将耗 费巨额资源,显然这是不现实的,正是上述这些难点制约了基于本体的语义Web服务的大规模实际应用。实际上,由于现有的Web服务绝大多数都是使用WSDL语言描述,业已成为工业界 的事实标准,并且被许多开发工具所支持。因此,本发明在不引进新的语言和本体描述Web 服务的前提下,针对基于WSDL语言描述的Web服务,尽可能地利用WSDL文档描述信息,并 结合WordNet语义扩展、LSI (Latent Semantic Indexing)概念语义空间降维、神经网络、 核机学习等信息检索和机器学习技术,提出了一种基于神经网络聚类优化的Web服务发现 方法。由于Web服务发现的效率和精度很大程度上依赖于服务表示、服务分类以及服务匹 配算法。其中,服务表示方法和服务匹配算法的性能影响着服务发现的精度,而对服务进行 预分类管理,将功能相同或相近的Web服务划分在一起,从中抽取“元服务”概念来描述每 一类Web服务,进而使用这个“元服务”来辅助Web服务的注册、查找等,可以大大缩小服务 搜索的匹配空间,从而可以提高Web服务发现的效率。

发明内容
本发明所要解决的技术问题是提供一种基于神经网络聚类优化的Web服务发现 方法,适用于企业信息规划、动态电子商务和应用集成,主要用于解决开放网络环境下快 速、准确地发现满足用户需求的Web服务。本发明为解决以上技术问题采用如下技术方案
一种基于神经网络聚类优化的Web服务发现的实现方法,包括如下步骤
(1)服务提供者开发Web服务并在服务注册中心注册发布;
(2)服务注册中心的WSDL文档经过服务发现中介的服务表示模块处理后,生成 WfLSI-VSM语义特征向量,其步骤是
(21)使用开源软件WSDL4J对WSDL文档进行服务解析;
(22)对解析后的WSDL文档进行分词、停用词过滤和抽取词干的处理,生成Web服务特 征词典;
(23)基于Web服务特征词典,使用开源软件Lucene对WSDL文档进行词频索引处理,生 成VSM词形特征向量;
(24)基于WordNet语料库,使用开源软件Rita对VSM词形特征向量进行语义扩展,生 成W-VSM语义特征向量;
(25)基于LSI技术对W-VSM语义特征向量进行词义消岐和概念语义空间降维,生成 WfLSI-VSM语义特征向量;
(3)服务发现中介的服务分类模块对经过步骤(2)处理后的WLSI-VSM语义特征向量采 用核Batch SOM神经网络进行分类处理,将所有Web服务按照功能语义自适应地聚类成若 干子类,并分别生成类标识服务-“元服务”;
(4)服务请求者构造Web服务请求描述文档并提交给服务发现中介;
(5)采用步骤(2)中的步骤(21)至(25)对步骤(4)的Web服务请求描述文档进行处理 后,生成相应的查询请求向量;
(6)服务发现中介的服务匹配模块以经过步骤(5)处理后的查询请求向量作为输入,进 行基于核余弦相似性测度的Web服务匹配,对匹配结果排序后,将符合查询请求的top-n个 查询结果反馈给查询结果展示模块;(7)服务请求者根据查询推荐结果通过Web服务调用支撑模块调用相应的Web服务。进一步的,前述的基于神经网络聚类优化的Web服务发现方法,步骤(3)基于核 Batch SOM神经网络的Web服务分类包括以下步骤
(31)批量输入所有WLSI-VSM语义特征向量;
(32)对核BatchSOM神经网络的神经元权值赋初值;
(33)基于服务相似度度量函数
权利要求
1.一种基于神经网络聚类优化的Web服务发现的实现方法,其特征在于,包括如下步骤步骤(1),服务提供者开发Web服务并在服务注册中心注册发布; 步骤(2),服务注册中心的WSDL文档经过服务发现中介的服务表示模块处理后,生成 WfLSI-VSM语义特征向量,其步骤是(21)使用开源软件WSDL4J对WSDL文档进行服务解析;(22)对解析后的WSDL文档进行分词、停用词过滤和抽取词干的处理,生成Web服务特 征词典;(23)基于Web服务特征词典,使用开源软件Lucene对WSDL文档进行词频索引处理,生 成VSM词形特征向量;(24)基于WordNet语料库,使用开源软件Rita对VSM词形特征向量进行语义扩展,生 成W-VSM语义特征向量;(25)基于LSI技术对W-VSM语义特征向量进行词义消岐和概念语义空间降维,生成 WfLSI-VSM语义特征向量;步骤(3 )服务发现中介的服务分类模块对经过步骤(2 )处理后的WLSI-VSM语义特征向 量采用核Batch SOM神经网络进行分类处理,将所有Web服务按照功能语义自适应地聚类 成若干子类,并分别生成类标识服务-“元服务”;步骤(4 ),服务请求者构造Web服务请求描述文档并提交给服务发现中介; 步骤(5 ),采用步骤(2 )中的步骤(21)至(25 )对步骤(4)的Web服务请求描述文档进 行处理后,生成相应的查询请求向量;步骤(6),服务发现中介的服务匹配模块以经过步骤(5)处理后的查询请求向量作为 输入,进行基于核余弦相似性测度的Web服务匹配,对匹配结果排序后,将符合查询请求的 top-n个查询结果反馈给查询结果展示模块;步骤(7 ),服务请求者根据查询推荐结果通过Web服务调用支撑模块调用相应的Web服务。
2.根据权利要求1所述的基于神经网络聚类优化的Web服务发现的实现方法,其特征 在于,步骤(3)基于核Batch SOM神经网络的Web服务分类包括以下步骤(31)批量输入所有WLSI-VSM语义特征向量;
3.根据权利要求1所述的基于神经网络聚类优化的Web服务发现的实现方法,其特征 在于,步骤(6)基于核余弦相似性测度的Web服务匹配包括以下步骤(61)输入查询请求向量和经过步骤(3)处理后的服务子类及相应的“元服务”;(62)计算查询请求向量与元服务的核余弦相似度;(63)选择和查询请求向量最相似的元服务对应的服务子类作为服务候选集;(64)计算查询请求向量与服务候选集中所有服务的核余弦相似度;(65)根据核余弦相似度降序排列服务候选集;(66)输出top-n个符合查询请求的相关Web服务。
全文摘要
本发明提供一种基于神经网络聚类优化的Web服务发现的实现方法,主要用于解决开放网络环境下快速、准确地发现满足用户需求的Web服务。本发明由服务请求子系统、服务提供子系统、服务注册中心和服务发现中介子系统四部分组成。其中服务发现中介子系统是该系统的核心构件,包括服务表示模块、服务分类模块和服务匹配模块。本发明实现了一个聚类优化的语义Web服务发现原型系统,真实Web服务数据集上的评测结果表明,本发明不仅具有较高的服务发现效率和精度,而且实现简单,系统灵活,代价低,易推广。
文档编号H04L29/08GK102123172SQ20111004606
公开日2011年7月13日 申请日期2011年2月25日 优先权日2011年2月25日
发明者张迎周, 杨庚, 王传栋, 许建, 陈燕俐, 陈蕾 申请人:南京邮电大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1