一种基于描述信息匹配相似度的资源服务匹配与搜索方法

文档序号:7744409阅读:118来源:国知局
专利名称:一种基于描述信息匹配相似度的资源服务匹配与搜索方法
技术领域
本发明涉及一种基于描述信息匹配相似度的资源服务匹配与搜索方法,即一种支 持语义、支持SOA的分布式系统的,在不同类型的资源服务描述信息间的相似度匹配算法 的基础上,将资源服务匹配搜索分为基本匹配、输入输出(I/O)匹配、QoS匹配、综合匹配等 步骤来实现的一种资源服务匹配与搜索的方法。该发明属于分布式制造系统信息集成技术 领域。
背景技术
资源服务的匹配与搜索,即为实现某个功能(或为了满足资源服务需求者RSD的 服务请求),按照预先设定的匹配算法,从资源服务信息中心RSIC中众多的资源服务(MRS) 中搜寻与资源服务请求(RSR)相匹配的服务。由于网络化制造环境的分布和异构特性,期 待RSR与MRS完全一致是不现实的。因此本发明采用基于语义的匹配算法,使用匹配度来 衡量RSR与MRS的匹配程度,按照对RSR的匹配度选择一定数量的MRS并进行评估排序,供 用户进一步选择。本发明研究制造资源服务的匹配模型,不同类型资源服务描述信息的相 似度计算算法,进而研究提出相应的基于资源服务描述信息的多层次制造资源服务匹配模 型及算法。服务发现问题研究已被国内外学者高度关注。在分布式系统服务发现方面,当前 的研究主要是基于服务描述信息的输入与输出,另外有一些研究考虑了其它描述服务的信 息,如preconditions,effects等。这些研究虽然提供了有效的资源服务搜索与匹配机制, 但没对具体实现搜索与匹配的基础算法(即底层具体资源服务描述信息间的匹配算法)进 行有效研究。此外,当前研究对象主要是计算资源服务的发现与匹配问题。由于制造网格 (MGrid)与计算网格比较起来,具有长周期、多方合作、知识性、复杂性、多样性等特点,因 此以上方法只能起到一定借鉴作用,而不能简单地直接应用到MGrid资源服务匹配与搜索 中。在分布式制造系统资源服务发现方面,针对MGrid资源服务匹配与搜索,目前已 有的研究主要停留在TQCS等性能QoS指标上,而QoS各个指标的计算方法没有具体给出 来,同时对制造资源服务的非功能QoS因素(如信任度等)考虑的不够。另外所研究的资 源匹配主要基于领域概念、知识库等方面,而没有考虑资源服务描述的其它信息类型(如 数值、句子、实体类概念间的匹配与实现算法)。针对以上不足,本发明提出了一种支持语义、支持SOA的分布式系统的,基于描述 信息匹配相似度的资源服务匹配与搜索方法。

发明内容
(1)目的本发明涉及一种基于描述信息匹配相似度的资源服务匹配与搜索方 法,即一种支持语义、支持SOA的分布式系统的,在设计出相应不同类型的资源服务描述信 息间的相似度匹配算法的基础上,将资源服务匹配搜索分为基本匹配、输入输出(I/O)匹配、QoS匹配、综合匹配等步骤来实现的一种资源服务匹配与搜索方法。它克服了现有技术 的不足,具有较好的兼容性、广泛性、普遍性、全面性和扩展性,提高了服务匹配和所生成的 待选资源服务的质量。(2)技术方案一种基于描述信息匹配相似度的资源服务匹配与搜索方法,即在 提出资源服务数字化描述之后,将资源服务描述信息进一步细分为文字本体概念、句子、数 值(包括数值区间和模糊数)、实体类(数据结构体)概念等类,并分别设计出相应的相似 度匹配算法;在此基础上,将资源服务匹配搜索分为基本匹配、输入输出(I/O)匹配、Q0S匹 配、综合匹配等步骤来实现的一种资源服务匹配与搜索方法。其中文字本体概念间的相似度测量综合考虑了语意距离、语义重合度、层次深度 三个因素克服了传统方法的不足。句子相似度由相似的关键词(或词形)、句子的长度、词 序等因素决定。数值匹配算法可以分为数值区间相似度匹配和模糊数相似度匹配,其中模 糊数相似度匹配包括三角形模糊数和梯形模糊数的相似度匹配。由同义词、属性、语意关系 集合所组成的实体类概念的相似度可以基于Tversky模型和Andrea相似函数及集合论来 计算。MGrid资源服务匹配是一个逐步精确化的过程,主要有基本匹配、输入输出(I/O) 匹配、QoS匹配、综合匹配四个步骤,其具体步骤如下所示
首先进行基本匹配,主要是对资源服务的基本信息(例如服务名称和描述等)进 行匹配。如果匹配结果低于用户或者系统设定的基本匹配阀值,则表明待选资源服务不符 合用户的基本需求。此时系统停止后续的匹配过程,并返回匹配失败结果。其次,如果基本匹配达到基本匹配阀值,且用户希望进一步匹配,则进行下一阶段 的I/O匹配,主要负责资源服务之间I/O参数间的匹配。合格者(即不低于I/O匹配阀值) 再进行QoS匹配。否则系统返回匹配失败结果。再次,I/O匹配合格者再进行QoS匹配,主要负责资源服务QoS参数之间的匹配。 淘汰掉不符合QoS匹配阀值的待选资源服务。最后,如果待选资源服务满足以上的基本匹配、I/O匹配、QoS匹配,并且用户希望 进一步综合匹配,则进行最后的综合匹配,主要是根据需要对基本匹配、I/O匹配、QoS匹配 结果进行综合处理,产生一个整体综合匹配结果。符合用户或系统设定的综合匹配阀值的, 即为最终符合用户需求的待选资源服务,被加入到待选资源服务集中。在资源服务匹配流程中,基本匹配、I/O匹配、QoS匹配可以相互独立进行,也可以 联合进行,具体视用户的需求而定。


图1是MGrid资源服务匹配与搜索实现框架;图2是MGrid资源服务匹配流程图;图3是基本匹配算法;图4是输入输出(I/O)匹配算法;图5是QoS匹配算法;图6是MGrid资源服务匹配与搜索算法。
具体实施例方式下面结合附图对本发明作进一步详细的描述。本发明包括一种基于描述信息匹配相似度的资源服务匹配与搜索的实现框架,以及四种不同类型的资源服务描述信息(文字本体概念、句子、数值(包括数值区间和模糊 数)、实体类(数据结构体)概念)间的相似度匹配算法进而提出四层次的资源服务匹配模 型。参见图1,资源服务匹配与搜索实现框架主要由三部分组成(1)资源服务信息解析器Parser主要负责将用户提交的任务描述(或资源服务 请求信息)以及资源服务信息中心的待选资源服务信息中的各类信息描述进行分类提取, 解析出相应的数字化描述信息,包括总体信息、输入信息、输出信息、服务质量信息、先决条 件、结果信息等,便于后续的资源服务匹配。(2)资源服务相似度匹配算法库MAs主要提供MRSMS所需的各类资源服务描述 信息相似度计算算法,包括文字概念相似度算法(WMAs)、句子相似度算法(SMAs)、数值区 间相似度算法(NIMAs)、梯形模糊数相似度算法(TrapFNMAs),三角形模糊数相似度算法 (TrangFNMAs)、实体类相似度算法(ECMAs)等。(3)资源服务匹配器RS-Matcher主要根据MAs提供的各类算法,对待匹配的资源 服务各类参数进行匹配,包括基本信息匹配、输入/输出(I/O)参数匹配、QoS参数匹配、综 合匹配等。MGrid资源服务匹配与搜索实现流程如图1和图2所示,简要描述如下(1)用户企业通过面向服务制造系统(如制造网格)平台的制造任务管理中心,提 交制造任务,Parser将用户任务请求转化为标准的资源服务描述请求,并将其分解为基本 信息,输入信息、输出信息、QoS信息等。(2)系统从资源服务信息中心(RSIC)根据关键词检索算法搜索到相应的待选资 源服务,提交给Parser,将其解析为标准的基本信息,输入信息、输出信息、QoS信息等。(3) RS-Matcher调用MAs的相应算法,将解析后的标准用户资源服务需求与系统 资源服务信息中心的资源服务的基本信息首先进行匹配,经由基本匹配筛选后的候选资源 服务再进行输入/输出(I/O)信息匹配,合格的服务再参与QoS信息匹配,最后进入综合匹 配。基于MAs提供的各类算法,在资源服务匹配器RS-Matcher中进行的基本信息匹 配、输入/输出(I/O)参数匹配、QoS参数匹配、综合匹配,匹配流程参见图2。基本信息一般是文字性的描述,则基本匹配算法一般采用文字匹配和句子匹配算 法,如图3所示。首先,输入需求资源服务基本描述信息A、待选资源服务基本描述信息B和 基本匹配阀值。然后计算其文字概念相似度和句子相似度,从而计算出资源服务A与待选 资源服务B的基本匹配值。接着,将计算出的基本匹配值与所输入的基本匹配阀值进行比 较,若基本匹配值小于基本匹配阀值,则待选资源服务B不符合用户要求,返回失败结果; 否则,待选资源服务B符合用户要求,返回匹配值及匹配成功消息。资源服务描述中输入与输出参数有数值参数、实体类概念参数、文字概念参数,其 参数集则可分为三个两两不相交的子集,即D、C、W。则输入/输出(I/O)参数匹配算法如 图4所示。首先,输入需求资源服务I/O描述信息A、待选资源服务I/O描述信息B和I/O 匹配阀值。然后,将B中的输入与输出参数集合分成三个两两不相交的子集,D、C、W。在W、D、C不为空的情况下,计算其文字概念相似度、数值匹配相似度(数值区间、三角形模糊数或梯形模糊数)和实体类概念相似度,从而得出其I/O匹配值。再将其I/O匹配值与阀值 进行比较,若I/O匹配值小于I/O匹配阀值,则待选资源服务B不符合用户I/O要求,返回 失败结果;若不小于该阀值,则待选资源服务B符合用户I/O要求,返回I/O匹配值及匹配 成功消息。由于QoS各个量主要是数值,因此QoS需求匹配主要采用数值匹配,该QoS匹配算 法看参见图5。首先,输入需求资源服务QoS描述信息A、待选资源服务QoS描述信息B和 QoS匹配阀值。其次,计算各数值参数间匹配的相似度,包括数值区间匹配相似度、三角形模 糊数匹配相似度和梯形模糊数匹配相似度,从而计算出QoS匹配值。最后,将所得QoS匹配 值与所输入的QoS匹配阀值相比较,若不大于该阀值,则待选资源服务B不符合用户QoS要 求,返回匹配失败结果;否则,待选资源服务B符合用户QoS要求,返回QoS匹配值及匹配成 功消息。在实际应用过程中,参加资源服务匹配与搜索的往往远不止一个待选资源。系统 必须从海量的资源服务中,根据各种算法选择出满足用户需求的资源服务并生成待选资源 服务集,从而为后续的资源服务优化配置(优选和组合)实现提供基础。结合资源服务信 息相似度匹配算法和资源服务匹配流程,MGrid资源服务匹配与搜索算法如图6所示第一步,输入资源服务请求A、待选资源服务集B、基本匹配阀值、I/O匹配阀值、 QoS匹配阀值和综合匹配阀值。第二步,对B中每一个待选资源服务Bj进行匹配。第三步,进行资源服务基本匹配,其具体基本匹配算法如前所述。将计算所得的基 本匹配值与基本匹配阀值相比较,若不合格,则将该个待选资源服务剔除并返回到第二步; 否则,执行下一步的资源服务I/O匹配。第四步,进行资源服务I/O匹配,其具体基本匹配算法如前所述。将计算所得的I/ O匹配值与I/O匹配阀值相比较,若不合格,则将该个待选资源服务剔除并返回到第二步; 否则,执行下一步的资源服务QoS匹配。第五步,进行资源服务QoS匹配,其具体基本匹配算法同样如前所述。将计算所得 的QoS匹配值与QoS匹配阀值相比较,若不合格,则将该个待选资源服务剔除并返回到第二 步;否则,执行下一步的资源服务综合匹配。第六步,进行资源服务综合匹配,将计算所得的最后匹配值与综合匹配阀值相比 较,若不合格,则将该个待选资源服务剔除并返回到第二步;若合格,则将该待选资源服务 放入资源搜索队列。
权利要求
一种基于描述信息匹配相似度的资源服务匹配与搜索方法,该方法包括以下步骤步骤1)用户企业通过面向服务的制造平台的任务管理中心,提交制造任务请求,资源服务信息解析器Parser将用户制造任务请求转化为标准的资源服务描述请求,并将制造任务请求分解为基本信息,输入信息、输出信息、QoS信息;步骤2)系统从资源服务信息中心(RSIC)根据关键词检索算法搜索到相应的待选资源服务,提交给Parser,将搜索到的待选资源服务解析为标准的基本信息,输入信息、输出信息、QoS信息;步骤3)资源服务匹配器RS-Matcher调用资源服务相似度匹配算法库MAs的相应算法,将解析后的标准用户资源服务需求与系统资源服务信息中心的资源服务的基本信息进行匹配;步骤4)对资源服务的基本信息进行匹配;如果基本信息匹配结果低于用户或者系统设定的基本匹配阀值,则表明待选资源服务不符合用户的基本需求;此时系统停止后续的匹配过程,并返回匹配失败结果;步骤5)如果基本信息匹配达到基本匹配阀值,且用户希望进一步匹配,则进行下一阶段的I/O匹配;步骤6)I/O匹配合格者再进行QoS匹配;淘汰掉不符合QoS匹配阀值的待选资源服务;步骤7)如果待选资源服务满足以上的基本匹配、I/O匹配、QoS匹配,并且用户希望进一步综合匹配,则进行最后的综合匹配;符合用户或系统设定的综合匹配阀值的,即为最终符合用户需求的待选资源服务,被加入到待选资源服务集中。
2.根据权利要求1所说的方法,其特征在于步骤1)中所说的资源服务信息解析器 Parser负责将用户提交的任务描述或资源服务请求信息以及资源服务信息中心的待选 资源服务信息中的各类信息描述进行分类提取,解析出相应的数字化描述信息,包括总体 信息(General Information)、输入信息(Inputs)、输出信息(Outputs)、服务质量信息 (QoS)、先决条件(Pre-conditions)、结果信息(Results)等,便于后续的资源服务匹配。
3.根据权利要求1所说的方法,其特征在于步骤2)中所说的资源服务信息中心 (RSIC)是由资源企业通过制造资源服务发布中心所建立的资源服务信息集。
4.根据权利要求1所说的方法,其特征在于步骤3)中所说的资源服务匹配器 RS-Matcher根据MAs提供的各类算法,对待匹配的资源服务各类参数进行匹配,包括基本 信息匹配、输入/输出(I/O)参数匹配、QoS参数匹配、综合匹配。
5.根据权利要求1所说的方法,其特征在于步骤3)中所说的资源服务相似度匹配算 法库MAs提供资源服务匹配与搜索所需的各类资源服务描述信息相似度计算算法,包括文 字概念相似度算法(WMAs)、句子相似度算法(SMAs)、数值区间相似度算法(NIMAs)、模糊数 相似度算法(FNMAs)、实体类相似度算法(ECMAs)。
6.根据权利要求5所说的方法,其特征在于步骤3)中所说的文字概念相似度是指一 对文字概念间的相似程度,相似度达到用户或系统设定的某个阀值时,就认为这对概念相 似。
7.根据权利要求5所说的方法,其特征在于步骤3)中所说的句子相似度是指两个句 子的相似程度,相似度达到某个设定的阀值时,就认为这两个句子相似。
8.根据权利要求5所说的方法,其特征在于步骤3)中所说的数值区间相似度解决资源服务之间数值信息之间的匹配问题。
9.根据权利要求5所说的方法,其特征在于步骤3)中所说的模糊数相似度解决资源 服务之间不确定性参数信息之间的匹配问题。
10.根据权利要求5所说的方法,其特征在于步骤3)中所说的实体类相似度解决资 源服务之间实体类参数或数据结构体参数信息之间的匹配问题。
11.根据权利要求1所说的方法,其特征在于步骤4)中所说的基本匹配是指基于服 务名称(ServiceName)和服务描述(ServiceDescription)的匹配,其匹配算法采用文字匹 配和句子匹配算法。
12.根据权利要求1所说的方法,其特征在于步骤5)中所说的I/O匹配是对请求的 和提供的资源服务描述中输入与输出参数进行匹配。
13.根据权利要求1所说的方法,其特征在于步骤6)中所说的QoS匹配是时间 (Time),成本(Cost),可靠性(Reliability),信任(Trust),可维护性(Maintainability), 满意度(Satisfaction)的集合,其各个量是数值,QoS需求匹配采用数值匹配。
14.根据权利要求1所说的方法,其特征在于步骤(7)中所说的综合匹配是根据需要 对基本匹配、I/O匹配、QoS匹配结果进行综合处理,产生一个整体综合匹配结果。
15.根据权利要求1所说的方法,其特征在于,所述面向服务的制造平台是MGrid平台。
全文摘要
本发明涉及一种基于描述信息匹配相似度的制造资源服务匹配与搜索方法。具体的说该方法是在制造资源服务数字化描述之后,将资源服务描述信息进一步细分为文字本体概念、句子、数值、实体类概念等类,并分别设计相应的相似度匹配算法;在此基础上,将资源服务匹配搜索分为基本匹配、输入输出匹配、服务质量匹配、综合匹配几个步骤来实现。该方法主要为了解决目前资源服务匹配没有考虑数值、句子、实体类等描述信息类型的匹配与搜索问题。本发明包括一种制造资源服务匹配与搜索实现框架,不同类型服务描述信息间的相似度匹配算法,多层资源服务匹配模型与实现算法。本发明具有如下优点支持语义和SOA的分布式系统,层次清晰,兼容性与扩展性强。
文档编号H04L29/08GK101820444SQ20101013216
公开日2010年9月1日 申请日期2010年3月24日 优先权日2010年3月24日
发明者张霖, 程颖, 陶飞 申请人:北京航空航天大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1