一种根据用户非功能性需求搜索Web服务的方法

文档序号：6422996阅读：229来源：国知局

专利名称：一种根据用户非功能性需求搜索Web服务的方法
技术领域：
本发明涉及软件工程技术领域，尤其涉及一种根据用户非功能性需求搜索Web服务的方法。
背景技术：
20世纪90年代后期，在电子商务应用的直接推动下，Web服务技术出现并迅速发展为基于互联网构造跨域分布应用的主流技术。通过将不同层次的应用和数据资源抽象成统一的表述形式并提供标准的使用方法，Web服务技术能有效支持服务提供者将自己的应用和数据资源以服务的方式提供给用户，而无需考虑具体的实现细节，如编程语言、开发环境、运行平台等；同时，在面向服务的体系结构(Service-oriented Architecture, S0A)支撑下，用户可以在互联网环境中根据自己的需要选择所需的Web服务。由于具有良好的互操作性和松散耦合性，互联网上的Web服务资源日益丰富。比如，截止到2010年底，著名的kekda网站拥有的注册Web服务超过2. 8万个，其中天气预报、汇率转换、邮件地址确认是最常使用的三类Web服务。面对互联网上不断增长的Web服务资源，对于用户而言，可供选择的Web服务数量繁多而不是稀缺将会是一种新的烦恼，因此按需服务搜索就成为一个亟待解决的关键技术问题[1]。针对用户的功能性需求，根据抽取出的重要词汇进行基于关键字的搜索，是目前 Web服务选择的基本方法，但是结果的准确性有待提高。针对上述问题，研究人员通过构造本体(ontology)，将语义信息引入到Web服务的表征[2’ 和发现[4’5]上，利用明确的概念命名空间和概念间等价、相似等关联关系消除歧义，从语义的角度提升搜索结果的准确性。在此基础上，随着社会化标注(social annotation)技术[6]的兴起，利用大众用户的个性化标签(tag)构造分众分类法(f0lkS0n0my)[7]，来替代领域专家构建的本体进行大众化的精细分类，是近年来一种新的研究趋势。虽然更加人性化，但考虑到一些用户在标注时的随意性，该方法在语义精确性方面较前述方法还有所欠缺[8]。如何把专业化的领域本体和大众化的分众分类法结合起来进一步提高搜索结果的准确性和合理性，将是今后研究关注的重点ο另一方面，用户对于Web服务的非功能性需求通常是模糊和不确定的，很难像功能性需求那样，可以通过结构化和量化的词汇来描述清楚，导致搜索结果往往不太符合用户的实际要求。针对上述问题，一种比较常见的解决方案是，将用户的非功能性需求人工或半自动地转化为Web服务的非功能性属性约束条件[9’1(1]，从而过滤掉多余的候选Web服务。在具体实现时，研究人员一般采用服务质量(Quality of Service,QoS)中对应的非功能性属性的量化数据作为约束条件的限定值[11]。互联网环境瞬息万变，Web服务的QoS值也会随之发生变化，为适应这种动态变化，情境感知(context-aware)[12]的和QoS感知[13]的服务选择方法及其优化方法[14’15]被相继提出，以期满足真实互联网环境中用户的实时要求。但是，上述方法侧重于动态情境下Web服务QoS的量化和评价，而缺乏将这种随机的定量数据与用户的非功能性需求中的模糊定性概念进行转换和匹配的研究。
为解决该问题，研究人员尝试引入模糊数学相关方法，如模糊逻辑(fuzzy logic) [16]、模糊集合(fuzzy set)[17]、粗糙集合(rough set)[18]等，对Web服务的QoS进行描述和评价，辅助用户进行决策。这些方法均采用精确的隶属函数来表示模糊概念，但事实上不同的人对相同的词汇的理解是不同的，具有明显的随机性和不确定性。因此，在定性概念与定量数据进行匹配时，需要进一步考虑隶属度的不确定性，而非依靠传统的专家先验知识或针对训练集的统计分析结果，因为这些方法往往存在主观差异性、环境条件差异性等问题。云模型(Cloud model)[19]利用计算机程序实现的正向云发生器所生成的离散云滴(clouddrop)构成的整体模型来表达定性概念，基于概率测度空间自动形成隶属度，是一种问题求解的非解析方法，适合用于解决上述问题。在形式化表达上，云模型用期望、熵 (entropy)和超熵(hyper entropy)三个数字特征表达定性概念，其中，期望是云滴在论域空间分布的中心，即最能够代表定性概念的点；熵是定性概念的不确定性度量，既反映了能够代表这个定性概念的云滴的离散程度，又反映了论域空间中可被概念接受的云滴的取值范围；超熵是熵的不确定性度量，即熵的熵，由熵的随机性和模糊性共同决定。现实世界中正态分布的普遍性与钟形隶属函数的普遍性，共同奠定了正态云模型普适性的理论基础 _，使得云模型方法在知识表示、数据挖掘和知识推理等领域获得了成功应用。文中涉及的参考文献如下[1]Liu Y, Ngu A H and Zeng L. QoS Computation and Policing in Dynamic Web ServiceSelection[A]. In Proceedings of the 13th International Conference on World Wide Web(WWW2004) [C]，New York, USA, May 17-20，2004，pp. 66-73.[2]满君丰，邱银安，陈青，等.语义Web服务框架模型研究[J].计算机集成制造系统，2005，11 (10) :1372-1379.[3]牟帅，黄映辉，李冠宇.语义Web服务的OWL-S描述及其应用[J].计算机技术与发展，2009，19(1) :13-16.[4]吴健，吴朝晖，李莹，等.基于本体论和词汇语义相似度的Web服务发现[J]. 计算机学报，2005，沘(04) :595-602.[5]华进，钱雪忠.基于语义的Web服务发现模型研究[J].计算机工程与设计， 2008,29(9) :2394-2396.[6]Wu X,Zhang L and Yu Y. Exploring Social Annotations for the Semantic Web[A]. InProceedings of the 15th International Conference on World Wide Web(WWW 2006)[C]，Edinburgh，Scotland, May 23—26，2006，pp.417-426.[7]Spiteri L F.Structure and form of folksonomy tags :The road to the public library catalogue[J]. ffebology,2007,4(2) Article 41.[8]刘丹·近年来国外Folksonomy的改进研究进展[J]·图书情报工作，2010， 54(8) :55-59.[9]刘晓光，金烨.网络服务自动化中基于非功能性条件约束的服务选择研究 [J].计算机集成制造系统，2006，12 O) :297-301.[10] Stephan R-M, Yu H and Marcel Τ. Service Selection Based on Non-functional Properties[A]. In Proceedings of the Workshops of the 5th International Conference on Service OrientedComputing(ICS0C 2007)[C], Vienna,Austria, September 17，2007，pp.128—138.[11]李研，周明辉，李瑞超，等.一种考虑QoS数据可信性的服务选择方法[J].软件学报，2008，19(10) :2620-2627.[12]Sensoy M and Yolum P. A context-aware approach for service selection using ontologies[A]. In Proceedings of the 5th International Joint Conference on Autonomous Agents andMultiagent Systems(AAMAS 2006)[C]， Hakodate, Japan, May 8-12,2006, pp. 931-938.[13]Wang X, Vitvar T, Kerrigan M, et al. A QoS-Aware Selection Model for Semantic WebServices[A]. In Proceedings of the 4th International Conference on Service Oriented Computing(ICS0C 2006) [C], Chicago, USA, December 4-7,2006, pp. 390-401.[14]张成文，苏森，陈俊亮.基于遗传算法的QoS感知的Web服务选择[J].计算机学报，2006，四(7) :1029-1037.[15]冯在文，何克清，李兵，等.一种基于情境推理的语义Web服务发现方法[J]. 计算机学报，2008，31 (8) :1354-1363.[16]阳辉.一种支持QoS约束的Web服务模糊匹配方法[J].信息系统工程，2009， 21 (8) :52-55.[17]Wang P. QoS-aware web services selection with intuitionistic fuzzy set under consumer，svague perception[J]. Expert Systems with Applications,2009, 36(3) :4460-4466.[ 18] Yu L and Luo S. Discovery of services in context using rough sets[A]. In Proceedings ofthe 2009 Joint Conferences on Pervasive ComputingCJCPC 2009)[C]，Taipei, China, December 3-5,2009, pp. 299-304.[19]李德毅，杜鹋.不确定性人工智能[Μ].北京国防工业出版社，2005.[20]李德毅，刘常昱.论正态云模型的普适性[J].中国工程科学，2004，6(8) 28-34.

发明内容
针对上述存在的技术问题，本发明的目的是提供一种根据用户非功能性需求搜索 Web服务的方法，利用云模型方法处理用户不确定和模糊的非功能性需求，消除影响现有方法准确性的一些主观因素(如专家先验知识)，通过定性概念与定量数据的转换，返回更贴合用户认知常识的结果。为达到上述目的，本发明采用如下的技术方案一种根据用户非功能性需求搜索Web服务的方法，包括(1)对用户的需求文本以句子为单位进行分词处理，抽取出其中的关键词；(2)根据用户的语境，使用预先定义的本体对所获得的关键词进行语义歧义消解；(3)从上述消除了歧义的关键词中识别出代表用户非功能性需求的关键词，将它们分别映射到对应的Web服务质量属性上；
(4)逐个收集候选Web服务中上述待分析质量属性的量化数据，使用云变换方法得到对应的以期望、熵和超熵三个数字特征表述的原子概念集合；(5)通过概念的合并和综合，将所获得的原子概念集合逐一转化为对应的合适粒度的候选概念集合；(6)从上述每个候选概念集合中分别选出一个与相应的代表用户非功能性需求的关键词最匹配的概念，根据它们各自对应的云模型生成查询的组合约束条件。所述的步骤(4)进一步包括以下子步骤(4. 1)根据收集的某一具体Web服务质量属性的数据生成其频率分布函数；(4. 2)将频率分布中的局部极大值点对应的属性值作为原子概念的期望，计算用于拟合频率分布并以此为期望的云模型的熵和超熵；(4. 3)在原频率分布中减去该原子概念对应的数值部分，继续寻找局部极大值
点；(4.4)重复(4.2)和3)，直到剩余的数据出现频率小于云变换允许的误差阈值。所述的步骤( 进一步包括以下子步骤(5. 1)选择指定原子概念集合内当前概念层次中相距最近的两个概念；(5. 2)如果这两个概念对应的云模型期望曲线相交，则将它们合并为一个新的综合概念；(5. 3)用生成的综合概念替换掉当前概念层次中原来的两个概念；(5. 4)重复(5. 1)至(5. 3)，直到达到合适的概念粒度。所述的Web服务质量属性的定义遵循IS0/IEC 9126和OASIS (Organization for theAdvancement of Structured Information Standards)白勺 Quality Model for Web Services。所述的中文分词遵循《实用现代汉语语法》和《现代汉语语料库文本分词规范》，英文分词遵循《Unicode Standard Annex#29 Unicode Text Segmentation》。所述的中文分词工具是 ICTCLASdnstitute of Computing Technology,Chinese LexicalAnalysis System),英文分词工具是 Z parser。所述的本体使用W3C(World Wide Web Consortium)的 OWL (Web Ontology Language)规范进行描述。所述的本体解析和推理工具是Jena。所述的Web服务来源于可访问的Web服务注册中心或注册库。所述的合适粒度是指最后形成的概念层次中包含的概念数遵循“7士2”法则。本发明具有以下优点和积极效果1)用户模糊的非功能性需求转化为筛选条件时，对应Web服务质量属性的约束条件无需人为输入确定的阈值或明确的隶属函数，而由真实Web服务数据的频率分布决定，能有效地消除专家先验知识的主观差异性和针对训练集的统计分析结果的环境条件差异性；2)由于用户认知能力的差异，他们对所提出的非功能性需求的期望是不同的，通过与真实Web服务数据生成的变粒度的定性概念进行匹配，突出了用户的个性化特点，因而更贴合用户的实际需求，在一定程度上提高了查询的准确率。

图1是本发明实施例的总体流程图2是Web服务质量属性概念树图3是概念合并时截断熵的示意图4是候选Web服务的可用性数据的频率分布曲线图5是使用云模型期望曲线拟合频率分布曲线的结果及误差分析图6是通过云变换方法得到的观个原子概念对应的云模型图7是两个原子概念合并成一个新概念的示意图8是逐步合并原子概念得到合适粒度的候选概念集合的过程图9是逐步合并原子概念对应的云模型得到合适粒度的候选概念集合的过程图。
具体实施例方式下面以具体实施例结合附图对本发明作进一步说明本发明提出的一种根据用户非功能性需求搜索Web服务的方法，具体步骤如下(1)对用户的需求文本以句子为单位进行分词处理，抽取出其中的关键词首先，对用户输入的需求文本进行分析，判断是中文还是英文；其次，对于中文输入以“。”为分隔符进行分句，对于英文输入以“.”为分隔符进行分句，如果没有上述字符则默认为是一句话；然后，使用ICTCLAS (http://ictclas. org/)遵循《实用现代汉语语法》和《现代汉语语料库文本分词规范》对中文句子进行分词处理，使用开源软件工具Z parser (http //sourceforge. net/projects/zpar/) ((Unicode Standard Annex #29 : Unicode TextSegmentation))对英文句子进行分词处理；最后，过滤掉高频噪音词，如中文的“的”、“了 ”等，英文的“ i s ”、“ οf ”等。(2)根据用户的语境，使用预先定义的本体对所获得的关键词进行语义歧义消解本体是共享的概念模型的形式化的规范说明，它明确和形式化定义概念及概念间的关系，提供了词汇含义无歧义理解的公共语义基础。词汇的语义歧义是指一词多义和多词一义的情况，例如，中文的“番茄”和“西红柿”虽然是不同的词汇，但实际上是指同一个事物，可以通过本体概念的等同关系，将“西红柿”映射为“番茄”；英文的“doctor”可以指博士，也可以指医生，应根据用户的真实语境确定其具体的含义，即赋予该词汇对应的本体概念明确的命名空间，如确定“doctor”的上位词为“career”、下位词为“patient”。首先，判断待分析的关键词是中文还是英文；其次，使用开源软件工具 Jena (http ://jena. sourceforge. net/)解析相应的预先定义的使用OWL规范描述的本体；然后，对多词一义的情况进行处理，利用本体中定义的等同关系将相关的关键词映射为其等价概念，例如，由于术语翻译的差异，中文的“可理解性”和“易懂性”实际上都对应着英文的“understandability” ；最后，对一词多义的情况进行处理，利用本体的推理机制，结合关键词的上下文语境，赋予它对应的本体概念明确的命名空间。(3)从上述消除了歧义的关键词中识别出代表用户非功能性需求的关键词，将它们分别映射到对应的Web服务质量属性上首先，根据IS0/IEC 9126 和 OASIS 的 Quality Model for Web Services 规范，构造Web服务质量属性概念树，如图2所示，这些概念分为功能性(包括适用性、正确性、互操作性和安全性4个子属性，其中安全性又包括保密性、完整性和隐私性3个子属性)、性能 (包括响应时间、时延和吞吐量3个子属性)、稳定性(包括可用性、成功率和可达性3个子属性)、可靠性、费用和可管理性(包括易用性和可维护性2个子属性，其中易用性包括可理解性和可操作性2个子属性，可维护性包括可分析性、可伸缩性和可测试性3个子属性)六大类属性；其次，将上述概念(如“可用性”)与所有消除了歧义的关键词(如“高可用”)逐一进行(中文或英文的)字符串模糊匹配；然后，根据匹配程度，识别出代表用户非功能性需求的关键词，及其对应的Web服务质量属性概念；最后，如果无匹配对象或用户没有提出明确的非功能性需求，则默认用户的非功能性需求为使用免费的和高可用性的Web服务。(4)逐个收集候选Web服务中上述待分析质量属性的量化数据，使用云变换方法得到对应的以期望、熵和超熵三个数字特征表述的原子概念集合在确定了要分析的Web服务质量属性后，从可访问的Web服务注册中心或注册库中收集候选Web服务的待分析质量属性的数据。该Web服务注册中心或注册库可以是企业构建供内部使用的，也可以是互联网上能公共访问的，如kekda网站 (http://webservices. seekda. com/)。Web 服务的注册可采用 OASIS 的 UDDI (Universal Description, Discovery, and Integration)、IS0/IEC 11179 或 IS0/IEC 19763-7，但不仅限于上述标准。通过代表用户功能性需求的关键词，查询Web服务注册中心或注册库，从而得到所需的候选Web服务。该步骤所述的从量化数据到原子概念集合的云变换方法进一步包括以下子步骤(4. 1)根据收集的某一具体Web服务质量属性X的数据D生成其频率分布函数 f(x)；其中，f (χ) = FREQUENCY⑶，即对属性X的论域中的每一个可能属性值X，计算D 中含有该属性值的记录个数，为方便计算可将f(x)进行归一化处理，使得f(x)的值介于0 和1之间。(4. 2)将频率分布f (X)中的局部极大值点(即峰值位置)对应的属性值Xi作为原子概念Ci的期望Exi,计算用于拟合频率分布并以此为期望的云模型的熵Eni和超熵Hei ；
(χ-Εχ 其中，使用云模型的期望曲线} = ^^^来拟合f(x)得到Ci(期望为Exi)的Eni,
拟合方法可采用最小二乘法、遗传算法或启发式方法等；对于根据云模型期望曲线确定隶属于Ci的属性值集合DZ A )，利用不带确定度的逆向云算法求得相应的Hei,计算过程如下(4. 2. 1)计算Di中数据d的均值3 =去ΣΑ、一阶绝对中心矩去Σ—;-司和方
K J=IK J=I
差S2 =^"τ (《-^2，其中K为Di中数据样本的规模；
Κ -1 ；=权利要求
1.一种根据用户非功能性需求搜索Web服务的方法，其特征在于，包括以下步骤(1)对用户的需求文本以句子为单位进行分词处理，抽取出其中的关键词；(2)根据用户的语境，使用预先定义的本体对所获得的关键词进行语义歧义消解；(3)从上述消除了歧义的关键词中识别出代表用户非功能性需求的关键词，将它们分别映射到对应的Web服务质量属性上；(4)逐个收集候选Web服务中上述待分析质量属性的量化数据，使用云变换方法得到对应的以期望、熵和超熵三个数字特征表述的原子概念集合；(5)通过概念的合并和综合，将所获得的原子概念集合逐一转化为对应的合适粒度的候选概念集合；(6)从上述每个候选概念集合中分别选出一个与相应的代表用户非功能性需求的关键词最匹配的概念，根据它们各自对应的云模型生成查询的组合约束条件。
2.根据权利要求1所述的根据用户非功能性需求搜索Web服务的方法，其特征在于所述的步骤(4)进一步包括以下子步骤(4. 1)根据收集的某一具体Web服务质量属性的数据生成其频率分布函数； (4. 2)将频率分布中的局部极大值点对应的属性值作为原子概念的期望，计算用于拟合频率分布并以此为期望的云模型的熵和超熵；(4.3)在原频率分布中减去该原子概念对应的数值部分，继续寻找局部极大值点；(4.4)重复(4.2)和3)，直到剩余的数据出现频率小于云变换允许的误差阈值。
3.根据权利要求1或2所述的根据用户非功能性需求搜索Web服务的方法，其特征在于所述的步骤( 进一步包括以下子步骤(5. 1)选择指定原子概念集合内当前概念层次中相距最近的两个概念；(5. 2)如果这两个概念对应的云模型期望曲线相交，则将它们合并为一个新的综合概念；(5. 3)用生成的综合概念替换掉当前概念层次中原来的两个概念； (5. 4)重复(5. 1)至(5. 3)，直到达到合适的概念粒度。
4.根据权利要求1至3中任一项所述的根据用户非功能性需求搜索Web服务的方法，其特征在于所述的Web服务质量属性的定义遵循IS0/IEC 9126和OASIS的Quality Model for Web Services。
5.根据权利要求1所述的根据用户非功能性需求搜索Web服务的方法，其特征在于所述的中文分词遵循《实用现代汉语语法》和《现代汉语语料库文本分词规范》，英文分词遵循〈〈Unicode Standard Annex #29: Unicode Text Segmentation))。
6.根据权利要求1所述的根据用户非功能性需求搜索Web服务的方法，其特征在于所述的中文分词工具是ICTCLAS，英文分词工具是Z parser.
7.根据权利要求1所述的根据用户非功能性需求搜索Web服务的方法，其特征在于所述的本体使用OWL规范进行描述。
8.根据权利要求1或7所述的根据用户非功能性需求搜索Web服务的方法，其特征在于所述的本体解析和推理工具是Jena。
9.根据权利要求1或2所述的根据用户非功能性需求搜索Web服务的方法，其特征在于所述的Web服务来源于可访问的Web服务注册中心或注册库。
10.根据权利要求1或3所述的根据用户非功能性需求搜索Web服务的方法，其特征在于所述的合适粒度是指最后形成的概念层次中包含的概念数遵循“7士2”法则。
全文摘要
本发明涉及软件工程技术领域，尤其涉及一种根据用户非功能性需求搜索Web服务的方法。本发明处理用户的需求文本，抽取出其中的关键词；使用本体对所获得的关键词进行语义歧义消解；识别其中代表用户非功能性需求的关键词，将其映射到对应的Web服务质量属性上；逐个收集候选Web服务中上述待分析质量属性的数据，使用云变换方法得到对应的原子概念集合；将所获得的原子概念集合逐一转化为对应的合适粒度的候选概念集合；从中分别选出一个与相应的代表用户非功能性需求的关键词最匹配的概念，根据对应的云模型生成查询的组合约束条件。本发明利用云模型的定性定量转换，减少专家主观差异性和环境条件差异性对查询的影响，返回更贴近用户期望的结果。
文档编号G06F17/30GK102193994SQ20111010375
公开日2011年9月21日申请日期2011年4月22日优先权日2011年4月22日
发明者刘玉超, 尹峻松, 张海粟, 李德毅, 陈桂生, 马于涛申请人:武汉大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李德毅;马于涛;张海粟;刘玉超;尹峻松;陈桂生
技术所有人：武汉大学
我是此专利的发明人

上一篇：基于静态共享变量识别的动态数据竞争检测方法
上一篇：Rfid标签芯片真随机数产生器的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。