基于用户邻域的WebService服务质量预测方法及装置制造方法

文档序号:7797821阅读:213来源:国知局
基于用户邻域的Web Service服务质量预测方法及装置制造方法
【专利摘要】本发明涉及Web?Service服务质量预测领域,公开了一种基于用户邻域的Web?Service服务质量预测方法,通过建立第一类邻域以及第二类邻域,建立预测模型,对预测模型进行求解得到最终的预测值,同时,还公开了一种基于用户邻域的Web?Service服务质量预测装置。本发明的优点在于,解决了地域对服务质量预测的准确性的不利影响,同时也很好地解决了数据稀疏性以及推荐系统中用户评分过于主观的问题,具有较高的应用价值。
【专利说明】基于用户邻域的Web Service服务质量预测方法及装置
【技术领域】
[0001]本发明涉及Web Service服务质量预测领域,特别涉及一种基于用户邻域的WebService服务质量预测方法及装置。
【背景技术】
[0002]Web Service是一类在网络上用以实现资源的互操作性与可访问性的应用,且这类应用是自我描述的、可编程的。Web Service—般使用标准的已定义完善的语言实现,并通过规范的协议发布。基于SOA的架构,Web Service已成为实现企业内与企业间信息系统的重要手段。同时,由于Web Service技术广泛应用在云计算中,特别是SaaS平台上,所以Web Service的数量在迅猛增长。
[0003]服务质量是Web Service非功能性指标的统称,包括服务价格、响应时间、吞吐量等。服务质量是Web Service除功能性外,在服务选择、服务发现、服务推荐等方面重要的衡量标准,特别是候选的服务集中各服务的功能相似的情况下。但是大部分情况下,用户只能获取仅少一部分的QoS值,原因如下:1)因为Web Service的数量非常多,全部调用是不现实的;2)很多Web Service的服务质量会随着物理资源的变化而变动。在实际的服务调用过程中,这些缺失值必须被预测出来作为服务选择与推荐的依据。
[0004]作为推荐系统中最常用的预测缺失值的方法,协同过滤技术在近几年也被开发人员应用到了服务质量预测问题上。协同过滤的核心是根据历史的服务调用记录,计算用户与用户或者服务与服务之间的相似度,常用的计算方法有余弦相似度等。但是,这类方法存在以下缺陷:1)协同过滤方法难以解决“冷启动”的问题,即某个服务从未被任何用户调用过,或某个用户从未调用过任何服务。2)传统的协同过滤方法只能反映用户的主观喜欢,而在服务调用的过程中,决定最终服务质量的却是客观的物理资源与运行环境。所以,需要寻求其它的技术更好地解决这一问题。
[0005]最近,一部分研发人员已经注意到了地域对于服务质量的影响。对于同样一个服务,不同地区的用户调用该用户得到的服务质量会相差很大,原因在于,不同用户所处的地区IT基础设施的水准相差很大。例如,韩国和日本是世界上平均网速最快的两个国家,而中国的平均网速则相对较慢。所以,如果在首尔、东京和北京的三位用户均调用同一个服务,则在首尔和东京的用户体验到比北京用户更好的服务质量。
[0006]另外,数据的稀疏性也是服务质量预测要面临的另一个重要的问题。极高的数据稀疏性意味着在用户-服务调用矩阵里绝大多数项都是空值。最近,矩阵分解技术已经被应用在推荐系统中,用于解决数据稀疏性的问题。但是,由于服务质量主要由客观的物理资源决定,而推荐系统中的评分是用户主观喜好的反映,故而传统的分解技术需要进行较大的改进。

【发明内容】

[0007]本发明针对现有技术中所存在的地域对于服务质量的影响的缺点,提供了一种基于用户邻域的Web Service服务质量预测方法及装置,可以很好地解决地域的因素对于服务质量预测的影响。
[0008]为实现上述目的,本发明可采取下述技术方案:
[0009]基于用户邻域的Web Service服务质量预测方法,包括以下的具体步骤:
[0010]第一类邻域识别步骤:根据用户的历史调用记录计算任意两个用户1、I之间的相似度Simil,用户i为目标用户,用户1、I共同调用过服务集合S,相似度Simil采用余弦相似度计算得到,并以历史调用记录中所记载的服务被用户调用后返回的服务质量作为用户的空间向量坐标值;选择与用户i相似度Simil最大的K个用户I组成目标用户的第一类邻域 TopK1Q);
[0011]第一类邻域权重计算步骤:根据相似度Simil计算第一类邻域TopK1Q)内每个用户I的权重Wil ;
[0012]第二类邻域识别步骤:根据用户的地理位置坐标计算任意两个用户1、h之间的空间距离dih,选择与用户i的空间距离dih最近的K个用户h组成目标用户的第二类邻域TopKh ⑴;
[0013]第二类邻域权重计算步骤:根据空间距离dih计算第二类邻域TopKh(i)内每个用户h与用户i之间的相似度simih,当dih为O时,simih = I ;当dih逐渐增大时,simih逐渐减小;当dih趋向于无穷时,Simih = O ;根据相似度Simih计算第二类邻域TopKh(i)内每个用户h的权重Wih ;
[0014]模型建立步骤:在矩阵分解模型的基础上建立用于预测目标用户与第一类邻域TopKj(i)内用户的Web Service服务质量的预测模型,所述预测模型还包括一个根据目标用户与第二类邻域TopKh(i)内用户之间的权重Wih得到的正则化项,所述正则化项用于令目标用户的特征向量与第二 类邻域TopKh⑴内用户的特征向量之间尽可能地接近;
[0015]模型求解步骤:应用梯度下降法求解预测模型,得到待求解的用户特征矩阵以及服务特征矩阵;
[0016]预测步骤:通过预测模型中用户特征矩阵与服务特征矩阵的矩阵乘法得到最终的预测值。
[0017]作为优选,第一类邻域识别步骤中,使用历史调用记录中所记载的服务被用户调用后返回的服务质量与服务被调用后返回的服务质量的平均值之差作为用户的空间向量坐标值计算余弦相似度。
[0018]作为优选,第一类邻域识别步骤中,所述相似度
【权利要求】
1.一种基于用户邻域的Web Service服务质量预测方法,其特征在于,包括以下的具体步骤: 第一类邻域识别步骤(101):根据用户的历史调用记录计算任意两个用户1、I之间的相似度Simil,用户i为目标用户,用户1、I共同调用过服务集合S,相似度Simil采用余弦相似度计算得到,并以历史调用记录中所记载的服务被用户调用后返回的服务质量作为用户的空间向量坐标值;选择与用户i相似度Simil最大的K个用户I组成目标用户的第一类邻域 TopK1Q); 第一类邻域权重计算步骤(102):根据相似度SimiJf算第一类邻域TopK1W内每个用户I的权重Wil ; 第二类邻域识别步骤(103):根据用户的地理位置坐标计算任意两个用户1、h之间的空间距离dih,选择与用户i的空间距离dih最近的K个用户h组成目标用户的第二类邻域TopKh ⑴; 第二类邻域权重计算步骤(104):根据空间距离dih计算第二类邻域TopKh(i)内每个用户h与用户i之间的相似度simih,当dih为O时,simih = I ;当dih逐渐增大时,simih逐渐减小;当dih趋向于无穷时,Simih = O ;根据相似度Simih计算第二类邻域TopKh(i)内每个用户h的权重Wih ; 模型建立步骤(105):在矩阵分解模型的基础上建立用于预测目标用户与第一类邻域TopKj(i)内用户的Web Service服务质量的预测模型,所述预测模型还包括一个根据目标用户与第二类邻域TopKh(i)内用户之间的权重Wih得到的正则化项,所述正则化项用于令目标用户的特征向量与第二类邻域TopKh⑴内用户的特征向量之间尽可能地接近; 模型求解步骤(106):应用梯度下降法求解预测模型,得到待求解的用户特征矩阵以及服务特征矩阵; 预测步骤(107):通过预测模型中用户特征矩阵与服务特征矩阵的矩阵乘法得到最终的预测值。
2.根据权利要求1所述的基于用户邻域的WebService服务质量预测方法,其特征在于,第一类邻域识别步骤(101)中,使用历史调用记录中所记载的服务被用户调用后返回的服务质量与服务被调用后返回的服务质量的平均值之差作为用户的空间向量坐标值计算余弦相似度。
3.根据权利要求1所述的基于用户邻域的WebService服务质量预测方法,其特征在于,第一类邻域识别步骤(101)中,所述相似度
4.根据权利要求1、2或者3所述的基于用户邻域的WebService服务质量预测方法,其特征在于,第一类邻域识别步骤(101)中,使用修正后的相似度
5.根据权利要求1所述的基于用户邻域的WebService服务质量预测方法,其特征在于,第二类邻域权重计算步骤(104)中,simih = exp(-dih)。
6.根据权利要求1所述的基于用户邻域的WebService服务质量预测方法,其特征在于,模型建立步骤(105)还包括:将用户-服务调用矩阵Q分解为两个低维矩阵,即
7.根据权利要求1所述的基于用户邻域的WebService服务质量预测方法,其特征在于,模型建立步骤(105)中,所述正则化项为IlU1- Eh€TopKh(0 WmiZftIl=,其中,U1、Uh依次表示矩阵U中的第1、h行。
8.根据权利要求1所述的基于用户邻域的WebService服务质量预测方法,其特征在于,模型求解步骤(106)还包括:将预测模型对于求偏导数到最
9.根据权利要求1所述的基于用户邻域的WebService服务质量预测方法,其特征在于,预测步骤(107)中,采用qq = aUfSj + (1- a)计算得到最终的预测值。
10.根据权利要求1-9任一所述的基于用户邻域的Web Service服务质量预测方法所得到的基于用户邻域的Web Service服务质量预测装置,其特征在于,包括第一类邻域识别装置(201)、第一类邻域权重计算装置(202)、第二类邻域识别装置(203)、第二类邻域权重计算装置(204)、模型建立装置(205)、模型求解装置(206)以及预测装置(207); 第一类邻域识别装置(201)用于根据用户的历史调用记录计算任意两个用户1、l之间的相似度Simil,用户i为目标用户,用户1、I共同调用过服务集合S,相似度Simil采用余弦相似度计算得到,并以历史调用记录中所记载的服务被用户调用后返回的服务质量作为用户的空间向量坐标值;选择与用户i相似度Simil最大的K个用户I组成目标用户的第一类邻域TopK1Q); 第一类邻域权重计算装置(202)用于根据相似度算第一类邻域TopKJi)内每个用户I的权重Wil ; 第二类邻域识别装置(203)用于根据用户的地理位置坐标计算任意两个用户1、h之间的空间距离dih,选择与用户i的空间距离dih最近的K个用户h组成目标用户的第二类邻域 TopKh (i); 第二类邻域权重计算装置(204)用于根据空间距离dih计算第二类邻域TopKh(i)内每个用户h与用户i之间的相似度simih,当dih为O时,simih = I ;当dih逐渐增大时,simih逐渐减小;当dih趋向于无穷时,Simih = O ;根据相似度Simih计算第二类邻域TopKh⑴内每个用户h的权重Wih ; 模型建立装置(205)用于在矩阵分解模型的基础上建立用于预测目标用户与第一类邻域ΤορΚ」α)内用户的Web Service服务质量的预测模型,所述预测模型还包括一个根据目标用户与第二类邻域TopKh(i)内用户之间的权重Wih得到的正则化项,所述正则化项用于令目标用户的特征向量与第二类邻域TopKh(i)内用户的特征向量之间尽可能地接近; 模型求解装置(206)用于应用梯度下降法求解预测`模型,得到待求解的用户特征矩阵以及服务特征矩阵; 预测装置(207)用于通过预测模型中用户特征矩阵与服务特征矩阵的矩阵乘法得到最终的预测值。
【文档编号】H04L12/26GK103840985SQ201410072178
【公开日】2014年6月4日 申请日期:2014年2月28日 优先权日:2014年2月28日
【发明者】尹建伟, 徐悦甡, 李莹, 邓水光, 吴朝晖 申请人:浙江大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1