一种基于隐语义概率模型的个性化服务推荐系统及方法

文档序号:6509868阅读:371来源:国知局
一种基于隐语义概率模型的个性化服务推荐系统及方法
【专利摘要】本发明涉及一种基于隐语义概率模型的个性化服务推荐系统及方法,属于服务计算【技术领域】,包括以下步骤:确定用于评价一系列功能相似服务的性能优劣的QoS指标体系;建立用户、用户指标偏好以及服务情境三者之间的隐语义概率模型;收集系统内不同用户在不同的服务情境下使用不同功能的服务时通过与系统交互提供的指标偏好信息,并存入历史经验数据库;用已收集的数据训练隐语义概率模型的参数;当用户不熟悉某种服务情境,但需要在该服务情景下调用特定功能服务时,利用已训练的隐语义概率模型对该用户的指标偏好进行预测;根据预测出的用户个性化的QoS指标偏好,对候选服务进行综合筛选,从中选出最贴近该用户需求的服务,从而实现个性化服务推荐。
【专利说明】一种基于隐语义概率模型的个性化服务推荐系统及方法
【技术领域】
[0001]本发明属于服务计算【技术领域】,具体涉及一种基于隐语义概率模型的个性化服务推荐系统及方法。
【背景技术】
[0002]随着互联网技术的飞速发展,服务计算技术得到了广泛应用,Web服务就是这样一种分布运行于Internet之上、支持不同平台之间互操作的松耦合软件系统,它主要通过“发布-查找-绑定”的模式允许服务使用者和提供者之间形成松散的绑定关系,这为服务的使用奠定了基础。但web服务的使用者和提供者相分离的特性,增加了服务使用者理解服务的难度,同时随着Internet上运行的web服务数量不断增多,服务使用者需要从众多功能相似的服务中选出最符合自身需求的一个或一组服务,这对大多数缺乏专业知识的服务使用者来说无疑是一项繁重的任务,所以发展有效的服务推荐技术是服务选择的必然需求。
[0003]经过对现有技术的检索发现,中国专利申请号200710162463.8,记载了一种自适应服务推荐设备,该装置主要包括:语义分析装置、服务选择装置、服务推荐装置;语义分析装置用于对用户的查询进行语义上的分析;服务选择装置用于找出与语义分析后的查询对应的选择的服务,并根据选择的服务更新服务相关数据库;最后服务推荐装置用于利用获取的选择的服务来查找服务相关数据库以向用户推荐相关服务。
[0004]进一步检索发现,中国专利申请号200910236492.3,记载了一种个性化服务推荐系统和方法,该方法主要包括:用户信息收集器监控在终端进行的各种操作信息,并进行预处理后存入用户信息数据库,若用户信息数据库方法更新,则启动用户行为分析器进行分析;用户行为分析器扫描用户信息数据库,提取新的用户信息并计入资源信息数据库,计算新的推荐策略并记入推荐策略数据库;上下文感知处理器感知用户的当前上下文,输出当前的上下文描述信息,启动个性化推荐处理器;个性化推荐处理器接收来自上下文感知处理器的消息后,获得当前上下文信息,通过检索推荐策略数据库,获得匹配的左右推荐策略,并按照左右推荐策略通过检索资源信息数据库,匹配合适的资源信息,实时生成个性化推荐服务。
[0005]进一步检索发现,中国专利申请号20121014234.2记录了一种基于上下文感知和用户偏好的空间信息服务匹配方法,在用户的服务请求和候选空间信息服务的功能性匹配和非功能性匹配的基础上,考虑上下文敏感的用户偏好,计算出用户服务需求与智能空间中的各候选空间信息服务的匹配度,然后依据匹配度将候选空间信息服务推荐给用户;虽然用户可能具有固定的或者重复的偏好,但这些偏好不是在任何时候都相关,该发明基于上下文感知和用户偏好的空间信息服务匹配方法从上下文的角度对用户偏好进行精简,剔除与用户无关的用户偏好;该发明从功能匹配和非功能匹配两个方面进行匹配度计算,提高空间信息服务匹配的准确率。
[0006]进一步检索发现,中国专利申请号201210253884.2记录了一种用于Web服务推荐的个性化搜索方法,包括以下步骤:步骤1,预处理WSDL文档:通过去除停用词和提取词干两个预处理步骤,形成词袋;步骤2,抽取用户兴趣:使用改进的TF-1DF公式计算词袋中的每一个词的权重,并乘以该词的时间衰减因子,得到新的权重;选择权重由大至小前k个词作为用户的兴趣词,以及每个词的对应权重,组成k维的用户兴趣向量;步骤3,计算兴趣相似度:设定相似度阈值,超过阈值的用户入选为目标用户的邻居用户;步骤4,排序服务检索结果,根据邻居用户的相似度及其选择服务的次数计算服务的推荐预测值,并将检索结果按照推荐预测值降序排列,从而得到个性化搜索结果。
[0007]上述的方法都涉及了个性化的服务推荐,但很少针对Web服务的非功能属性筛选服务以满足用户的个性化需求,服务的非功能属性往往是服务性能的主要体现,所以如何利用服务的非功能属性客观地评价服务的性能同时又能满足不同用户的个性化需求是服务推荐需要解决的问题。

【发明内容】

[0008]本发明技术解决问题:针对现有技术存在的不足,提供一种基于隐语义概率模型的个性化服务推荐系统及方法,旨在为用户在不熟悉的服务情境下提供指标偏好预测,从而完成基于多维QoS指标的服务综合排序,为用户提供个性化的服务推荐结果。
[0009]本发明的技术解决方案:一种个性化服务推荐中基于隐语义概率模型的用户指标偏好预测方法,具体步骤如下:
[0010]步骤1、确定评价服务性能优劣的服务QoS指标体系
[0011 ] 所述的服务QoS指标体系是指整个Web服务系统统一采用的用于评价一系列功能相似服务性能优劣所用QoS指标的集合,不同的系统可以根据需要选取适当的QoS指标组成自己的QoS指标体系用于评价服务的性能优劣;
[0012]步骤2、建立用户、用户指标偏好以及服务情境三者之间的隐语义概率模型
[0013]所述的用户指标偏好是指用户对步骤I中所述服务QoS指标体系中各个QoS指标的偏好程度,对每个QoS指标的偏好程度值介于O到I之间,并且对各个QoS指标的偏好值总和为I ;所述的服务情境是指在何种场景下使用何种功能的服务,每一个服务情境e用三元组(WDWhW3)表示,其中W1表示服务完成的与业务无关的基本功能,如视频功能、导航功能等,W2表示用户使用该功能的服务完成的具体业务活动,如学术会议、军事导航等,W3表示用户调用服务的终端设备,如手机、PC机等;所述的用户、用户指标偏好、服务情境三者之间的隐语义概率模型是指单个用户以不同的概率依赖不同的用户隐类而存在,单则服务情境以不同的概率依赖不同的服务情境隐类存在,指标偏好同时以不同的概率同时依赖不同的用户隐类和服务情境隐类存在的概率模型,模型的图像化表示如7所示。
[0014]所述的用户隐类是指非人为事先确定的而是从历史经验数据中学习得到的用户聚簇;所述的服务情境隐类是指非人为事先确定的而是从历史经验数据中学习得到的服务情境聚簇;
[0015]步骤3、收集不同用户在不同的服务情境下使用不同功能服务时自主提供的指标偏好信息,作为历史经验数据存入数据库,为训练步骤2中建立的隐语义概率模型的参数作准备,存储格式为(用户,服务情境、指标偏好)三元组;
[0016]步骤4、用EM算法及已收集的历史经验数据训练隐语义概率模型的参数[0017]所述的隐语义概率模型的参数是指所有用户隐类的先验概率P(Ui) ( )、服务情境隐类取,E2,, EjI先验概率P (Ej) ( 隐类Ui的情况下单个用户u出现的条件概率P (UlUi) (l^i^ I)、给定一个服务情境隐类Ej的情况下单则服务情境e出现的条件概率P (e I Ej) (I ^ j ^ J)、给定用户隐类Ui和服务情境隐类Ej的情况下用户指标偏好向量r出现的概率P(I^Ej) ( 其中I,J分别表示用户隐类和服务情境隐类的总个数,i,j分别表示用户隐类和服务情境隐类的编号;
[0018]步骤5、获得用户需要服务推荐的请求,包括个人信息、服务推荐所依赖的服务情境;
[0019]步骤6、用已训练的隐语义概率模型预测指定用户在特定服务情境下的未知指标偏好;
[0020]步骤7、根据预测出的用户个性化的QoS指标偏好,对候选服务进行综合筛选,从而选出最贴近该用户需求的服务,将推荐结果返回给用户。
[0021]所述步骤3中收集历史经验数据的过程如下:
[0022](I)用户在其熟悉的服务情境下调用熟悉的web服务时可以直接与系统交互,使用层次分析法给出自己给出对各个指标偏好的两两比较结果,建立比较矩阵;
【权利要求】
1.一种基于隐语义概率模型的个性化服务推荐系统,其特征在于包括: 历史信息收集模块:收集不同用户在不同服务情境下通过层次分析法自主提供的指标偏好比较矩阵,检查该矩阵满足一致性约束后,计算该矩阵最大特征值对应的特征向量,归一化后得出不同用户在不同服务情境下的指标偏好,并将用户,服务情境、指标偏好以三元组形式存入数据库,为隐语义概率模型参数训练模块提供历史训练数据; 隐语义概率模型参数训练模块:从数据库中获取历史信息收集模块收集的用户,服务情境、指标偏好三元组作为训练样本,根据事先设定的隐语义概率模型参数初值,利用EM算法在训练数据上迭代训练模型参数,直至模型参数收敛,保存所得训练参数,提供给个性化指标偏好预测模块; 用户服务推荐请求模块:该模块获取用户登录是提供的个性资料信息及用户登录后录入的需要进行服务推荐的服务情境信息,最后将这两项信息提供给个性化指标偏好预测模块; 个性化指标偏好预测模块:获取用户服务推荐请求模块提供的用户个人信息和服务情境信息,结合隐语义概率模型参数训练模块提供的已经训练好的模型参数,预测该用户在该服务情境下的指标偏好,并将预测的指标偏好提供过个性化服务推荐模块; 个性化服务推荐模块:接收来自个性化指标偏好模块的用户指标偏好,及来自用户服务推荐请求模块的服务情境信息,获取适用于该服务情境的所有功能相似的服务,及服务各维度的QoS指标值,与用户个性化的指标偏好作点积,给出服务的综合排序,作为推荐列表返回给用户,用户根据推荐的结果选择自己感兴趣的项目进行关注。
2.根据权利要求1所述的基于隐语义概率模型的个性化服务推荐系统,其特征在于:所述隐语义概率模型参数训练 模块实现过程: (1)从数据库中获取历史信息收集模块存入的用户、服务情境、指标偏好三元组,作为历史训练数据; (2)人工设置用户隐类和服务情境隐类的个数,以及模型的参数初值,包括用户隐类和服务情境隐类的先验概率,单个用户在给定不同用户隐类时的条件概率,单则服务情境在给定不同服务情境隐类时的条件概率,以及各个指标偏好在给定不同用户隐类和不同服务情境隐类时的正态分布均值和方差; (3)用EM算法,结合历史训练数据,对模型参数进行迭代训练,直至收敛,保存模型参数,提供给个性化指标偏好预测模块。
3.一种基于隐语义概率模型的个性化服务推荐方法,其特征在于实现步骤如下: 步骤1、确定评价服务性能优劣的服务QoS指标体系 所述的服务QoS指标体系是指整个Web服务系统统一采用的用于评价一系列功能相似服务性能优劣所用QoS指标的集合,不同的系统可以根据需要选取适当的QoS指标组成自己的QoS指标体系用于评价服务的性能优劣; 步骤2、建立用户、用户指标偏好以及服务情境三者之间的隐语义概率模型 所述的用户指标偏好是指用户对步骤I中所述服务QoS指标体系中各个QoS指标的偏好程度,对每个QoS指标的偏好程度值介于O到I之间,并且对各个QoS指标的偏好值总和为I ;所述的服务情境是指在何种场景下使用何种功能的服务,每一个服务情境e用三元组(W1, W2, W3)表示,其中W1表示服务完成的与业务无关的基本功能,如视频功能、导航功能等,W2表示用户使用该功能的服务完成的具体业务活动,W3表示用户调用服务的终端设备; 所述的用户、用户指标偏好、服务情境三者之间的隐语义概率模型是指单个用户以不同的概率依赖不同的用户隐类而存在,单则服务情境以不同的概率依赖不同的服务情境隐类存在,指标偏好同时以不同的概率同时依赖不同的用户隐类和服务情境隐类存在的概率模型, 所述的用户隐类是指非人为事先确定的而是从历史经验数据中学习得到的用户聚簇;所述的服务情境隐类是指非人为事先确定的而是从历史经验数据中学习得到的服务情境聚簇; 步骤3、收集不同用户在不同的服务情境下使用不同功能服务时自主提供的指标偏好信息,作为历史经验数据存入数据库,为训练步骤2中建立的隐语义概率模型的参数作准备,存储格式为用户,服务情境、指标偏好三元组; 步骤4、用EM算法及已收集的历史经验数据训练隐语义概率模型的参数 所述的隐语义概率模型的参数是指所有用户隐类的先验概率P(Ui)(I≤i≤I)、服务情境隐类取,E2,, EjI先验概率P(Ej) (I≤j≤J)、给定一个用户隐类仏的情况下单个用户u出现的条件概率P (UlUi) (l≤i≤ I)、给定一个服务情境隐类Ej的情况下单则服务情境e出现的条件概率P (e I Ej) (I ≤ j ≤ J)、给定用户隐类Ui和服务情境隐类Ej的情况下用户指标偏好向量r出现的概率P(IHUpEj) (I≤i≤I,I≤j≤J);其中I,J分别表示用户隐类和服务情境隐类的总个数,i,j分别表示用户隐类和服务情境隐类的编号; 步骤5、获得用户需要服务推荐的请求,包括个人信息、服务推荐所依赖的服务情境; 步骤6、用已训练的隐语义概率模型预测指定用户在特定服务情境下的未知指标偏好; 步骤7、根据预测出的用户个性化的QoS指标偏好,对候选服务进行综合筛选,从而选出最贴近该用户需求的服务,将推荐结果返回给用户。
4.根据权利要求3所述的基于隐语义概率模型的个性化服务推荐方法,其特征在于:所述步骤3中收集历史经验数据的过程如下: (1)用户在其熟悉的服务情境下调用熟悉的web服务时,直接与系统交互,使用层次分析法给出自己给出对各个指标偏好的两两比较结果,建立比较矩阵;
5.根据权利要求3所述的基于隐语义概率模型的个性化服务推荐方法,其特征在于:所述步骤4中隐语义概率模型的参数训练过程如下, (I)从数据库中取出所有的用户、服务情境、指标偏好三元组作为训练数据,是用户在其熟悉的服务情境下利用层次分析法给出的个性化指标偏好权值,每个三元组(U,e, r)表示用户u在服务情境e下对服务的各个QoS指标的偏好权重为r,r是一个K维向量(r1; r2,..., rK),为简单起见,假设权重向量r的每一维相互独立并且服从正态分布,则联合概率P (u,e,r)用下面两个公式表示,
6.根据权利要求3所述的基于隐语义概率模型的个性化服务推荐方法,其特征在于:步骤6中利用已训练的隐语义概率模型预测用户指标偏好的实现方式如下: (1)用户Ut登陆服务推荐系统,提供需要进行服务推荐的服务情境一; (2)推荐系统获取用户的个人数据及其提供的服务情境信息,用下面的公式对该用户在该服务情境下的各个QoS指标偏好进行独立预测:
7.根据权利要求3所述的基于隐语义概率模型的个性化服务推荐方法,其特征在于:步骤7中根据预测出的用户个性化的QoS指标偏好,对候选服务进行筛选的过程如下:用户Ut在服务情境J下已得到多个功能相似的候选服务,假设每个服务的各QoS指标上的性能可有其他方法得到,记为(qi,q2,...,qK),每一个服务的总得分采用R^r\-ql+r\-q2 +...+ fK _ ^表示,最后根据各个服务的总得分给出服务的排序,作为服务推荐的依据。
【文档编号】G06F17/30GK103473291SQ201310392446
【公开日】2013年12月25日 申请日期:2013年9月2日 优先权日:2013年9月2日
【发明者】彭启民, 胡堰, 胡晓惠 申请人:中国科学院软件研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1