本发明涉及数据挖掘技术领域,具体涉及一种基于兴趣点重要性和用户权威性的兴趣点推荐方法。
背景技术:
近期,基于位置社交网络(lbsns)非常流行并且吸引了工业界和学术界的广泛关注,典型的基于位置社交网络包括foursquare,gowalla,facebookplace等。在lbsns中,用户可以与他们的朋友建立起联系,上传照片,通过签到兴趣点分享他们的位置。除了为用户提供社交平台外,lbsns更希望利用用户的签到历史和其他方面的信息来挖掘用户的偏好并推荐满足用户偏好的有趣的地方。推荐有趣位置的任务被称为兴趣点推荐。兴趣点推荐系统在lbsns中起着重要的作用,因为它们不仅满足了用户的个性化需求,而且还帮助lbsns供应商提供智能化位置服务(如位置感知广告)来增加收入。
然而,大多数现有的方法简化用户签到行为数据,即无论用户在一个兴趣点签到多少次,都使用二进制值来表示用户是否访问了兴趣点。另外,很少研究工作考虑兴趣点重要性和用户权威性对用户最终签到决定的影响。
技术实现要素:
针对上述现有技术存在的问题和不足,提供了一种基于兴趣点重要性和用户权威的兴趣点推荐算法,根据用户对兴趣点的签到行为和兴趣点之间的共现关系,利用hits和pagerank的混合模型来计算用户权威性和兴趣点重要性,在泊松因子模型中集成兴趣点重要性和用户权威性,更加准确的学习用户和兴趣点的隐式特征向量,从而提高兴趣点推荐的性能。为了实现上述目标,本发明采用如下的技术方案:
一种基于兴趣点重要性和用户权威性的兴趣点推荐方法,其特征在于,包含以下步骤:
步骤1)根据用户对兴趣点的签到行为和兴趣点之间的共现关系,利用hits和pagerank的混合模型(vldb_10_miningsignificantsemanticlocationsfromgpsdata),计算用户权威性和兴趣点重要性;
步骤2)在泊松因子模型中集成兴趣点重要性,建模用户的签到行为;
步骤3)在兴趣点推荐模型中融合用户权威性,衡量用户签到行为数据的置信度;
步骤4)采用随机梯度下降算法学习用户隐式特征向量和兴趣点隐式特征向量;
步骤5)利用用户和兴趣点隐式特征向量,预测用户对未签到兴趣点的签到频次,根据预测频次推荐用户潜在感兴趣的兴趣点。
前述的一种基于兴趣点重要性和用户权威性的兴趣点推荐方法,其特征在于:所述步骤1)的具体内容为:
步骤1-1)根据用户对兴趣点的签到数据,构建转移概率矩阵tul∈rm×n,转移概率矩阵中每个元素为p(uk|li),表示从兴趣点li到用户uk的转移概率,计算公式如下:
步骤1-2)根据用户对兴趣点的签到数据,构建转移概率矩阵tlu∈rn×m,此转移概率矩阵中每个元素为p(li|uk),表示从用户uk到兴趣点li的转移概率,计算公式如下:
步骤1-3)结合转移概率矩阵tul和tlu,基于hits和pagerank的混合模型定义为:
前述的一种基于兴趣点重要性和用户权威性的兴趣点推荐方法,其特征在于,所述步骤2)中,在泊松因子模型中集成兴趣点重要性,建模用户的签到行为,构建包含兴趣点重要性的目标函数:
给定用户ui的隐式特征向量ui和兴趣点lj的隐式特征向量vj,用户ui在兴趣点lj上的签到频率的期望值
用户ui在兴趣点lj的签到频率rij建模为:
以期望值fij为元素构建用户签到频次期望值矩阵
对数后验分布p(u,v|r,α,β)定义为:
基于兴趣点重要性的兴趣点推荐算法的目标函数即为最大化对数后验分布p(u,v|r,α,β)。
前述的一种基于兴趣点重要性和用户权威性的兴趣点推荐方法,其特征在于,所述步骤3)中使用用户的权威性衡量用户签到行为置信度,基于兴趣点重要性和用户权威性的兴趣点推荐算法的目标函数l如下:
前述的一种基于兴趣点重要性和用户权威性的兴趣点推荐方法,其特征在于,所述步骤4)中的目标函数l关于uik和vjk的偏导数为:
采用随机梯度下降算法迭代更新用户和兴趣点隐式特征向量,直至目标函数收敛。
前述的一种基于兴趣点重要性和用户权威性的兴趣点推荐方法,其特征在于:所述步骤5)中,用户ui对未签到兴趣点lj的预测签到频次
本发明所达到的有益效果:在基础泊松模型基础上,集成兴趣点重要性,建模用户在兴趣点上的签到行为,在兴趣点推荐模型中,融合用户权威性,衡量用户签到行为数据的置信度,从而能够更加准确的学习用户和兴趣点的隐式特征向量,提高提供兴趣点推荐的性能。
附图说明
图1为本发明提供的基于兴趣点重要性和用户权威性的兴趣点推荐方法的流程图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
如图1所示,本发明公开了基于兴趣点重要性和用户权威性的兴趣点推荐方法,包含以下步骤:
步骤1)根据用户对兴趣点的签到行为和兴趣点之间的共现关系,利用hits和pagerank的混合模型,计算用户权威性和兴趣点重要性。
步骤1-1)根据用户对兴趣点的签到数据,构建转移概率矩阵tul∈rm×n,转移概率矩阵中每个元素为p(uk|li),表示从兴趣点li到用户uk的转移概率,计算公式如下:
步骤1-2)根据用户对兴趣点的签到数据,构建转移概率矩阵tlu∈rn×m,此转移概率矩阵中每个元素为p(li|uk),表示从用户uk到兴趣点li的转移概率,计算公式如下:
步骤1-3)结合转移概率矩阵tul和tlu,基于hits和pagerank的混合模型定义为:
根据上述混合模型定义,采用幂律迭代方法计算用户权威性向量ωuser和兴趣点重要性向量ωloc。
步骤2)在泊松因子模型中集成兴趣点重要性,建模用户的签到行为;
步骤2)中,在泊松因子模型中集成兴趣点重要性,建模用户的签到行为,构建包含兴趣点重要性的目标函数:
给定用户ui的隐式特征向量ui和兴趣点lj的隐式特征向量vj,用户ui在兴趣点lj上的签到频率的期望值
用户ui在兴趣点lj的签到频率rij建模为:
以期望值fij为元素构建用户签到频次期望值矩阵
对数后验分布p(u,v|r,α,β)定义为:
基于兴趣点重要性的兴趣点推荐算法的目标函数即为最大化对数后验分布p(u,v|r,α,β)。
步骤3)在兴趣点推荐模型中融合用户权威性,衡量用户签到行为数据的置信度;使用用户的权威性衡量用户签到行为置信度,基于兴趣点重要性和用户权威性的兴趣点推荐算法的目标函数l如下:
步骤4)采用随机梯度下降算法学习用户隐式特征向量和兴趣点隐式特征向量:
目标函数l关于uik和vjk的偏导数为:
采用随机梯度下降算法迭代更新用户和兴趣点隐式特征向量,直至目标函数收敛。
步骤5)利用用户和兴趣点隐式特征向量,预测用户对未签到兴趣点的签到频次,根据预测频次推荐用户潜在感兴趣的兴趣点。
用户ui对未签到兴趣点lj的预测签到频次
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。