一种基于兴趣点重要性和用户权威性的兴趣点推荐方法与流程

文档序号:16609754发布日期:2019-01-14 21:30阅读:359来源:国知局
一种基于兴趣点重要性和用户权威性的兴趣点推荐方法与流程

本发明涉及数据挖掘技术领域,具体涉及一种基于兴趣点重要性和用户权威性的兴趣点推荐方法。



背景技术:

近期,基于位置社交网络(lbsns)非常流行并且吸引了工业界和学术界的广泛关注,典型的基于位置社交网络包括foursquare,gowalla,facebookplace等。在lbsns中,用户可以与他们的朋友建立起联系,上传照片,通过签到兴趣点分享他们的位置。除了为用户提供社交平台外,lbsns更希望利用用户的签到历史和其他方面的信息来挖掘用户的偏好并推荐满足用户偏好的有趣的地方。推荐有趣位置的任务被称为兴趣点推荐。兴趣点推荐系统在lbsns中起着重要的作用,因为它们不仅满足了用户的个性化需求,而且还帮助lbsns供应商提供智能化位置服务(如位置感知广告)来增加收入。

然而,大多数现有的方法简化用户签到行为数据,即无论用户在一个兴趣点签到多少次,都使用二进制值来表示用户是否访问了兴趣点。另外,很少研究工作考虑兴趣点重要性和用户权威性对用户最终签到决定的影响。



技术实现要素:

针对上述现有技术存在的问题和不足,提供了一种基于兴趣点重要性和用户权威的兴趣点推荐算法,根据用户对兴趣点的签到行为和兴趣点之间的共现关系,利用hits和pagerank的混合模型来计算用户权威性和兴趣点重要性,在泊松因子模型中集成兴趣点重要性和用户权威性,更加准确的学习用户和兴趣点的隐式特征向量,从而提高兴趣点推荐的性能。为了实现上述目标,本发明采用如下的技术方案:

一种基于兴趣点重要性和用户权威性的兴趣点推荐方法,其特征在于,包含以下步骤:

步骤1)根据用户对兴趣点的签到行为和兴趣点之间的共现关系,利用hits和pagerank的混合模型(vldb_10_miningsignificantsemanticlocationsfromgpsdata),计算用户权威性和兴趣点重要性;

步骤2)在泊松因子模型中集成兴趣点重要性,建模用户的签到行为;

步骤3)在兴趣点推荐模型中融合用户权威性,衡量用户签到行为数据的置信度;

步骤4)采用随机梯度下降算法学习用户隐式特征向量和兴趣点隐式特征向量;

步骤5)利用用户和兴趣点隐式特征向量,预测用户对未签到兴趣点的签到频次,根据预测频次推荐用户潜在感兴趣的兴趣点。

前述的一种基于兴趣点重要性和用户权威性的兴趣点推荐方法,其特征在于:所述步骤1)的具体内容为:

步骤1-1)根据用户对兴趣点的签到数据,构建转移概率矩阵tul∈rm×n,转移概率矩阵中每个元素为p(uk|li),表示从兴趣点li到用户uk的转移概率,计算公式如下:

其中num(li)表示在兴趣点li的签到总数,num(uk,li)表示用户uk在li的签到数量,∈是当前情况下的传送概率;n表示兴趣点的个数,m表示用户个数;

步骤1-2)根据用户对兴趣点的签到数据,构建转移概率矩阵tlu∈rn×m,此转移概率矩阵中每个元素为p(li|uk),表示从用户uk到兴趣点li的转移概率,计算公式如下:

其中num(li,lj,uk)表示用户uk同时访问兴趣点li和lj的次数,p(li|lj,uk)表示用户uk在兴趣点lj上转移到兴趣点li的概率,τ为当前情况下的传送概率;

步骤1-3)结合转移概率矩阵tul和tlu,基于hits和pagerank的混合模型定义为:

其中,表示第k+1次迭代兴趣点重要性向量,表示第k+1次迭代用户权威性向量,p(li)表示兴趣点li的重要性,p(uk)表示用户uk的权威性,对应的上标表示第k+1次下的迭代值;根据上述混合模型定义,采用幂律迭代方法计算用户权威性向量ωuser和兴趣点重要性向量ωloc。

前述的一种基于兴趣点重要性和用户权威性的兴趣点推荐方法,其特征在于,所述步骤2)中,在泊松因子模型中集成兴趣点重要性,建模用户的签到行为,构建包含兴趣点重要性的目标函数:

给定用户ui的隐式特征向量ui和兴趣点lj的隐式特征向量vj,用户ui在兴趣点lj上的签到频率的期望值其中p(j)为兴趣点lj的重要性;

用户ui在兴趣点lj的签到频率rij建模为:

以期望值fij为元素构建用户签到频次期望值矩阵以签到频率rij为元素构建用户对兴趣点签到频次矩阵条件分布为:

其中iij是指示函数,如果用户ui访问兴趣点lj,则指示函数等于1,否则等于0;

对数后验分布p(u,v|r,α,β)定义为:

其中,表示用户隐式特征矩阵u的概率先验,

表示兴趣点隐式特征矩阵v的概率先验,所有的隐式特征向量ui构成用户隐式特征矩阵u,所有的隐式特征向量vj构成兴趣点隐式特征矩阵v,k为用户和兴趣点隐式特征向量的维度,γ(x)为伽玛函数,α=[α1,α2,...,αk]为伽玛分布的形状参数向量,αk为伽玛分布的形状参数;β=[β1,β2,...,βk]为伽玛分布的尺度参数向量,βk为伽玛分布的尺度参数;uik为用户隐式特征矩阵第i行k列的值,vjk为兴趣点隐式特征矩阵第j行k列的值,

基于兴趣点重要性的兴趣点推荐算法的目标函数即为最大化对数后验分布p(u,v|r,α,β)。

前述的一种基于兴趣点重要性和用户权威性的兴趣点推荐方法,其特征在于,所述步骤3)中使用用户的权威性衡量用户签到行为置信度,基于兴趣点重要性和用户权威性的兴趣点推荐算法的目标函数l如下:

其中α(i)=p(ui)表示用户ui的权威性。

前述的一种基于兴趣点重要性和用户权威性的兴趣点推荐方法,其特征在于,所述步骤4)中的目标函数l关于uik和vjk的偏导数为:

采用随机梯度下降算法迭代更新用户和兴趣点隐式特征向量,直至目标函数收敛。

前述的一种基于兴趣点重要性和用户权威性的兴趣点推荐方法,其特征在于:所述步骤5)中,用户ui对未签到兴趣点lj的预测签到频次的计算方法如下:对于用户ui,计算完所有未签到兴趣点的预测值后,根据预测值,推荐预测值高的k项给用户ui。

本发明所达到的有益效果:在基础泊松模型基础上,集成兴趣点重要性,建模用户在兴趣点上的签到行为,在兴趣点推荐模型中,融合用户权威性,衡量用户签到行为数据的置信度,从而能够更加准确的学习用户和兴趣点的隐式特征向量,提高提供兴趣点推荐的性能。

附图说明

图1为本发明提供的基于兴趣点重要性和用户权威性的兴趣点推荐方法的流程图。

具体实施方式

下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。

下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。

如图1所示,本发明公开了基于兴趣点重要性和用户权威性的兴趣点推荐方法,包含以下步骤:

步骤1)根据用户对兴趣点的签到行为和兴趣点之间的共现关系,利用hits和pagerank的混合模型,计算用户权威性和兴趣点重要性。

步骤1-1)根据用户对兴趣点的签到数据,构建转移概率矩阵tul∈rm×n,转移概率矩阵中每个元素为p(uk|li),表示从兴趣点li到用户uk的转移概率,计算公式如下:

其中num(li)表示在兴趣点li的签到总数,num(uk,li)表示用户uk在li的签到数量,∈是当前情况下的传送概率;n表示兴趣点的个数,m表示用户个数;

步骤1-2)根据用户对兴趣点的签到数据,构建转移概率矩阵tlu∈rn×m,此转移概率矩阵中每个元素为p(li|uk),表示从用户uk到兴趣点li的转移概率,计算公式如下:其中num(li,lj,uk)表示用户uk同时访问兴趣点li和lj的次数,p(li|lj,uk)表示用户uk在兴趣点lj上转移到兴趣点li的概率,τ为当前情况下的传送概率;

步骤1-3)结合转移概率矩阵tul和tlu,基于hits和pagerank的混合模型定义为:

其中,表示第k+1次迭代兴趣点重要性向量,表示第k+1次迭代用户权威性向量,p(li)表示兴趣点li的重要性,p(uk)表示用户uk的权威性,对应的上标表示第k+1次下的迭代值;

根据上述混合模型定义,采用幂律迭代方法计算用户权威性向量ωuser和兴趣点重要性向量ωloc。

步骤2)在泊松因子模型中集成兴趣点重要性,建模用户的签到行为;

步骤2)中,在泊松因子模型中集成兴趣点重要性,建模用户的签到行为,构建包含兴趣点重要性的目标函数:

给定用户ui的隐式特征向量ui和兴趣点lj的隐式特征向量vj,用户ui在兴趣点lj上的签到频率的期望值其中p(j)为兴趣点lj的重要性;

用户ui在兴趣点lj的签到频率rij建模为:

以期望值fij为元素构建用户签到频次期望值矩阵以签到频率rij为元素构建用户对兴趣点签到频次矩阵条件分布为:

其中iij是指示函数,如果用户ui访问兴趣点lj,则指示函数等于1,否则等于0;

对数后验分布p(u,v|r,α,β)定义为:

其中,表示用户隐式特征矩阵u的概率先验,

表示兴趣点隐式特征矩阵v的概率先验,k为用户和兴趣点隐式特征向量的维度,γ(x)为伽玛函数,α=[α1,α2,...,αk]为伽玛分布的形状参数向量,αk为伽玛分布的形状参数;β=[β1,β2,...,βk]为伽玛分布的尺度参数向量,βk为伽玛分布的尺度参数;uik为用户隐式特征矩阵第i行k列的值,vjk为兴趣点隐式特征矩阵第j行k列的值,

基于兴趣点重要性的兴趣点推荐算法的目标函数即为最大化对数后验分布p(u,v|r,α,β)。

步骤3)在兴趣点推荐模型中融合用户权威性,衡量用户签到行为数据的置信度;使用用户的权威性衡量用户签到行为置信度,基于兴趣点重要性和用户权威性的兴趣点推荐算法的目标函数l如下:

其中α(i)=p(ui)表示用户ui的权威性。

步骤4)采用随机梯度下降算法学习用户隐式特征向量和兴趣点隐式特征向量:

目标函数l关于uik和vjk的偏导数为:

采用随机梯度下降算法迭代更新用户和兴趣点隐式特征向量,直至目标函数收敛。

步骤5)利用用户和兴趣点隐式特征向量,预测用户对未签到兴趣点的签到频次,根据预测频次推荐用户潜在感兴趣的兴趣点。

用户ui对未签到兴趣点lj的预测签到频次的计算方法如下:对于用户ui,计算完所有未签到兴趣点的预测值后,根据预测值,推荐预测值高的k项(这里的k根据实际需求进行选择)给用户ui。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1