引入空间衰减函数的兴趣点推荐算法

文档序号:9929630阅读:1888来源:国知局
引入空间衰减函数的兴趣点推荐算法
【技术领域】
[0001] 本发明属于计算机技术领域,具体设及一种引入空间衰减函数的兴趣点推荐算 法。
【背景技术】
[0002] 随着智能手机的普及和定位技术的发展,人们更容易获得自己位置的实时信息, 从而促使了基于位置的社交网络的出现,例如大众点评,Foursquare Ji邱ang等。由于运些 网站收集了大量的用户签到信息,利用运些签到信息可W对用户没有访问过的兴趣点进行 推荐。现实社会有大量景点,用户往往对目的地难W挟择,服务提供商可W根据系统内其他 用户的签到记录W及用户自身的特征对用户推荐合适的兴趣点。常用的推荐算法有基于内 容的推荐,基于协同过滤的推荐,基于模型的推荐,W及混合推荐等。在兴趣点推荐中,由于 用户的数目巨大并且在不断变化,而兴趣点相对固定,因此基于兴趣点相似度的协同过滤 推荐算法常常被用在兴趣点推荐服务上,运种算法首先要建立"用户-兴趣点"评价矩阵进 行数据分析,矩阵中每个元素是用户对兴趣点的访问次数或者评分数据。基于位置的社交 网络中包含了用户访问兴趣点的地理位置等信息,运就为我们在推荐算法中考虑空间衰减 性提供了方便。
[0003] 由于兴趣点包含地理信息,一些研究者在基于位置的社交网络中发现了人们的移 动行为存在空间聚类现象,个人的访问地点趋向于聚集在一起,利用运种现象来帮助兴趣 点推荐,例如,通过任意一对访问地点之间距离的幕律分布来描述,或对兴趣点分布直接执 行密度估计。运些算法仅仅考虑空间聚类现象对兴趣点推荐的影响,而没有考虑兴趣点相 似度存在空间上的衰减现象。
[0004] 在兴趣点推荐中空间衰减性是重要的因素,能对推荐结果产生重大影响。相隔的 距离越近,用户感兴趣地点的相似度越高,与间隔很远的兴趣点相比在推荐算法中具有更 大的权重。

【发明内容】

[0005] 本发明针对现有兴趣点推荐算法仅仅考虑空间聚类现象对兴趣点推荐的影响,而 没有考虑兴趣点相似度存在空间上的衰减现象,提出了一种引入空间衰减函数的兴趣点推 荐算法,该算法利用兴趣点之间相似度受到空间距离的影响,在求解兴趣点之间相似度时 用距离作为参数的函数对兴趣点相似度进行加权。实际数据集上测试结果表明,该改进算 法在精准度、召回率和巧旨标等方面比传统基于兴趣点的协同过滤推荐算法有更好的表现。
[0006] 本发明的具体步骤是:
[0007] 步骤1、收集签到网站中用户签到数据。
[000引表1签到网站中用户签到数据集
[0009]
[0010] 表1中:U代表用户的编号,I <u<m,m为收集的用户总数;V代表兴趣点的编号,I < V含n,n为兴趣点总数;ruv代表用户U对兴趣点V的评分,Av代表兴趣点V的缔度,Ov代表兴趣 点V的经度。
[0011] 步骤2、建立包含兴趣点位置信息的"用户-兴趣点"评分矩阵R(mXn),评分矩阵含 m个用户和n个兴趣点,兴趣点的位置信息用兴趣点的经缔度来表示,如表2所示。随机选取 1/8的签到兴趣点作为测试集,剩余7/8的兴趣点作为训练集。
[0012]表2包含兴趣点位置信息的"用户-兴趣点'评分矩阵
[0013]
[0014] 步骤3、使用传统兴趣点相似度求解公式求解兴趣点i,j之间的相似度w(i,j),1 < i <n,l含j含n;传统兴趣点相似度求解公式有:余弦相似度求解公式、修正余弦相似度求解 公式和皮尔逊相关系数相似度求解公式。
[001引相关参数设置:和rw分别表示用户U对兴趣点i和兴趣点j的评分,用户没有对 兴趣点评分被设置为0, n和O分别表示m个用户对兴趣点i和兴趣点j的平均评分,万表示 用户U对兴趣点的平均评分,U(i)和U(j)分别表示对兴趣点i和兴趣点j评分的用户集合,U (i,j)表示同时对兴趣点i,j评分的用户集合。
[0016] 3.1余弦相似度求解公式。在余弦相似度求解公式中,通过兴趣点评分向量之间的 夹角余弦来度量它们之间的相似度。兴趣点i,j的余弦相似度如下:
[0017]
(1)
[0018] 3.2修正余弦相似度求解公式。它在余弦相似度基础上进行了改进,通过减去用户 对兴趣点的平均评分解决了余弦相似度没有考虑用户评分等级差异的问题。兴趣点i,j的 修正余弦相似度如下:
[0019]
巧)
[0020] 3.3皮尔逊相关系数相似度求解公式。与修正余弦相似度一样,它也解决了用户评 分等级差异的问题。兴趣点i,j的皮尔逊相关系数相似度如下:
[0021]
[0022] 步骤4、=种兴趣点相似度求解公式分别代入兴趣点的预测评分公式形成=种传 统兴趣点推荐算法,分别预测出用户U对测试集内各个兴趣点的预测评分;用户U对兴趣点i 的预测评分公式如下:
[0023]
(4)
[0024] 式中,SQ,K)表示和兴趣点i最相似的K个兴趣点的集合,N(U)表示用户U访问兴趣 点的集合。
[0025] 步骤5、每种传统兴趣点推荐算法都推荐出预测评分值最大的N个兴趣点。
[0026] 步骤6、通过召回率、精准度和F指标评价传统兴趣点推荐算法的推荐性能。
[0027] RU)表示用户U推荐的N个兴趣点的集合,T(U)表示用户U实际感兴趣的兴趣点集 合,则召回率Pi、精准度P2和巧旨标F,分别由下式求得:
[0028] (5)
[0029] (6)
[0030] W
[0031] 召回率描述的是在用户实际感兴趣的兴趣点当中被推荐的比例,精准度描述的是 推荐列表当中用户实际感兴趣的兴趣点所占的比例,但运2个指标经常出现相互矛盾的情 况,往往1个指标增大的同时另1个指标随之减小,为了综合考虑召回率和精准度,还用到了 综合评价指标巧旨标。
[0032] 步骤7、在推荐性能最好的传统兴趣点推荐算法基础上引入空间衰减函数,得到引 入空间衰减函数的兴趣点推荐算法,具体如下:
[0033] 7.1找到推荐性能最好的传统兴趣点推荐算法。
[0034] 由推荐列表长度N的不同值,根据=种传统兴趣点推荐算法中召回率、精准度和F 指标选取最好的传统兴趣点推荐算法。
[0035] 7.2引入空间衰减函数^(1(1^)),其中(1(1^)是兴趣点巧日兴趣点^'之间的大圆距 离,大圆距离指的是从球面的一点出发沿球面到达球面上另一点所经过的最短路径的长 度。设置兴趣点巧日兴趣点j的编号分别是C和(1,1^〇^,1<(1如,分别用经缔度^。,0。)和 (Ad,0d)表示兴趣点i和兴趣点j的坐标,则大圆距离的计算公式如下:
[0036]
(技)
[0037] 式中,R表示地球的平均半径,取值为6371.009虹1,(1。,如的单位为虹1。
[0038] 空间衰减函数f(d(i J))的定义需满足下列条件:兴趣点i和j之间的大圆距离越 大,则f(d(i J))越小,兴趣点i和j之间的相似度越小,从而降低用户对距离更远的兴趣点 的签到行为对推荐结果的影响。首先给出适合签到网站中用户签到数据集的空间衰减函数 类型,然后对空间衰减函数预设参数,并将含有预设参数的空间衰减函数作为权值代入步 骤7.3的公式中;在进行推荐算法推荐性能实验时,通过给定不同的空间衰减函数预设参数 值来得到不同的召回率、精确度和F指标,根据运些指标选取适合签到网站中用户签到数据 集的空间衰减函数预设参数值,此时,即可确定适合签到网站中用户签到数据集的空间衰 减函数。
[0039] 7.3引入空间衰减函数的兴趣点推荐算法如下:
[0040]
(9)
[0041] 式中:W" Q J)表示推荐性能最好的传统兴趣点推荐算法中运用的传统兴趣点相 似度求解公式。
[0042] 本发明具有的有益效果:
[0043] 本发明首先给出适合特定签到数据集的空间衰减函数类型,然后对空间衰减函数 预设参数,并将含有预设参数的空间衰减函数作为权值参与兴趣点相似度的计算当中;在 进行推荐算法推荐性能实验时,通过给定不同的空间衰减函数预设参数值来得到不同的召 回率、精确度和巧旨标,根据运些指标选取适合本数据集的空间衰减函数预设参数值,此时, 即可确定适合本数据集的空间衰减函数。本发明通过引入空间衰减函数可W提高兴趣点推 荐算法的推荐性能,可广泛应用在大众点评、Foursquare、Jiepang等含有位置信息的兴趣 点推荐服务中,不仅适用于固定范围内的兴趣点,还可W对整个空间轴上的兴趣点做推荐。
【附图说明】
[0044] 图1为=种传统兴趣点推荐算法针对实施例中签到数据集的召回率、精准度随推 荐列表长度的变化示意图。
[0045] 图2为=种传统兴趣点推荐算法针对实施例中签到数据集的F指标随推荐列表长 度的变化示意图。
[0046] 图3为实施例中引入空间衰减函数的兴趣点推荐算法的推荐性能随空间衰减参数 Nd的变化不意图。
[0047] 图4为实施例中引入空间衰减函数的兴趣点推荐算法与推荐性能最好的传统兴趣 点推荐算法的召回率和精确度随推荐列表长度变化的对比图。
[004引图5为实施例中引入空间衰减函数的兴趣点推荐算法与推荐性能最好的传统兴趣 点推荐算法的巧旨标随推荐列表长度变化的对比图。
【具体实施方式】
[0049] 下面结合附图及实施例对本发明作进一步说明。
[0050] 引入时间衰减函数的兴趣点推荐算法,具体步骤如下:
[0051 ]步骤1、实验抓取大众点评网中杭州地区用户2013年6月10日到2015年6月10日的 签到数据,共收集1276683条签到信息,其中包括49870名用户,6532个兴趣点。大众点评网 提供了兴趣点的经缔度信息,运对研究空间衰减性对兴趣点推荐的影响提供了便利。
[0052] 步骤2、建立包含兴趣点位置信息的"用户-兴趣点"评分矩阵R(mXn),收集的用户 总数m = 49870,兴趣点总数n = 6532,兴趣点的位置信息用兴趣点的经缔度来表示。随机选 取1/8的签到兴趣点作为测试集,剩余7/8的兴趣点作为训练集。
[0053] 步骤3、使用传统兴趣点相似度求解公式求解兴趣点i,j之间的相似度w(i,j),1 < i <n,l含j含n;传统兴趣点相似度求解公式有:余弦相似度求解公式、修正余弦相似度求解 公式和皮尔逊相关系数相似度求解公式。
[0054] 相关参数设置:w(i, j)表示兴趣点i,j之间的相似度,1 y如,1幻' <n,;Tui和ruj 分别表示用户U对兴趣点i和兴趣点j的评分,用户没有对兴趣点评分被设置为0,云和^分 别表示m个用户对兴趣点i和兴趣点j的平均评分,;;;表示用户U对兴趣点的平均评分,U(i) 和U(j)分别表示对兴趣点i和兴趣点j评分的用户集合,U(i,j)表示同时对兴趣点i,j评分 的用户集合。
[0055] 3.1余弦相似
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1