一种基于位置服务的旅游推荐方法_2

文档序号：9788074阅读：来源：国知局

br>[0045] 6:t = t+l；end while
[0046] 7:retuenJ = \_Xc, Yc, Ζτ~]
[0047] end
[0048] 获得了不完整的张量和附加信息矩阵后，我们的目标就是补齐张量并获得推荐输出。如算法图1所示，我们用一个迭代算法来解决这个问题。在每次迭代过程中，我们根据 (2)式计算目标方程L的梯度，然后获得更新后的目标方程，直至获取其最小值。在本算法中，T是迭代最大次数，γ是迭代步长。实验中，我们设置T = 1000, γ =0.0001。最后，迭代终止后，我们用低维表示Χ，Υ，Ζ重新构建张量』（用户-位置-活动）。之后向用户做出推荐，对用户u ( 1 < u < m )，可以得到其位置-活动矩阵G e R n x r， i?(l，a) e S 7 S /?，1 S <3 S获取用户位置1作为输入，我们就将S的第1行做〇递减排序，并将最顶端的几个活动推荐给用户11。相似地，输入活动a，我们就将G的第a列做降序排列，并把队列中最顶端的地点推荐给用户u。其中推荐个数可根据需求进行变化。以上数据根据实际使用需要可进行适当地，按目的性进行数量上的调整。
[0049] 在本算法每一次迭代过程中，获取相应梯度Vx，时间复杂度是0(mnr+m2)，其中m， n，r是输入数据的维度；相似地，对▽ γ其时间复杂度是0(mnr);对Vz，其时间复杂度是0 (mnr);对Vv，其时间复杂度是〇(n)。因此，获取所有梯度的时间复杂度是0(mnr+m 2)。解此目标函数的时间复杂度是〇(mnr+m2+r2)。因为最大迭代次数是常数，本算法总的时间负责度是0(mnr+m 2+r2)，这表明我们的算法是高效的。
[0050] 对以上优化建模进行实测实验如下：
[00511实验数据集包含2407名用户在广东省江门市的GPS轨迹数据，总里程数达到了 197680千米。
[0052]为了确保推荐是有意义的，把工作地点和家庭的GPS数据进行过滤和删除，剩余数据中包含五种不同的活动:饮食、购物、娱乐、运动、游览。另外，利用聚类算法从GPS轨迹点中聚类出了 153个有意义的位置以供推荐。因此，试验中共有用户2407个，m=2407;位置153 个，η = 153;活动5个，r = 5;另外位置特征P = 14。跟GPS数据相关的用户评论被人工附着在 153个位置所适宜进行的活动介绍中。这些介绍被用来构建张量(用户-位置-活动）：如果一个用户在某地做了某活动，张量中相应的数据项被标记为1;反之，则为0。建立起这个张量后，只有1.17%的数据项非零。
[0053]本方法的工作流程如下：用户可以输入一个位置（比如东湖公园）用以推荐活动，之后本方法根据该用户的GPS历史轨迹和其他用户的经验，向该用户提供一个推荐活动列表(比如游览〉运动>···)。相似地，当用户输入"游览"查询推荐位置时，本方法会输出一个景点推荐列表(比如熙春塔〉飞马广场〉大钟楼>···)。
[0054]本发明创造在相同数据集上跟本领域其它主流方法作对比，具体而言，对基于用户的协同过滤方法，我们将协同过滤思想应用于对应于每一个活动的每一个用户-位置矩阵。在每一个矩阵，根据Herlocker方法并应用皮尔森相关系数作为用户相似性权重。找出跟目标用户最相似的N个用户，然后计算它们的加权均值，用以预测缺失的数据项。同样地，对基于位置/活动的协同过滤，将协同过滤思想应用与对应于每一个用户的每一个位置-活动矩阵。在实验中，我们设置N=4,因为我们发现预测结果对N的依赖并不明显。
[0055]在联合协同过滤方法中，对张量中的每一个缺失值，提取出一个最相似用户集合 (包括Nu个用户），最相似位置集合(包括m个位置)和最相似活动集合(包括Na个用户），然后利用其他用户对相关位置和活动的评分，用加权的方式计算该项的值。特别地，我们设计了预测方程：
[0057]其中Su>1是从用户-用户矩阵B中学习到的用户u和用户i的相似性;是从位置-特征矩阵C和用户-位置矩阵E中，通过均等地联合两者各自的余弦相似度，学习到的位置j和位置1的相似性;Sa,k是从活动-活动矩阵D中学习到的活动k和活动a的相似性;S u,i,a是Ai,j,k和 Au, 1, a之间的相似性，其中u，1，a分别是用户i、位置j、活动k的邻居集合Ri、Rj、Rk。实验中，我们设 Nu = Ni = Na = 4。
[0060]如上表所示，对相关方案的实验结果进行对比。实验结果显示，随机取50 %的张量数据作为训练集，取另外50%的张量数据作为测试集。对所有的相关方法，运行5次以获取结果的平均值和标准差。在模型中设置模型参数，设置模型参数心=\2=\3=\4=〇.1数据维度k = 4。对参数的影响表面在，采用两种评价指标评价方法性能:其一是RMSE(均方根误差），越小越好;其一是nDCG(归一化折损累积增益），用以衡量该方法预测的位置/活动推荐列表的排序结果。对某用户给定活动后的位置推荐而言，我们首先根据要求把测试集中的位置排序。然后，我们将这个排序和测试集中的最优排序作比较，产生nDCG值。最后，我们将所有用户和活动的nDCG值取平均值，得到了表1中的地点推荐、归一化折损累积增益，即 nDCGi。。;同样地，得出活动推荐结果nDCG ac；t，nDCGi。。表示活动推荐、归一化折损累积增益。其中，nDCG值越大越好。在上表注意到活动推荐的nDCG值比位置推荐的nDCG值高，这是因为排序队列中活动的数量远远少于位置的数量。
[0061]如图2和图3所示，在数据优化过程中的影响。在方程(1)表示的目标函数中，每一个λι(? = 1，···4)控制着一种不同的附加信息对模型的影响。取Μ的值从〇到10,并将每一种取值对应的位置推荐的nDCG值在图2中表示，每一取值对应的活动推荐的nDCG值在图3 中表示。这两图都可以看出应用附加信息(λ,的取值大于0)的推荐效果要好于没应用附加信息^，的取值为0)。此外，可以看出我们的模型这些参数并不敏感。这是因为附加信息是有限的，而且也说明的模型具有很强鲁棒性。随着"的值增加，位置推荐nDCG值下降得很快。因为位置-特征矩阵具有很大数据噪声，λ 2越大，噪声的影响越大。而这个位置-特征矩阵跟活动推荐没有直接关联，所以我们没有观察到活动推荐准确率的下降。
[0062]综上所述，本发明创造提供的优化方案以用户为中心，通过挖掘GPS轨迹数据，向用户做出精准的位置、活动推荐。在推荐系统领域，位置、活动推荐是息息相关的，恰好可以看作是位置-活动评分矩阵中的协同过滤问题。我们通过张量正则化和矩阵分解，构造了一个以用户为中心的位置/活动协同过滤方法。该方法可以针对特定领域，便捷地挖掘附加信息，以此强化该方法的推荐准确率。在真实GPS数据集上的实验表明，该方法相较传统的基于内存的协同过滤方法（比如，比如，基于用户协同过滤方法、基于位置协同过滤方法、基于活动协同过滤方法），在位置推荐准确率上提升了 19%，在活动推荐准确率上提升了 22%。
[0063]以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。
【主权项】
1. 一种基于位置服务的旅游推荐方法，包括如下步骤，步骤1，获取实体轨迹-事件信息，以三维张量对实体信息进行用户-位置-活动关联建模;其特征在于：步骤2,记录用户轨迹-事件信息，用户的具备GPS定位功能的设备抓取用户轨迹，用户在轨迹的某个地点上传活动信息，并对该活动予以评价；步骤3,通过用户类比进行相似度匹配，主动推送较高相似度用户轨迹-事件信息给其他用户参考，其中，相似度匹配包括用户轨迹-事件信息，来自于手机、运动手环、运动手表的位置信息整合后，匹配用户轨迹-事件信息的推送。2. 根据权利要求1所述的基于位置服务的旅游推荐方法，其特征在于：步骤3中，相似度匹配包括位置特征匹配和活动匹配，其中，位置特征匹配和活动匹配进行加权定义，优选高指数、高相似度推送。3. 根据权利要求2所述的基于位置服务的旅游推荐方法，其特征在于：加权定义以正则化张量和矩阵分解方法评定。4. 根据权利要求1所述的基于位置服务的旅游推荐方法，其特征在于：步骤1中，建模包括建模张量Z，其中，构建张量ZeRmXnX、m表示用户数目，n表示位置数目^表示活动数目；其中，任意张量有实体Zijk，表示用户i在位置j进行活动k的频率。5. 根据权利要求1所述的基于位置服务的旅游推荐方法，其特征在于：位置信息整合包括有稀疏张量的整合，稀疏张量通过协同过滤填补完成稀疏张量的整合。6. 根据权利要求5所述的基于位置服务的旅游推荐方法，其特征在于：稀疏张量的协同过滤填补包括将张量分解为矩阵集填补。7. 根据权利要求1所述的基于位置服务的旅游推荐方法，其特征在于：步骤1中，获取用户轨迹-事件信息，其中，获取的实体轨迹-事件信息过滤用户轨迹中家庭和工作地数据。8. 根据权利要求1-7之一所述的基于位置服务的旅游推荐方法，其特征在于：用户搜索位置信息时，通过用户历史轨迹和张量Z推送用户活动列表。
【专利摘要】本发明提出了一种基于位置服务的旅游推荐方法，包括步骤1，获取实体轨迹-事件信息，以三维张量对实体信息进行用户-位置-活动关联建模；步骤2，记录用户轨迹-事件信息，步骤3，通过用户类比进行相似度匹配，主动推送较高相似度用户轨迹-事件信息，其中，用户轨迹-事件信息(来自于手机、运动手环、运动手表的位置信息)整合后，匹配相关用户轨迹-事件信息，并实施推送。本发明提出的方法，为集成海量用户数据并用协同过滤算法在不同位置找出相似的用户和活动，用张量对用户-位置-活动之间的相互关系建模并提出一个正则化张量/矩阵分解算法，该算法可以有效缓解单个用户移动位置数据的稀疏性问题，挖掘用户的移动模式。
【IPC分类】G06Q50/14
【公开号】CN105550950
【申请号】CN201510819258
【发明人】成英超, 郝志峰, 蔡瑞初, 温雯, 王丽娟, 杨易扬
【申请人】广东工业大学
【公开日】2016年5月4日
【申请日】2015年11月20日

完整全部详细技术资料下载

当前第2页1 2