面向lbs的基于马尔可夫预测算法的个性化推荐方法_3

文档序号：9727489阅读：来源：国知局

步骤见附图7。
[0092]通常用来计算用户相似度的方法有一下几种，欧式距离、余弦相似性、修正余弦相似度、皮尔森相关系数等等。
[0093]用户兴趣点的相似度与用户所处的情境信息有着紧密的联系，本发明通过改进余弦相似度，根据情境的具体属性融合到余弦相似度的计算公式中可以得到式(9)。
[0095]式中α，β为权重值，取值〇到1 context为用户兴趣点的相关信息，包括:时间、位置、用户输入、用户需求、用户操作习惯、用户背景，其中，时间和位置应该是最重要的情境信息。
[0096]本发明使用改进的Slope One算法进行数据填充，解决稀疏性问题，将Markov预测法与协同过滤推荐相结合。首先，基于Markov预测的协同过滤推荐算法，利用对用户兴趣点的评分对情境进行分类，记录用户情境转移情况，并根据用户的情境转移情况形成一个时间观察序列，进而使用Markov预测法预测用户下一个时刻的用户的情境信息，在实际生活中，情境的地理位置对用户兴趣点的转移有着重要的影响，因此在使用协同过滤推荐相关技术计算用户情境的相似度的过程中，也充分结合地理位置对相似度的影响，从而大幅度提高了向用户推荐情景的质量，由此可见本发明改进的推荐算法相对于传统的推荐算法有着很大的优势，有助于提高推荐的质量。
[0097]本发明的主要贡献在于：
[0098] (1)利用情境信息来表示用户的兴趣点，并对情境的信息进行相关研究和分类。在推荐过程中为了解决数据稀疏性问题，根据Slope One算法的思想，提出一种对数据填充方法，最后设计对比实验，实验结果验证了该方法的合理性；
[0099] (2)使用Markov预测法对用户兴趣点的情境信息进行预测，以及在计算用户情境信息的综合评分过程中，研究了情境属性信息对综合评分的影响，通过设计对比实验，最后验证了情境属性信息对用户情境信息评分的影响程度；
[0100] (3)提出了一种融合用户情境的地理位置信息，计算用户兴趣点的相似度的方法。根据用户兴趣点的相似度进一步选择最近邻居集，得到更加精确的推荐列表。实验结果显示改进后算法得到的平均绝对误差和预测准确度比传统方法更加准确。
[0101]以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明的保护范围。
【主权项】
1. 一种面向LBS基于Markov预测的个性化推荐方法，其特征在于:所述方法包括以下步骤：步骤A:数据预处理，将原始的网页数据解析为文本格式的数据，然后进行数据填充，采用如下算法： (1) 构造用户项目评分矩阵； (2) 遍历用户项目评分矩阵，统计对项目i和对项目j有评分记录的数目，得到集合set; (3) 遍历集合set，采用下式计算set中元素与项目j的平均差值：式中Ui为用户11对;[的评分，I为对项目i和项目j评分用户集，number(u)为集合的数目； (4) 采用下式计算用户u对项目j的预测评分P(U)j以进行填充，式中number(i，j)为集合的数目；步骤B:使用用户的情境信息来表示用户的兴趣点，从而对用户兴趣点的预测转化为对用户情境的预测；步骤C:利用Markov预测算法对用户兴趣点进行预测：利用对用户兴趣点的评分对情境进行分类，记录用户情境转移情况，并根据用户的情境转移情况形成一个时间观察序列，进而使用Markov预测算法预测用户下一个时刻的用户的情境信息；步骤D:融合用户情境的地理位置信息，计算用户兴趣点的相似度，根据用户兴趣点的相似度进一步选择最近邻居集，得到更加精确的推荐列表。2. 根据权利要求1所述的个性化推荐方法，其特征在于:所述步骤A中利用爬虫工具获取网页的信息并以XML文件的形式保存在本地硬盘。3. 根据权利要求1所述的个性化推荐方法，其特征在于:所述步骤C中对用户兴趣点进行预测具体为： (1) 采集实验数据收集用户近段时间的用户兴趣点转移的信息:把用户某段时间内的活动可以看作一个时间序列，需要记录用户在特点的时间段所处的情境； (2) 处理实验数据得到用户该段时间内用户兴趣点转移的矩阵信息，并统计用户在对应时间段的所在就餐情境的次数，计算出用户在某段时间区间内出现在某一个兴趣点出现的总数； (3) 计算用户状态转移概率统计出每个状态出现的次数，以及统计各个状态之间转移的次数，再根据公式 Ej)=P(Ej/Ei)=Pij计算用户状态转移概率，由此可以得到用户状态转移概率矩阵P; (4) 计算出状态概率:π 根据递推公式：计算出状态概率π，式中P是事物的初始状态。4. 根据权利要求1所述的个性化推荐方法，其特征在于:所述步骤D中用户兴趣点的相似度与用户所处的情境信息有着紧密的联系，的计算公式情境的具体属性得到相似度的计算公式：式中α，β为权重值，取值O到I，contex为用户兴趣点的相关信息。5. -种面向LBS基于Markov预测的个性化推荐装置，其特征在于:所述装置包括：数据预处理装置，将原始的网页数据解析为文本格式的数据，然后进行数据填充，采用如下算法： (1) 构造用户项目评分矩阵； (2) 遍历用户项目评分矩阵，统计对项目i和对项目j有评分记录的数目，得到集合set; (3) 遍历集合set，采用下式计算set中元素与项目j的平均差值：式中Ui为用户11对;[的评分，I为对项目i和项目j评分用户集，number(u)为集合的数目； (4) 采用下式计算用户u对项目j的预测评分P(U)j以进行填充，式中number(i，j)为集合的数目；用户兴趣点表示装置，使用用户的情境信息来表示用户的兴趣点，从而对用户兴趣点的预测转化为对用户情境的预测；用户兴趣点预测装置：利用Markov预测算法对用户兴趣点进行预测：利用对用户兴趣点的评分对情境进行分类，记录用户情境转移情况，并根据用户的情境转移情况形成一个时间观察序列，进而使用Markov预测算法预测用户下一个时刻的用户的情境信息；推荐列表生成装置，融合用户情境的地理位置信息，计算用户兴趣点的相似度，根据用户兴趣点的相似度进一步选择最近邻居集，得到更加精确的推荐列表。6. 根据权利要求5所述的个性化推荐装置，其特征在于:所述数据预处理装置，利用爬虫工具获取网页的信息并以XML文件的形式保存在本地硬盘。7. 根据权利要求5所述的个性化推荐装置，其特征在于:所述对用户兴趣点进行预测具体为： (1)采集实验数据收集用户近段时间的用户兴趣点转移的信息:把用户某段时间内的活动可以看作一个时间序列，需要记录用户在特点的时间段所处的情境； (2) 处理实验数据得到用户该段时间内用户兴趣点转移的矩阵信息，并统计用户在对应时间段的所在就餐情境的次数，计算出用户在某段时间区间内出现在某一个兴趣点出现的总数； (3) 计算用户状态转移概率统计出每个状态出现的次数，以及统计各个状态之间转移的次数，再根据公式 Ej)=P(Ej/Ei)=Pij计算用户状态转移概率，由此可以得到用户状态转移概率矩阵P; (4) 计算出状态概率:π 根据递推公式：计算出状态概率π，式中P是事物的初始状态。8.根据权利要求5所述的个性化推荐装置，其特征在于:所述用户兴趣点的相似度与用户所处的情境信息有着紧密的联系，的计算公式情境的具体属性得到相似度的计算公式：式中α，β为权重值，取值O到I，contex为用户兴趣点的相关信息。
【专利摘要】本发明提出了一种面向LBS的基于马尔可夫预测算法的个性化推荐方法，使用Slope？One算法进行数据填充，解决稀疏性问题，将Markov预测法与协同过滤推荐相结合利用对用户兴趣点的评分对情境进行分类，记录用户情境转移情况，并根据用户的情境转移情况形成一个时间观察序列，进而使用Markov预测法预测用户下一个时刻的用户的情境信息，在实际生活中，情境的地理位置对用户兴趣点的转移有着重要的影响，因此在使用协同过滤推荐相关技术计算用户情境的相似度的过程中，也充分结合地理位置对相似度的影响，从而大幅度提高了向用户推荐情景的质量，由此可见本发明改进的推荐算法相对于传统的推荐算法有着很大的优势，有助于提高推荐的质量。
【IPC分类】G06F17/30
【公开号】CN105488213
【申请号】CN201510925927
【发明人】王岢, 徐晓飞, 叶允明
【申请人】哈尔滨工业大学深圳研究生院
【公开日】2016年4月13日
【申请日】2015年12月11日

完整全部详细技术资料下载

当前第3页1 2 3