一种基于用户行为分析的个性化商品推荐方法及系统与流程

文档序号:15463290发布日期:2018-09-18 18:41阅读:327来源:国知局
本发明属于计算机
技术领域
,具体地涉及一种基于用户行为分析的个性化商品推荐方法及系统。
背景技术
:随着互联网信息技术的发展,网络服务商为用户提供了诸如新闻、商品、图片、视频、音频、文档等以下统一简称为物品的在线服务。为了更好的为用户提供服务,服务商会记录用户的历史行为,尤其是用户的点击行为。用户对物品的点击行为是分析用户偏好的重要信息,用户对某商品的点击查看次数越多,说明用户对该商品的属性特征越感兴趣。由于每一个用户消费的物品数量有限,如何根据有限的行为数据挖掘用户偏好,进而据此为用户提供推荐是推荐领域面临的重要问题。所谓推荐即是预测用户可能喜欢的商品、按照可能的喜欢程度排序,并把这个商品列表推荐给用户。目前,个性化推荐系统能够在用户没有明确目的时候,帮助发现那些他们感兴趣但很难发现的商品。但是也存在诸多难点:1、用户兴趣的量化:正所谓一千个人中有一千个汉姆雷特;个人的兴趣千差万别,如何给出一种能准确量化用户兴趣的指标,用以表征用户的偏好。比如如何判断用户喜欢小户型还是大户型,如何量化对各个维度、标签的偏好程度;2、用户行为模式挖掘:用户行为的点击数据代表了用户的明确需求,每一次的鼠标点击都是用户本质需求的反应,如何正确衡量不同时间点的鼠标点击权重,如何将用户的点击行为和用户的偏好进行结合;3、个性化的精准性:如何保证个性化的推荐结果是真正符合用户需求,一直也都是业界都在绞尽脑汁解决的问题。技术实现要素:本发明的目的在于针对现有技术的缺陷或问题,提供一种基于用户行为分析的个性化商品推荐方法及系统。本发明的技术方案如下:一种基于用户行为分析的个性化商品推荐方法包括如下步骤:步骤1:提取商品的属性信息,提取用户对商品的访问行为;步骤2:通过用户对商品基于时间维度的访问行为,得到衰减因子,所述商品属性信息,建立用户模型;步骤3:根据用户模型,得到用户在各个属性维度的兴趣属性信息;步骤4:根据用户兴趣属性信息、商品属性信息和用户对商品的访问行为建立基于商品属性的回归树模型;步骤5:根据用户的访问记录得到用户的候选推荐商品列表;步骤6:利用商品属性的回归树模型预测用户的候选推荐商品评分;步骤7:根据用户对候选推荐商品的预测评分进行排序,将排名较高的商品作为候选推荐推荐给用户。优选地,步骤1具体包括如下步骤:步骤1-1:提取得到的商品以及商品的属性信息;所述商品是在不同场景下,待推荐主体;属性信息为:<itemid,<category1:feature1>,<category2:feature2>……<categoryn:featuren》其中itemid表示唯一标识一个商品,<categoryn:featuren>中categoryn表示商品属性的维度,featuren表示商品属性的值;步骤1-2:提取得到用户对于商品的访问记录;所述访问记录是用户在不同场景下,所包含的点击、查看行为:<yserid,itemid,timestamp>其中userid表示唯一标识一个用户,itemid表示唯一标识一个物品,timestamp表示本次操作的时间。优选地,步骤2具体包括如下步骤:步骤2-1:根据用户某次访问日志距离当前时间的时间间隔,得到衰减因子RR=e-λx;其中,x为时间间隔,λ是一个调节系数;步骤2-2:将得到的R作为用户此次访问商品的权重,计算得到此次用户行为的商品属性分数;步骤2-3:汇总用户行为对应的商品属性分数,得到了每个用户在不同商品属性上的分数分布。优选地,步骤3具体包括如下步骤:步骤3-1:根据用户在不同商品属性的分数分布,按照商品属性的维度得到用户在不同商品属性维度下的属性评分分布;步骤3-2:根据用户在不同商品属性维度下的权重评分,得到用户在不同商品维度上的偏好兴趣属性信息。优选地,步骤4具体包括如下步骤:步骤4-1:将用户的偏好属性信息向量化为Vuser;步骤4-2:将物品的属性信息向量化为Vitem;步骤4-3:根据用户对商品的访问记录将Vuser和Vitem组合成新的训练向量Vtotal,使用访问记录的权重作为Vtotal的标识;步骤4-4:在用户对商品的访问记录训练向量集上训练回归树回归模型。优选地,步骤5具体包括如下步骤:步骤5-1:根据用户对商品的访问记录,对于每一个用户u得到用户访问过的商品集合Iu;步骤5-2:根据Iu得到访问过这些商品的所有用户集合S;步骤5-3:根据用户的商品访问记录得到S中所有用户的访问商品集合Itotal,即为用户u的候选商品集合。优选地,步骤6具体包括如下步骤:步骤6-1:将待推荐用户u′的偏好属性信息向量化为Vuser′;步骤6-2:将用户u′的候选商品集合Itotal′中的商品属性信息向量化为Vitem′;步骤6-3:将Vuser′和Vitem′组合成新的训练向量Vtotal′,使用训练好的回归树模型预测用户对商品的评分。优选地,步骤7具体包括如下步骤:步骤7-1:统计用户对商品的预测评分,对相同用户的商品预测评分进行排序;步骤7-2:按照预测评分从大到小的顺序进行针对用户的个性化推荐。一种基于用户行为分析的个性化商品推系统包括:信息收集模块,其用以收集商品以及商品属性信息,且收集用户对商品的访问行为;信息处理模块,其用以对所述信息收集模块中的商品属性信息、用户对商品行为数据进行预处理,并得到用户在各个维度的兴趣偏向属性,且得到用户的候选推荐商品列表;推荐模型建立模块,其用以通过所述信息处理模块得到的预处理数据训练得到推荐模型;及个性化推荐模块,其用以根据所述推荐模型进行用户针对候选商品的预测评分生成,统计用户针对商品的预测评分,得到用户个性化推荐的结果。本发明提供的技术方案具有如下有益效果:所述基于用户行为分析的个性化商品推荐方法和系统基于对用户在网站上浏览,点击留下的日志数据,将这些用户日志行为数据,通过分析挖掘处理。综合用户的行为数据,细致划分用户在多维度的倾向兴趣,可以准确的表示用户的复杂偏好,并通过回归树算法使用将用户倾向兴趣数据与商品数据作匹配,可以最终生成与用户匹配度较高的商品推荐数据,从而得到更令人满意的推荐效果。附图说明图1是本发明实施的基于用户行为分析的个性化商品推荐方法流程图;图2是本发明实施的基于用户行为分析的个性化商品推荐系统的功能模块图。具体实施方式为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。除非上下文另有特定清楚的描述,本发明中的元件和组件,数量既可以单个的形式存在,也可以多个的形式存在,本发明并不对此进行限定。本发明中的步骤虽然用标号进行了排列,但并不用于限定步骤的先后次序,除非明确说明了步骤的次序或者某步骤的执行需要其他步骤作为基础,否则步骤的相对次序是可以调整的。可以理解,本文中所使用的术语“和/或”涉及且涵盖相关联的所列项目中的一者或一者以上的任何和所有可能的组合。首先介绍本发明中需要用到的几个名词:商品的维度,是指表征商品属性的各个方面,以房屋信息平台为例,表征商品的维度可以包括:面积、单价、区域、交通条件等;维度的属性值,是指每个维度的属性的具体值,比如面积:50-70平方米,单价:10000-20000元,区域:栖霞区等;维度的量化值,是指为了查找计算方便,而对每个维度的属性的具体指设置的对应值,比如量化值1表示面积:50-70平方米;量化值2表示单价:10000-20000元等;权重值,是以表征用户在考虑时间维度的基础上对商品的关注程度。如图1所示,本发明提供的基于用户行为分析的个性化商品推荐方法包括如下步骤:1、提取商品的属性信息,提取用户对商品的访问行为。具体地,步骤1具体包括如下步骤:1.1、提取得到的商品以及商品的属性信息;所述商品是在不同场景下,待推荐主体;属性信息为:<itemid,<category1:feature1>,<category2:feature2>……<categoryn:featuren》其中itemid表示唯一标识一个商品,<categoryn:featuren>中categoryn表示商品属性的维度,featuren表示商品属性的值。在步骤1.1中,获取商品的属性信息,所述商品泛指用户可能感兴趣的产品和服务,每个商品都具有一定的属性和特征,比如颜色,大小,产地等等。如表1所示,实例性的示出了商品属性特征的具体形式。表1商品ID区域户型面积(平方米)单价(元)10001鼓楼区2室90-12020000-2500010002江宁区3室120-15020000-2500010003鼓楼区3室120-15015000-20000……………1.2、提取得到用户对于商品的访问记录;所述访问记录是用户在不同场景下,所包含的点击、查看行为:<userid,itemid,timestamp>其中userid表示唯一标识一个用户,itemid表示唯一标识一个物品,timestamp表示本次操作的时间。在步骤1.2中,获取预定时间段内用户对商品的访问行为,在实际应用中,可以通过任意网络平台或第三方收集用户对商品的访问信息,访问信息包括用户标识(ID),商品标识(ID),访问时间信息,预定时间段内可以任意设置,例如设置成一周,一个月等。具体的,在本发明实例中,获得的一条访问记录至少包括什么人(用户ID)在什么时间访问了什么商品(商品ID)。如表2所示,实例性的示出了访问记录的具体形式。表2用户ID商品ID访问时间u10001100012017-01-01u10002100032017-02-01………2、通过用户对商品基于时间维度的访问行为,得到衰减因子,所述商品属性信息,建立用户模型。具体地,步骤2包括如下步骤:2.1、根据用户某次访问日志距离当前时间的时间间隔,得到衰减因子RR=e-λx;其中,x为时间间隔,λ是一个调节系数。在步骤2.1中,遍历用户的所有访问记录,用户的行为数据随着时间的推移,表征用户兴趣的能力在下降,比如用户1个月前的访问记录能够反映兴趣倾向价值就比一天前的访问记录小,我们引入数据的时间衰减机制。根据访问记录中的访问时间与当前时间的间隔计算衰减因子R:R=e-λx;其中,x为时间间隔,λ是一个调节系数,λ越大代表时间衰减的越快,越早的记录对用户倾向兴趣的影响越小,在实践中可以动态调整。2.2、将得到的R作为用户此次访问商品的权重,计算得到此次用户行为的商品属性分数。在步骤2.2中,将衰减因子作为对应访问记录的倾向兴趣权重,遍历用户的所有点击过的商品ID,获取商品ID对应的商品属性,统计商品在不同的商品维度上的量化值的带权重评分,这样就得到了用户在商品维度上的倾向兴趣分布,基于分布可以建立用户模型。比如用户A有如表3所示的访问记录,当前时间假定为2017年4月1日,λ取0.025。表3A访问10001商品的衰减因子R1=0.472;A访问10002商品的衰减因子R2=0.687;A访问10003商品的衰减因子R3=0.882;如表4根据衰减因子和表3,则可以得到A在商品属性中不同维度的带权重评分为:表4<商品维度>:<维度的量化值>带权重评分区域维度:鼓楼区0.472+0.882=1.354区域维度:江宁区0.687户型:2室0.472户型:3室0.687+0.882=1.569面积:90-1200.472面积:120-1500.687+0.882=1.569单价:20000-250000.882单价:15000-200000.472+0.687=1.1592.3、汇总用户行为对应的商品属性分数,得到了每个用户在不同商品属性上的分数分布。3、根据用户模型,得到用户在各个属性维度的兴趣属性信息。具体地,步骤3包括如下步骤:3.1、根据用户在不同商品属性的分数分布,按照商品属性的维度得到用户在不同商品属性维度下的属性评分分布。在步骤3.1中,根据用户模型中的用户在商品维度上的倾向兴趣分布,选取每个商品维度的权重最大属性,我们就得到了所有用户在商品维度上的兴趣属性信息。比如通过表4我们可以得到用户A的兴趣属性信息如表5所示。表5用户ID兴趣区域兴趣户型兴趣面积兴趣单价A鼓楼区3室120-15015000-200003.2、根据用户在不同商品属性维度下的权重评分,得到用户在不同商品维度上的偏好兴趣属性信息。4、根据用户兴趣属性信息、商品属性信息和用户对商品的访问行为建立基于商品属性的回归树模型。具体地,步骤4包括如下步骤:4.1、将用户的偏好属性信息向量化为Vuser,遍历所有的商品属性信息,生成属性信息的量化值,量化值保证一一对应;4.2、将物品的属性信息向量化为Vitem,根据量化值的数量N,使用N位的向量DN来表示商品的属性信息;其中,DN的第n位用0或者1表示量化值为n的属性是否是商品的属性;比如某一商品有属性<区域:鼓楼区>,<区域:鼓楼区>的量化值为3,该商品的向量DN中的第三位应该是1;4.3、根据用户对商品的访问记录将Vuser和Vitem组合成新的训练向量Vtotal,使用访问记录的权重作为Vtotal的标识,根据商品属性信息的量化值对应关系,将用户兴趣属性信息根据同样的对应关系使用N位的向量DN′表示,遍历所有的访问记录,根据用户ID得到表示该用户的向量DN′,然后根据商品ID得到表示该商品的向量DN,将DN′和DN按照顺序拼成向量DNtotal,其中DNtotal=[DN′,DN];4.4、在用户对商品的访问记录训练向量集上训练回归树回归模型,将DNtotal作为训练回归树模型的训练样本,训练样本的标记为对应访问记录的倾向兴趣权重,输入到回归树模型中,训练得到回归树模型model。5、根据用户的访问记录得到用户的候选推荐商品列表。具体地,步骤5包括如下步骤:5.1、根据用户对商品的访问记录,对于每一个用户u得到用户访问过的商品集合Iu;5.2、根据Iu得到访问过这些商品的所有用户集合S;5.3、根据用户的商品访问记录得到S中所有用户的访问商品集合Itotal,即为用户u的候选商品集合。6、利用商品属性的回归树模型预测用户的候选推荐商品评分。具体地,步骤6包括如下步骤:6.1、将待推荐用户u′的偏好属性信息向量化为Vuser′;6.2、将用户u′的候选商品集合Itotal′中的商品属性信息向量化为Vitem′;6.3、将Vuser′和Vitem′组合成新的训练向量Vtotal′,使用训练好的回归树模型预测用户对商品的评分。7、根据用户对候选推荐商品的预测评分进行排序,将排名较高的商品作为候选推荐推荐给用户。具体地,步骤7中包括如下步骤:7.1、统计用户对商品的预测评分,对相同用户的商品预测评分进行排序,即遍历所有用户针对候选推荐商品的评分,统计每个用户的候选推荐商品的分布,顺序按照评分的从大到小排列;7.2、按照预测评分从大到小的顺序进行针对用户的个性化推荐,即对每个用户的预测评分统计结果进行筛选,产生最后针对每个用户的推荐商品。如图2所示,一种基于用户行为分析的个性化商品推系统包括信息收集模块、信息处理模块、推荐模型建立模块和个性化推荐模块。而且,所述信息收集模块用以收集商品以及商品属性信息,且收集用户对商品的访问行为;所述信息处理模块用以对所述信息收集模块中的商品属性信息、用户对商品行为数据进行预处理,并得到用户在各个维度的兴趣偏向属性,且得到用户的候选推荐商品列表;所述推荐模型建立模块用以通过所述信息处理模块得到的预处理数据训练得到推荐模型;所述个性化推荐模块用以根据所述推荐模型进行用户针对候选商品的预测评分生成,统计用户针对商品的预测评分,得到用户个性化推荐的结果。对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1