本发明属于个性化推荐,具体涉及一种基于数据中台的双线个性化推荐方法。
背景技术:
1、传统的推荐方法对于初始用户数据、用户线上浏览数据、用户线下活动数据的结合不够完整,数据利用不够充分,同时存在“冷启动”等一系列问题。
2、图卷积网络是一种针对图信号的深度学习模型,因推荐方法可转化为图的链接预测模型,因此随着图卷积网络近些年的发展与其强大的特征表征能力,人们开始提出将其用于个性化推荐方法。
3、基于此原因,图卷积网络已经开始被应用到个性化推荐方法中。目前,基于数据中台的图卷积推荐方法还存在大量的亟待解决的技术问题,如,现有的图卷积类推荐算法中异质顶点和同质顶点的交互信息,无法做到统一应用、用户在线上与线下的数据结合性不够完善等。
4、以下对本文中涉及的技术术语进行简要介绍:
5、js页面捕捉技术:通过脚本抓取用户在当前web页面的鼠标移动、点击、停留时间等操作与轨迹,并以动画的方式重现,从而精准获取用户对于产品的爱好、需求倾向与行为倾向。
6、rfid技术:radio frequency identification,无线射频识别技术,是自动识别技术的一种,通过无线射频方式进行非接触双向数据通信,通过无线射频方式对记录媒体(例如电子标签以及射频卡)进行读写,从而达到识别目标和数据交换的目的,其被认为是21世纪最具发展潜力的信息技术之一。其通常应用场景为:在一个高频信号所能所覆盖的大范围中,在不同位置安置多个低频阅读器用于激活半有源rfid产品。这样既完成了定位,又实现了信息的采集与传递。
7、图卷积网络gcn:graph convolutional network,简称gcn,图卷积网络是一种针对图信号的深度学习模型,其处理的数据是图结构,即non euclidean structure非欧几里得结构,拓扑结构。如社交网络连接,信息网络等等。其具有强大的模型表征能力,并且推荐问题可以抽象为用户顶点、商品顶点、二者之间的链接预测问题,因此近年来普遍将其应用于推荐等问题的研究与解决。
8、gcn4rs图卷积推荐算法:graph convolutional network for recommendersystems,针对推荐系统的图卷积算法,一种统一利用异质交互和同质交互信息的图卷积推荐算法,其采用自编码器框架,其中包含提取图信息的gcn层以及提取特征信息的全连接层,再通过解码器根据顶点的嵌入向量的相似度来预测图链接的存在与否,当初始数据不足时,顶点信息能有效缓解“冷启动”等问题,反之评分图谱中的信息又可作为补充,二者相辅相成,实现互助,提升了系统的性能。
技术实现思路
1、本发明所要解决的技术问题是克服现有技术的不足,提供一种基于数据中台的双线个性化推荐方法,实现了用户信息收集的全面性、系统性、科学性,并保证了推荐结果的合理性与准确性。
2、本发明提供一种基于数据中台的双线个性化推荐方法,包括如下步骤,
3、步骤s1.收集用户数据:
4、收集用户的个人初始信息与喜好初始信息;
5、获取用户浏览信息;
6、获取用户线下活动范围,作为动态信息与静态信息相互补充;
7、步骤s2.刻画用户形象:
8、对用户的基本信息进行收集分类,利用决策树模型获取用户信息的群体特征;
9、通过记录线下用户的活动轨迹、停留时长、路线判断用户喜好;
10、获取用户线上浏览记录作为用户的喜好倾向;
11、步骤s3.采用gcn4rs图卷积推荐算法实现推荐:
12、构造评分矩阵、用户特征、商品特征,输入嵌入向量维度与迭代次数,
13、通过独热码编码获取用户和商品各自的顶点信号,
14、将特征向量填充至同一纬度、构造异质交互图与同质交互图并初始化编码器参数与解码器参数;
15、在迭代次数循环内反复执行两图的卷积操作、特征的全连接操作和嵌入向量获取操作;
16、循环计算损失,根据反向传播梯度更新式更新解码器参数、编码器参数与嵌入向量;
17、循环结束后获取最终的用户嵌入向量与商品嵌入向量;
18、步骤s4.获取预测结果:
19、通过用户与商品的嵌入向量做出用户分析报告;
20、通过用户需求分析报告做出推荐结果的说明与预测。
21、作为本发明的进一步技术方案,步骤s1中,通过线上平台、营销界面收集用户的个人初始信息与喜好初始信息,通过web端页面捕捉技术、日志记录获取用户浏览信息,通过线下芯片扫描实现用户线下活动范围,作为动态信息与静态信息相互补充。
22、进一步的,步骤s2中,通过营销页面对用户的基本信息进行收集分类,利用决策树模型得出用户信息的群体特征,通过现场无线改写式rfid标签配合阅读器记录线下用户的活动轨迹、停留时长、路线判断用户喜好,通过日志、js轨迹记录获取用户线上浏览记录作为用户的喜好倾向。
23、进一步的,步骤s3的具体流程为,
24、步骤s31.构造评分矩阵r、用户特征、商品特征,输入嵌入向量维度c与迭代次数i;
25、设用户数量为m,商品数量为n,则构造用户商品交互图为:
26、;
27、其中,用户商品评分矩阵 r ,
28、评分等级为l的交互图,且;
29、同理可构造同质交互图;
30、步骤s32.通过独热码编码对用户和商品得到各自的顶点信号x;
31、步骤s33.将特征向量填充至同一纬度,即令,、构造异质交互图与同质交互图并初始化编码器参数与解码器参数;
32、步骤s34.在迭代次数循环内不断执行两图的卷积操作、特征的全连接操作、获得的嵌入向量z;
33、,
34、其中, 为 的度矩阵,用于归一化;x为顶点信号,为参数;
35、,
36、其中, 为 的度矩阵,用于归一化;x为顶点信号,为参数;
37、 = ,
38、其中,通过特征的全连接层运算得到;
39、步骤s35.循环通过公式计算损失,其中, 为集合中 的元素;
40、更新反向传播梯度更新式中的解码器、编码器参数与嵌入向量,其中,为第i个用户的嵌入向量,为第i个商品的嵌入向量,为模型训练参数;
41、步骤s36.循环结束后得到最终的用户嵌入向量与商品嵌入向量。
42、进一步的,gcn4rs图卷积推荐算法的评价指标采用rmse,均方根误差,公式为:rmse = 。
43、本发明的优点在于,
44、1.实现了用户群体的精准识别与分析,并能够通过gcn实现精准推荐。
45、2.通过线上浏览记录能够显著记录用户在线上的行为活动、通过线下浏览路线能够实地记录用户的线下喜好倾向,二者结合能够更有效地刻画用户画像。
46、3.采用gcn4rs图卷积推荐算法,其中异质顶点的交互便于挖掘用户与条目的交互模式,而同质顶点的交互能有效缓解“冷启动”等一系列问题。