本发明属于序列推荐,具体涉及一种基于长短期兴趣分离的去偏序列推荐方法及系统。
背景技术:
1、本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
2、个性化序列推荐的目标是预测用户下一个感兴趣的项目,然而拟合一个推荐模型来重建观测到的用户行为数据时,往往会使得训练模型偏向于推荐流行商品,从而导致推荐结果不公平。
3、早期的研究主要依赖马尔可夫链模型,这些方法主要捕获序列的局部信息,捕捉长期依赖关系能力不足。为了解决这一问题,部分研究使用循环神经网(rnn)来建模用户交互序列中的潜在兴趣,gru4rec是其中最具代表性的工作。后来部分研究开始转向利用卷积神经网络(cnn)进行序列建模,它能从特定区域学习局部特征,并理解不同区域间的关系,从而有效地捕捉到通常被其他模型忽略的联合层级集体依赖关系,caser是其中的一个代表性工作,其通过卷积运算在联合级别和点级别上同时捕获用户的一般偏好和顺序模式。此外,基于图神经网络(gnn)的模型如sr-gnn、gcsan、surge等也被提出来进行序列推荐任务,由于gnn能够捕捉全局连接,因此这些模型在性能上也得到了一定地提升。后来transformer的引入激发了研究人员开发像sasrec、bert4rec这类基于注意力机制的序列推荐模型,可以更好地捕获用户交互项目之间的依赖关系,取得了更好地性能表现。现今的许多序列推荐模型都通过对比学习框架来引入自监督信号以增强对用户和物品的表征学习。例如,cl4srec将序列数据增强引入对比学习任务中,以获得更鲁棒的序列表示,有效地缓解了数据稀疏问题。然而数据增强可能会破坏原始序列内部关联,构造正样本对质量不高,因此duorec使用一种基于dropout的模型级增强的对比学习方法,实现了更好地语义保留。另一方面,为了捕捉时间顺序交互行为的不同用户意图,iclrec对用户意图进行聚类和对比学习,通过改善用户兴趣的表示来增强序列推荐。
4、在过去几年中,许多研究人员提出了基于深度神经网络的序列推荐方法,包括基于注意力的方法和基于gnn的方法,它们可以捕捉序列中隐含的用户兴趣。然而,这些方法通常遭受数据稀疏问题的困扰,这使得他们难以学习到足够好的兴趣表示用于推荐。而对比学习则能够较好解决该问题,即通过引入自监督信号从而有效增强了用户与项目的表示学习。例如,利用序列上的各种数据增强来强制增强视图之间的一致性以进行嵌入对比,通过识别序列或推荐项目的语义正对来应用对比学习。虽然这些对比学习方法在缓解数据稀疏问题上取得了一定的成效,但是并未解决对推荐性能影响的另一个重要问题,即流行度偏差问题,因此现有技术中也有尝试在序列推荐任务上将从众性信号纳入对比学习中,试图减轻流行度偏差现象,以增强序列推荐性能。尽管这些方法在推荐性能上有一定提升,通过引入从众因子来缓解这一问题,但是仍然缺乏对用户从众性的全面考虑,忽略了用户在长期和短期的从众程度上的差异,难以精确地建模用户的真实意图。
技术实现思路
1、为了解决上述问题,本发明提出了一种基于长短期兴趣分离的去偏序列推荐方法及系统,本发明将用户兴趣的长期表示与短期表示进行分离,并与多用户兴趣交互图的嵌入表示进行对比学习,在对比学习的过程中引入长期从众因子和短期从众因子辅助去偏,赋予了序列推荐较强的去偏能力,使得模型学到的兴趣表示更能表达用户真实意图。
2、根据一些实施例,本发明的第一方案提供了一种基于长短期兴趣分离的去偏序列推荐方法,采用如下技术方案:
3、基于长短期兴趣分离的去偏序列推荐方法,包括:
4、基于用户交互序列构建多用户兴趣交互图,得到全局用户兴趣表示;
5、根据用户交互序列分别构建长期兴趣表示和短期兴趣表示;
6、基于长期兴趣表示和短期兴趣表示,利用从众因子分别进行对比学习,得到用户长期兴趣表示和用户短期兴趣表示;
7、将用户长期兴趣表示和用户短期兴趣表示进行自适应融合形成用户融合兴趣表示,用于序列推荐的预测任务。
8、进一步地,所述基于用户交互序列构建多用户兴趣交互图,得到全局用户兴趣表示,包括:
9、将每个用户序列中的相邻项目对作为序列图的边构建多用户兴趣交互图;
10、利用图卷积网络对多用户兴趣交互图的项目进行编码,得到全局用户兴趣表示。
11、进一步地,根据用户交互序列构建长期兴趣表示,包括:
12、将用户交互序列映射为长期用户嵌入,并将长期用户嵌入和用户交互项目的位置嵌入拼接,得到长期兴趣嵌入;
13、利用编码器将长期兴趣编码,得到长期兴趣表示。
14、进一步地,根据用户交互序列构建短期兴趣表示,包括:
15、根据用户交互序列筛选出短期交互序列;
16、将短期交互序列映射为短期用户嵌入,并将短期用户嵌入和用户交互项目的位置嵌入拼接,得到短期兴趣嵌入;
17、利用编码器将短期兴趣嵌入编码,得到短期兴趣表示。
18、进一步地,所述基于长期兴趣表示和短期兴趣表示,利用从众因子分别进行对比学习,得到用户长期兴趣表示和用户短期兴趣表示,包括:
19、利用对比学习损失函数将长期兴趣表示与长期从众因子控制对比学习,得到用户长期兴趣表示;
20、利用对比学习损失函数将短期兴趣表示与短期从众因子控制对比学习,得到用户短期兴趣表示。
21、进一步地,所述长期从众因子的提取过程,具体为:
22、基于多用户兴趣交互图,采用度中心性算法分别计算每个项目节点的度中心度;
23、对每个用户的项目节点的度中心度进行归一化处理;
24、对每个用户所有项目节点归一化后的度中心度进行聚合得到长期从众因子。
25、进一步地,所述短期从众因子的提取过程,具体为:
26、基于多用户兴趣交互图,采用度中心性算法分别计算每个项目节点的度中心度;
27、对每个用户的项目节点的度中心度进行归一化处理;
28、对每个用户短期交互项目节点归一化后的度中心度进行聚合得到短期从众因子。
29、根据一些实施例,本发明的第二方案提供了一种基于长短期兴趣分离的去偏序列推荐系统,采用如下技术方案:
30、基于长短期兴趣分离的去偏序列推荐系统,包括:
31、全局兴趣表示提取模块,被配置为基于用户交互序列构建多用户兴趣交互图,得到全局用户兴趣表示;
32、长短期兴趣表示提取模块,被配置为根据用户交互序列分别构建长期兴趣表示和短期兴趣表示;
33、长短期兴趣表示对比学习模块,被配置为基于长期兴趣表示和短期兴趣表示,利用从众因子分别进行对比学习,得到用户长期兴趣表示和用户短期兴趣表示;
34、序列推荐模块,被配置为将用户长期兴趣表示和用户短期兴趣表示进行自适应融合形成用户融合兴趣表示,用于序列推荐的预测任务。
35、根据一些实施例,本发明的第三方案提供了一种计算机可读存储介质。
36、一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一个方面所述的基于长短期兴趣分离的去偏序列推荐方法中的步骤。
37、根据一些实施例,本发明的第四方案提供了一种计算机设备。
38、一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述第一个方面所述的基于长短期兴趣分离的去偏序列推荐方法中的步骤。
39、与现有技术相比,本发明的有益效果为:
40、本发明在基于对比学习的序列推荐中综合考虑了用户的长期从众性和短期从众性,可以学习到更能表达用户真实意图的兴趣表示。通过将用户兴趣表示分解为长期和短期表示,以更精细地捕捉用户兴趣的动态变化。为了全面考虑多用户兴趣的交互关系,引入了多用户兴趣交互图,并通过图卷积网络在此图上获取用户兴趣的从众嵌入,同时提取长短期从众因子。随后,通过对比学习的方式,将长短期兴趣表示与从众表示进行有效对比。在对比学习的过程中,引入了长期从众因子和短期从众因子,以有效地减缓基于对比学习的序列推荐系统中流行度偏差的影响。