一种基于跨域不变元表征的推荐方法、介质及设备

文档序号:37928340发布日期:2024-05-11 00:07阅读:9来源:国知局
一种基于跨域不变元表征的推荐方法、介质及设备

本发明涉及计算机推荐系统领域,尤其涉及一种基于跨域不变元表征的推荐方法、介质及设备。


背景技术:

1、跨域不变信息推荐是推荐系统领域中的一个重要课题,其主要目标是通过在不同领域之间利用共享的不变信息,提高跨领域推荐的准确性和效果。在传统的推荐系统中,通常会在一个单一的领域内建模用户兴趣和物品特征,而忽视了用户在不同领域中的潜在兴趣关联。跨域不变信息推荐旨在弥补这一不足,使得推荐系统能够更全面地理解用户的兴趣和行为。

2、跨域推荐系统目前存在一些关键的问题,限制着跨域推荐的性能。主要的问题主要为:

3、1)数据稀疏性和冷启动问题:在跨域推荐中,用户和物品在不同领域中的交互数据可能非常有限,导致数据稀疏性问题。同时,新领域或新用户的冷启动问题也是一个挑战,因为缺乏足够的历史行为信息。

4、2)领域差异和异构信息融合:不同领域的用户行为和物品特征可能存在显著的差异。有效地融合这些异构信息,使得模型能够理解跨域关系,是一个关键问题。这包括文本、图像、音频等多模态信息的整合。

5、3)领域漂移和动态适应:用户的兴趣和行为可能随时间发生变化,不同领域之间可能存在领域漂移。跨域推荐系统需要具备一定的动态适应性,能够及时调整模型以适应领域和用户行为的变化。

6、4)共享表示学习和特征对齐:跨域推荐通常需要学习到在不同领域中共享的表示,以便更好地捕捉跨域相似性。实现特征对齐,确保在不同领域中相对应的特征能够有意义地对齐,是一个关键问题。

7、5)迁移学习和领域自适应:如何在一个领域中学到的知识迁移到另一个领域,并且有效地适应新的领域,是跨域推荐中的一项关键任务。领域自适应技术可帮助模型适应不同领域的数据分布。

8、针对上述的这些问题跨域推荐系统目前主要使用以下方法尝试解决:迁移学习方法、域自适应方法、共享表示学习。具体而言,各方法特征如下:

9、1)迁移学习:跨域不变信息推荐的关键概念之一是迁移学习。这种方法通过在一个域中学到的知识迁移到另一个域,从而提高目标域的推荐性能。迁移学习的方法包括领域自适应和共享表示学习。

10、2)领域自适应:领域自适应是一种将一个领域中的知识适应到另一个领域的技术。在推荐系统中,这意味着通过调整模型,使其能够更好地适应目标领域的数据分布,从而提高跨域推荐的性能。

11、3)共享表示学习:通过共享表示学习,模型能够学习到在不同领域中共享的表示,从而更好地捕捉跨域的相似性和不变信息。这通常包括在训练中共享部分模型参数或通过对共享表示进行约束。

12、针对上述三种方法,先前的工作主要使用三种流行的框架:元学习、聚合模型和动态适应方法。

13、1)元学习:元学习是一种通过在训练中学习如何学习的方法。在跨域不变信息推荐中,元学习可以用于快速适应到新领域,提高模型的泛化能力;

14、2)聚合模型:聚合模型是一种将不同领域的推荐模型进行有效整合的方法。通过合理的信息聚合策略,可以更好地利用跨域信息,提高推荐系统的整体性能;

15、3)动态适应方法:考虑到用户兴趣和行为可能随时间变化,一些研究者提出了动态适应方法,使得推荐系统能够更灵活地适应不同领域和时间的变化。

16、总之,跨域推荐系统是一个流行的研究方向。需要解决的问题集中在使用训练数据训练出来的模型如何在其他推荐领域中能有一个出色的推荐性能。


技术实现思路

1、本发明的目的是克服现有技术的不足,提供一种基于跨域不变元表征的推荐方法、介质及设备。

2、为实现上述发明目的,本发明具体采用的技术方案如下:

3、第一方面,本发明提供了一种基于跨域不变元表征的推荐方法,其包括如下步骤:

4、s1.获取一个在源域商品编码数据集上预训练并在目标域商品编码数据集上进行微调的推荐模型,所述推荐模型包含一个编码器、一个解码器以及键线性层、查询线性层和值线性层,获取预先构建好的目标域待检测商品表征表,获取微调好的目标域元商品表征表以及微调好的目标域元用户表征表,通过目标域待检测商品表征表查询每个目标域商品编码数据对应索引编号的目标域商品表征;遍历所述目标域元商品表征表中的每一行,得到目标域元商品表征表每行对应的目标域元商品表征;

5、s2.将每个目标域商品表征输入到所述查询线性层,得到每个目标域商品表征的目标域商品查询向量表征;将目标域元商品表征输入到所述键线性层,得到目标域元商品键向量表征;利用目标域商品查询向量表征和目标域元商品键向量表征计算目标域元相似度矩阵;

6、s3.将每个目标域元相似度矩阵输入到softmax函数中,得到每个目标域元相似度矩阵对应的第一目标域融合权重;将每个目标域元商品表征输入到所述值线性层,得到目标域元商品值向量表;利用第一目标域融合权重和每个目标域元商品值向量表征,得到每个目标域商品表征得到对应的第一目标域融合商品表征;

7、s4.将每个目标域商品表征输入到所述键线性层,得到目标域商品键向量表征,依次计算索引编号不同的每个目标域商品查询向量表征和每个目标域商品键向量表征之间的目标域非自身相似度矩阵;

8、s5.将目标域非自身相似度矩阵输入到softmax函数中,得到目标域非自身相似度矩阵对应第二目标域融合权重;将每个目标域商品表征输入到所述值线性层,得到每个目标域商品表征的目标域商品值向量表征;对于每个目标域商品表征,利用与每个目标域商品表征索引编号不同的每个目标域商品值向量表征、以及第二目标域融合权重,得到每个目标域商品表征对应的第二目标域融合商品表征;

9、s6.利用第一目标域融合商品表征和第二目标域融合商品表征更新每个目标域商品表征,得到目标域最终的融合商品表征;

10、s7.将目标域最终的融合商品表征输入到所述编码器中,对应得到每个用户表征;对于用户表征中的每个用户表征值,依次计算当前的用户表征值和目标域元用户表征表中每个元用户表征值的欧式距离,得到第一欧氏距离集合,在第一欧氏距离集合中选出数值最小第一欧式距离,获取数值最小第一欧式距离对应的第一位置索引,提取目标域元用户表征表中与所述第一位置索引对应的元用户表征值,将与所述第一位置索引对应的元用户表征值替换当前的用户表征值;直到用户表征中所有用户表征值均完成替换,得到目标域新的融合用户表征;

11、s8.将目标域新的融合用户表征输入到所述解码器中,得到目标域预测的商品表征;

12、s9.在所述目标域待检测商品表征表中,根据目标域预测的商品表征,对于目标域预测的商品表征,依次计算目标域预测的商品表征和所述目标域待检测商品表征表中每个目标域商品表征之间的欧式距离,得到第二欧氏距离集合,在第二欧氏距离集合中选出数值最小第二欧式距离,获取数值最小第二欧式距离对应的第二位置索引,在所述目标域待检测商品表征表中提取与所述第二位置索引对应的目标域商品表征,将与所述第二位置索引对应的目标域商品表征作为最终预测商品信息,完成从源域到目标域的跨域推荐。

13、作为上述第一方面的优选,所述推荐模型在预训练时,分别获取来自源域商品编码数据集和目标域商品编码数据集,源域商品编码数据集和目标域商品编码数据集均包含用户的多个商品编码数据,在源域商品编码数据集和目标域商品编码数据集中获取商品编码数值最大的商品编码号以及用户数量的最大数值nuser,分别获取预先构建好的一个源域元商品表征表、一个源域元用户表征表和一个源域商品表征表;所述推荐模型预训练后,得到预训练的源域元用户表征表和预训练的源域元商品表征表;

14、所述推荐模型在微调时,预先获取经过预训练的源域元用户表征表并作为初始的目标域元用户表征表,预先获取经过预训练的源域元商品表征表并作为初始的目标域元商品表征表,所述推荐模型微调后输出微调好的目标域元商品表征表以及微调好的目标域元用户表征表。

15、作为上述第一方面的优选,所述目标域元相似度矩阵的函数形式为:

16、

17、其中,表示目标域商品查询向量表征;表示目标域元商品键向量表征转置;α表示超参数。

18、作为上述第一方面的优选,所述第一目标域融合商品表征的函数形式为:

19、

20、其中,表示目标域商品表征;表示第一目标域融合权重;表示目标域元商品值向量表征;nitem表示在源域商品编码数据集和目标域商品编码数据集中商品编码数值最大的商品编码号。

21、作为上述第一方面的优选,所述目标域非自身相似度矩阵的函数形式为:

22、

23、其中,表示目标域商品查询向量表征;表示目标域商品键向量表征转置。

24、作为上述第一方面的优选,所述第二目标域融合商品表征的函数形式为:

25、

26、其中,l表示目标域商品编码数据的目标域商品表征数量;表示第二目标域融合权重;表示目标域商品值向量表征;表示目标域商品表征。

27、作为上述第一方面的优选,所述目标域最终的融合商品表征的函数形式为:

28、

29、其中,表示第一目标域融合商品表征;表示第二目标域融合商品表征。

30、作为上述第一方面的优选,所述超参数α设置为8。

31、第二方面,本发明提供了一种计算机可读存储介质,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,实现如上述第一方面任一方案所述的一种基于跨域不变元表征的推荐方法。

32、第三方面,本发明提供了一种计算机电子设备,其包括存储器和处理器;

33、所述存储器,用于存储计算机程序;

34、所述处理器,用于当执行所述计算机程序时,现如上述第一方面任一方案所述的一种基于跨域不变元表征的推荐方法。

35、本发明与背景技术相比,具有的有益的效果是:

36、本发明在源域数据中提取出用户表征和商品表征中的对应的跨域不变的元用户表征和元商品表征,利用这些元表征挖掘源域和目标域用户和商品的共性,从而作为将推荐模型从源域迁移到目标域的桥梁。本发明方法从实际应用角度出发,充分识别不同数据集之间的共性,扩展了推荐模型在真实世界中的应用场景,并提升了推荐模型性能表现。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1