本申请实施例涉及数据处理的,具体而言,涉及一种跨域推荐优化方法、装置和存储介质。
背景技术:
1、跨域推荐是一种在推荐系统中被广泛采用的策略,旨在通过源域信息为目标域提供更好的推荐,可以缓解推荐数据稀少和冷启动问题。
2、现有的跨域方法大多集中在通过设计有效的模型架构来迁移源域知识,示例地,利用隐因子模型分别学习用户在源域和目标域上的表征,然后学习从源用户表征到目标域用户表征的非线性映射来迁移源域知识等多种知识迁移方法。
3、但是,现有的跨域方法大多集中在设计有效的模型架构来迁移源域知识,在模型优化过程中忽略了行为层面的影响,忽视行为层面影响的将导致现在精心设计的模型架构只能匹配次优的参数,从而限制了推荐性能目前的推荐模型优化过程忽略了行为层面的影响,从而限制了推荐性能。
技术实现思路
1、本申请实施例提供一种跨域推荐优化方法、装置和存储介质,旨在提高跨域推荐模型的推荐性能。
2、第一方面,本申请实施例提供一种跨域推荐优化方法,所述方法包括:
3、获取跨域推荐模型当前训练过程中输入的多个源域行为和多个目标域行为并输入行为感知模块,其中,每个行为为用户-商品对;
4、通过所述行为感知模块确定所述多个源域行为中每个源域行为的重要性,其中,所述重要性表征所述每个源域行为的商品对目标域的重要性以及对用户的重要性;
5、将所述每个源域行为的重要性作为当前训练过程的总损失函数中每个源域行为的损失权重,根据所述总损失函数更新所述跨域推荐模型的模型参数。
6、可选地,通过所述行为感知模块确定所述多个源域行为中每个源域行为的重要性,包括:
7、通过所述行为感知模块确定所述每个源域行为中商品对目标域的全局重要性;
8、通过所述行为感知模块确定所述每个源域行为中商品对该用户的局部重要性;
9、将所述全局重要性和所述局部重要性的乘积作为所述每个源域行为的重要性。
10、可选地,通过所述行为感知模块确定所述每个源域行为中商品对目标域的全局重要性,包括:
11、所述行为感知模块通过第一多层感知器,将所述每个源域行为中商品的特征映射为商品对目标域的全局重要性。
12、可选地,通过所述行为感知模块确定所述每个源域行为中商品对该用户的局部重要性,包括:
13、对于任一用户,所述行为感知模块通过多头注意力机制,分别确定所述每个源域行为中商品与该用户在源域的历史行为的第一关联度,以及所述每个源域行为中商品与该用户在目标域的历史行为的第二关联度;
14、根据所述第一关联度和所述第二关联度,所述行为感知模块通过第二多层感知器确定所述每个源域行为中商品对该用户的局部重要性。
15、可选地,所述方法还包括:
16、对所述跨域推荐模型的模型参数迭代优化目标次数。
17、可选地,对所述跨域推荐模型的模型参数迭代优化目标次数之后,所述方法还包括:
18、基于所述跨域推荐模型的目标域损失,对所述行为感知模块的参数进行优化更新;
19、基于优化更新后的行为感知模块对所述跨域推荐模型的模型参数继续进行目标次数的优化更新;
20、直到所述跨域推荐模型收敛至目标状态。
21、可选地,基于所述跨域推荐模型的目标域损失,对所述行为感知模块的参数进行优化更新之前,所述方法还包括:
22、获取所述跨域推荐模型训练过程的目标域行为集;
23、对所述目标域行为集重新排序,得到重排后的目标域行为集;
24、基于所述重排后的目标域行为集,确定所述跨域推荐模型的目标域损失。
25、可选地,基于所述跨域推荐模型的目标域损失,对所述行为感知模块的参数进行优化更新,包括:
26、基于链式法则确定所述目标域损失的隐式梯度;
27、基于所述隐式梯度,对所述行为感知模块的参数进行优化更新。
28、第二方面,本申请实施例提供一种跨域推荐优化装置,所述装置包括:
29、获取模块,用于获取跨域推荐模型当前训练过程中输入的多个源域行为和多个目标域行为并输入行为感知模块,其中,每个行为为用户-商品对;
30、重要性确定模块,用于通过所述行为感知模块确定所述多个源域行为中每个源域行为的重要性,其中,所述重要性表征所述每个源域行为的商品对目标域的重要性以及对用户的重要性;
31、更新模块,用于将所述每个源域行为的重要性作为当前训练过程的总损失函数中每个源域行为的损失权重,根据所述总损失函数更新所述跨域推荐模型的模型参数。
32、第三方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如实施例第一方面所述的跨域推荐优化方法。
33、有益效果:
34、获取跨域推荐模型当前训练过程中输入的多个源域行为和多个目标域行为并输入行为感知模块,其中,每个行为为用户-商品对;通过所述行为感知模块确定所述多个源域行为中每个源域行为的重要性,其中,所述重要性表征所述每个源域行为的商品对目标域的重要性以及对用户的重要性;将所述每个源域行为的重要性作为当前训练过程的总损失函数中每个源域行为的损失权重,根据所述总损失函数更新所述跨域推荐模型的模型参数。
35、本方法在跨域推荐模型的当前训练过程中,通过行为感知模块确定每个源域行为在目标域上的重要性和对用户的重要性,然后根据每个源域行为的重要性对每个源域行为添加一个损失权重,使得跨域推荐模型在训练过程中基于具有不同影响程度的源域行为得到更优的模型参数,提高了训练得到的跨域推荐模型的推荐性能。
1.一种跨域推荐优化方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,通过所述行为感知模块确定所述多个源域行为中每个源域行为的重要性,包括:
3.根据权利要求2所述的方法,其特征在于,通过所述行为感知模块确定所述每个源域行为中商品对目标域的全局重要性,包括:
4.根据权利要求2所述的方法,其特征在于,通过所述行为感知模块确定所述每个源域行为中商品对该用户的局部重要性,包括:
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
6.根据权利要求5所述的方法,其特征在于,对所述跨域推荐模型的模型参数迭代优化目标次数之后,所述方法还包括:
7.根据权利要求6所述的方法,其特征在于,基于所述跨域推荐模型的目标域损失,对所述行为感知模块的参数进行优化更新之前,所述方法还包括:
8.根据权利求6所述的方法,其特征在于,基于所述跨域推荐模型的目标域损失,对所述行为感知模块的参数进行优化更新,包括:
9.一种跨域推荐优化装置,其特征在于,所述装置包括:
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的跨域推荐优化方法。