基于扩散模型增强的序列推荐模型的训练方法和装置

文档序号：36864569发布日期：2024-02-02 20:46阅读：14来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本公开涉及数据处理，特别是涉及一种基于扩散模型增强的序列推荐模型的训练方法和装置。

背景技术：

1、序列推荐旨在根据用户的一系列历史交互行为向用户推荐个性化的新交互项目，是当前互联网信息服务系统中广泛采用的推荐策略。

2、然而，相关技术的序列推荐方法往往极大地受限于真实世界场景中的数据稀疏问题，尤其是冷启动等场景下，缺乏大量有效的用户交互行为，导致推荐系统无法充分挖掘用户意图，从而限制了推荐性能。

技术实现思路

1、鉴于上述问题，本公开实施例提供了一种基于扩散模型增强的序列推荐模型的训练方法和装置，以便克服上述问题或者至少部分地解决上述问题。

2、本公开实施例的第一方面，提供了一种基于扩散模型增强的序列推荐模型的训练方法，所述方法包括：

3、获取历史交互序列；

4、获取扩散模型输出的所述历史交互序列的多个增强交互序列；

5、根据所述多个增强交互序列与所述历史交互序列的相似度，确定每个所述增强交互序列对应的训练难度；

6、按照训练难度从易到难的顺序，利用所述多个增强交互序列和所述历史交互序列，对初始序列推荐模型进行训练，得到训练好的序列推荐模型。

7、可选地，所述按照训练难度从易到难的顺序，利用所述多个增强交互序列和所述历史交互序列，对初始序列推荐模型进行训练，得到训练好的序列推荐模型，包括：

8、按照训练难度从易到难的顺序，每次从所述多个增强交互序列和所述历史交互序列中确定出一个序列，将所述序列的子序列输入所述初始序列推荐模型，得到所述初始序列推荐模型预测的所述子序列的下一序列元素，所述子序列为所述序列中排在前列的多个序列元素组成；

9、获取所述序列中，所述子序列的下一目标序列元素；

10、根据所述下一目标序列元素，以及所述初始序列推荐模型预测的下一序列元素，建立第一损失函数；

11、基于所述第一损失函数对所述初始序列推荐模型进行训练，得到训练好的所述序列推荐模型。

12、可选地，所述扩散模型的训练步骤至少包括：

13、将所述历史交互序列输入初始扩散模型，得到所述历史交互序列的编码，所述初始扩散模型包括噪声添加模块和去噪模块；

14、所述噪声添加模块在每个时间步，向所述历史交互序列的编码中添加噪声，得到目标编码；

15、所述去噪模块预测在所述每个时间步添加的噪声；

16、所述去噪模块根据预测的在所述每个时间步添加的噪声，对所述目标编码进行去噪处理，得到预测的增强交互序列的编码；

17、根据所述每个时间步添加的噪声，以及预测的所述每个时间步添加的噪声，建立第二损失函数，基于所述第二损失函数对所述初始扩散模型进行训练，得到训练好的所述扩散模型。

18、可选地，所述扩散模型包括去噪模块；所述获取扩散模型输出的所述历史交互序列的多个增强交互序列，包括：

19、将所述历史交互序列输入所述扩散模型，得到所述历史交互序列的编码；

20、所述去噪模块根据所述历史交互序列的编码，生成所述多个增强交互序列的编码；

21、对所述多个增强交互序列的编码进行解码，得到所述多个增强交互序列。

22、可选地，在所述得到训练好的序列推荐模型之后，所述方法还包括：

23、获取目标历史交互序列；

24、将所述目标历史交互序列输入训练好的所述序列推荐模型，得到预测的待推荐序列元素。

25、本公开实施例的第二方面，提供了一种基于扩散模型增强的序列推荐模型的训练装置，所述装置包括：

26、获取模块，用于获取历史交互序列；

27、增强模块，用于获取扩散模型输出的所述历史交互序列的多个增强交互序列；

28、确定模块，用于根据所述多个增强交互序列与所述历史交互序列的相似度，确定每个所述增强交互序列对应的训练难度；

29、训练模块，用于按照训练难度从易到难的顺序，利用所述多个增强交互序列和所述历史交互序列，对初始序列推荐模型进行训练，得到训练好的序列推荐模型。

30、可选地，所述训练模块具体用于执行：

31、按照训练难度从易到难的顺序，每次从所述多个增强交互序列和所述历史交互序列中确定出一个序列，将所述序列的子序列输入所述初始序列推荐模型，得到所述初始序列推荐模型预测的所述子序列的下一序列元素，所述子序列为所述序列中排在前列的多个序列元素组成；

32、获取所述序列中，所述子序列的下一目标序列元素；

33、根据所述下一目标序列元素，以及所述初始序列推荐模型预测的下一序列元素，建立第一损失函数；

34、基于所述第一损失函数对所述初始序列推荐模型进行训练，得到训练好的所述序列推荐模型。

35、可选地，所述扩散模型的训练步骤至少包括：

36、将所述历史交互序列输入初始扩散模型，得到所述历史交互序列的编码，所述初始扩散模型包括噪声添加模块和去噪模块；

37、所述噪声添加模块在每个时间步，向所述历史交互序列的编码中添加噪声，得到目标编码；

38、所述去噪模块预测在所述每个时间步添加的噪声；

39、所述去噪模块根据预测的在所述每个时间步添加的噪声，对所述目标编码进行去噪处理，得到预测的增强交互序列的编码；

40、根据所述每个时间步添加的噪声，以及预测的所述每个时间步添加的噪声，建立第二损失函数，基于所述第二损失函数对所述初始扩散模型进行训练，得到训练好的所述扩散模型。

41、可选地，所述扩散模型包括去噪模块；所述增强模块具体用于执行：

42、将所述历史交互序列输入所述扩散模型，得到所述历史交互序列的编码；

43、所述去噪模块根据所述历史交互序列的编码，生成所述多个增强交互序列的编码；

44、对所述多个增强交互序列的编码进行解码，得到所述多个增强交互序列。

45、可选地，在所述得到训练好的序列推荐模型之后，所述装置还包括：

46、目标获取模块，用于获取目标历史交互序列；

47、预测模块，用于将所述目标历史交互序列输入训练好的所述序列推荐模型，得到预测的待推荐序列元素。

48、本公开实施例的第三方面，提供了一种电子设备，包括：处理器；用于存储所述处理器可执行指令的存储器；其中，所述处理器被配置为执行指令，以实现如第一方面的基于扩散模型增强的序列推荐模型的训练方法。

49、本公开实施例的第四方面，提供了一种计算机可读存储介质，当计算机可读存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行如第一方面的基于扩散模型增强的序列推荐模型的训练方法。

50、本公开实施例包括以下优点：

51、本公开实施例中，利用扩散模型生成了历史交互序列的多个增强交互序列，实现了数据增强；利用历史交互序列和多个增强交互序列对初始序列推荐模型进行训练，解决了数据稀疏的问题；按照训练难度从易到难的顺序进行训练，可以减轻扩散模型生成的增强交互序列中的潜在噪声，通过逐渐增加训练难度，序列推荐模型可以更好地泛化并避免过度拟合。如此，训练得到的序列推荐模型，具有优良的性能。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王鑫,朱文武,孙立峰,吴子豪
技术所有人：清华大学
我是此专利的发明人

上一篇：一种环保型竹香板生产用压合装置的制作方法
上一篇：一种综合自助终端机的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。