推送指数预测模型的训练方法和推送内容的获取方法与流程

文档序号：36936593发布日期：2024-02-02 22:04阅读：15来源：国知局

本公开涉及数据处理领域，尤其涉及自然语言处理和深度学习等人工智能领域。

背景技术：

1、实现中，网站可以通过向用户推送其感兴趣的资源内容，提高用户的粘性以及网站内容的转化率。相关技术中，可以获取用户的大量历史数据作为学习样本，并通过对学习样本的分析从而识别用户需求，并基于识别到的用户需求对用户进行针对性的资源内容的推送。

2、可选地，针对在网站上的浏览痕迹较少的中长尾用户，相较于浏览痕迹较多的头部用户的历史数据量，中长尾用户的历史数据量明显较少，在基于中长尾用户的少量历史数据进行分析识别该类用户的用户需求的场景下，较少的历史数据量可能会对用户需求的识别准确度存在一定程度的影响，从而导致网站针对中长尾用户推送的资源内容与该类用户实际需求之间的匹配程度欠佳，影响用户体验。

技术实现思路

1、本公开提出了一种推送指数预测模型的推送指数预测模型的训练方法和推送内容的获取方法。

2、根据本公开的第一方面，提出了一种推送指数预测模型的训练方法，方法包括：获取待训练的候选组合模型，其中，所述候选组合模型包括候选推送指数预测模型和候选相似度识别模型；获取样本用户的第一资源样本和对应的第二资源样本，并对所述第一资源样本和所述第二资源样本分别进行部分特征掩盖，得到所述第一资源样本掩盖后的第一子样本集合以及所述第二资源样本掩盖后的第二子样本集合，其中，所述第一资源样本和所述第二资源样本不同；根据所述第一资源样本和所述第一子样本集合，以及所述第二资源样本和所述第二子样本集合，对所述候选组合模型进行模型训练，得到所述候选组合模型的训练损失；根据所述训练损失对所述候选组合模型进行整体的参数调整，得到参数调整后的候选组合模型；返回获取下一第一资源样本和下一第二资源样本对参数调整后的候选组合模型继续进行训练，直至训练结束，得到训练好的目标推送指数预测模型和目标相似度识别模型组成的目标组合模型，其中，所述目标推送指数预测模型用于进行线上推送内容的确定。

3、根据本公开的第二方面，提出了一种推送内容的获取方法，方法包括：获取训练好的目标推送指数预测模型，其中，所述目标推送指数预测模型基于上述第一方面提出的推送指数预测模型的训练方法得到；获取用户端待推送的候选资源内容集合，并通过所述目标推送指数预测模型输出所述候选资源内容集合中各候选资源内容的目标推送指数；根据所述目标推送指数由高至低的顺序对各候选资源内容进行排序，得到排序后的候选资源内容队列，并从所述候选资源内容队列中获取推送给所述用户端的目标推送资源内容。

4、根据本公开的第三方面，提出了一种推送指数预测模型的训练装置，装置包括：第一获取模块，用于获取待训练的候选组合模型，其中，所述候选组合模型包括候选推送指数预测模型和候选相似度识别模型；第二获取模块，用于获取样本用户的第一资源样本和对应的第二资源样本，并对所述第一资源样本和所述第二资源样本分别进行部分特征掩盖，得到所述第一资源样本掩盖后的第一子样本集合以及所述第二资源样本掩盖后的第二子样本集合，其中，所述第一资源样本和所述第二资源样本不同；第一训练模块，用于根据所述第一资源样本和所述第一子样本集合，以及所述第二资源样本和所述第二子样本集合，对所述候选组合模型进行模型训练，得到所述候选组合模型的训练损失；调整模块，用于根据所述训练损失对所述候选组合模型进行整体的参数调整，得到参数调整后的候选组合模型；第二训练模块，用于返回获取下一第一资源样本和下一第二资源样本对参数调整后的候选组合模型继续进行训练，直至训练结束，得到训练好的目标推送指数预测模型和目标相似度识别模型组成的目标组合模型，其中，所述目标推送指数预测模型用于进行线上推送内容的确定。

5、根据本公开的第四方面，提出了一种推送内容的获取装置，装置包括：第三获取模块，用于获取训练好的目标推送指数预测模型，其中，所述目标推送指数预测模型基于上述第三方面提出的推送指数预测模型的训练装置得到；第四获取模块，用于获取用户端待推送的候选资源内容集合，并通过所述目标推送指数预测模型输出所述候选资源内容集合中各候选资源内容的目标推送指数；推送模块，用于根据所述目标推送指数由高至低的顺序对各候选资源内容进行排序，得到排序后的候选资源内容队列，并从所述候选资源内容队列中获取推送给所述用户端的目标推送资源内容。

6、根据本公开的第五方面，提出了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述第一方面提出的推送指数预测模型的训练方法和/或第二方面提出的推送内容的获取方法。

7、根据本公开的第四方面，提出了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行上述第一方面提出的推送指数预测模型的训练方法和/或第二方面提出的推送内容的获取方法。

8、根据本公开的第五方面，提出了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现上述第一方面提出的推送指数预测模型的训练方法和/或第二方面提出的推送内容的获取方法。

9、应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

技术特征：

1.一种推送指数预测模型的训练方法，其中，所述方法包括：

2.根据权利要求1所述的方法，其中，所述根据所述训练损失对所述候选组合模型进行整体的参数调整，得到参数调整后的候选组合模型，包括：

3.根据权利要求1所述的方法，其中，所述获取样本用户的第一资源样本和对应的第二资源样本，并对所述第一资源样本和所述第二资源样本分别进行部分特征掩盖，得到所述第一资源样本掩盖后的第一子样本集合以及所述第二资源样本掩盖后的第二子样本集合，其中，所述第一资源样本和所述第二资源样本不同，包括：

4.根据权利要求3所述的方法，其中，所述获取所述第一资源样本中的多个第一掩盖特征组合，包括：

5.根据权利要求4所述的方法，其中，所述从各第一特征类型中，获取所述第一资源样本特征集合的多个第一掩盖特征类型组合，包括：

6.根据权利要求3所述的方法，其中，所述获取所述第二资源样本中的多个第二掩盖特征组合，包括：

7.根据权利要求6所述的方法，其中，所述从各第二候选特征类型中，获取所述第二资源样本特征集合的多个第二掩盖特征类型组合，包括：

8.根据权利要求1所述的方法，其中，所述根据所述第一资源样本和所述第一子样本集合，以及所述第二资源样本和所述第二子样本集合，对所述候选组合模型进行模型训练，得到所述候选组合模型的训练损失，包括：

9.根据权利要求8所述的方法，其中，所述根据所述第一资源样本和所述第一子样本集合，以及所述第二资源样本和所述第二子样本集合，获取所述候选推送指数预测模型的第一训练样本以及所述候选相似度识别模型的第二训练样本，包括：

10.根据权利要求9所述的方法，其中，所述对所述第一子样本集合中的各第一子样本以及所述第二子样本集合中的各第二子样本进行两两配对，得到所述候选相似度识别模型的所述第二训练样本，包括：

11.根据权利要求8所述的方法，其中，所述基于所述第一训练样本获取所述候选推送指数预测模型的第一损失值，包括：

12.根据权利要求8所述的方法，其中，所述基于所述第二训练样本获取所述候选相似度识别模型的第二损失值，包括：

13.根据权利要求8所述的方法，其中，所述基于所述第一损失值和所述第二损失值，获取所述候选推送指数预测模型和所述候选相似度识别模型的所述候选组合模型的所述训练损失，包括：

14.一种推送内容的获取方法，其中，所述方法包括：

15.一种推送指数预测模型的训练装置，其中，所述装置包括：

16.根据权利要求15所述的装置，其中，所述调整模块，还用于：

17.根据权利要求15所述的装置，其中，所述第二获取模块，还用于：

18.根据权利要求17所述的装置，其中，所述第二获取模块，还用于：

19.根据权利要求18所述的装置，其中，所述第二获取模块，还用于：

20.根据权利要求17所述的装置，其中，所述第二获取模块，还用于：

21.根据权利要求20所述的装置，其中，所述第二获取模块，还用于：

22.根据权利要求15所述的装置，其中，所述第一训练模块，还用于：

23.根据权利要求22所述的装置，其中，所述第一训练模块，还用于：

24.根据权利要求23所述的装置，其中，所述第一训练模块，还用于：

25.根据权利要求22所述的装置，其中，所述第一训练模块，还用于：

26.根据权利要求22所述的装置，其中，所述第一训练模块，还用于：

27.根据权利要求22所述的装置，其中，所述第一训练模块，还用于：

28.一种推送内容的获取装置，其中，所述装置包括：

29.一种电子设备，包括：

30.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-13和/或权利要求14中任一项所述的方法。

31.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-13和/或权利要求14中任一项所述的方法。

技术总结
本公开提出了一种推送指数预测模型的训练方法和推送内容的获取方法，涉及自然语言处理和深度学习等人工智能领域，包括获取待训练的候选组合模型，对第一资源样本和第二资源样本分别进行部分特征掩盖，得到第一资源样本的第一子样本集合以及第二资源样本的第二子样本集合，以对候选组合模型进行模型训练得到训练损失；根据训练损失对候选组合模型进行整体的参数调整，返回获取下一第一资源样本和下一第二资源样本对参数调整后的候选组合模型继续进行训练，直至训练结束得到训练好的目标推送指数预测模型和目标相似度识别模型。优化了模型的训练效果，提高了获取的中长尾用户的推送内容与中长尾用户的实际需求的匹配程度。

技术研发人员：吴学超,王爽旭,祝帅,刘星
受保护的技术使用者：北京百度网讯科技有限公司
技术研发日：
技术公布日：2024/2/1

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吴学超,王爽旭,祝帅,刘星
技术所有人：北京百度网讯科技有限公司
我是此专利的发明人

上一篇：基于图神经网络的水库水位预测方法与流程
上一篇：一种基于智能软开关的主动配电网控制方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。