一种模型训练方法、内容推荐方法、装置及电子设备与流程

文档序号：35926200发布日期：2023-11-04 17:38阅读：17来源：国知局

本发明涉及内容推荐，特别是涉及一种模型训练方法、内容推荐方法、装置及电子设备。

背景技术：

1、在视频推荐领域，视频推荐系统通常存在多个分支入口，对应多个应用程序或者对应一个应用程序的多个接口，将每一分支对应一种场景。相关技术中，为了在不同场景中为用户准确的推荐视频，针对不同的场景，分别训练排序模型，然后，在不同的场景中利用针对该场景所训练的排序模型对待推荐视频进行排序，之后根据排序结果向用户推荐视频。

2、针对不同的场景，分别训练排序模型，模型训练成本高，且因排序模型是针对单一场景训练的，存在小场景流量小的问题，使得训练所采用的样本数量有限，可能导致排序模型训练不充分，进而影响视频推荐结果。

技术实现思路

1、本发明实施例的目的在于提供一种模型训练方法、内容推荐方法、装置及电子设备，以实现充分训练模型，为用户准确的推荐内容。具体技术方案如下：

2、在本发明实施的第一方面，首先提供了一种模型训练方法，所述方法包括：

3、获取关联同一内容数据库的不同应用程序下样本用户的第一用户属性特征、所述样本用户已访问样本内容的样本内容属性特征、以及所述样本用户访问所述样本内容时的样本上下文特征，所述样本用户对应有行为标签，所述行为标签用于表示所述样本用户访问所述样本内容的实际操作信息，所述样本上下文特征用于表征所述样本用户访问所述样本内容时的环境特征；

4、针对每一应用程序，获取该应用程序下所述样本用户的第二用户属性特征；

5、将该应用程序下所述样本用户的第二用户属性特征输入第一待训练模型中进行权重预测，得到该应用程序下所述样本用户的预测权重；

6、将所述样本用户的第一用户属性特征、所述样本内容属性特征以及所述样本上下文特征输入第二待训练模型中，利用所述预测权重对所述第二待训练模型的稀疏特征进行调整，对所述样本用户进行行为预测，得到该应用程序下所述样本用户针对所述样本内容的预测行为标签；

7、根据所述行为标签以及所述预测行为标签，计算所述第二待训练模型的损失，并根据所述损失对所述第一待训练模型以及所述第二待训练模型的参数进行调整。

8、在一种可能的实施方式中，所述第一用户属性特征包括：所述样本用户的用户id、年龄、性别、vip属性、登录属性、观看历史行为属性、点击历史行为属性以及长期画像、短期画像中的至少一种；所述样本内容属性特征包括：内容id、内容类型、内容上传用户id、内容上传用户属性中的至少一种；所述样本上下文特征包括：节假日、时间、地点、季节、天气中的至少一种。

9、在一种可能的实施方式中，所述行为标签包括：点击率、观看时长、评论率、点赞率以及完播率中的至少一种；所述第二用户属性特征包括：场景id，场景人均播放时长，所述样本用户的vip属性、登录属性、观看历史行为属性、点击历史行为属性以及长期画像、短期画像中的至少一种。

10、在一种可能的实施方式中，所述利用所述预测权重对所述第二待训练模型的稀疏特征进行调整，包括：

11、对所述样本用户的第一用户属性特征、所述样本内容属性特征以及所述样本上下文特征进行拼接，得到第二待训练模型的稀疏特征；

12、将所述预测权重作为所述第二待训练模型的稀疏特征的embedding权重。

13、在一种可能的实施方式中，所述第一待训练模型与所述第二待训练模型的结构相同。

14、在本发明实施的第二方面，提供了一种内容推荐方法，所述方法包括：

15、获取目标应用程序中目标用户的目标用户属性特征；

16、针对每一待排序内容，获取该待排序内容对应的候选用户属性特征、候选内容属性特征以及候选上下文特征；

17、将所述目标用户属性特征输入预先训练好的第一模型中进行权重预测，得到所述目标用户在所述目标应用程序中的目标预测权重；

18、针对每一待排序内容，将该待排序内容对应的候选用户属性特征、候选内容属性特征以及候选上下文特征输入预先训练好的第二模型中，利用所述目标预测权重对所述第二模型的稀疏特征进行调整，对所述目标用户进行行为预测，得到所述目标用户在所述目标应用程序中针对该待排序内容的目标行为标签；其中，所述目标行为标签用于表示所述目标用户对待排序内容的实际操作信息；所述预先训练好的第一模型和所述预先训练好的第二模型为采用上述第一方面所述的方法训练得到的；

19、基于各目标行为标签，计算各待排序内容的得分；

20、根据所述得分对各所述待排序内容进行排序，并根据排序结果，向所述目标用户推荐目标内容。

21、在一种可能的实施方式中，所述目标用户属性特征包括：场景id，场景人均播放时长，所述目标用户的vip属性、登录属性、观看历史行为属性、点击历史行为属性以及长期画像、短期画像中的至少一种；所述候选用户属性特征包括：用户点击率、平均播放时长、点赞率中的至少一种；所述候选内容属性特征包括：内容id、内容类型、内容上传用户id、内容上传用户属性中的至少一种；所述候选上下文特征包括：当前时间、地点、天气、网络环境中的至少一种；所述目标行为标签包括：点击率、观看时长、评论率、点赞率以及完播率中的至少一种。

22、在一种可能的实施方式中，所述利用所述目标预测权重对所述第二模型的稀疏特征进行调整，包括：

23、对所述待排序内容对应的候选用户属性特征、候选内容属性特征以及候选上下文特征进行拼接，得到第二模型的稀疏特征；

24、将所述目标预测权重作为所述第二模型的稀疏特征的embedding权重。

25、在本发明实施的第三方面，还提供了一种模型训练装置，所述装置包括：

26、第一数据获取模块，用于获取关联同一内容数据库的不同应用程序下样本用户的第一用户属性特征、所述样本用户已访问样本内容的样本内容属性特征、以及所述样本用户访问所述样本内容时的样本上下文特征，所述样本用户对应有行为标签，所述行为标签用于表示所述样本用户访问所述样本内容的实际操作信息，所述样本上下文特征用于表征所述样本用户访问所述样本内容时的环境特征；

27、第二数据获取模块，用于针对每一应用程序，获取该应用程序下所述样本用户的第二用户属性特征；

28、第一权重预测模块，用于将该应用程序下所述样本用户的第二用户属性特征输入第一待训练模型中进行权重预测，得到该应用程序下所述样本用户的预测权重；

29、第一行为预测模块，用于将所述样本用户的第一用户属性特征、所述样本内容属性特征以及所述样本上下文特征输入第二待训练模型中，利用所述预测权重对所述第二待训练模型的稀疏特征进行调整，对所述样本用户进行行为预测，得到该应用程序下所述样本用户针对所述样本内容的预测行为标签；

30、模型训练模块，用于根据所述行为标签以及所述预测行为标签，计算所述第二待训练模型的损失，并根据所述损失对所述第一待训练模型以及所述第二待训练模型的参数进行调整。

31、在本发明实施的第四方面，还提供了一种内容推荐装置，所述装置包括：

32、第三数据获取模块，用于获取目标应用程序中目标用户的目标用户属性特征；

33、第四数据获取模块，用于针对每一待排序内容，获取该待排序内容对应的候选用户属性特征、候选内容属性特征以及候选上下文特征；

34、第二权重预测模块，用于将所述目标用户属性特征输入预先训练好的第一模型中进行权重预测，得到所述目标用户在所述目标应用程序中的目标预测权重；

35、第二行为预测模块，用于针对每一待排序内容，将该待排序内容对应的候选用户属性特征、候选内容属性特征以及候选上下文特征输入预先训练好的第二模型中，利用所述目标预测权重对所述第二模型的稀疏特征进行调整，对所述目标用户进行行为预测，得到所述目标用户在所述目标应用程序中针对该待排序内容的目标行为标签；其中，所述目标行为标签用于表示所述目标用户对待排序内容的实际操作信息；所述预先训练好的第一模型和所述预先训练好的第二模型为采用上述第一方面所述的方法训练得到的；

36、得分计算模块，用于基于各目标行为标签，计算各待排序内容的得分；

37、内容推荐模块，用于根据所述得分对各所述待排序内容进行排序，并根据排序结果，向所述目标用户推荐目标内容。

38、在本发明实施的又一方面，还提供了一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

39、存储器，用于存放计算机程序；

40、处理器，用于执行存储器上所存放的程序时，实现上述任一所述的方法的步骤。

41、在本发明实施的又一方面，还提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述任一所述的方法的步骤。

42、在本发明实施的又一方面，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述任一所述的方法的步骤。

43、本发明实施例提供的一种模型训练方法、内容推荐方法、装置及电子设备，针对每一应用程序，通过该应用程序下样本用户的第二用户属性特征训练第一待训练模型，以预测该应用程序下样本用户的权重，利用预测的权重对第二待训练模型的稀疏特征进行调整，并利用关联同一内容数据库的不同应用程序下样本用户的第一用户属性特征、样本内容属性特征、样本上下文特征以及样本用户对应的行为标签综合训练第一待训练模型和第二待训练模型。因是利用关联同一内容数据库的不同应用程序下样本用户的第一用户属性特征、样本内容属性特征、样本上下文特征以及样本用户对应的行为标签综合训练第一待训练模型和第二待训练模型，实现了第一待训练模型和第二待训练模型的充分训练，且，针对不同的应用程序，通过第一待训练模型利用该应用程序下样本用户的第二用户属性特征，对该应用程序下样本用户的权重进行预测，并利用该预测的权重对第二待训练模型的稀疏特征进行调整，使得第二待训练模型能够更准确的匹配该应用程序下样本用户的兴趣、偏好，捕获不同用户的偏差，进而使样本用户对内容的操作信息预测的更准确、更具有针对性，达到了不同应用程序不同用户使用不同的第二模型来预测其对内容的操作，实现千人千模的目的，能够为用户更准确的推荐内容。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：赵明明查强
技术所有人：北京奇艺世纪科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。