本公开涉及推荐,尤其涉及一种视频召回模型训练方法、视频推荐方法及相关装置。
背景技术:
1、本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
2、在视频推荐系统中,常见的流程为召回、粗排、精排和重排四个阶段。其中,召回是推荐系统中的第一个阶段,主要是根据用户特征和视频特征,从海量的视频库里,快速找回一小部分用户潜在感兴趣的视频,然后交给排序环节。
3、然而,现有技术中的视频召回模型训练方法,通常仅关注单一目标,目标例如完播率或播放时长,即仅能通过预测用户针对视频的完播率或时长中的一个,以判定用户是否对视频潜在感兴趣,不能同时关注多个目标,例如不能同时预测用户针对视频的完播率和时长,以判定用户是否对视频潜在感兴趣,因此准确率较低。
技术实现思路
1、有鉴于此,本公开的目的在于提出一种视频召回模型训练方法、视频推荐方法及相关装置,至少在一定程度上解决相关技术中的技术问题之一。
2、基于上述目的,本公开示例性实施例第一方面提供了一种视频召回模型训练方法,包括:
3、获取训练用视频信息、训练用用户信息,以及所述训练用视频信息和所述训练用用户信息对应的训练用用户针对训练用视频的真实观看反馈信息,其中,所述真实观看反馈信息针对至少两个目标;
4、根据所述训练用视频信息和所述训练用用户信息,基于预先构建的视频召回模型,预测训练用用户针对训练用视频的预测观看反馈信息,其中,所述预测观看反馈信息与所述真实观看反馈信息针对的目标相同;
5、根据所述真实观看反馈信息和所述预测观看反馈信息,基于预设的损失函数,训练所述视频召回模型。
6、基于同一发明构思,本公开示例性实施例第二方面提供了一种视频推荐方法,包括:
7、获取目标用户的用户信息;
8、获取若干备选视频信息;
9、根据所述用户信息和所述备选视频信息,基于如第一方面所述的视频召回模型,得到召回视频信息;
10、根据所述召回视频信息,向所述用户进行视频推荐。
11、基于同一发明构思,本公开示例性实施例第三方面提供了一种视频召回模型训练装置,包括:
12、训练数据获取模块,被配置为获取训练用视频信息、训练用用户信息,以及所述训练用视频信息和所述训练用用户信息对应的训练用用户针对训练用视频的真实观看反馈信息,其中,所述真实观看反馈信息针对至少两个目标;
13、观看反馈信息预测模块,被配置为根据所述训练用视频信息和所述训练用用户信息,基于预先构建的视频召回模型,预测训练用用户针对训练用视频的预测观看反馈信息,其中,所述预测观看反馈信息与所述真实观看反馈信息针对的目标相同;
14、模型训练模块,被配置为根据所述真实观看反馈信息和所述预测观看反馈信息,基于预设的损失函数,训练所述视频召回模型。
15、基于同一发明构思,本公开示例性实施例第四方面提供了一种视频推荐装置,包括:
16、用户信息获取模块,被配置为获取目标用户的用户信息;
17、视频信息获取模块,被配置为获取若干备选视频信息;
18、视频召回模块,被配置为根据所述用户信息和所述备选视频信息,基于如第一方面所述的视频召回模型,得到召回视频信息;
19、视频推荐模块,被配置为根据所述召回视频信息,向所述用户进行视频推荐。
20、基于同一发明构思,本公开示例性实施例第五方面提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所述的方法或如第二方面所述的方法。
21、基于同一发明构思,本公开示例性实施例第六方面提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使计算机执行如第一方面所述的方法或如第二方面所述的方法。
22、基于同一发明构思,本公开示例性实施例第七方面提供了一种计算机程序产品,包括计算机程序指令,当所述计算机程序指令在计算机上运行时,使得计算机执行如第一方面所述的方法或如第二方面所述的方法。
23、从上面所述可以看出,本公开实施例提供的视频召回模型训练方法、视频推荐方法及相关装置,视频召回模型训练方法,包括:获取训练用视频信息、训练用用户信息,以及训练用视频信息和训练用用户信息对应的训练用用户针对训练用视频的真实观看反馈信息,其中,真实观看反馈信息针对至少两个目标;根据训练用视频信息和训练用用户信息,基于预先构建的视频召回模型,预测训练用用户针对训练用视频的预测观看反馈信息,其中,预测观看反馈信息与真实观看反馈信息针对的目标相同;根据真实观看反馈信息和预测观看反馈信息,基于预设的损失函数,训练视频召回模型。通过本公开,提高了视频召回及视频推荐的准确性。
1.一种视频召回模型训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
3.根据权利要求2所述的方法,其特征在于,所述每一维度的数值表征针对目标的完成情况,包括:
4.根据权利要求1所述的方法,其特征在于,所述训练用视频信息,包括以下至少一种:
5.根据权利要求1所述的方法,其特征在于,所述训练用用户信息,包括以下至少一种:
6.根据权利要求1所述的方法,其特征在于,所述真实观看反馈信息与所述预测观看反馈信息,均包括以下至少一种:
7.根据权利要求1所述的方法,其特征在于,所述损失函数,包括:
8.一种视频推荐方法,其特征在于,包括:
9.根据权利要求8所述的方法,其特征在于,所述获取若干备选视频信息,包括:
10.根据权利要求8所述的方法,其特征在于,所述根据所述召回视频信息,向所述用户进行视频推荐,包括:
11.一种视频召回模型训练装置,其特征在于,包括:
12.一种视频推荐装置,其特征在于,包括:
13.一种电子设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1至7任意一项所述的方法或如权利要求8至10任意一项所述的方法。
14.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使计算机执行如权利要求1至7任意一项所述的方法或如权利要求8至10任意一项所述的方法。
15.一种计算机程序产品,其特征在于,包括计算机程序指令,当所述计算机程序指令在计算机上运行时,使得计算机执行如权利要求1至7任意一项所述的方法或如权利要求8至10任意一项所述的方法。