本公开涉及计算机,尤其涉及自然语言理解、深度学习等人工智能,具体涉及一种多目标模型的生成方法、装置、电子设备及存储介质。
背景技术:
1、在直播场景中,可以通过对用户的下单行为进行学习来生成预测模型,之后就可以基于用户的观看行为,为用户个性化地预测各候选目标(如直播间)的推荐概率,进而可以基于预测的推荐概率,为用户进行个性化的目标推荐。
技术实现思路
1、本公开旨在至少在一定程度上解决相关技术中的技术问题之一。
2、为此,本公开的目的在于提出一种多目标模型的生成方法、装置、电子设备及存储介质,提高了多目标模型的鲁棒性和对各类型任务的适应性,提高了模型的可靠性和准确性。
3、根据本公开第一方面,提供了一种多目标模型的生成方法,包括:
4、获取训练数据集,其中,所述训练数据集中包括多种类型的训练数据及每个训练数据对应的标注标签,所述多种类型的训练数据包括直播数据,及所述直播数据关联的垂类数据;
5、根据每个所述训练数据的类型,确定每个所述训练数据关联的目标塔;
6、基于每个所述训练数据及对应的标注标签,对初始多目标模型中与该训练数据关联的目标塔进行训练,直至获取多目标模型,其中,所述多目标模型中至少包括转化率目标塔及第一观看时长目标塔。
7、根据本公开第二方面,提供了一种基于多目标模型的直播间排序方法,包括:
8、获取目标用户的第一特征及每个候选直播间的第二特征;
9、分别将每个所述候选直播间的第二特征及所述第一特征,输入多目标模型中,以获取该候选直播间在多个目标下的概率值,其中,所述多目标模型为基于如第一方面所述的方法生成的;
10、基于每个所述目标的权重,分别将每个所述候选直播间在多个目标下的推荐概率值进行融合,得到该候选直播间的得分;
11、根据每个所述候选直播间的得分,确定每个所述候选直播间在所述目标用户的用户界面中的显示顺序。
12、根据本公开第三方面,提供了一种多目标模型的生成装置,包括:
13、第一获取模块,用于获取训练数据集,其中,所述训练数据集中包括多种类型的训练数据及每个训练数据对应的标注标签,所述多种类型的训练数据包括直播数据,及所述直播数据关联的垂类数据;
14、第一确定模块,用于根据每个所述训练数据的类型,确定每个所述训练数据关联的目标塔;
15、第一处理模块,用于基于每个所述训练数据及对应的标注标签,对初始多目标模型中与该训练数据关联的目标塔进行训练,直至获取多目标模型,其中,所述多目标模型中至少包括转化率目标塔及第一观看时长目标塔。
16、根据本公开第四方面,提供了一种基于多目标模型的直播间排序装置,包括:
17、第二获取模块,用于获取目标用户的第一特征及每个候选直播间的第二特征;
18、第三获取模块,用于分别将每个所述候选直播间的第二特征及所述第一特征,输入多目标模型中,以获取该候选直播间在多个目标下的概率值,其中,所述多目标模型为由第三方面所述的装置生成的;
19、第二处理模块,用于基于每个所述目标的权重,分别将每个所述候选直播间在多个目标下的推荐概率值进行融合,得到该候选直播间的得分;
20、第二确定模块,用于根据每个所述候选直播间的得分,确定每个所述候选直播间在所述目标用户的用户界面中的显示顺序。
21、根据本公开的第三方面,提供了一种电子设备,包括:
22、至少一个处理器;以及
23、与所述至少一个处理器通信连接的存储器;其中,
24、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如第一方面所述的多目标模型的生成方法,或第二方面所述的基于多目标模型的直播间排序方法。
25、根据本公开第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如第一方面所述的多目标模型的生成方法,或第二方面所述的基于多目标模型的直播间排序方法。
26、根据本公开的第五方面,提供了一种计算机程序产品,包括计算机指令,所述计算机指令在被处理器执行时实现如第一方面所述的多目标模型的生成方法,或第二方面所述的基于多目标模型的直播间排序方法。
27、本公开提供的多目标模型的生成方法、装置、电子设备及存储介质,存在如下有益效果:
28、本公开中,通过利用直播间数据及关联的垂类数据,来分别训练初始多目标网络中与训练数据关联的目标塔,从而提高了得到的多目标模型的鲁棒性和对各类型任务的适应性,提高了模型的可靠性和准确性。
29、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
1.一种多目标模型的生成方法,包括:
2.如权利要求1所述的方法,其中,所述根据每个所述训练数据的类型,确定每个所述训练数据关联的目标塔,包括:
3.如权利要求1所述的方法,其中,在所述基于每个所述训练数据及对应的标注标签,对初始多目标模型中与该训练数据关联的目标塔进行训练之前,还包括:
4.如权利要求1所述的方法,其中,所述基于每个所述训练数据及对应的标注标签,对初始多目标模型中与该训练数据关联的目标塔进行训练,包括:
5.如权利要求4所述的方法,其中,在所述获取该多层感知网络输出的概率值之后,还包括:
6.如权利要求1-5任一所述的方法,其中,所述直播数据包括用户画像特征、用户历史行为特征、主播画像特征、主播行为特征及所述用户与所述主播的交互特征。
7.如权利要求1-5任一所述的方法,其中,所述多目标模型中至少包括转化率目标塔及第一观看时长目标塔。
8.一种基于多目标模型的直播间排序方法,包括:
9.如权利要求8所述的方法,其中,所述分别将每个所述候选直播间的第二特征及所述第一特征,输入多目标模型中,包括:
10.一种多目标模型的生成装置,包括:
11.如权利要求10所述的装置,其中,所述第一确定模块,具体用于:
12.如权利要求10所述的装置,其中,所述处理模块,还用于:
13.如权利要求10所述的装置,其中,所述处理模块,具体用于:
14.如权利要求13所述的装置,其中,所述处理模块,还用于:
15.如权利要求10-14任一所述的装置,其中,所述直播数据包括用户画像特征、用户历史行为特征、主播画像特征、主播行为特征及所述用户与所述主播的交互特征。
16.如权利要求10-14任一所述的装置,其中,所述多目标模型中至少包括转化率目标塔及第一观看时长目标塔。
17.一种基于多目标模型的直播间排序装置,包括:
18.如权利要求17所述的装置,其中,所述第三获取模块,具体用于:
19.一种电子设备,包括:
20.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,其中,所述计算机指令用于使所述计算机执行权利要求1-7中任一项所述的多目标模型的生成方法,或权利要求8-9中任一项所述的基于多目标模型的直播间排序方法。
21.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序在被处理器执行时实现如权利要求1-7中任一项所述的多目标模型的生成方法,或权利要求8-9中任一项所述的基于多目标模型的直播间排序方法。