本公开涉及数据分析领域,尤其涉及一种转化率预测方法、装置及存储介质。
背景技术:
1、目前电商产品推荐或者广告智能出价领域,推荐系统大多是通过预估用户点击率(click-through-rate,ctr)、转化率(click-value-rate,cvr)并对其进行合适的组合,达到给用户个性化推荐优质商品的目的。
2、预估cvr时,通常存在样本选择偏差(sample selection bias,ssb),数据稀疏性(data sparisity,ds)以及延时反馈(delayed feedback)的问题。近年来,许多学者对推荐系统中的转化率预测进行了大量研究,并提出了一种cvr预估模型——全空间建模的方法模型,用于改善上述问题。但目前cvr预估模型预测结果与真实预测结果差异较大,模型仍无法实现准确的个性化推荐。
技术实现思路
1、为克服相关技术中存在的问题,本公开提供一种转化率预测方法、装置及存储介质。
2、根据本公开实施例的第一方面,提供一种转化率预测方法,所述方法包括:
3、通过转化率预估教师模型,基于第一用户点击率表征和目标页面停留时长中的至少一项,以及用户行为特征,预测转化率的第一预测结果;通过转化率预估学生模型,基于所述第一预测结果、第二用户点击率表征,预测转化率的目标预测结果。
4、一种实施方式中,所述第一用户点击率表征由所述转化率预估教师模型基于所述用户行为特征得到。
5、一种实施方式中,所述方法还包括:
6、确定对所述第一预测结果进行逆向倾向评分加权的逆向倾向评分损失值;基于所述逆向倾向评分损失值对所述转化率预估教师模型进行约束,优化所述转化率预估教师模型。
7、一种实施方式中,所述确定对所述第一预测结果进行逆向倾向评分加权的逆向倾向评分损失值,包括:
8、预估第一转化概率与实际转化概率之间的第一交叉熵,所述第一转化概率由所述转化率预估教师模型基于所述第一用户点击率表征和所述停留时长中的至少一项,以及用户行为特征确定;基于点击标签、用户点击概率值以及所述第一交叉熵,确定对所述第一预测结果进行逆向倾向评分加权的逆向倾向评分损失值。
9、一种实施方式中,所述基于所述第一预测结果、第二用户点击率表征,预测转化率的目标预测结果,包括:
10、基于所述转化率预估学生模型中的孪生网络,分别确定转化率的第二预测结果和第三预测结果;确定所述第二预测结果与所述第三预测结果之间的散度,并确定所述第一预测结果与所述第二预测结果之间的第二交叉熵;基于所述散度以及所述第二交叉熵,确定满足置信度阈值条件的第一预测结果;基于所述满足置信度阈值条件的第一预测结果、第二用户点击率表征,预测转化率的目标预测结果。
11、根据本公开实施例第二方面,提供一种转化率预测装置,包括:
12、第一预测单元,用于通过转化率预估教师模型,基于第一用户点击率表征和目标页面停留时长中的至少一项,以及用户行为特征,预测转化率的第一预测结果;第二预测单元,用于通过转化率预估学生模型,基于所述第一预测结果、第二用户点击率表征,预测转化率的目标预测结果。
13、一种实施方式中,所述第一用户点击率表征由所述转化率预估教师模型基于所述用户行为特征得到。
14、一种实施方式中,所述第一预测单元还用于:
15、确定对所述第一预测结果进行逆向倾向评分加权的逆向倾向评分损失值;基于所述逆向倾向评分损失值对所述转化率预估教师模型进行约束,优化所述转化率预估教师模型。
16、一种实施方式中,所述第一预测单元采用如下方式确定对所述第一预测结果进行逆向倾向评分加权的逆向倾向评分损失值:
17、预估第一转化概率与实际转化概率之间的第一交叉熵,所述第一转化概率由所述转化率预估教师模型基于所述第一用户点击率表征和所述停留时长中的至少一项,以及用户行为特征确定;基于点击标签、用户点击概率值以及所述第一交叉熵,确定对所述第一预测结果进行逆向倾向评分加权的逆向倾向评分损失值。
18、一种实施方式中,所述第二预测单元采用如下方式基于所述第一预测结果、第二用户点击率表征,预测转化率的目标预测结果:
19、基于所述转化率预估学生模型中的孪生网络,分别确定转化率的第二预测结果和第三预测结果;确定所述第二预测结果与所述第三预测结果之间的散度,并确定所述第一预测结果与所述第二预测结果之间的第二交叉熵;基于所述散度以及所述第二交叉熵,确定满足置信度阈值条件的第一预测结果;基于所述满足置信度阈值条件的第一预测结果、第二用户点击率表征,预测转化率的目标预测结果。
20、根据本公开实施例第三方面,提供一种转化率预测装置,包括:
21、处理器;用于存储处理器可执行指令的存储器;
22、其中,所述处理器被配置为:执行第一方面或者第一方面任意一种实施方式中所述的转化率预测方法。
23、根据本公开实施例第四方面,提供一种存储介质,所述存储介质中存储有指令,当所述存储介质中的指令由终端的处理器执行时,使得终端能够执行第二方面或者第二方面任意一种实施方式中所述的转化率预测方法。
24、本公开的实施例提供的技术方案可以包括以下有益效果:通过转化率预估教师模型,利用用户点击率表征和目标页面的停留时长中的至少一项,预测转化率的第一预测结果。其中,将用户点击率表征作为一个特征进行转化率的预测,能够体现用户点击率对于转化率的影响,并且目标页面的停留时长能够一定程度上体现点击样本以及未点击样本之间的区别。转化率预估学生模型通过学习第一预测结果,以及调节知识蒸馏权重,降低点击率对转化率预估值的不利影响。在此基础上,ctr模型与cvr模型优化方向趋于一致,学生模型预测转化率的准确性得到提高。进一步的,对于电商场景,应用预估模型可以实现更加准确的个性化商品推荐。
25、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
1.一种转化率预测方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述第一用户点击率表征由所述转化率预估教师模型基于所述用户行为特征得到。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
4.根据权利要求3所述的方法,其特征在于,所述确定对所述第一预测结果进行逆向倾向评分加权的逆向倾向评分损失值,包括:
5.根据权利要求1所述的方法,其特征在于,所述基于所述第一预测结果、第二用户点击率表征,预测转化率的目标预测结果,包括:
6.一种转化率预测装置,其特征在于,包括:
7.根据权利要求6所述的转化率预测装置,其特征在于,所述第一用户点击率表征由所述转化率预估教师模型基于所述用户行为特征数据得到。
8.根据权利要求6所述的转化率预测装置,其特征在于,所述第一预测单元还用于:
9.根据权利要求8所述的转化率预测装置,其特征在于,所述第一预测单元采用如下方式确定对所述第一预测结果进行逆向倾向评分加权的逆向倾向评分损失值:
10.根据权利要求6所述的转化率预测装置,其特征在于,所述第二预测单元采用如下方式基于所述第一预测结果、第二用户点击率表征,预测转化率的目标预测结果:
11.一种转化率预测装置,其特征在于,包括:
12.一种存储介质,其特征在于,所述存储介质中存储有指令,当所述存储介质中的指令由终端的处理器执行时,使得终端能够执行权利要求1至5中任意一项所述的转化率预测方法。