一种针对不准确伪标签的双稳健去偏推荐方法及装置

文档序号:36896138发布日期:2024-02-02 21:28阅读:13来源:国知局
一种针对不准确伪标签的双稳健去偏推荐方法及装置

本发明涉及计算机,尤其涉及一种针对不准确伪标签的双稳健去偏推荐方法及装置。


背景技术:

1、去偏已经在推荐系统中广泛研究。由于去偏,许多推荐系统中的任务得到了显著发展,例如评分预测,点击后转化率预测,查看后点击且转化率预测,以及提升建模。这些任务的一个重要且普遍的问题是,由于用户自我选择和系统过滤的原因,收集到的数据中的标签(例如,评分、点击、购买)总不是目标人群中标签的代表性样本。由于标签仅在收集到的数据中可观测,而在目标人群中缺失严重,因此这对于实现无偏学习构成了巨大的挑战。

2、为了解决这一问题,现有技术通常需要基于误差插补的方法,首先插补缺失的标签(称为伪标签),然后使用观察到的标签和伪标签训练预测模型。然而,由于标签插补模型是使用观察到的数据进行训练的,而应用于缺失数据中,因而难以获得准确的伪标签,从而导致次优的性能。


技术实现思路

1、鉴于此,本发明的实施例提供了一种针对不准确伪标签的双稳健去偏推荐方法,以消除或改善现有技术中存在的一个或更多个缺陷。

2、本发明的一个方面提供了一种针对不准确伪标签的双稳健去偏推荐方法,所述方法的步骤包括:

3、基于预设的训练数据集对第一倾向性得分模型进行训练,基于完成训练的第一倾向性得分模型计算第一损失函数,基于第一损失函数对第二倾向性得分模型进行训练,所述第二倾向性得分模型用于输出预测的倾向性得分值;

4、基于所述第二倾向性得分模型输出的倾向性得分值计算第二损失函数,基于第二损失函数对插补模型进行训练,所述插补模型用于输出预测的伪标签值;

5、基于插补模型输出预测的伪标签值和完成训练的第二倾向性得分模型输出预测的倾向性得分值计算第三损失函数,基于第三损失函数对预测模型进行训练;

6、基于完成训练的所述预测模型进行结果预测。

7、采用上述方案,首先,本方案的插补模型并不基于数据集直接进行训练,而是通过结合第二倾向性得分模型输出的倾向性得分值和数据集联合进行训练,提高标签的准确度,进一步地,本方案预测模型的训练过程中,基于完成训练的插补模型输出伪标签值和完成训练的第二倾向性得分模型输出的倾向性得分值计算第三损失函数,通过两个模型联合对第三个模型进行训练,并不是简单通过补充标签进行训练,提高了最终预测模型的预测准确度。

8、在本发明的一些实施方式中,在基于完成训练的第一倾向性得分模型计算第一损失函数的步骤中,

9、基于所述预测模型对于输入的训练数据输出的预测值和训练数据的计算标签值计算第四损失函数;

10、基于所述第四损失函数的值和完成训练的第一倾向性得分模型计算第一损失函数。

11、在本发明的一些实施方式中,在基于所述预测模型对于输入的训练数据输出的预测值和训练数据的计算标签值计算第四损失函数的步骤中,基于如下公式计算第四损失函数:

12、

13、其中,表示用户u和商品i的组合对应的计算标签值为r的训练数据对应的第四损失函数,表示预测模型对于用户u和商品i的组合对应的训练数据输出的预测值。

14、在本发明的一些实施方式中,在基于所述第四损失函数的值和完成训练的第一倾向性得分模型计算第一损失函数的步骤中,基于如下公式计算第一损失函数:

15、

16、其中,表示第一损失函数,表示所有用户集合,u表示任一用户,表示所有商品集合,i表示任一商品,表示完成训练的第一倾向性得分模型对于用户u和商品i的组合对应的训练数据输出的初始倾向性得分,表示第二倾向性得分模型对于用户u和商品i的组合对应的训练数据输出的倾向性得分值,γ表示预设的权衡超参数,λu和λi分别表示对应用户u和商品i预设的计算参数,表示用户u和商品i的组合带入计算标签值为1的训练数据得到的第四损失函数,表示用户u和商品i的组合带入计算标签值为0的训练数据得到的第四损失函数,ou,i表示训练数据的标签指示值。

17、在本发明的一些实施方式中,在基于所述第二倾向性得分模型输出的倾向性得分值计算第二损失函数的步骤中,

18、基于实际标签值和所述预测模型对于输入的训练数据输出的预测值计算第五损失函数;

19、基于插补模型输出预测的伪标签值和所述预测模型对于输入的训练数据输出的预测值计算第六损失函数;

20、基于所述第五损失函数、第六损失函数和所述第二倾向性得分模型输出的倾向性得分值计算第二损失函数。

21、在本发明的一些实施方式中,在基于所述第五损失函数、第六损失函数和所述第二倾向性得分模型输出的倾向性得分值计算第二损失函数的步骤中,根据如下公式计算第二损失函数:

22、

23、其中,表示第二损失函数,d表示用户和商品的组合总数量,表示所有用户集合,u表示任一用户,表示所有商品集合,i表示任一商品,δu,i表示第五损失函数,表示第六损失函数,ou,i表示训练数据的标签指示值,表示第二倾向性得分模型对于用户u和商品i的组合对应的训练数据输出的倾向性得分值。

24、在具体实施过程中,标签指示值表示该用户商品组合的实际标签值是否被观测到,若该用户商品组合的实际标签值被观测到,则标签指示值为1;否则为0,表示用户商品组合的实际标签值未被观测到。

25、在本发明的一些实施方式中,在基于插补模型输出预测的伪标签值和训练数据的实际标签值计算第五损失函数的步骤中,根据如下公式计算第五损失函数:

26、

27、其中,ru,i表示用户u和商品i对应的实际标签值,δu,i对于用户u和商品i的组合对应的训练数据对应的第五损失函数,表示用户u和商品i的组合带入计算标签值为1的训练数据得到的第四损失函数,表示用户u和商品i的组合带入计算标签值为0的训练数据得到的第四损失函数;

28、在基于插补模型输出预测的伪标签值和所述预测模型对于输入的训练数据输出的预测值计算第六损失函数的步骤中,根据如下公式计算第六损失函数:

29、

30、其中,表示插补模型对于用户u和商品i的组合输出预测的伪标签值,对于用户u和商品i的组合对应的训练数据对应的第六损失函数。

31、在本发明的一些实施方式中,在基于插补模型输出预测的伪标签值和完成训练的第二倾向性得分模型输出预测的倾向性得分值计算第三损失函数的步骤中,基于如下公式计算第三损失函数:

32、

33、其中,表示第三损失函数,|d|表示用户和商品的组合总数量,表示所有用户集合,u表示任一用户,表示所有商品集合,i表示任一商品,δu,i表示第五损失函数,表示第六损失函数,ou,i表示训练数据的标签指示值,表示第二倾向性得分模型对于用户u和商品i的组合对应的训练数据输出的倾向性得分值。

34、在本发明的一些实施方式中,在基于完成训练的所述预测模型进行结果预测的步骤中,所述预测模型需要完成预设轮次的训练,在每轮次的训练中顺序执行第二倾向性得分模型、插补模型和的预测模型训练。

35、本发明的第二方面还提供一种针对不准确伪标签的双稳健去偏推荐装置,该装置包括计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机指令,所述处理器用于执行所述存储器中存储的计算机指令,当所述计算机指令被处理器执行时该装置实现如前所述方法所实现的步骤。

36、本发明的第三方面还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时以实现前述针对不准确伪标签的双稳健去偏推荐方法所实现的步骤。

37、本发明的附加优点、目的,以及特征将在下面的描述中将部分地加以阐述,且将对于本领域普通技术人员在研究下文后部分地变得明显,或者可以根据本发明的实践而获知。本发明的目的和其它优点可以通过在说明书以及附图中具体指出并获得。

38、本领域技术人员将会理解的是,能够用本发明实现的目的和优点不限于以上具体所述,并且根据以下详细说明将更清楚地理解本发明能够实现的上述和其他目的。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1