本说明书实施例涉及计算机,尤其涉及一种训练相关性分析模型的方法和装置。
背景技术:
1、在计算机技术领域中,多种任务均涉及相关性分析。例如,在物品推荐任务中,可以基于用户与待推荐物品的相关性分析,对待推荐物品进行筛选和排序,从而筛选出与用户相关性高的物品并排序,提升整个推荐链路的效果。又例如,在信息搜索任务中,可以基于搜索信息与搜索结果的相关性分析,对搜索结果进行筛选和排序,从而筛选出与搜索信息相关性高的搜索结果并排序,提升信息搜索效果。基于此,对数据进行相关性分析并排序对于多种任务都是很有必要的。
技术实现思路
1、本说明书的实施例描述了一种训练相关性分析模型的方法和装置,本方法在训练相关性分析模型时,对基于相关性分析模型得到的多个预测分数进行平滑处理,使得到的处理分数的分布变得更加平滑。之后,基于多个处理分数和多个相关性标签之间的相关系数作为预测损失,调整相关性分析模型的模型参数。由于,多个处理分数的分布更加平滑,因此,更能体现模型多个预测分数之间的排序性,基于多个处理分数和多个相关性标签之间的预测损失调整模型参数,从而使训练得到的相关性分析模型输出的预测分数更加适用于排序。
2、根据第一方面,提供了一种训练相关性分析模型的方法,包括:获取样本数据,其中包括样本对象,待匹配的多项内容,以及上述样本对象与上述多项内容之间的多个相关性标签;将上述样本对象以及上述多项内容输入相关性分析模型,得到该样本对象与上述多项内容之间相关性的多个预测分数;对上述多个预测分数进行平滑处理,得到多个处理分数;确定上述多个处理分数和多个相关性标签之间的相关系数作为预测损失;以上述预测损失最小化为目标,调整上述相关性分析模型的模型参数。
3、根据第二方面,提供了一种相关性排序方法,包括:获取目标对象以及多项候选内容;将上述目标对象和上述多项候选内容输入相关性分析模型,得到该目标对象与上述多项候选内容之间相关性的多个预测分数;其中,上述相关性分析模型根据权利要求1的方法训练得到;根据上述多个预测分数,确定上述多项候选内容的排序结果。
4、根据第三方面,提供了一种训练相关性分析模型的装置,包括:第一获取单元,配置为,获取样本数据,其中包括样本对象,待匹配的多项内容,以及上述样本对象与上述多项内容之间的多个相关性标签;第一输入单元,配置为,将上述样本对象以及上述多项内容输入相关性分析模型,得到该样本对象与上述多项内容之间相关性的多个预测分数;平滑单元,配置为,对上述多个预测分数进行平滑处理,得到多个处理分数;确定单元,配置为,确定上述多个处理分数和多个相关性标签之间的相关系数作为预测损失;调整单元,配置为,以上述预测损失最小化为目标,调整上述相关性分析模型的模型参数。
5、根据第四方面,提供了相关性排序装置,包括:第二获取单元,配置为,获取目标对象以及多项候选内容;第二输入单元,配置为,将上述目标对象和上述多项候选内容输入相关性分析模型,得到该目标对象与上述多项候选内容之间相关性的多个预测分数;其中,上述相关性分析模型根据第一方面所描述的方法训练得到;排序单元,配置为,根据上述多个预测分数,确定上述多项候选内容的排序结果。
6、根据第五方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当上述计算机程序在计算机中执行时,令计算机执行如第一方面或第二方面中任一实现方式描述的方法。
7、根据第六方面,提供了一种计算设备,包括存储器和处理器,其特征在于,上述存储器中存储有可执行代码,上述处理器执行上述可执行代码时,实现如第一方面或第二方面中任一实现方式描述的方法。
8、根据本说明书实施例提供的训练相关性分析模型的方法和装置,样本数据包括样本对象、待匹配的多项内容,以及样本对象与多项内容之间的多个相关性标签。将样本对象以及多项内容输入相关性分析模型,得到样本对象与多项内容之间相关性的多个预测分数。之后,对多个预测分数进行平滑处理,得到多个处理分片。将多个处理分数和多个相关性标签之间的相关系数作为预测损失,以预测损失最小化为目标,调整相关性分析模型的模型参数。由于,多个处理分数的分布更加平滑,因此,更能体现模型多个预测分数之间的排序性,基于多个处理分数和多个相关性标签之间的预测损失调整模型参数,从而使训练得到的相关性分析模型输出的预测分数更加适用于排序。
1.一种训练相关性分析模型的方法,包括:
2.根据权利要求1所述的方法,其中,所述相关系数为斯皮尔曼相关系数。
3.根据权利要求1所述的方法,其中,对所述多个预测分数进行平滑处理,包括:
4.根据权利要求1所述的方法,其中,所述多个相关性标签根据所述样本对象与所述多项内容之间的排序标签转换得到。
5.根据权利要求1所述的方法,其中,所述样本对象包括目标用户,所述多项内容包括待推荐的多个物品;以及,
6.根据权利要求1所述的方法,其中,所述样本对象包括检索信息,所述多项内容包括多个检索结果;以及,
7.根据权利要求1所述的方法,其中,所述样本对象包括目标信息,所述多项内容包括多个标签;以及,
8.根据权利要求1所述的方法,其中,所述样本对象包括目标问题,所述多项内容包括多个答案信息;所述相关性分析模型通过预训练的语言模型实现,以及,
9.一种相关性排序方法,包括:
10.根据权利要求9所述的方法,其中,所述方法还包括:
11.一种训练相关性分析模型的装置,包括:
12.根据权利要求11所述的装置,其中,所述相关系数为斯皮尔曼相关系数。
13.根据权利要求11所述的装置,其中,所述平滑单元进一步配置为:
14.根据权利要求11所述的装置,其中,所述多个相关性标签根据所述样本对象与所述多项内容之间的排序标签转换得到。
15.根据权利要求11所述的装置,其中,所述样本对象包括目标用户,所述多项内容包括待推荐的多个物品;以及,所述第一输入单元进一步配置为:
16.根据权利要求11所述的装置,其中,所述样本对象包括检索信息,所述多项内容包括多个检索结果;以及,所述第一输入单元进一步配置为:
17.根据权利要求11所述的装置,其中,所述样本对象包括目标信息,所述多项内容包括多个标签;以及,所述第一输入单元进一步配置为:
18.根据权利要求11所述的装置,其中,所述样本对象包括目标问题,所述多项内容包括多个答案信息;所述相关性分析模型通过预训练的语言模型实现,以及,所述第一输入单元进一步配置为:
19.一种相关性排序装置,包括:
20.根据权利要求19所述的装置,其中,所述装置还包括:
21.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-10中任一项所述的方法。
22.一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-10中任一项所述的方法。