本技术涉及计算机,具体涉及一种模型训练方法、装置、计算机设备和存储介质。
背景技术:
1、在内容检索场景中,可以通过样本数据对内容检索模型进行训练,以使得训练后模型能够满足预期的内容检索要求,例如,使得训练后模型能够确定与检索内容所匹配的检索结果内容。
2、在对相关技术的研究和实践过程中,本技术的发明人发现,目前基于内容特征实现的内容检索模型还有待改进,例如随着训练阶段的进展,检索内容特征与检索结果内容特征之间会产生较大的语义偏离,导致检索精度下降;又如,若检索内容特征与检索结果内容特征之间差异较大时,检索准确度亦会对应下降。
技术实现思路
1、本技术实施例提供一种模型训练方法、装置、计算机设备和存储介质,可以改善针对内容检索模型的模型训练,提高内容检索模型的内容检索精确度
2、本技术实施例提供一种模型训练方法,包括:
3、获取样本检索内容、以及与所述样本检索内容匹配的样本检索结果内容;
4、通过内容检索模型对所述样本检索内容与所述样本检索结果内容进行特征提取处理,得到多个不同特征粒度的特征信息,所述特征信息包括检索内容特征与检索结果内容特征;
5、通过所述内容检索模型对所述检索内容特征与所述检索结果内容特征进行特征量化处理,得到各个特征粒度的量化后特征信息;
6、基于所述特征信息与所述量化后特征信息,计算所述各个特征粒度对应的检索语义损失;
7、基于所述各个特征粒度对应的检索语义损失,对所述内容检索模型进行模型训练。
8、相应的,本技术实施例还提供一种内容检索方法,包括:
9、获取待检索内容;
10、通过训练后的内容检索模型对所述待检索内容进行特征提取处理,得到多个不同特征粒度的待检索内容特征;
11、基于各个特征粒度的待检索内容特征,计算所述待检索内容与候选检索结果内容在各个特征粒度对应的相似度;
12、基于所述各个特征粒度对应的相似度,确定所述待检索内容对应的检索结果内容。
13、相应的,本技术实施例还提供一种模型训练装置,包括:
14、样本获取单元,用于获取样本检索内容、以及与所述样本检索内容匹配的样本检索结果内容;
15、特征提取单元,用于通过内容检索模型对所述样本检索内容与所述样本检索结果内容进行特征提取处理,得到多个不同特征粒度的特征信息,所述特征信息包括检索内容特征与检索结果内容特征;
16、特征量化单元,用于通过所述内容检索模型对所述检索内容特征与所述检索结果内容特征进行特征量化处理,得到各个特征粒度的量化后特征信息;
17、损失计算单元,用于基于所述特征信息与所述量化后特征信息,计算所述各个特征粒度对应的检索语义损失;
18、模型训练单元,用于基于所述各个特征粒度对应的检索语义损失,对所述内容检索模型进行模型训练。
19、在一实施例中,所述损失计算单元,包括:
20、双向计算子单元,用于基于所述特征信息与所述量化后特征信息,计算所述各个特征粒度在第一语义检索方向对应的第一检索语义损失,以及所述各个特征粒度在第二语义检索方向对应的第二检索语义损失;
21、损失聚合子单元,用于对所述第一检索语义损失与所述第二检索语义损失进行损失聚合处理;
22、损失确定子单元,用于根据处理结果,确定所述各个特征粒度对应的检索语义损失。
23、在一实施例中,所述双向计算子单元,用于:
24、根据所述第一语义检索方向,从所述特征信息中确定目标特征,并从所述量化后特征信息中确定目标量化后特征,所述目标特征与所述目标量化后特征对应不同的特征模态;根据特征粒度,对所述目标特征与所述目标量化后特征进行特征对齐处理;基于对齐后的目标特征与对齐后的目标量化后特征之间的特征相似度,计算所述各个特征粒度在第一语义检索方向对应的第一检索语义损失。
25、在一实施例中,所述内容检索模型包括与各个特征粒度对应的特征量化模块,每个所述特征量化模块用于对对应特征粒度的特征信息进行特征量化处理;所述特征量化单元,包括:
26、特征划分子单元,用于通过所述特征量化模块,对对应的检索内容特征进行特征划分处理,得到划分后的子检索内容特征;
27、特征量化子单元,用于对所述划分后的子检索内容特征进行特征量化处理,得到量化后的子检索内容特征;
28、特征融合子单元,用于对所述量化后的子检索内容特征进行特征融合处理,以获取各个特征粒度的量化后检索内容特征。
29、在一实施例中,所述特征粒度包括粗粒度,所述内容检索模型包括针对所述样本检索结果内容的第一粗粒度特征提取模块;所述特征提取单元,包括:
30、第一获取子单元,用于获取所述样本检索结果内容在至少一个内容模态对应的模态内容特征;
31、特征编码子单元,用于通过所述第一粗粒度特征提取模块,基于自注意力机制对所述模态内容特征进行特征编码处理,得到各个内容模态对应的编码后特征;
32、特征聚合子单元,用于对所述各个内容模态对应的编码后特征进行特征聚合处理,得到所述样本检索结果内容的粗粒度的检索结果内容特征。
33、在一实施例中,所述特征粒度包括粗粒度,所述内容检索模型包括针对所述样本检索内容的第二粗粒度特征提取模块;所述特征提取单元,包括:
34、特征提取子单元,用于通过所述第二粗粒度特征提取模块,提取所述样本检索内容的语义表征特征;
35、特征投影子单元,用于基于自注意力机制,对所述语义表征特征进行特征投影处理,得到所述样本检索内容的粗粒度的检索内容特征。
36、在一实施例中,所述特征粒度包括细粒度,所述内容检索模型包括所述样本检索内容与所述样本检索结果内容共享的细粒度特征提取模块;所述特征提取单元,包括:
37、第二获取子单元,用于获取所述样本检索内容与所述样本检索结果内容的多个待聚类内容特征;
38、特征聚类子单元,用于通过所述细粒度特征提取模块,对所述待聚类内容特征进行特征聚类处理;
39、信息确定子单元,用于基于聚类结果,确定多个不同细粒度的特征信息,所述特征信息包括检索内容特征与检索结果内容特征。
40、在一实施例中,所述第二获取子单元,用于:
41、确定所述样本检索结果内容的至少一个内容模态;提取所述样本检索结果内容与所述内容模态对应的模态内容特征;根据所述模态内容特征,确定所述样本检索结果内容的多个待聚类内容特征。
42、在一实施例中,所述第二获取子单元,用于:
43、对所述样本检索内容进行内容划分处理,得到所述样本检索内容的至少一个子内容;提取所述子内容对应的子内容特征;根据所述子内容特征,确定所述样本检索内容的多个待聚类内容特征。
44、在一实施例中,所述模型训练单元,包括:
45、损失聚合子单元,用于根据所述特征粒度的粒度类型,对所述各个特征粒度对应的检索语义损失进行损失聚合处理;
46、模型训练子单元,用于基于聚合后的检索语义损失,对所述内容检索模型进行模型训练。
47、相应的,本技术实施例还提供一种内容检索装置,包括:
48、内容获取单元,用于获取待检索内容;
49、提取处理单元,用于通过训练后的内容检索模型对所述待检索内容进行特征提取处理,得到多个不同特征粒度的待检索内容特征;
50、相似计算单元,用于基于各个特征粒度的待检索内容特征,计算所述待检索内容与候选检索结果内容在各个特征粒度对应的相似度;
51、结果确定单元,用于基于所述各个特征粒度对应的相似度,确定所述待检索内容对应的检索结果内容。
52、在一实施例中,所述相似计算单元,包括:
53、量化确定子单元,用于确定所述候选检索结果内容在所述各个特征粒度对应的量化后检索结果内容特征;
54、相似度计算子单元,用于根据特征粒度,计算所述待检索内容特征与所述量化后检索结果内容特征之间的相似度,得到各个特征粒度对应的相似度。
55、相应的,本技术实施例还提供一种存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如本技术实施例所示的模型训练方法或内容检索方法中的步骤。
56、相应的,本技术实施例还提供一种计算机设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如本技术实施例所示的模型训练方法或内容检索方法中的步骤。
57、本技术实施例可以获取样本检索内容、以及与所述样本检索内容匹配的样本检索结果内容;通过内容检索模型对所述样本检索内容与所述样本检索结果内容进行特征提取处理,得到多个不同特征粒度的特征信息,所述特征信息包括检索内容特征与检索结果内容特征;通过所述内容检索模型对所述检索内容特征与所述检索结果内容特征进行特征量化处理,得到各个特征粒度的量化后特征信息;基于所述特征信息与所述量化后特征信息,计算所述各个特征粒度对应的检索语义损失;基于所述各个特征粒度对应的检索语义损失,对所述内容检索模型进行模型训练。
58、该方案能够联合内容的特征学习、以及特征的量化学习,使得特征量化的模块加入到了特征学习的训练中,这样的话,即可在模型训练优化的目标中加入特征量化的语义损失,从而使得样本检索内容与样本检索结果内容的语义信息能够更好地保留在量化后特征中,避免了由于特征学习与特征量化独立执行时,由特征量化所带来的量化损失使得样本检索内容的量化后内容特征与样本检索结果内容的量化后内容特征之间产生较大的语义偏离。并且,该方案还考虑到了在检索内容特征与检索结果内容特征之间差异较大时,例如,在检索内容特征与检索结果内容特征对应不同特征模态时,通过提取多个不同特征粒度的特征信息,以使得后续可以根据多个特征粒度进行特征对齐,从而降低内容特征之间的模态差异,并实现更好的内容检索效果。