双塔神经网络模型的训练方法、相似度的确定方法与流程

文档序号:35932098发布日期:2023-11-05 09:24阅读:110来源:国知局
双塔神经网络模型的训练方法、相似度的确定方法与流程

本申请涉及计算机领域,尤其涉及一种双塔神经网络模型的训练方法、相似度的确定方法。


背景技术:

1、目前对于相似度的计算,通常是通过人工筛选出特定特征组合来确定用户之间的相似度。但人工筛选的方案只能筛选出指定特征组合的用户,且用户间相似度不可比,无法满足当前复杂场景下的相似度计算需求。


技术实现思路

1、本申请提供了一种双塔神经网络模型的训练方法、相似度的确定方法,以解决现有技术中通过人工筛选出特定特征组合来确定用户之间的相似度,导致无法满足当前复杂场景下的相似度计算需求。

2、第一方面,本申请提供了一种一种双塔神经网络模型的训练方法,构造训练集,其中,所述训练集中包括多组用户特征,每一组用户特征中包括构成正样本对所对应的至少两个用户特征以及构成负样本对所对应的至少两个用户特征,所述正样本对中的用户特征为同一类型的相同用户特征,所述负样本对中的用户特征为所述同一类型的不同用户特征;所述用户特征包括所述用户的属性信息,以及用户与保险业务关联的行为特征;基于所述训练集对双塔神经网络模型进行训练,以使所述神经网络模型的损失值小于预设阈值,其中,在基于所述训练集对双塔神经网络模型进行训练的过程中,是将同一组正样本对和负样本对中的主用户特征输入双塔神经网络模型的主塔模型中,将同一组正样本对和负样本对中的副用户特征输入双塔神经网络模型的副塔模型中。

3、第二方面,本申请提供了一种基于双塔神经网络模型进行相似度的确定方法,包括:将第一保险用户的第一用户特征输入双塔神经网络模型中的主塔模型,输出第一用户特征向量;将第二保险用户的第二用户特征输入所述双塔神经网络模型中的副塔模型,输出第二用户特征向量;基于所述第一用户特征向量和所述第二用户特征向量确定所述第一保险用户与所述第二保险用户之间的相似度;其中,所述第一保险用户特征包括所述第一保险用户的属性信息,以及所述第一保险用户与所述保险业务关联的行为特征;所述第二保险用户特征包括所述第二保险用户的属性信息,以及所述第二保险用户与所述保险业务关联的行为特征。

4、第三方面,提供了一种双塔神经网络模型的训练装置,包括:构造模块,用于构造训练集,其中,所述训练集中包括多组用户特征,每一组用户特征中包括构成正样本对所对应的至少两个用户特征以及构成负样本对所对应的至少两个用户特征,所述正样本对中的用户特征为同一类型的相同用户特征,所述负样本对中的用户特征为所述同一类型的不同用户特征;所述用户特征包括所述用户的属性信息,以及用户与保险业务关联的行为特征;训练模块,用于基于所述训练集对双塔神经网络模型进行训练,以使所述神经网络模型的损失值小于预设阈值,其中,在基于所述训练集对双塔神经网络模型进行训练的过程中,是将同一组正样本对和负样本对中的主用户特征输入双塔神经网络模型的主塔模型中,将同一组正样本对和负样本对中的副用户特征输入双塔神经网络模型的副塔模型中。

5、第四方面,提供了一种基于双塔神经网络模型进行相似度的确定装置,包括:第一输入模块,用于将第一保险用户的第一用户特征输入所述双塔神经网络模型中的主塔模型,输出第一用户特征向量;第二输入模块,用于将第二保险用户的第二用户特征输入所述双塔神经网络模型中的副塔模型,输出第二用户特征向量;第一确定模块,用于基于所述第一用户特征向量和所述第二用户特征向量确定所述第一保险用户与所述第二保险用户之间的相似度;其中,所述第一保险用户特征包括所述第一保险用户的属性信息,以及所述第一保险用户与所述保险业务关联的行为特征;所述第二保险用户特征包括所述第二保险用户的属性信息,以及所述第二保险用户与所述保险业务关联的行为特征。

6、第五方面,提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;

7、存储器,用于存放计算机程序;

8、处理器,用于执行存储器上所存放的程序时,实现如第一方面任一项实施例所述的方法的步骤,或实现如第二方面任一项实施例所述的方法的步骤。

9、第六方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面任一项实施例所述的方法的步骤,或实现如第二方面任一项实施例所述的方法的步骤。

10、本申请实施例提供的上述技术方案与现有技术相比具有如下优点:

11、本申请实施例中的训练集能够涵盖各种与保险业务关联的行为特征,即能够全面包括用户特征以适应用户转化行为较为稀疏的保险场景,而且训练集中的正负样本对也可以是根据不同的任务或需求进行相应的调整,进而能够基于双塔神经网络模型计算出不同任务下用户之间的相似度;也就是说,本申请实施例中的双塔神经网络模型不仅能够适应户转化行为较为稀疏的保险场景,还能够适应不同任务下相似度的计算需求,满足了在不用应用场景下相似度计算需求。



技术特征:

1.一种双塔神经网络模型的训练方法,其特征在于,

2.根据权利要求1所述的方法,其特征在于,所述构造训练集包括:

3.根据权利要求2所述的方法,其特征在于,将所述正样本对和所述负样本对确定为一组样本对,基于多组样本对所对应的用户特征构造所述训练集包括:

4.根据权利要求2所述的方法,其特征在于,所述双塔神经网络模型的损失函数公式为:

5.根据权利要求4所述的方法,其特征在于,通过以下公式确定所述损失函数的收敛速度:

6.一种基于双塔神经网络模型进行相似度的确定方法,其特征在于,包括:

7.根据权利要求6所述的方法,其特征在于,所述方法还包括:

8.根据权利要求7所述的方法,其特征在于,所述方法还包括:

9.一种双塔神经网络模型的训练装置,其特征在于,包括:

10.一种基于双塔神经网络模型进行相似度的确定装置,其特征在于,包括:

11.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;

12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-5任一项所述方法的步骤,或实现权利要求6-8任一项所述方法的步骤。


技术总结
本申请涉及一种双塔神经网络模型的训练方法、相似度的确定方法,其中,双塔神经网络模型的训练方法包括:构造训练集,其中,训练集中包括多组用户特征,每一组用户特征中包括构成正样本对所对应的至少两个用户特征以及构成负样本对所对应的至少两个用户特征,正样本对中的用户特征为同一类型的相同用户特征,所述负样本对中的用户特征为所述同一类型的不同用户特征;基于训练集对双塔神经网络模型进行训练,以使神经网络模型的损失值小于预设阈值。本申请实施例中的双塔神经网络模型不仅能够适应户转化行为较为稀疏的保险场景,还能够适应不同任务下相似度的计算需求,满足了在不用应用场景下相似度计算需求。

技术研发人员:张懿
受保护的技术使用者:微民保险代理有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1