兴趣点召回方法、装置、计算机设备和存储介质与流程

文档序号:36180885发布日期:2023-11-29 19:05阅读:26来源:国知局
兴趣点召回方法与流程

本技术涉及地址搜索,特别是涉及一种兴趣点召回方法、装置、计算机设备和存储介质。


背景技术:

1、在货运业务场景中,用户在下货运订单时,可以在用户终端上的搜索页面上输入查询文本,进而搜索货运订单的起点或终点。服务器收到用户终端发起的搜索请求之后,会提取搜索请求中的查询文本和城市信息,并基于提取的信息来召回一些兴趣点并返回给用户终端进行显示,用户可以在该页面上看到服务器返回的兴趣点,进而进行选址。

2、目前在召回兴趣点时,通常是直接基于用户输入的查询文本来召回兴趣点,该方式可能因查询文本过于简单而导致兴趣点漏召回,继而使得用户不能选到自己想要的地址。


技术实现思路

1、本技术针对上述不足或缺点,提供了一种兴趣点召回方法、装置、计算机设备和存储介质,本技术实施例能够避免出现兴趣点漏召回的情况,能召回更符合用户需求的兴趣点供用户选址。

2、本技术根据第一方面提供了一种兴趣点召回方法,在一个实施例中,该方法包括:

3、根据过去预设时长内的多条历史用户发单日志构造训练样本集和发单城市分布信息;训练样本集中的每条训练样本包括历史查询文本、历史城市参数和发单兴趣点信息,发单兴趣点信息包括发单兴趣点的名称、地址和类别;发单城市分布信息包括每种历史查询文本对应的各个发单城市的分布比例;

4、将训练样本集分为多组,根据上述多组训练样本对包括第一模型和第二模型的多任务对比检索模型进行第一阶段训练和第二阶段训练;进行第一阶段训练时以各条训练样本中的发单兴趣点为正样本,以与各条训练样本同组的每条其他训练样本为负样本;进行第二阶段训练时以各条训练样本中的发单兴趣点为正样本,以与各条训练样本同组且相似度最高的其他训练样本为负样本;

5、通过训练好的上述多任务对比检索模型中的第一模型离线为兴趣点库中的每个兴趣点生产对应的兴趣点嵌入,根据获得的兴趣点嵌入进行向量索引,得到向量索引库;

6、响应于来自用户终端的位置搜索请求,通过训练好的上述多任务对比检索模型中的第二模型在线为位置搜索请求携带的实时查询文本和实时城市参数推断对应的查询文本嵌入,根据查询文本嵌入和向量索引库召回多个兴趣点作为相关性召回结果。

7、在一些实施例中,根据上述多组训练样本对上述多任务对比检索模型进行第一阶段训练时,将每组训练样本顺序输入两次到上述多任务对比检索模型中;

8、根据上述多组训练样本对上述多任务对比检索模型进行第二阶段训练时,将每组训练样本输入一次到上述多任务对比检索模型中。

9、在一些实施例中,以lstage1作为上述多任务对比检索模型的损失函数进行第一阶段训练;

10、lstage1=lcity+lmlm+lrdrop+lcl

11、

12、

13、lrdrop=1/2*(kl(qemb1||qemb2)+kl(qemb2||qemb1)+1/2*(kl(pemb1||pemb2)+kl(pemb2||pemb1))

14、

15、其中,lcity中的n是全部城市的个数,是发单城市分布信息中第i个城市的分布比例,是预测得到的该第i个城市的分布比例;为被掩码字符预测的真值概率;qemb1和qemb2是相同的历史查询文本经过第二模型得到的两个嵌入信息;pemb1和pemb2是相同的发单兴趣点信息经过第一模型得到的两个嵌入信息;

16、lcl中的n是指训练时每组训练样本的数量;qemb是当前使用的历史查询文本的嵌入信息,是该历史查询文本对应的发单兴趣点信息的嵌入信息,是同一组训练样本中的其他第i个发单兴趣点信息的嵌入信息;pemb是当前输入的发单兴趣点信息的嵌入信息,是该发单兴趣点信息对应的历史查询文本的嵌入信息,是同组训练样本中的其他第i个历史查询文本的嵌入信息;τ是温度系数,设置为0.05。

17、在一些实施例中,以lstage2作为上述多任务对比检索模型的损失函数进行第二阶段训练;

18、

19、其中,qemb是当前输入的历史查询文本的嵌入信息,是该历史查询文本对应的发单兴趣点信息的嵌入信息,而是同组训练样本中除外的与qemb相似度最高的发单兴趣点信息的嵌入信息,margin设置为0.15。

20、在一些实施例中,根据查询文本嵌入和向量索引库召回多个兴趣点作为相关性召回结果,包括:

21、将查询文本嵌入输入向量索引库,得到多个兴趣点嵌入;

22、将上述多个兴趣点嵌入对应的兴趣点作为相关性召回结果。

23、在一些实施例中,在训练上述多任务对比检索模型时,以发单兴趣点信息作为第一模型的输入,以各条训练样本中的历史查询文本和历史城市参数作为第二模型的输入;

24、第一模型的输出是兴趣点嵌入,第二模型的输出是查询文本嵌入;兴趣点嵌入是指兴趣点信息的嵌入信息,查询文本嵌入是指查询文本的嵌入信息。

25、在一些实施例中,上述方法还包括:

26、根据实时查询文本和实时城市参数进行常规召回,得到常规召回结果;

27、将常规召回结果和相关性召回结果进行去重处理,将处理结果作为搜索结果响应用户终端。

28、本技术根据第二方面提供了一种兴趣点召回装置,在一个实施例中,该装置包括:

29、构造模块,用于根据过去预设时长内的多条历史用户发单日志构造训练样本集和发单城市分布信息;训练样本集中的每条训练样本包括历史查询文本、历史城市参数和发单兴趣点信息,发单兴趣点信息包括发单兴趣点的名称、地址和类别;发单城市分布信息包括每种历史查询文本对应的各个发单城市的分布比例;

30、训练模块,用于将训练样本集分为多组,根据上述多组训练样本对包括第一模型和第二模型的多任务对比检索模型进行第一阶段训练和第二阶段训练;进行第一阶段训练时以各条训练样本中的发单兴趣点为正样本,以与各条训练样本同组的每条其他训练样本为负样本;进行第二阶段训练时以各条训练样本中的发单兴趣点为正样本,以与各条训练样本同组且相似度最高的其他训练样本为负样本;

31、离线生产模块,用于通过训练好的上述多任务对比检索模型中的第一模型离线为兴趣点库中的每个兴趣点生产对应的兴趣点嵌入,根据获得的兴趣点嵌入进行向量索引,得到向量索引库;

32、在线响应模块,用于响应于来自用户终端的位置搜索请求,通过训练好的上述多任务对比检索模型中的第二模型在线为位置搜索请求携带的实时查询文本和实时城市参数推断对应的查询文本嵌入,根据查询文本嵌入和向量索引库召回多个兴趣点作为相关性召回结果。

33、本技术根据第三方面提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述任一方法的实施例的步骤。

34、本技术根据第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一方法的实施例的步骤。

35、在本技术实施例中,针对相关技术的不足,搭建了多任务对比检索模型,该模型包括第一模型和第二模型,在训练时需要进行第一阶段训练和第二阶段训练,训练好多任务对比检索模型之后,即可利用其中的第一模型来离线生产兴趣点嵌入,并根据生产的兴趣点嵌入进行向量索引,进而搭建向量索引库;第二模型则用于在线为服务器接收到的位置搜索请求中的实时查询文本和实时城市参数推断对应的查询文本嵌入,从而后续能根据查询文本嵌入和向量索引库召回多个兴趣点作为相关性召回结果,该实施例能够避免出现兴趣点漏召回的情况,能召回更符合用户需求的兴趣点供用户选址。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1