城市检索意图识别方法、装置、设备及存储介质与流程

文档序号:36828029发布日期:2024-01-26 16:40阅读:14来源:国知局
城市检索意图识别方法、装置、设备及存储介质与流程

本申请涉及深度学习,具体而言,本申请涉及一种城市检索意图识别方法、装置、设备及存储介质。


背景技术:

1、随着智能设备和移动互联网技术的发展,结合互联网的新型出行方式也出现了蓬勃的发展。为了更好地满足用户的需求,准确识别用户想要去的目的地对于检索意图识别至关重要。

2、目前的检索意图识别方案,主要是对用户输入的地点词在全国范围内进行精准匹配,然后基于数据库里已有的结果进行打分,返回最高相似度的分的结果,然而,全国范围内精准匹配目的地容易召回过多冗余结果,对排序的压力过大,导致检索结果不够精确。


技术实现思路

1、本申请的主要目的为提供一种城市检索意图识别方法、装置、设备及存储介质,以避免召回过多冗余结果,降低排序的压力,提高检索结果的精确性。

2、为了实现上述发明目的,本申请提供一种城市检索意图识别方法,包括:

3、获取用户的地址检索信息;

4、将所述地址检索信息与城市字典进行匹配;

5、当匹配到的城市大于1时,将所述地址检索信息与特殊词字典进行匹配;其中,所述特殊词字典包括城市及对应表征所述城市的特殊词;

6、当匹配到的城市大于1时,利用过滤后的城市字典对所述地址检索信息进行匹配,得到标准城市;其中,所述过滤后的城市字典为删除行政区划的后缀的字典;

7、基于多标签fasttext模型对所述地址检索信息进行预测,生成序列表;其中,所述序列表包括多个候选城市及每个候选城市的预测概率;

8、基于标准城市及所述序列表筛选出目标城市,匹配出所属所述目标城市的地址推荐给用户。

9、进一步地,将所述地址检索信息与特殊词字典进行匹配之前,还包括:

10、获取用户在货运平台预设时间段内的点击数据和订单数据;

11、从所述点击数据和订单数据中汇总出存在唯一匹配城市的历史地址检索信息;

12、从所述历史地址检索信息中筛选出匹配的城市及对应表征所述城市的特殊词,生成特殊词字典。

13、优选地,基于标准城市及所述序列表筛选出目标城市,包括:

14、循环遍历所述序列表上排在前n位的候选城市;其中,所述n为正整数;

15、判断遍历到的候选城市是否排在所述序列表的第一位;

16、若是,将所述候选城市加入城市列表;

17、若否,判断遍历到的候选城市与用户所在城市之间的距离是否小于预设距离且对应的预测概率大于等于第一预设阈值;

18、若是,将所述候选城市加入第一候选列表;

19、若否,判断遍历到的候选城市是否为用户所在城市;

20、若是,将所述候选城市加入城市列表;

21、若否,判断遍历到的候选城市是否为标准城市;

22、若是,将所述候选城市加入第二候选列表;

23、基于所述第一候选列表、第二候选列表及城市列表筛选出目标城市。

24、优选地,基于所述第一候选列表、第二候选列表及城市列表筛选出目标城市,包括:

25、从所述第一候选列表中筛选出距离所述用户所在城市最近的候选城市并添加至所述城市列表;

26、将所述第二候选列表的所有候选城市添加至所述城市列表;

27、判断所述城市列表中候选城市的数量是否大于等于3;

28、若是,从所述城市列表中筛选出目标城市。

29、进一步地,判断所述城市列表中候选城市的数量是否大于等于3之后,还包括:

30、若否,循环遍历所述序列表上排在第n位至第m位之间的候选城市;其中,所述m为大于n的正整数;

31、判断遍历到的候选城市是否为距离所述用户所在城市最近,且预测概率大于第二预设阈值的候选城市;

32、若是,将所述候选城市加入城市列表。

33、进一步地,基于多标签fasttext模型对所述地址检索信息进行预测,生成序列表之前,还包括:

34、获取训练数据;其中,所述训练数据为由同城数据和跨城数据构成的融合数据,所述融合数据包括用户的点击数据、订单数据、po i数据和门址数据;

35、利用所述训练数据对fasttext模型进行多标签方式训练,得到多标签fasttext模型。

36、进一步地,将所述地址检索信息与城市字典进行匹配之后,还包括:

37、当匹配出唯一城市时,将所述城市作为目标城市并推荐给用户。

38、本申请还提供一种城市检索意图识别装置,所述装置包括:

39、获取模块,用于获取用户的地址检索信息;

40、第一匹配模块,用于将所述地址检索信息与城市字典进行匹配;

41、第二匹配模块,用于当匹配到的城市大于1时,将所述地址检索信息与特殊词字典进行匹配;其中,所述特殊词字典包括城市及对应表征所述城市的特殊词;

42、第三匹配模块,用于当匹配到的城市大于1时,利用过滤后的城市字典对所述地址检索信息进行匹配,得到标准城市;其中,所述过滤后的城市字典为删除行政区划的后缀的字典;

43、预测模块,用于基于多标签fasttext模型对所述地址检索信息进行预测,生成序列表;其中,所述序列表包括多个候选城市及每个候选城市的预测概率;

44、筛选模块,用于基于标准城市及所述序列表筛选出目标城市,匹配出所属所述目标城市的地址推荐给用户。

45、本申请还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。

46、本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述任一项所述方法的步骤。

47、本申请所提供的一种城市检索意图识别方法、装置、设备及存储介质,利用城市字典、特殊词字典及过滤后的城市字典对用户的地址检索信息进行城市意图初步判定,同时结合多标签fasttext模型对地址检索信息进行预测得到序列表,基于标准城市及序列表确定地址检索信息所属的目标城市,以在目标城市检索目的地,避免召回过多冗余结果,降低排序的压力,且多标签方式训练得到的fasttext模型,提高了对每个城市的预测准确率,缩小了模型训练与预测之间的差距,从而提高检索结果的精确性。



技术特征:

1.一种城市检索意图识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,将所述地址检索信息与特殊词字典进行匹配之前,还包括:

3.根据权利要求1所述的方法,其特征在于,基于标准城市及所述序列表筛选出目标城市,包括:

4.根据权利要求3所述的方法,其特征在于,基于所述第一候选列表、第二候选列表及城市列表筛选出目标城市,包括:

5.根据权利要求4所述的方法,其特征在于,判断所述城市列表中候选城市的数量是否大于等于3之后,还包括:

6.根据权利要求1所述的方法,其特征在于,基于多标签fasttext模型对所述地址检索信息进行预测,生成序列表之前,还包括:

7.根据权利要求1所述的方法,其特征在于,将所述地址检索信息与城市字典进行匹配之后,还包括:

8.一种城市检索意图识别装置,其特征在于,包括:

9.一种计算机设备,其特征在于,包括:

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现权利要求1-7任一项所述的城市检索意图识别方法。


技术总结
本申请为深度学习技术领域,本申请提供了一种城市检索意图识别方法、装置、设备及存储介质,其中,所述方法包括:获取用户的地址检索信息;将所述地址检索信息与城市字典进行匹配;当匹配到的城市大于1时,将所述地址检索信息与特殊词字典进行匹配;当匹配到的城市大于1时,利用过滤后的城市字典对所述地址检索信息进行匹配,得到标准城市;基于多标签FastText模型对所述地址检索信息进行预测,生成序列表;基于标准城市及所述序列表筛选出目标城市,匹配出所属所述目标城市的地址推荐给用户,以避免召回过多冗余结果,降低排序的压力,提高检索结果的精确性。

技术研发人员:张栋,赵骥
受保护的技术使用者:深圳依时货拉拉科技有限公司
技术研发日:
技术公布日:2024/1/25
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1