可疑地址的识别方法、计算机设备及计算机可读存储介质与流程

文档序号:37041127发布日期:2024-02-20 20:35阅读:15来源:国知局
可疑地址的识别方法、计算机设备及计算机可读存储介质与流程

本技术涉及地址识别,具体涉及一种可疑地址的识别方法、计算机设备及计算机可读存储介质。


背景技术:

1、在物流运输领域,运单地址往往是由寄件人手动填写,地址的可信度较低,因此需要对运单地址进行检测,以识别出其中的可疑地址。目前一般是安排专人来人工识别可疑地址,但人工识别的效率较低,且人工成本较高。


技术实现思路

1、本技术实施例提供一种可疑地址的识别方法、计算机设备及计算机可读存储介质,旨在提高可疑地址的识别效率。

2、一方面,本技术提供一种可疑地址的识别方法,包括:

3、获取待识别地址中的楼栋信息;

4、获取所述楼栋信息对应的楼栋内的楼层分布范围以及房号分布范围;

5、根据所述待识别地址是否处于所述楼层分布范围以及所述房号分布范围内,判断所述待识别地址是否为可疑地址。

6、在一些实施例中,所述获取待识别地址中的楼栋信息的步骤之前,还包括:

7、获取属于同一楼栋的多个第一预设地址;

8、根据多个所述第一预设地址中的楼层信息,确定多个所述第一预设地址所属楼栋的楼层分布范围;

9、在属于同一楼栋的多个所述第一预设地址中,确定属于同一楼层的多个第二预设地址;

10、根据多个所述第二预设地址中的房号信息,确定多个所述第二预设地址所属楼层的房号分布范围;

11、存储多个所述第一预设地址所属楼栋的楼层分布范围,以及多个所述第二预设地址所属楼层的房号分布范围。

12、在一些实施例中,所述根据多个所述第一预设地址中的楼层信息,确定多个所述第一预设地址所属楼栋的楼层分布范围的步骤包括:

13、确定多个所述第一预设地址中的楼层信息中的最大楼层值以及最小楼层值;

14、根据所述最大楼层值以及所述最小楼层值,确定多个所述第一预设地址所属楼栋的楼层分布范围;

15、所述根据多个所述第二预设地址中的房号信息,确定多个所述第二预设地址所属楼层的房号分布范围的步骤包括:

16、确定多个所述第二预设地址中的房号信息中的最大房号值以及最小房号值;

17、根据所述最大房号值以及所述最小房号值,确定多个所述第二预设地址所属楼层的房号分布范围。

18、在一些实施例中,所述可疑地址的识别方法还包括:

19、对所述待识别地址进行地址分词,得到所述待识别地址中的多个地址字段;

20、确定多个所述地址字段对应的地址词性的总数量;

21、根据多个所述地址字段对应的地址词性的总数量,确定所述待识别地址的详细程度值;

22、若所述待识别地址的详细程度值大于预设详细程度值,则执行所述获取待识别地址中的楼栋信息的步骤。

23、在一些实施例中,所述根据多个所述地址字段对应的地址词性的总数量,确定所述待识别地址的详细程度值的步骤之后,还包括:

24、若所述待识别地址的详细程度值小于或等于所述预设详细程度值,则判定所述待识别地址为可疑地址。

25、在一些实施例中,所述可疑地址的识别方法还包括:

26、对所述待识别地址进行地址分词,得到所述待识别地址中的多个地址字段;

27、确定多个所述地址字段分别对应的地址词性,获得多个地址词性;

28、获取预设地址书写规范对应的至少一个预设地址词性;

29、若所有所述预设地址词性均存在于所述多个地址词性中,则执行所述获取待识别地址中的楼栋信息的步骤。

30、在一些实施例中,所述获取预设地址书写规范对应的预设地址词性的步骤之后,还包括:

31、若至少一个预设地址词性不存在于所述多个地址词性中,则判定所述待识别地址为可疑地址。

32、在一些实施例中,所述根据所述待识别地址是否处于所述楼层分布范围以及所述房号分布范围内,判断所述待识别地址是否为可疑地址的步骤包括:

33、根据所述待识别地址是否处于所述楼层分布范围以及所述房号分布范围内,确定所述待识别地址对应的第一评分;

34、根据所述待识别地址的详细程度值,确定所述待识别地址对应的第二评分;

35、根据是否满足预设地址词性对应的预设评分条件,确定所述待识别地址对应的第三评分,其中,确定所述待识别地址中的多个地址字段分别对应的地址词性,获得多个地址词性,若所有所述预设地址词性均存在于所述多个地址词性中,判定满足预设地址词性对应的预设评分条件,若至少一个预设地址词性不存在于所述多个地址词性中,判定不满足预设地址词性对应的预设评分条件;

36、根据所述第一评分、所述第二评分以及所述第三评分,判断所述待识别地址是否为可疑地址。

37、另一方面,本技术实施例提供一种可疑地址的识别装置,可疑地址的识别装置包括:

38、获取模块,用于获取待识别地址中的楼栋信息,以及获取所述楼栋信息对应的楼栋内的楼层分布范围以及房号分布范围;

39、检测模块,用于根据所述待识别地址是否处于所述楼层分布范围以及所述房号分布范围内,判断所述待识别地址是否为可疑地址。

40、在一些实施例中,获取模块还用于:

41、获取属于同一楼栋的多个第一预设地址;

42、根据多个所述第一预设地址中的楼层信息,确定多个所述第一预设地址所属楼栋的楼层分布范围;

43、在属于同一楼栋的多个所述第一预设地址中,确定属于同一楼层的多个第二预设地址;

44、根据多个所述第二预设地址中的房号信息,确定多个所述第二预设地址所属楼层的房号分布范围;

45、存储多个所述第一预设地址所属楼栋的楼层分布范围,以及多个所述第二预设地址所属楼层的房号分布范围。

46、在一些实施例中,获取模块具体用于:

47、确定多个所述第一预设地址中的楼层信息中的最大楼层值以及最小楼层值;

48、根据所述最大楼层值以及所述最小楼层值,确定多个所述第一预设地址所属楼栋的楼层分布范围;

49、所述根据多个所述第二预设地址中的房号信息,确定多个所述第二预设地址所属楼层的房号分布范围的步骤包括:

50、确定多个所述第二预设地址中的房号信息中的最大房号值以及最小房号值;

51、根据所述最大房号值以及所述最小房号值,确定多个所述第二预设地址所属楼层的房号分布范围。

52、在一些实施例中,获取模块还用于:

53、对所述待识别地址进行地址分词,得到所述待识别地址中的多个地址字段;

54、确定多个所述地址字段对应的地址词性的总数量;

55、根据多个所述地址字段对应的地址词性的总数量,确定所述待识别地址的详细程度值;

56、若所述待识别地址的详细程度值大于预设详细程度值,则执行所述获取待识别地址中的楼栋信息的步骤。

57、在一些实施例中,检测模块还用于:

58、若所述待识别地址的详细程度值小于或等于所述预设详细程度值,则判定所述待识别地址为可疑地址。

59、在一些实施例中,获取模块还用于:

60、对所述待识别地址进行地址分词,得到所述待识别地址中的多个地址字段;

61、确定多个所述地址字段分别对应的地址词性,获得多个地址词性;

62、获取预设地址书写规范对应的至少一个预设地址词性;

63、若所有所述预设地址词性均存在于所述多个地址词性中,则执行所述获取待识别地址中的楼栋信息的步骤。

64、在一些实施例中,检测模块还用于:

65、若至少一个预设地址词性不存在于所述多个地址词性中,则判定所述待识别地址为可疑地址。

66、在一些实施例中,检测模块具体用于:

67、根据所述待识别地址是否处于所述楼层分布范围以及所述房号分布范围内,确定所述待识别地址对应的第一评分;

68、根据所述待识别地址的详细程度值,确定所述待识别地址对应的第二评分;

69、根据是否满足预设地址词性对应的预设评分条件,确定所述待识别地址对应的第三评分,其中,确定所述待识别地址中的多个地址字段分别对应的地址词性,获得多个地址词性,若所有所述预设地址词性均存在于所述多个地址词性中,判定满足预设地址词性对应的预设评分条件,若至少一个预设地址词性不存在于所述多个地址词性中,判定不满足预设地址词性对应的预设评分条件;

70、根据所述第一评分、所述第二评分以及所述第三评分,判断所述待识别地址是否为可疑地址。

71、另一方面,本技术还提供一种计算机设备,所述计算机设备包括:

72、一个或多个处理器;

73、存储器;以及

74、一个或多个应用程序,其中所述一个或多个应用程序被存储于所述存储器中,并配置为由所述处理器执行以实现任一项所述的可疑地址的识别方法中的步骤。

75、另一方面,本技术还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器进行加载,以执行任一项所述的可疑地址的识别方法中的步骤。

76、本技术实施例提供的可疑地址的识别方法、计算机设备及计算机可读存储介质,方法包括:获取待识别地址中的楼栋信息;获取楼栋信息对应的楼栋内的楼层分布范围以及房号分布范围;根据待识别地址是否处于楼层分布范围以及房号分布范围内,判断待识别地址是否为可疑地址。由于目前主要由人工来识别可疑地址,而人工识别的效率较低,因此本技术通过获取待识别地址所在楼栋的楼层分布范围以及房号分布范围,根据待识别地址是否处于楼层分布范围以及房号分布范围内,来确定待识别地址是否可疑,实现了可疑地址的自动识别,相较于人工识别可疑地址,识别效率更高,且成本更低。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1