一种用于分拣的地址匹配方法

文档序号:6619564阅读:503来源:国知局
一种用于分拣的地址匹配方法
【专利摘要】本发明公开了一种用于分拣的地址匹配方法。该方法包括:获取邮件的地址信息,根据所述地址信息进行数据清洗;利用中文分词算法对所述数据清洗后的地址信息进行解析处理,获得分词结果;根据所述分词结果进行邮件地址的匹配。本发明中,可实现邮件地址的自动匹配,降低了分拣过程中人工的劳动量,提高了匹配效率和成功率。
【专利说明】—种用于分拣的地址匹配方法

【技术领域】
[0001]本发明涉及邮政快递领域,尤其涉及一种用于分拣的地址匹配方法。

【背景技术】
[0002]邮政快递是一种具有邮递功能的门对门物流活动,即指快递公司通过公路,铁路和空运等交通工具,对客户货物进行快速的投递。随着社会的高速发展,人们的生活也逐渐进入了高速化时代,人们对物流行业提出了更高的要求,因此,从事邮政快递的物流公司正迫切的需要提高自己的服务,来满足人们对信息、货物等运输效率的需求。
[0003]目前在邮政、快递领域的生产活动中,分拣过程是必不可少的,这个过程需要由技术工人根据邮件地址分配到指定的格口,但由于邮件地址范围广、格式多样,因此格口所包含的地址范围凭人工记忆很难做到完全的准确。
[0004]为了解决人工记忆地址的困难,现有的地址匹配方法中,多采用关键字匹配算法。即用户先根据经验,将邮件上常见的地址关键字维护进应用系统,并指定对应的格口,后续再根据关键字进行地址匹配,找到该邮件对应的格口。
[0005]按照现有技术中的方法,需要针对每封邮件的特殊关键字进行维护,数据量特别大,而且出现新的地址信息时,很可能会出现无法匹配的问题。当出现格口和地址之间的映射关系变更时,还需要由人工进行数据的调整。这些都导致了匹配效率低,人工维护工作量大,成功率下降等问题。


【发明内容】

[0006]本发明提供了一种用于分拣的地址匹配方法,以实现邮件地址的自动匹配,提高邮件地址匹配的效率和成功率,提高人工维护的效率及降低分拣的出错率。
[0007]本发明的目的是通过以下技术方案实现的:
[0008]一种用于分拣的地址匹配方法,其特征在于,该方法包括以下步骤:
[0009]获取邮件的地址信息,根据所述地址信息进行数据清洗;
[0010]利用中文分词算法对所述数据清洗后的地址信息进行解析处理,获得分词结果;
[0011]根据所述分词结果进行邮件地址的匹配。
[0012]与现有技术相比,本发明实施例至少具有以下优点:
[0013]本发明实施例中,通过对邮件地址信息进行数据清洗和中文分词算法,得到地址的分词结果,利用分词结果可实现对邮件地址的自动匹配,分拣过程就不再需要大量的人工参与,降低了人工的劳动量,并能够提高邮件地址匹配的效率和成功率,同时提高了人工维护的效率及降低分拣的出错率。

【专利附图】

【附图说明】
[0014]图1为本发明提出的一种用于分拣的地址匹配方法的流程示意图;
[0015]图2为本发明的一种实施方式步骤S103的具体流程示意图。

【具体实施方式】
[0016]下面结合附图对本发明的【具体实施方式】进行详细说明:
[0017]如图1所示,为本发明实施例提出的一种用于分拣的地址匹配方法的流程示意图,该方法具体包括以下步骤:
[0018]步骤SlOl:获取邮件的地址信息,根据地址信息进行数据清洗。
[0019]由于邮件上用户书写的收件人地址可能存在不规范的情况,因此需要先进行数据的清晰,该过程包括:对邮件的地址信息进行转换大小写、转换汉字的全角/半角等,所述数据清洗后的地址信息将用于后续的处理。
[0020]步骤S102:利用中文分词算法对数据清洗后的地址信息进行解析处理,获得分词结果。
[0021]为了后续有效的进行匹配,利用中文分词算法对上述数据清洗后的地址信息进行解析处理,具体的,将该地址按照行政级别进行分词处理,该地址被解析为行政区域、街道、单位等部件,具体的,将地址分为单词的组合,例如将地址分解为“省-地市-县市-乡镇/街道-单位或门牌”等(如北京市海淀区增光路紫玉饭店=北京市+海淀区+增光路+紫玉饭店),分词之后的结果将用于后续的处理。
[0022]步骤S103:根据分词结果进行邮件地址的匹配。
[0023]具体的,所述根据分词结果进行邮件地址的匹配,包括第一次匹配、第二次匹配、第三次匹配、第四次匹配。
[0024]如图2所示,所述的步骤S103,具体包括以下步骤:
[0025]步骤S301:将分词结果组合成标准地址,与行政区域进行第一次匹配。
[0026]具体的,将得到的地址信息的分词结果分别组合成标准的地址,例如组合成格式为“省-地市-县市-乡镇/街道”的标准地址,之后按照“从高到低”的原则将上述标准地址与系统中的行政区域进行匹配,即先匹配省份、再匹配地市、再匹配县市、再匹配乡镇/街道等。一般情况下,城市范围内的地址应匹配到街道,远郊地区的地址只需匹配到县市或乡镇即可。如果匹配成功,则匹配结束并返回匹配成功的结果,具体的,该匹配成功的结果是所有匹配结果中舍最低级别的标准地址。否则,进行第二次匹配。
[0027]步骤S302:根据分词结果进行第二次匹配。
[0028]具体的,所述的步骤S302,具体包括以下步骤:
[0029]步骤S3021、将分词结果重新组合;
[0030]步骤S3022、过滤掉行政区域上下级不一致的组合;
[0031]步骤S3023、过滤掉单位信息不一致的组合;
[0032]步骤S3024、过滤掉街道信息不一致的组合;
[0033]步骤S3025、过滤掉重复的组合;
[0034]步骤S3026、过滤掉不符合书写习惯的组合。
[0035]在上述步骤S302中,如果在步骤S301中未匹配到正确结果,此时,在执行第二次匹配之前需要对分词结果进行重新的组合,重新组合的目的是避免因中文分词结果的不正确,而导致不能匹配的情况。
[0036]步骤S303:根据分词结果进行第三次匹配。
[0037]具体的,对分词结果中的街道信息进行匹配,如果匹配成功,则返回匹配结果中街道名称最长的结果,否则,进行第四次匹配。
[0038]步骤S304:根据分词结果进行第四次匹配。
[0039]具体的,对分词结果中的单位地址进行匹配,如果匹配成功,则返回匹配结果中单位名称最长的结果,否则返回无匹配结果。
[0040]需要进一步指出的是,在具体的应用场景中,在本发明提出的步骤SlOl之前,用户需要预先维护一些基础数据,其中,包括格口与邮政编码的对应关系,邮政编码与行政区域的对应关系,行政区域与街道信息的对应关系,以及行政区域与单位地址的对应关系。其中,格口与邮政编码的对应关系需要由用户进行维护。格口用于存放对应其行政区域的邮件和包裹,邮政快递人员可以直接从对应的格口中找到需要配送的邮件,并获取邮件对应的地址信息。
[0041]与现有技术相比,本发明实施例具有以下优点:
[0042]通过应用本发明实施例的技术方案,在进行货物分拣的过程中,利用对邮件地址信息的数据清洗和中文分词的结果,结合预先维护的格口的对应关系,通过匹配查找到正确的行政区域,就可以快速的将邮件的地址与正确的格口进行绑定,实现了邮件地址的自动匹配,提高了邮政运输的效率,大大降低了人工维护的工作量,可直接提高邮件地址匹配的效率和成功率。
[0043]以上所述,仅为本发明较佳的【具体实施方式】,但本发明的保护范围并不局限于此,任何熟悉本【技术领域】的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。
【权利要求】
1.一种用于分拣的地址匹配方法,其特征在于,该方法包括以下步骤: 获取邮件的地址信息,根据所述地址信息进行数据清洗; 利用中文分词算法对所述数据清洗后的地址信息进行解析处理,获得分词结果; 根据所述分词结果进行邮件地址的匹配。
2.如权利要求1所述的方法,其特征在于,所述根据地址信息进行数据清洗,具体包括:对所述地址信息进行转换大小写、和转换汉字的全角/半角。
3.如权利要求1所述的方法,其特征在于,所述利用中文分词算法对所述数据清洗后的地址信息进行解析处理,具体包括:利用中文分词算法将所述地址信息解析为行政区域、街道和单位。
4.如权利要求1所述的方法,其特征在于,所述方法还包括: 预先维护一个基础数据,具体的:维护格口与邮政编码的对应关系,维护邮政编码与行政区域的对应关系,维护行政区域与街道信息的对应关系,维护行政区域与单位地址的对应关系。
5.如权利要求1所述的方法,其特征在于,所述根据分词结果进行邮件地址的匹配,包括第一次匹配、第二次匹配、第三次匹配、第四次匹配。
6.如权利要求5所述的方法,其特征在于,所述第一次匹配,具体为: 将所述分词结果组合成标准地址,按照行政级别从高到低的原则与行政区域进行匹配,如果匹配成功,则匹配结束并返回所述匹配成功的结果,否则进行第二次匹配。
7.如权利要求6所述的方法,其特征在于,所述第二次匹配,具体为: 将所述分词结果重新组合,过滤掉行政区域上下级不一致的组合,过滤掉单位信息不一致的组合,过滤掉街道信息不一致的组合,过滤掉重复的组合,过滤掉不符合书写习惯的组合,如果剩下唯一的组合,则匹配结束并返回所述唯一组合的结果,否则进行第三次匹配。
8.如权利要求7所述的方法,其特征在于,所述第三次匹配,具体为: 对街道信息进行匹配,并返回所述匹配结果中街道名称最长的结果,否则进行第四次匹配。
9.如权利要求8所述的方法,其特征在于,所述第四次匹配,具体为: 对单位地址进行匹配,并返回所述匹配结果中单位名称最长的结果,否则返回无匹配结果。
【文档编号】G06F17/30GK104166679SQ201410323972
【公开日】2014年11月26日 申请日期:2014年7月8日 优先权日:2014年7月8日
【发明者】李科, 吴刚, 宫宇 申请人:北京迪威特科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1