基于关键词数据库检索的快递分拣装置及方法

文档序号:9453168阅读:335来源:国知局
基于关键词数据库检索的快递分拣装置及方法
【技术领域】
[0001]本发明涉及快递分拣技术领域,具体地说,涉及一种基于关键词数据库检索的快递分拣装置及方法。
【背景技术】
[0002]现有的快递分拣多为人工分拣,由工作人员根据快递面单地址来手工分配快递的中转或末端派件站点。快递分拣人员不但需要记忆大量地址信息,还要根据城市和站点变化随时更新,记忆难度之大,可想而知。所以,不可避免的有分拣错误、效率低下且覆盖面窄的问题。另一些为半自动分拣,既通过人工设定一些地址关键词数据,采用基于词典的字符串匹配分词算法,关键词作为词典的部分或全部,借助计算机辅助进行派件站点识别。在这类半自动分拣中,由于实际快递地址规模庞大且书写方式多样,需要大量的人力和时间来整理关键词数据,维护开销大、变更不及时且容易出错。

【发明内容】

[0003]为了克服现有技术的上述缺陷,本发明提供了一种快递分拣装置。根据本发明的快递分拣装置,其包括:
[0004]历史派件地址数据库,其用于记载历史派件地址信息,历史派件地址信息包括由至少一个历史派件地址组成的历史派件地址集合;
[0005]站点派送区域数据库,其用于记载由至少一个投递站点组成的投递站点集合,任一投递站点均包括由与该投递站点对应的至少一个派件点组成的派件点集合;
[0006]经玮度解析模块,其用于将所述至少一个历史派件地址对应解析为至少一个历史派件地址经玮度信息,并用于将所有派件点对应解析成所有派件点经玮度信息;
[0007]映射处理模块,其用于对所述至少一个历史派件地址经玮度信息与所有派件点经玮度信息进行处理,以得到历史派件地址集合到投递站点集合的映射;
[0008]第一分词模块,其用于对所述至少一个历史派件地址进行分词以对应得到至少一个关键词集合,任一关键词集合均包括至少一个关键词,所有关键词经映射处理模块进行处理以得到所有关键词在所述至少一个投递站点中的关键词分布信息;
[0009]统计处理模块,其用于对关键词分布信息进行处理以得到所有关键词在任一投递站点中的出现频率,并将在任一投递站点处出现概率不低于设定第一阈值的关键词作为该投递站点的有效关键词;
[0010]检索数据库,其用于记载所有有效关键词和所述至少一个投递站点的信息,并建立所有有效关键词到所述至少一个投递站点的映射;
[0011 ] 地址采集模块,其用于采集待派件地址;
[0012]第二分词模块,其用于对待派件地址进行分词以得到至少一个检索关键词,并将所述至少一个检索关键词发送至检索数据库以对应得到的至少一个待筛选投递站点;
[0013]解析模块,其用于对所述至少一个待筛选投递站点进行处理以得到任一待筛选投递站点的出现频率,并将出现概率不低于设定第二阈值的待筛选投递站点作为待投递投递站点;以及
[0014]输出模块,其用于输出待投递投递站点。
[0015]本发明的快递分拣装置中,能够根据历史派件地址而建立检索数据库,由于历史派件地址能够存储在历史派件地址数据库中,而地址采集模块处采集的当前派件地址信息也能够发送给历史派件地址数据库,故历史派件地址数据库由能够实时更新历史派件地址,使得检索数据库也能够实时进行更新,从而使得检索数据库具备较佳地实时性,进而较佳地提高了分拣准确率。
[0016]其次,检索数据库中能够对关键词和所有投递站点进行映射,从而能够根据关键词得到待投递投递站点,进而大大简化了分拣操作,能够得到较佳的分拣效率。
[0017]本发明的快递分拣装置中,第一分词模块和第二分词模块均能够包括两个分别用于定义分词的最长字串和最短字段的定义模块,从而较佳地保证了能够找到派件地址的所有可能的字串,提尚了检索数据库建立和分栋的准确性。
[0018]作为优选,设定第一阈值为65%?95%。
[0019]本发明的快递分拣装置中,第一阈值能够设为65%?95%,从而能够较多的较准确的获取有效关键词,进而较佳地保证了分拣的准确性。
[0020]作为优选,设定第二阈值为60%?85%。
[0021]本发明的快递分拣装置中,第二阈值能够设为60%?85%,从而能够在保证较为精准获取待投递投递站点的同时,也较佳地减少了因待筛选投递站点的数量较少而导致的解析失败。
[0022]作为优选,地址采集模块包括用于提取电子面单中派件地址信息的第一输入模块,用于提取手写面单中地址信息的第二输入模块,以及用于识别文字的第三输入模块。
[0023]本发明的快递分拣装置中,地址采集模块能够包括多种类型的输入模块,从而能够较佳地适应多种不同类型的快递面单。
[0024]本发明提供了一种基于上述任一快递分拣装置的快递分拣方法。根据本发明的快递分拣方法,其包括以下步骤:
[0025]—、构建关键词与投递站点映射的检索数据库;
[0026]二、对待派件地址进行分词以得到检索关键词;
[0027]三、将检索关键词发送至检索数据库中,进而得到与待派件地址对应的待投递投递站点。
[0028]本发明的快递分拣方法中,能够以向检索数据库内查询检索关键词的方式而获取待派件地址,从而能够较佳地提高分拣效率。其次,由于检索数据库能够自动建立,从而使得检索数据库便于维护且能够实时更新,进而保证了分拣的准确性和及时性。
[0029]作为优选,步骤一包括以下步骤,
[0030](I)从历史派件地址数据库中提取所有历史派件地址信息;
[0031](2)从站点派送区域数据库中提取所有投递站点信息;
[0032](3)采用经玮度解析模块对所有历史派件地址信息和所有投递站点的投递区域信息进行经玮度解析,从而得到所有历史派件地址经玮度信息和所有投递站点的投递区域经玮度信息;
[0033](4)采用映射处理模块对所有历史派件地址经玮度信息和所有投递站点的投递区域经玮度信息进行处理,从而得到所有历史派件地址与所有投递站点间的映射关系;
[0034](5)采用第一分词模块逐个对所有历史派件地址进行分词以对应得到至少一个关键词;
[0035](6)根据步骤(4)中所有历史派件地址与所有投递站点间的映射关系,得到所有关键词在所述所有投递站点中的关键词分布信息;
[0036](7)采用统计处理模块对关键词分布信息进行处理以得到所有关键词在任一投递站点中的出现频率,并将在任一投递站点处出现概率不低于设定第一阈值的关键词作为该投递站点的有效关键词;
[0037](8)建立所有有效关键词到所有投递站点的映射,从而得到检索数据库。
[0038]本发明的快递分拣方法中,站点派送区域数据库能够用于记载由所有投递站点组成的投递站点集合,任一投递站点均能够包括由与该投递站点对应的所有派件点组成的派件点集合,而经玮度解析模块能够采用提供API接口的第三方GIS引擎,例如百度地图、高德地图、MAPABC等,从而通过API接口向第三方GIS引擎中输入地址信息即可得到与该地址信息对应的经玮度信息,从而大大简化了检索数据库的建立难度。另外,通过判定经玮度的方法将所有历史派件地址与所有投递站点进行对应时,能够较为准确地获取对应关系。
[0039]其次,第一分词模块能够采用随意分词方法,即能够对分词的最长字串和最短字段依次进行定义,从而较佳地保证了能够找到派件地址的所有可能的字串,提高了检索数据库的建立准确性。
[0040]作为优选,步骤(7)中,设定第一阈值为65%?95%。
[0041]本发明的快递分拣方法中,第一阈值能够设为65%?95%,从而能够较多的较准确的获取有效关键词,进而较佳地保证了分拣的准确性。
[0042]作为优选,步骤二包括以下步骤,
[0043]A、获取待派件地址;
[0044]B、对待派件地址进行分词以获得至少一个检索关键词。
[0045]本发明的快递分拣方法中,待派件地址进行分词的分词方法能够采用随意分词方法,即能够对分词的最长字串和最短字段依次进行定义,从而较佳地保证了能够找到派件地址的所有可能的字串,提高了分拣的准确性。
[0046]作为优选,步骤三包括以下步骤,
[0047]C、将所述至少一个检索关键词发送给检索数据库,以对应得到至少一个待筛选投递站点;
[0048]D、将在所述至少一个待筛选投递站点中出现概率不低于设定第二阈值的待筛选投递站点作为待投递投递站点,并经输出模块输出。
[0049]本发明的快递分拣方法中,能够基于检索数据库对待投递投递站点进行查询,从而大大简化了分拣过程并具备较佳的分拣准确性。
[0050]作为优选,步骤D中,设定第二阈值为60 %?85 %。
[0051]本发明的快递分拣方法中,第二阈值能够设为60%?85%,从而能够在保证较为精准获取待投递投递站点的同时,也较佳地减少了因待筛选投递站点的数量较少而导致的解析失败。
【附图说明】
[0052]图1为实施例1中一种快递分
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1