一种运单地址分级方法及装置的制造方法

文档序号:9304554阅读:320来源:国知局
一种运单地址分级方法及装置的制造方法
【技术领域】
[0001]本发明涉及地址分级处理技术领域,尤其涉及一种运单地址分级方法及装置。
【背景技术】
[0002]现有的地址信息在社会活动中无处不在,如同人类生活不可缺少的空气和水一样。据统计,80%的信息与空间有关系,而关系的主要纽带就是地址信息。这些信息几乎涉及到了所有政府部门、企事业单位和社会公众,如公安户籍、民政地名、国土地籍、工商税务法人单位、综合部门统计信息等等,无不包含着地址信息。
[0003]目前,尽管这些地址描述信息已经实现了数字化,但由于缺少空间定位,故而影响了管理的效率,制约了专题信息之间的沟通和集成使用。只有将这些地址信息转换成空间坐标,专题信息才能与地理信息叠加,才能利用GIS软件的可视化和空间分析功能辅助用户应用。
[0004]目前已有一些实现地址匹配的方法,针对符合标准描述的地址信息,例如“北京市海淀区北太平路16号”采用城市名+区名+道路名+门牌号码的表述方式。而实际情况是,在地址描述中存在着各种各样的表达方式,例如“北京市五棵松中国人民解放军总医院”、“北京市石景山区国际雕塑公园”、“北京市石景山区永乐小区”、“北京市丰台区总部基地11区19号楼”等,在很多的地址信息中人们更习惯于采用单位名、标志地物名称等来进行描述。同时在国内大多数城市的实际情况中,存在大量的地址没有标准门牌号码的情况。由此,对于表述不规范、一致性差的地址信息,采用上述方法很难对地址信息进行有效地匹配和空间定位。
[0005]现有的构建地址数据库技术存在若干缺陷。现有的地址数据库在建构时只是利用词典、词表、后缀关键字列表和人工总结的方式将接收到的地址数据分词后分类入地址数据库,其往往是通过人工来适应接收到的地址数据,举例说明:若接收到的地址为“中关村大街南100号”时,其首先通过词典、词表、后缀关键字列表,进行分词,如,后缀关键字列表可能是:“街”、“道”、“路”、“号”等,那么在遇到如“街”、“道”、“路”、“号”等关键字时,即在关键字后进行分词,举例说明:若接收到的地址为“中关村大街南100号”,则通过后缀关键字列表,将该地址分词为“中关村大街”、“南”、“100号”;在分词结束后,再通过人工适应的方式,为分词后的地址信息加入属性,其属性标注顺序为:道路名-方位名-门牌名,如在“中关村大街”中加入属性为道路名、“南”加入方位名、“100号”中加入属性为门牌名。然而,若接收到的地址为“中关村大街100号南”,除通过上述分词将其分为“中关村大街”、“100号”、“南”后,还要为该分词后的地址信息添加新的属性标注顺序为:道路名-门牌名-方位名,并对该分词后的地址加入属性,如在“中关村大街”中加入属性为道路名、“ 100号”中加入属性为门牌名、“南”加入方位名。
[0006]上述的地址数据建构方法,因要不断的加入新的属性标注顺序,从而导致处理过程较为复杂,效率较低,另外,只是通过词典、词表、后缀关键词的方式进行分词,会导致分词准确率较低。
[0007]进一步的,针对特定的运单中的地址来说,由于希望根据用户输入的运单地址名称获取相应的坐标,名称的随意组合,可能会带来大量的搜索结果,排重困难,而且运单地址一般都是跟地名相关的,都遵循一定的规则的,如果使用统计进行处理,可能会对一些常用地名错分,降低分词成功率,不利于后续根据分级结果查找坐标。

【发明内容】

[0008]本发明实施例提供一种运单地址分级方法及装置,用以解决现有技术中针对特定的运单中的地址,可能会对一些常用地名错分,降低分词成功率,不利于后续根据分级结果查找坐标的问题。
[0009]本发明实施例提供一种运单地址分级方法,该方法包括:
[0010]接收运单地址并进行规范化处理,得到用户地址;
[0011]对所述用户地址进行分词,并对分词结果赋予词性;
[0012]根据所述分词结果和对应词性,分别确定所述分词结果是否为行政区划、道路/兴趣点Ρ0Ι、楼栋单元号,若是,则记录本次处理结果;否则,将所述分词结果作为描述性信息;
[0013]遍历所述分词结果,将处理后的分词结果重新组合为完整运单地址。
[0014]所述分别确定所述分词结果是否为行政区划、道路/兴趣点Ρ0Ι、楼栋单元号,包括:
[0015]在预先设定的分词词典中分别查询所述分词结果是否有对应行政区划、道路/兴趣点PO1、楼栋单元号记载内容。
[0016]所述方法还包括:
[0017]若所述分词词典中查询所述分词结果没有对应行政区划记载内容,则以行政区划规则处理所述分词,并对处理后的结果再次在所述分词词典中查询所述分词结果是否有对应行政区划记载内容,若是,记录本次处理结果;否则,继续下列步骤;
[0018]在所述分词词典中查询所述分词结果是否有对应道路/兴趣点POI记载内容,若是,则记录本次处理结果;否则,以道路/兴趣点POI规则处理所述分词,并对处理后的结果再次在所述分词词典中查询所述分词结果是否有对应道路/兴趣点POI记载内容,若是,记录本次处理结果;否则,继续下列步骤;
[0019]在所述分词词典中查询所述分词结果是否有对应楼栋单元号记载内容。
[0020]所述对所述用户地址进行分词,并对分词结果赋予词性,包括:
[0021]对所述用户地址与预先设定的分词词典进行匹配,根据正向最大匹配进行分词;并对匹配成功的所述分词结果给定不同的类别作为所述分词结果的词性。
[0022]所述分词词典根据如下方式设定:
[0023]获取地图数据库中原始名称行政区划、道路、POI名称并归类,将同一类所述名称归类为所述分词词典的一个词性;
[0024]将所述名称、对应词性编译后形成所述分词词典。
[0025]所述接收运单地址并进行规范化处理,得到用户地址,包括:
[0026]接收输入的运单地址,并去除其中无效字符,按照省、市、区县的方式拼接成一个符合用户书写习惯的用户地址。
[0027]另一方面,本发明实施例提供一种运单地址分级装置,所述装置包括:
[0028]规范化处理模块,用于接收运单地址并进行规范化处理,得到用户地址;
[0029]分词模块,用于对所述用户地址进行分词,并对分词结果赋予词性;
[0030]地址分级模块,用于根据所述分词结果和对应词性,分别确定所述分词结果是否为行政区划、道路/兴趣点Ρ0Ι、楼栋单元号,若是,则记录本次处理结果;否则,将所述分词结果作为描述性信息;
[0031]组合模块,用于将处理后的分词结果重新组合为完整运单地址。
[0032]所述地址分级模块,用于在预先设定的分词词典中分别查询所述分词结果是否有对应行政区划、道路/兴趣点PO1、楼栋单元号记载内容。
[0033]所述分词模块,用于对所述用户地址与预先设定的分词词典进行匹配,根据正向最大匹配进行分词;并对匹配成功的所述分词结果给定不同的类别作为所述分词结果的词性。
[0034]所述地址分级模块,包括:
[0035]行政区划子模块,用于在预
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1