一种未知道路与已知道路关联关系的分析方法和装置的制造方法

文档序号:9865532阅读:453来源:国知局
一种未知道路与已知道路关联关系的分析方法和装置的制造方法
【技术领域】
[0001]本发明涉及地理信息技术领域,特别是涉及一种未知道路与已知道路关联关系的分析方法和装置。
【背景技术】
[0002]目前有许多领域需要用到地址信息,如果地址信息有误,将直接影响业务质量。比如在电子商务领域用户购买货物时,需要在订单中填写订单地址,如果订单地址填写有误,将会导致货物无法及时送达至用户。
[0003]发明人在对现有地址信息进行分析的过程中发现,地址信息中的省市等区域信息一般不易出错,最容易出错的是地址信息中的道路信息。现有技术采用如下方法分析地址信息中的道路与预置的道路数据库中道路(也就是已知道路)的关联关系:
[0004]对地址信息进行分级,得到区域信息和道路名称;将所述道路名称与预置的道路数据库中所述区域内的已知道路的名称或者名称的拼音进行匹配,如果匹配不到名称或名称的拼音一致的道路,则认为该道路是未知道路,否则,建立地址中的道路与已知道路的关联关系。
[0005]现有技术中的分析方法基于现有的道路数据库仅能够识别出与已知道路的名称属于同音错别字的未知道路,并将该未知道路与已知道路关联起来;但针对地址中与已知道路的名称相比存在多字、少字、别名、颠倒字词的道路,现有技术无法正确分析出其与已知道路的关系,而是将其当作未知道路,从而使大量的地址信息中的道路无法被识别,严重影响具体业务的实施。

【发明内容】

[0006]为了解决上述技术问题,本发明实施例提供了一种未知道路与已知道路关联关系的分析方法和装置,能够提高地址中道路识别的准确度,为其他以道路信息为依据的业务打好基础,为用户提供便利。
[0007]本发明实施例公开了如下技术方案:
[0008]第一方面,本发明实施例公开了一种未知道路与已知道路关联关系的分析方法,包括:
[0009]获取运单数据集合;
[0010]根据所述运单数据集合中各条运单数据的地址信息及预置的道路数据库,得到已知道路集合和未知道路集合;
[0011 ] 针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配,选择兴趣点匹配度最高的已知道路作为未知道路的关联道路。
[0012]优选的,所述针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配,选择兴趣点匹配度最高的已知道路作为未知道路的关联道路具体包括:
[0013]针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配;
[0014]选择与该未知道路关联的兴趣点匹配的兴趣点的数目最多的已知道路作为所述未知道路的关联道路。
[0015]优选的,所述针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配,选择兴趣点匹配度最高的已知道路作为未知道路的关联道路具体包括:
[0016]针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配;
[0017]按照与该未知道路匹配的兴趣点的数目由高到低的顺序,选择预设个数的已知道路作为该未知道路的待关联已知道路;
[0018]根据所述匹配的兴趣点的数目和待关联已知道路关联的兴趣点的个数,得到该未知道路与各待关联已知道路之间的匹配度;
[0019]选择匹配度最高的待关联已知道路作为所述未知道路的关联道路。
[0020]优选的,所述方法还包括:
[0021]判断未知道路的名称与该未知道路关联的已知道路名称的长度是否相同;
[0022]如果长度相同,则判断两者名称的文字及其顺序是否相同,如果有一字不同,标记所述未知道路为关联的已知道路的错别字道路;如果文字完全相同但文字顺序不完全相同,则标记所述未知道路为关联的已知道路的文字顺序颠倒道路;如果多个字不相同,查看两者名称是否存在于同一个地址信息中,如果是,标记所述未知道路为关联道路的临近道路;如果否,判断两者的兴趣点匹配度是否大于预置的匹配度阈值,如果是,标记所述未知道路为关联道路的别名道路;
[0023]如果长度不相同,判断两者名称的文字是否多一字或者少一字且其他文字完全相同,如果是,则标记所述未知道路为关联的已知道路的多字或少字道路;如果否,查看两者名称是否存在于同一个地址信息中,如果是,标记所述未知道路为关联的已知道路的临近道路;如果否,判断两者的兴趣点匹配度是否大于预置的匹配度阈值,如果是,标记所述未知道路为关联的已知道路的别名道路。
[0024]优选的,所述针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配具体为:
[0025]针对未知道路集合中关联的兴趣点的数目大于等于第一阈值的未知道路,将其关联的兴趣点与已知道路集合中关联的兴趣点的数目大于等于第二阈值的已知道路的兴趣点进行匹配。
[0026]优选的,所述根据所述匹配的兴趣点的数目和待关联已知道路关联的兴趣点的个数,得到该未知道路与各待关联已知道路之间的匹配度具体为:
[0027]根据所述匹配的兴趣点的数目和待关联已知道路关联的兴趣点的个数,计算所述匹配的兴趣点的数目与待关联已知道路关联的兴趣点的个数的比值,将该比值作为未知道路与待关联已知道路的匹配度。
[0028]优选的,所述根据所述运单数据集合中各条运单数据的地址信息及预置的道路数据库,得到已知道路集合和未知道路集合具体包括:
[0029]将所述运单数据集合中各条运单数据的地址信息进行分级,得到各条地址信息的区域信息和道路名称;
[0030]将各条地址信息的道路名称与预置的道路数据库中对应区域内的已知道路的名称或者名称的拼音进行匹配,得到已知道路和未知道路;
[0031]将所有已知道路中相同的已知道路及其关联的兴趣点进行合并,将合并处理后得到的所有已知道路及其关联兴趣点构成已知道路集合;
[0032]将所有未知道路中相同的未知道路及其关联的兴趣点进行合并,将合并处理后得到的所有未知道路及其关联兴趣点构成未知道路集合。
[0033]第二方面,本发明实施例公开了一种未知道路与已知道路关联关系的分析装置,包括:
[0034]获取单元,用于获取运单数据集合;
[0035]分类单元,用于根据所述运单数据集合中各条运单数据的地址信息及预置的道路数据库,得到已知道路集合和未知道路集合;
[0036]匹配选择单元,用于针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配,选择兴趣点匹配度最高的已知道路作为未知道路的关联道路。
[0037]优选的,所述匹配选择单元具体包括:
[0038]匹配子单元,用于针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配;
[0039]第一选择子单元,用于选择与该未知道路关联的兴趣点匹配的兴趣点的数目最多的已知道路作为所述未知道路的关联道路。
[0040]优选的,所述匹配选择单元具体包括:
[0041]匹配子单元,用于针对未知道路集合中的未知道路,将未知道路关联的兴趣点与已知道路集合中已知道路关联的兴趣点进行匹配;
[0042]第二选择子单元,用于按照与该未知道路匹配的兴趣点的数目由高到低的顺序,选择预设个数的已知道路作为该未知道路的待关联已知道路;
[0043]计算子单元,用于根据所述匹配的兴趣点的数目和待关联已知道路关联的兴趣点的个数,得到该未知道路与各待关联已知道路之间的匹配度;
[0044]第三选择子单元,用于选择匹配度最高的待关联已知道路作为所述未知道路的关联道路。
[0045]优选的,所述装置还包括:
[0046]第一判断单元,用于判断未知道路的名称与该未知道路关联的已知道路名称的长度是否相同;
[0047]第二判断单元,用于当第一判断单元判断结果为长度相同时,判断两者名称的文字及其顺序是否相同,如果有一字不同,标记所述未知道路为关联的已知道路的错别字道路;如果文字完全相同但文字顺序不完全相同,则标记所述未知道路为关联的已知道路的文字顺序颠倒道路;如果多个字不相同,查看两者名称是否存在于同一个地址信息中,如果是,标记所述未知道路为关联道路的临近道路;如果否,判断两者的兴趣点匹配度是否大于预置的匹配度阈值,如果是,标记所述未知道路为关联道路的别名道路;
[0048]第三判断单元,用于当第一判断单元判断结果为长度不相同时,判断两者名称的文字是否多一字或者少一字且其他文字完全相同,如果是,则标记所述未知道路为关联的已知道路的多字或少字道路;如果否,查看两者名称是否存在于同一个地址信息中,如果是,标记所述未知道路为关联的已知道路的临近道路;如果否,判断两者的兴趣点匹配度是否大于预置的匹配度阈值,如果是,标记所述未知道路为关联的已知道路的别名道路。
[0049]优选的,所述匹配子单元具体用于针对未知道路集合中关联的兴趣点的数目大于等于第一阈值的未知道路,将其关联的兴趣点与已知道路集合中关联的兴趣点的数目大于等于第二阈值的已知道路的兴趣点进行匹配。
[0050]优选的
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1