一种兴趣点POI地址编码的处理方法及装置与流程

文档序号:12719663阅读:184来源:国知局
一种兴趣点POI地址编码的处理方法及装置与流程
本发明涉及电子地图的数据处理领域,特别是涉及一种兴趣点POI地址编码的处理方法及装置。
背景技术
:随着网路电子地图与基于位置服务的快速发展,以POI为代表的空间地理数据出现快速增长。POI是兴趣点(PointofInterest)的缩写,是一种代表真实地理实体的点状数据,POI一般包括名称、类别、经纬度以及地址等基本信息。现有技术中对POI地址的地址编码一般会根据作业员的工作经验,人工处理成“道路名+门牌号”或“小区名+楼栋号”。但是,人工地址编码的处理效率低,不能满足大数据量的地址编码要求。而且地址编码质量的好坏由人工作业经验决定,没有明确的衡量标准。技术实现要素:本发明的目的在于提供一种兴趣点POI地址编码的处理方法及装置,用于解决现有技术中人工地址编码效率低,且无法满足大数据量的地址编码的要求的问题。为了实现上述目的,本发明实施例提供了一种兴趣点POI地址编码的处理方法,包括:获取包括道路名称的道路数据;按照预设的道路分类规则建立所述道路数据对应的道路类型表;根据所述道路类型表,生成与所述道路数据相匹配的索引信息;通过所述道路类型表、所述索引信息以及一预设算法,对一POI地址进行编码处理,得到所述POI地址的地址编码。其中,所述道路名称为按照省市区划分的道路名称。其中,根据所述道路类型表,生成与所述道路数据相匹配的索引信息的步骤包括:按照所述道路名称的字节长短顺序对所述道路数据进行排序;根据所述排序的结果,通过一检索引擎生成并保存与所述道路数据相匹配的索引信息。其中,所述索引信息包括:行政区划代码、道路名称及道路类型。其中,通过所述道路类型表、所述索引信息以及一预设算法,对一POI地址进行编码处理,得到所述POI地址的地址编码的步骤包括:获取一POI地址信息,查询区划配置表确定所述POI地址对应的POI行政区划代码;根据所述道路类型表及所述索引信息得到所述POI地址的道路名称。其中,所述根据所述道路类型表及所述索引信息得到所述POI地址的道路名称的步骤包括:根据所述道路类型表获取与所述POI地址相匹配的POI道路类型;根据所述POI行政区划代码及所述POI道路类型,检索所述索引信息,得到与所述POI道路类型相匹配的第一匹配道路名称;通过对所述POI地址的迭代解析处理,在所述第一匹配道路名称中得到所述POI地址的道路名称。其中,通过所述道路类型表、所述索引信息以及一预设算法,对一POI地址进行编码处理,得到所述POI地址的地址编码的步骤还包括:根据所述预设算法获取所述POI地址中的门牌号码。其中,还包括:将所述地址编码保存于所述POI地址的数据库中。本发明实施例还提供了一种兴趣点POI地址编码的处理装置,包括:获取模块,用于获取包括道路名称的道路数据;分类建立模块,用于按照预设的道路分类规则建立所述道路数据对应的道路类型表;索引生成模块,用于根据所述道路类型表,生成与所述道路数据相匹配的索引信息;编码处理模块,用于通过所述道路类型表、所述索引信息以及一预设算法,对一POI地址进行编码处理,得到所述POI地址的地址编码。其中,所述道路名称为按照省市区划分的地址编码。其中,所述索引生成模块包括:排序子模块,用于按照所述道路名称的字节长短顺序对所述道路数据进行排序;索引生成子模块,用于根据所述排序的结果,通过一检索引擎生成并保存与所述道路数据相匹配的索引信息。其中,所述索引信息包括:行政区划代码、道路名称及道路类型。其中,所述编码处理模块包括:第一处理子模块,用于获取一POI地址信息,查询区划配置表确定所述POI地址对应的POI行政区划代码;第二处理子模块,用于根据所述道路类型表及所述索引信息得到所述POI地址的道路名称。其中,所述第二处理子模块包括:获取单元,用于根据所述道路类型表获取与所述POI地址相匹配的POI道路类型;检索单元,用于根据所述POI行政区划代码及所述POI道路类型,检索所述索引信息,得到与所述POI道路类型相匹配的第一匹配道路名称;处理单元,用于通过对所述POI地址的迭代解析处理,在所述第一匹配道路名称中得到所述POI地址的道路名称。其中,所述编码处理模块还包括:第三处理子模块,用于根据所述预设算法获取所述POI地址中的门牌号码。其中,还包括:数据存储模块,用于将所述地址编码保存于所述POI地址的数据库中。本发明的上述技术方案的有益效果如下:本发明实施例的方案中,通过道路类型表的建立及索引信息的生成,通过不断地迭代处理可快速地对POI地址进行编码。提高了地址编码的处理效率及编码的准确性。附图说明图1为本发明实施例的兴趣点POI地址编码的处理方法的基本步骤示意图;图2为本发明实施例的兴趣点POI地址编码的处理方法的具体流程示意图图3为本发明实施例的兴趣点POI地址编码的处理装置的组成结构示意图。具体实施方式为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。本发明针对现有技术中人工地址编码效率低,且无法满足大数据量的地址编码的要求的问题,提供一种兴趣点POI地址编码的处理方法,通过道路类型表的建立及索引信息的生成,经不断地迭代处理可快速地对POI地址进行编码。提高了地址编码的处理效率及编码的准确性。第一实施例如图1所示,本发明实施例提供一种兴趣点POI地址编码的处理方法,包括:步骤11,获取包括道路名称的道路数据;具体地,所述道路数据主要是指全国道路名称表。步骤12,按照预设的道路分类规则建立所述道路数据对应的道路类型表;这里,预设的道路分类规则主要是根据道路名称的后缀词组对所述道路数据进行分类。例如,道路名称为“欧美中心北路”,则其道路类型为“北路”;又如,道路名称为“学院路”,则其道路类型为“路”;再如,道路名称为“金宁世纪购物广场步行街”,则其道路类型为“步行街。”步骤13,根据所述道路类型表,生成与所述道路数据相匹配的索引信息;步骤14,通过所述道路类型表、所述索引信息以及一预设算法,对一POI地址进行编码处理,得到所述POI地址的地址编码。这里,所述地址编码的形式为“道路名称+门牌号码”或“小区名+楼栋号”。本发明实施例的兴趣点POI地址编码的处理方法,通过道路类型表的建立及索引信息的生成,经不断地迭代处理可快速地对POI地址进行编码。提高了地址编码的处理效率及编码的准确性。具体地,所述道路名称为按照省市区划分的道路名称。本发明实施例中所述步骤13可以进一步包括:步骤131,按照所述道路名称的字节长短顺序对所述道路数据进行排序;这里,道路名称的字节长短也就是道路名称汉字字符的长短。步骤132,根据所述排序的结果,通过一检索引擎生成并保存与所述道路数据相匹配的索引信息。需说明的是,这里的检索引擎优选地为开源的Lucene.net全文检索引擎。Lucene.net是一个开源的全文检索引擎开发包,可提供完整的查询引擎和索引引擎。当然本发明不仅限于该检索引擎,其他可实现全文检索功能的检索引擎均可采用。具体地,如下表1所示,所述索引信息包括:行政区划代码、道路名称及道路类型。表1行政区划代码道路名称道路类型320116金宁世纪购物广场步行街步行街330100欧美中心北路北路330100欧美中心南路南路110103学院路路本发明实施例中所述步骤14可以包括:步骤141,获取一POI地址信息,查询区划配置表确定所述POI地址对应的POI行政区划代码;这里,所述区划配置表存储于本地数据库中,可直接获取调用。步骤142,根据所述道路类型表及所述索引信息得到所述POI地址的道路名称。进一步地,本发明实施例中所述步骤142可以包括:步骤1421,根据所述道路类型表获取与所述POI地址相匹配的POI道路类型;这里,将获取的POI地址信息根据所述道路类型表查询匹配,确定该POI地址对应的道路类型。步骤1422,根据所述POI行政区划代码及所述POI道路类型,检索所述索引信息,得到与所述POI道路类型相匹配的第一匹配道路名称;这里需说明的是,检索索引信息中,也就是索引文件中行政区划代码与所述POI行政区划代码相同,道路名称中包含有所述POI道路类型的道路数据,得到与所述POI道路类型相匹配的第一匹配道路名称。步骤1423,通过对所述POI地址的迭代解析处理,在所述第一匹配道路名称中得到所述POI地址的道路名称。这里,举例简要说明本步骤中对所述POI地址进行迭代解析处理的过程。首先,若获取的POI地址为“北京市海淀区中科院南路7号”,通过本地区划配置表查询确定与所述POI地址对应的的行政区划代码,即POI行政区划代码,这里海淀区的行政区划代码为110108;这里需要说明的是,获取到POI地址信息并非以上述明文汉字的形式运行于程序中,需要对获取到的POI地址进行解析处理。然后,通过遍历所述道路类型表,获取与所述POI地址相匹配的道路类型,即POI道路类型;之后,使用开源的Lucene.net全文检索引擎检索行政区划代码为所述POI行政区划代码,道路名称包含所述POI道路类型的道路名称,得到与所述POI道路类型相匹配的第一匹配道路名称。这里需说明的是,道路名称包含所述POI道路类型的道路名称具体可以是较道路类型本身所占字符多预设字符数的道路名称。其中,所述字符数在POI地址迭代解析时可设置。以本POI地址为例,道路类型为“南路”,道路名称包含所述POI道路类型的道路名称可为“科院南路”。这里,得到的第一匹配道路名称以列表的形式呈现。最后,对所述POI地址的迭代解析处理,在所述第一匹配道路名称中得到所述POI地址的道路名称。需说明的是,此处的迭代解析具体为:以在检索文件中检索到行政区划代码为所述POI行政区划代码,道路名称包含所述POI道路类型一第一道路名称列表;根据POI地址信息,以设置的较POI道路类型本身所占字符多预设字符数的道路名称为检索对象,在所述第一道路名称列表中检索是否有与之相匹配的道路名称或第二道路名称列表中;若存在与之相匹配的道路名称,则确定该道路名称为POI地址编码中的道路名称;若存在与之相匹配的第二道路名称列表,则调整上述预设字符数的个数,一般为增加1个或2个字符,之后以调整的道路名称为检索对象,在该第二道路名称列表中检索是否有与之相匹配的道路名称或第三道路名称列表,如此一直迭代处理,直到获取到POI地址编码中的道路名称。本举例中,迭代解析具体为:在检索文件中检索到POI行政区划代码为110108,道路名称包含“南路”的一第一道路名称列表;接着,在该第一道路名称列表中检索到与道路名称为“科院南路”相匹配的第二道路名称列表;之后,遍历该第二道路名称列表,检索到与道路名称为“中科院南路”相匹配的道路名称。这里,“中科院南路”字符数较之前的“科院南路”多一个,“科院南路”的字符数较之前的“南路”多两个。如此在第二道路名称列表中获取到POI地址编码中的道路名称。进一步地,本发明实施例中所述步骤14还可以包括:步骤143,根据所述预设算法获取所述POI地址中的门牌号码。具体地,所述预设算法可以是数字提取算法,主要是为了提取POI地址信息中的门牌号码或楼栋号。这里,简要说明几种常见的数字位于POI地址中的位置,即POI地址的格式。A:道路名称+数字;比如“学院路7号”,程序可直接将道路名称后面的数字7提取出来。B:道路名称+同位词+数字;比如“万寿路甲15号”,首先需提取道路名“万寿路”与数字“15”之间的文字,遍历本地存储的同位词配置表,若查询到该字符串“甲”包含在同位词配置表内,则确定数字“15”为门牌号码。若查询到该字符串“甲”不在同位词配置表内则需要人工确认,判断是够需要将“甲”添加到同位词配置表内。一般道路名称与门牌号码之间的字符串长度小于等于4位,门牌号码的长度小于等于4位。C:道路名称+数字+字母;此种格式一般仅用于香港和澳门,程序可直接提取数字和字母。需要说明的是,数字提取算法中提取的数字格式为半角阿拉伯数字,若识别到的POI地址中的数字格式不符合要求,需要在使用数字提取算法之前将其转换为符合要求的数字格式。比如“零”转换为“0”。这样,上述举例POI地址信息中的数字可通过该数字提取算法得到,为道路名称“中科院南路”之后的数字“7”。至此,上述举例POI地址为“北京市海淀区中科院南路7号”解析得到的地址编码为“中科院南路+7”。本发明实施例中所述的兴趣点POI地址编码的处理方法还可包括:步骤15,将所述地址编码保存于所述POI地址的数据库中。本发明实施例的方案中,通过道路类型表的建立及索引信息的生成,经不断地迭代处理以及数字提取算法的应用,可快速地对POI地址进行编码。同时提高了地址编码的处理效率及编码的准确性。第二实施例如图2所示,为本发明实施例的兴趣点POI地址编码的处理方法的具体流程示意图。下面就该图简要说明一下该兴趣点POI地址编码的处理方法的主要处理过程。其具体步骤如下:S01,建立一道路类型表;这里,首先获取按省市区分类的全国道路名称表;然后按照预设的道路分类规则建立一与所述全国道路名称表对应的道路类型表。需要说明的是,预设的道路分类规则主要是根据道路名称的后缀词组对所述全国道路名称表进行分类。例如,道路名称为“欧美中心北路”,则其道路类型为“北路”;又如,道路名称为“学院路”,则其道路类型为“路”;再如,道路名称为“金宁世纪购物广场步行街”,则其道路类型为“步行街。”S02,根据道路类型表,建立索引;具体地,根据道路类型表,通过一全文检索引擎Lucene.net按照道路名称的字节长短顺序生成与全国道路名称表相对应的索引文件。S03,解析POI地址进行地址编码;这里需说明的是,通过建立的道路类型表、生成的索引文件以及一预设的算法对POI地址的地址解码处理。最终得到的地址编码格式为:“道路名称+门牌号码”或“小区名+楼栋号”。详细的过程参见第一实施例,在此不再赘述。S04,将得到的地址编码结果输出并保存。这里,对结果的输出并保存是为了便于用户查看最终的地址编码。本发明实施例的方案中,通过道路类型表的建立及索引信息的生成,经不断地迭代处理以及数字提取算法的应用,可快速地对POI地址进行编码。同时提高了地址编码的处理效率及编码的准确性。第二实施例如图3所示,本发明实施例还提供一种兴趣点POI地址编码的处理装置,包括:获取模块21,用于获取包括道路名称的道路数据;具体地,所述道路数据主要是指全国道路名称表。分类建立模块22,用于按照预设的道路分类规则建立所述道路数据对应的道路类型表;这里,预设的道路分类规则主要是根据道路名称的后缀词组对所述道路数据进行分类。例如,道路名称为“欧美中心北路”,则其道路类型为“北路”;又如,道路名称为“学院路”,则其道路类型为“路”;再如,道路名称为“金宁世纪购物广场步行街”,则其道路类型为“步行街。”索引生成模块23,用于根据所述道路类型表,生成与所述道路数据相匹配的索引信息;编码处理模块24,用于通过所述道路类型表、所述索引信息以及一预设算法,对一POI地址进行编码处理,得到所述POI地址的地址编码。这里,所述地址编码的形式为“道路名称+门牌号码”或“小区名+楼栋号”具体地,所述道路名称为按照省市区划分的道路名称。本发明实施例中所述索引生成模块23具体可以包括:排序子模块,用于按照所述道路名称的字节长短顺序对所述道路数据进行排序;这里,道路名称的字节长短也就是道路名称汉字字符的长短。索引生成子模块,用于根据所述排序的结果,通过一检索引擎生成并保存与所述道路数据相匹配的索引信息。需说明的是,这里的检索引擎优选地为开源的Lucene.net全文检索引擎。Lucene.net是一个开源的全文检索引擎开发包,可提供完整的查询引擎和索引引擎。当然本发明不仅限于该检索引擎,其他可实现全文检索功能的检索引擎均可采用。具体地,如第一实施例中的表1所示,所述索引信息包括:行政区划代码、道路名称及道路类型。本发明实施例中所述编码处理模块24具体可以包括:第一处理子模块,用于获取一POI地址信息,查询区划配置表确定所述POI地址对应的POI行政区划代码;这里,所述区划配置表存储于本地数据库中,可直接获取调用。第二处理子模块,用于根据所述道路类型表及所述索引信息得到所述POI地址的道路名称。具体地,所述第二处理子模块可以包括:获取单元,用于根据所述道路类型表获取与所述POI地址相匹配的POI道路类型;这里,将获取的POI地址信息根据所述道路类型表查询匹配,确定该POI地址对应的道路类型。检索单元,用于根据所述POI行政区划代码及所述POI道路类型,检索所述索引信息,得到与所述POI道路类型相匹配的第一匹配道路名称;这里需说明的是,检索索引信息中,也就是索引文件中行政区划代码与所述POI行政区划代码相同,道路名称中包含有所述POI道路类型的道路数据,得到与所述POI道路类型相匹配的第一匹配道路名称。处理单元,用于通过对所述POI地址的迭代解析处理,在所述第一匹配道路名称中得到所述POI地址的道路名称。这里,举例简要说明本处理单元中对所述POI地址进行迭代解析处理的过程。首先,若获取的POI地址为“北京市海淀区中科院南路7号”,通过本地区划配置表查询确定与所述POI地址对应的的行政区划代码,即POI行政区划代码,这里海淀区的行政区划代码为110108;这里需要说明的是,获取到POI地址信息并非以上述明文汉字的形式运行于程序中,需要对获取到的POI地址进行解析处理。然后,通过遍历所述道路类型表,获取与所述POI地址相匹配的道路类型,即POI道路类型;之后,使用开源的Lucene.net全文检索引擎检索行政区划代码为所述POI行政区划代码,道路名称包含所述POI道路类型的道路名称,得到与所述POI道路类型相匹配的第一匹配道路名称。这里需说明的是,道路名称包含所述POI道路类型的道路名称具体可以是较道路类型本身所占字符多预设字符数的道路名称。其中,所述字符数在POI地址迭代解析时可设置。以本POI地址为例,道路类型为“南路”,道路名称包含所述POI道路类型的道路名称可为“科院南路”。这里,得到的第一匹配道路名称以列表的形式呈现。最后,对所述POI地址的迭代解析处理,在所述第一匹配道路名称中得到所述POI地址的道路名称。需说明的是,此处的迭代解析具体为:以在检索文件中检索到行政区划代码为所述POI行政区划代码,道路名称包含所述POI道路类型一第一道路名称列表;根据POI地址信息,以设置的较POI道路类型本身所占字符多预设字符数的道路名称为检索对象,在所述第一道路名称列表中检索是否有与之相匹配的道路名称或第二道路名称列表中;若存在与之相匹配的道路名称,则确定该道路名称为POI地址编码中的道路名称;若存在与之相匹配的第二道路名称列表,则调整上述预设字符数的个数,一般为增加1个或2个字符,之后以调整的道路名称为检索对象,在该第二道路名称列表中检索是否有与之相匹配的道路名称或第三道路名称列表,如此一直迭代处理,直到获取到POI地址编码中的道路名称。本举例中,迭代解析具体为:在检索文件中检索到POI行政区划代码为110108,道路名称包含“南路”的一第一道路名称列表;接着,在该第一道路名称列表中检索到与道路名称为“科院南路”相匹配的第二道路名称列表;之后,遍历该第二道路名称列表,检索到与道路名称为“中科院南路”相匹配的道路名称。这里,“中科院南路”字符数较之前的“科院南路”多一个,“科院南路”的字符数较之前的“南路”多两个。如此在第二道路名称列表中获取到POI地址编码中的道路名称。本发明实施例中所述编码处理模块24具体还可以包括:第三处理子模块,用于根据所述预设算法获取所述POI地址中的门牌号码。具体地,所述预设算法可以是数字提取算法,主要是为了提取POI地址信息中的门牌号码或楼栋号。这里,简要说明几种常见的数字位于POI地址中的位置,即POI地址的格式。A:道路名称+数字;比如“学院路7号”,程序可直接将道路名称后面的数字7提取出来。B:道路名称+同位词+数字;比如“万寿路甲15号”,首先需提取道路名“万寿路”与数字“15”之间的文字,遍历本地存储的同位词配置表,若查询到该字符串“甲”包含在同位词配置表内,则确定数字“15”为门牌号码。若查询到该字符串“甲”不在同位词配置表内则需要人工确认,判断是够需要将“甲”添加到同位词配置表内。一般道路名称与门牌号码之间的字符串长度小于等于4位,门牌号码的长度小于等于4位。C:道路名称+数字+字母;此种格式一般仅用于香港和澳门,程序可直接提取数字和字母。需要说明的是,数字提取算法中提取的数字格式为半角阿拉伯数字,若识别到的POI地址中的数字格式不符合要求,需要在使用数字提取算法之前将其转换为符合要求的数字格式。比如“零”转换为“0”。这样,上述举例POI地址信息中的数字可通过该数字提取算法得到,为道路名称“中科院南路”之后的数字“7”。至此,上述举例POI地址为“北京市海淀区中科院南路7号”解析得到的地址编码为“中科院南路+7”。本发明实施例中所述的兴趣点POI地址编码的处理装置具体还可包括:数据存储模块25,用于将所述地址编码保存于所述POI地址的数据库中。本发明实施例的方案中,通过道路类型表的建立及索引信息的生成,经不断地迭代处理以及数字提取算法的应用,可快速地对POI地址进行编码。同时提高了地址编码的处理效率及编码的准确性。以上所述是本发明的优选实施方式,应当指出,对于本
技术领域
的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1