一种地名地址快速定位与查询的方法与流程

文档序号:11620664阅读:1641来源:国知局
一种地名地址快速定位与查询的方法与流程

本发明涉及数据处理技术领域,尤其涉及一种地名地址快速定位与查询的方法。



背景技术:

随着中国经济的高速稳定的发展,随着城市化进程的加快,以及市区建设力度的加大,目前的地名变化很大,目前每年的新生地名大约在2万条以上,而有的地名命名很不规范,如包含生僻字、异体字等,或存在名不符实的现象,特别是有的建筑物、道路等还存在长期未命名的情况,这样在管理上存在很多困扰,无法做到有效的管理,同时不利于用户查询。

地名地址数据是最常用的社会公共信息资源,与大众的日常生活紧密相关,同时,地名地址信息也是政府基础行政管理的基础资源。将地名地址信息提取并标准化,使其转化为地理信息服务的基础成果,为大众的生产生活提供支撑,已成为一项迫切的需要。

现有的地理位置信息挖掘算法主要是利用关键字匹配的方法,由于在互联网环境下文本中的地名地址信息存在描述错误、不准确、同音字、不够标准等问题,所以基于关键字匹配的位置信息挖据算法准确率较低,不足以满足各行各业对地理信息的要求。

现有的地名查询面向公众服务要求结果的广度(尽可能多的返回),地址节类型不限定;面向行业应用要求结果的精度(一个或无),地址节类型限定;检索服务核心sdk(分词、解析、比对、查询)及其对外检索服务的分离;地名地址库的构建效率,检索服务的响应效率;因此,现在有必要开发一种能够快速查询和定位的地名地址快速定位与查询的方法。



技术实现要素:

本发明要解决的技术问题是,提供一种能够自动纠错、对于模糊地名搜索智能化程度高地名地址快速定位与查询的方法。

为了解决上述技术问题,本发明采用的技术方案是:该地名地址快速定位与查询的方法,包括以下步骤:

(1)建立数据成果库:将标注的基础地名地址样本数据库的数据进行数据比对并整合分析,得到数据成果并建立数据成果库;

(2)将数据成果库建成地名地址检索库:首先对数据成果库进行构建地址树,再将地址树与地名检索服务建立连接,从而形成地名地址检索库;

(3)将地名地址检索库构建成标准地名地址检索服务平台:将地名地址检索库通过服务总线构建成标准地名地址检索服务平台;其中地名地址检索库的检索引擎提供至少一种接口供用户查询,所述接口包括地址正向匹配、地址逆向匹配、地址简单检索、地址列表查询、行政区划查询、楼盘表查询和地址详情查询;

(4)在标准地名地址检索服务平台中输入需查询或需定位的地址,标准地名地址检索服务平台通过rest服务接口对外提供查询检索服务。

采用上述技术方案,通过标准库建立模型将各个标注的基础地名地址样本数据库的数据进行比对整合,通过对城市地址门楼牌号进行分析归纳、拆分处理和统一编码,使空间信息后形成的通用地址空间数据库数据规范,包括制定规范的标准依据、地址模型、地址信息数据项构成、地址编码规则、地址数据库建库方法等内容;这整个过程由建库系统自动完成,然后在该数据成果库的基础上搭建检索服务平台,这样即能快速的完成数据成果库的建立,又能节省人力物力;同时实现了地名地址的快速定位与查询;此外,统一标准地名地址规范模型,在经典有限状态机理论的基础上,通过“地址层级-地址表-地址节”,实现兼顾地名地址空间语义的拓扑关系及地名地址节文本序列的地址路径模型,尤其便于表达多路径同一空间语义的地名地址。

本发明进一步改进在于,所述步骤(1)中数据成果建立数据成果库的步骤是:先将数据成果批量处理输入预处理库,再对预处理库的数据进行审核入库后构建成数据成果库。

本发明进一步改进在于,所述标注的基础地名地址样本数据包括:住建数据、国土数据、公安数据、民政数据和基础地理信息数据;所述数据整合的步骤是:

1)将基础地理信息数据输入数据成果库;

2)对住建数据进行预处理,将住建数据中的规则数据和不规则数据进行分类,规则数据则直接输入数据成果库;不规则的数据则与国土数据和公安数据一起进行匹配数据后输入数据成果库。

本发明进一步改进在于,所述数据成果包括mongodb数据库和oracle数据库;所述mongodb数据库为统一标准地名地址库,所述oracle数据库包括地名地址提交库、地名地址发布库、地名地址预处理库和地名地址成果库。

本发明进一步改进在于,服务总线包括地名地址检索服务、地名分词服务、反向地址匹配服务和数据比对服务。

本发明进一步改进在于,所述步骤(1)中的对基础地名地址样本数据库的数据进行比对的步骤包括:

a)第一轮比对导入表:将原始数据表按照比对表的格式导入比对表中,然后查询服务(query)比对,将各地址节利用查询服务,进行比对,如果比对成果则将比对效果设置为1,否则设置成0;

b)第一轮未匹配分析:针对第一轮未匹配分析的分析未匹配的原因,并整理,然后使用解析服务方案进行比对;

c)第二轮地址节拼接成地址全称:先将各地址节拼接成地址全称,然后进行解析服务(resolve)比对,针对地址全称进行解析和比对,比对成果,则比对效果设置为1,否则设置为0;

d)第二轮未匹配分析:针对第二轮未匹配分析的分析未匹配的原因,并提出解决策略;针对问题进行修改,再次进行解析服务(resolve)比对,针对解析比对结果进行分析,对未匹配的数据进行分析后继续循环上述步骤。

本发明进一步改进在于,所述步骤(1)中的对基础地名地址样本数据库的数据进行比对采用的是地名地址分词算法和地名地址解析算法;地名地址分词算法采用综合地名地址辞典(gazetteer)与地名地址关键词的方法;地名地址解析算法在分词的基础上,通过地址路径搜索与地址节文本冗余相结合的方法。地名地址分词算法采用综合地名地址辞典(gazetteer)与地名地址关键词的方法实现精确识别与模糊匹配的平衡;地名地址解析算法在分词的基础上,通过地址路径搜索与地址节文本冗余相结合的方法,实现面向行业应用与面向公众服务的不同检索服务应用场景。

本发明的进一步改进在于,该地名地址快速定位与查询系统包括gps定位模块、存储模块、网络模块、无线模块和电源模块;所述无线模块包括蓝牙模块与wifi模块,所述gps定位模块、存储模块、网络模块、无线模块和电源模块均与控制模块相连接;所述gps定位模块用于所处位置定位捕捉,所述存储模块用于信息的存储,所述网络模块用于网络连接,所述无线模块用于与外部设备无线连接,所述电源模块用于提供地名地址快速定位与查询系统的电源。

与现有技术相比,本发明具有的有益效果是:

1)地名匹配命中率高;2)自动纠错,对于模糊地名搜索智能化程度高;3)检索服务提供多种查询方式,例如正向地址查询、分类查询、普通查询、逆向查询、园查询等多维度查询方式;4)基于soa系统架构,以esb消息总线进行集成,通过rest服务接口对外提供服务,架构轻盈灵活,扩展性强。

附图说明

下面结合附图进一步描述本发明的技术方案:

图1是本发明的地名地址快速定位与查询的方法的数据构建图;

图2是本发明的地名地址快速定位与查询的方法的检索实现的方式图;

图3是本发明的地名地址快速定位与查询的系统的结构图。

具体实施方式

为了加深对本发明的理解,下面将结合附图和实施例对本发明做进一步详细描述,该实施例仅用于解释本发明,并不对本发明的保护范围构成限定。

实施例:该地名地址快速定位与查询的方法,包括以下步骤:

(1)建立数据成果库:将标注的基础地名地址样本数据库的数据进行数据比对并整合分析,得到数据成果并建立数据成果库;

(2)将数据成果库建成地名地址检索库:首先对数据成果库进行构建地址树,再将地址树与地名检索服务建立连接,从而形成地名地址检索库;

(3)将地名地址检索库构建成标准地名地址检索服务平台:将地名地址检索库通过服务总线构建成标准地名地址检索服务平台;其中地名地址检索库的检索引擎提供至少一种接口供用户查询,所述接口包括地址正向匹配、地址逆向匹配、地址简单检索、地址列表查询、行政区划查询、楼盘表查询和地址详情查询;

(4)在标准地名地址检索服务平台中输入需查询或需定位的地址;所述步骤(1)中数据成果建立数据成果库的步骤是:先将数据成果批量处理输入预处理库,再对预处理库的数据进行审核入库后构建成数据成果库;所述标注的基础地名地址样本数据包括:住建数据、国土数据、公安数据、民政数据和基础地理信息数据;所述数据整合的步骤是:

1)将基础地理信息数据输入数据成果库;

2)对住建数据进行预处理,将住建数据中的规则数据和不规则数据进行分类,规则数据则直接输入数据成果库;不规则的数据则与国土数据和公安数据一起进行匹配数据后输入数据成果库;所述数据成果包括mongodb数据库和oracle数据库;所述mongodb数据库为统一标准地名地址库,所述oracle数据库包括地名地址提交库、地名地址发布库、地名地址预处理库和地名地址成果库;服务总线包括地名地址检索服务、地名分词服务、反向地址匹配服务和数据比对服务;所述步骤(1)中的对基础地名地址样本数据库的数据进行比对的步骤包括:

a)第一轮比对导入表:将原始数据表按照比对表的格式导入比对表中,然后查询服务(query)比对,将各地址节利用查询服务,进行比对,如果比对成果则将比对效果设置为1,否则设置成0;

b)第一轮未匹配分析:针对第一轮未匹配分析的分析未匹配的原因,并整理,然后使用解析服务方案进行比对;

c)第二轮地址节拼接成地址全称:先将各地址节拼接成地址全称,然后进行解析服务(resolve)比对,针对地址全称进行解析和比对,比对成果,则比对效果设置为1,否则设置为0;

d)第二轮未匹配分析:针对第二轮未匹配分析的分析未匹配的原因,并提出解决策略;针对问题进行修改,再次进行解析服务(resolve)比对,针对解析比对结果进行分析,对未匹配的数据进行分析后继续循环上述步骤;所述步骤(1)中的对基础地名地址样本数据库的数据进行比对采用的是地名地址分词算法和地名地址解析算法;地名地址分词算法采用综合地名地址辞典(gazetteer)与地名地址关键词的方法;地名地址解析算法在分词的基础上,通过地址路径搜索与地址节文本冗余相结合的方法;该地名地址快速定位与查询系统包括gps定位模块、存储模块、网络模块、无线模块和电源模块;所述无线模块包括蓝牙模块与wifi模块,所述gps定位模块、存储模块、网络模块、无线模块和电源模块均与控制模块单向数据连接;所述gps定位模块用于所处位置定位捕捉,所述存储模块用于信息的存储,所述网络模块用于网络连接,所述无线模块用于与外部设备无线连接,所述电源模块用于提供地名地址快速定位与查询系统的电源。

对于本领域的普通技术人员而言,具体实施例只是对本发明进行了示例性描述,显然本发明具体实现并不受上述方式的限制,只要采用了本发明的方法构思和技术方案进行的各种非实质性的改进,或未经改进将本发明的构思和技术方案直接应用于其它场合的,均在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1