一种缺失电子地图数据的确定方法和设备与流程

文档序号:19924443发布日期:2020-02-14 16:45阅读:257来源:国知局
一种缺失电子地图数据的确定方法和设备与流程

本发明涉及导航电子地图技术领域,尤其涉及一种缺失电子地图数据的确定方法和设备。



背景技术:

地理编码,又被称为地址匹配,是指为识别点、线、面的位置和属性而设置的编码。通过地理编码,能够将一个中文地址描述信息或者地名描述信息转换成地球表面上一个具体的坐标位置点,具体实现为:将中文地址描述信息或地名描述信息与电子地图数据库中的标准地图数据进行匹配,当匹配上时将该匹配成功的标准地图数据对应的坐标位置点作为中文地址描述信息或地名描述信息对应的坐标位置点。在电子地图中进行定位或检索的过程中,经常需要通过地理编码,将用户输入的地址描述信息转换为具体的坐标位置点。但是由于用户输入的地址描述信息很可能存在错误或者该地址描述信息描述的地址为新地址,而该新地址并未更新到电子地图数据中,从而导致地理编码失败。

目前,当对用户输入的地址信息进行地理编码成功时,将直接反馈地理编码得到的坐标位置点;若地理编码失败,则直接反馈地理编码失败。由于用户输入的地址信息很可能是不少用户后续可能会查询的位置点,具有较高的存在价值,若不对这些地址信息进行处理(如采集这些地址信息的经纬度坐标等),若后续仍然以该地址信息进行地理编码时,仍旧会显示地理编码失败,不利于电子地图数据库内容的丰富以及不利于后续的地理编码。



技术实现要素:

有鉴于此,本发明实施例提供了一种缺失电子地图数据的确定方法和设备,通过地理编码确定出缺失电子地图数据,为后续完善电子地图数据库提供依据。

一种缺失电子地图数据的确定方法,包括:

接收携带有待编码地址的地理编码请求;

对所述地理编码请求中的待编码地址进行分词,得到组成所述待编码地址的地址片段;

对所述待编码地址对应的地址片段进行地理编码,当地理编码失败时,将所述待编码地址确定为缺失电子地图数据,并存储至预置的缺失数据库中;

对所述待编码地址对应的地址片段,按照其在待编码地址中的位置顺序,进行重新组合,得到至少一个包含所述待编码地址对应的部分地址片段的新地址,并对新地址进行地理编码,若地理编码失败则将该新地址确定为缺失电子地图数据,并存储至预置的缺失数据库中。

一种缺失电子地图数据的确定设备,包括:

接收模块,用于接收携带有待编码地址的地理编码请求;

分词模块,用于对所述地理编码请求中的待编码地址进行分词,得到组成所述待编码地址的地址片段;

第一缺失电子地图数据确定模块,用于对所述待编码地址对应的地址片段进行地理编码,当地理编码失败时,将所述待编码地址确定为缺失电子地图数据,并存储至预置的缺失数据库中,并触发第二缺失电子地图数据确定模块;

第二缺失电子地图数据确定模块,用于对所述待编码地址对应的地址片段,按照其在待编码地址中的位置顺序,进行重新组合,得到至少一个包含所述待编码地址对应的部分地址片段的新地址,并对新地址进行地理编码,若地理编码失败则将该新地址确定为缺失电子地图数据,并存储至预置的缺失数据库中。

本发明有益效果如下:

本发明实施例提供的方法,在接收到携带有待编码地址的地理编码请求时,对所述地理编码请求中的待编码地址进行分词,得到组成所述待编码地址的地址片段;对所述待编码地址对应的地址片段进行地理编码,当地理编码失败时,将所述待编码地址确定为缺失电子地图数据,并存储至预置的缺失数据库中;对所述待编码地址对应的地址片段,按照其在待编码地址中的位置顺序,进行重新组合,得到至少一个包含所述待编码地址对应的部分地址片段的新地址,并对新地址进行地理编码,若地理编码失败则将该新地址确定为缺失电子地图数据,并存储至预置的缺失数据库中。本方案,能够通过地理编码方式确定出缺失电子地图数据,并对所述待编码地址对应的地址片段按照其在待编码地址中的位置顺序进行重新组合,得到至少一个包含所述待编码地址对应的部分地址片段的新地址,并对新地址进行地理编码,若地理编码失败则将该新地址确定为缺失电子地图数据,最后将确定出的缺失电子地图数据存储至预置的缺失数据库中,为后续补充电子地图数据提供依据,从而能够有针对性的完善电子地图数据库,继而更进一步提高后续地理编码的成功率。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种缺失电子地图数据的确定方法的流程图之一;

图2本发明实施例提供的一种缺失电子地图数据的确定方法的流程图之二;

图3为本发明实施例提供的一种缺失电子地图数据的确定设备的结构示意图。

具体实施方式

为了实现本发明的目的,本发明实施例提供了一种缺失电子地图数据的确定方法和设备,在接收到携带有待编码地址的地理编码请求时,对所述地理编码请求中的待编码地址进行分词,得到组成所述待编码地址的地址片段;对所述待编码地址对应的地址片段进行地理编码,当地理编码失败时,将所述待编码地址确定为缺失电子地图数据,并存储至预置的缺失数据库中;对所述待编码地址对应的地址片段,按照其在待编码地址中的位置顺序,进行重新组合,得到至少一个包含所述待编码地址对应的部分地址片段的新地址,并对新地址进行地理编码,若地理编码失败则将该新地址确定为缺失电子地图数据,并存储至预置的缺失数据库中。本方案,能够通过地理编码方式确定出缺失电子地图数据,并对所述待编码地址对应的地址片段按照其在待编码地址中的位置顺序进行重新组合,得到至少一个包含所述待编码地址对应的部分地址片段的新地址,并对新地址进行地理编码,若地理编码失败则将该新地址确定为缺失电子地图数据,最后将确定出的缺失电子地图数据存储至预置的缺失数据库中,为后续补充电子地图数据提供依据,从而能够有针对性的完善电子地图数据库,继而更进一步提高后续地理编码的成功率。

下面结合说明书附图对本发明各个实施例作进一步地详细描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

实施例一:

如图1所示,为本发明实施例一提供的一种缺失电子地图数据的确定方法的流程图之一,所述方法包括:

步骤101:接收携带有待编码地址的地理编码请求。

其中,所述地理编码请求中包含待编码地址。

优选地,本发明实施例中为了提高地理编码系统的地理编码效率和均衡性,本发明实施例,在地理编码系统中设置有多个独立且功能一致的地理编码服务器。当地理编码系统接收到多个地理编码请求时,将该多个地理编码请求均匀地分配至不同的地理编码服务器上,以并行处理;或者,将地理编码请求发送至当前较为空闲的地理编码服务器上。

步骤102:对所述地理编码请求中的待编码地址进行分词,得到组成所述待编码地址的地址片段。

优选地,由于待编码地址一般是用户输入的信息,该信息有可能不规范,如“北京xx街xxxx大厦那里”、“北京西单商场旁边”等。为规范用户输入的信息,在前述步骤102中对所述地理编码请求中的待编码地址进行分词之前,还包括以下步骤:根据预置的无效词词库,确定出所述待编码地址中的无效词,并删除所述待编码地址中的无效词。步骤102针对删除无效词之后的待编码地址进行分词操作。

优选地,在将待编码地址中的无效词删除之后,更进一步的,对待编码地址中的数字进行大小写统一化、字母大小写统一化等规范操作。

需要说明的是,本发明实施例中描述的无效词是指与地址相关联但不能确定地址的词,例如:回家、找酒店、哪里、那边、那儿等。由于在实际应用中,若根据预置的无效词库确定出地址编码请求中包括的待编码地址中包含无效词,例如:回家、找酒店等,这些无效词并不能指定具体地址,而地理编码服务器无法识别这些无效词,因此,删除该待编码地址中的无效词。

优选地,由于用户输入的待编码地址可能为标准地址也可能是不标准地址,该不标准地址虽然可能包括行政名称、道路名称、小区名称等,但是还包含一些模糊词,如待编码地址可能为地址描述性信息,如“北京市海淀区苏州街10号对面”;待编码地址还可能是模糊地址,如“北京市海淀区大恒科技大厦附近”。标准地址是指能精确确定地址位置的词组,包含行政区名称、道路名称以及小区名称的分词组合,例如:xx市xx区xx路xx号院xx号楼。本发明实施例针对标准地址和不标准地址,采用的分词方式有所区别,以采用更合适的分词方式对待编码地址进行分词,以使得分词更准确。因此,在前述步骤102对待编码地址进行分词之前,还可以包括以下步骤:

将所述待编码地址与预置非标准地址词库进行匹配,若匹配成功则确定所述待编码地址为非标准地址,若匹配失败则确定所述待编码地址为标准地址。

本发明实施例中非标准地址词库中包括“附近”、“对面”、“旁边”等模糊性词语。若待编码地址中出现有非标准地址词库中的词语,则表明待编码地址与非标准地址词库匹配成功。

此时前述步骤102中,对所述地理编码请求中的待编码地址进行分词,具体包括:

当所述待编码地址为非标准地址时,根据预置的通用分词词库对所述待编码地址进行分词;

当所述待编码地址为标准地址时,根据预置的标准分词词库对所述待编码地址进行分词。

本发明实施例中,通用分词词库是指预先设置的包含各行各业涉及到的所有分词(如专业术语、专业名词等)的词库;标准分词词库是指预先设置的地理信息行业所涉及到的分词的词库。

步骤103:对所述待编码地址对应的地址片段进行地理编码。

步骤104:当地理编码失败时,将所述待编码地址确定为缺失电子地图数据,并存储至预置的缺失数据库中。

步骤105:对所述待编码地址对应的地址片段,按照其在待编码地址中的位置顺序,进行重新组合,得到至少一个包含所述待编码地址对应的部分地址片段的新地址,并对新地址进行地理编码,若地理编码失败则将该新地址确定为缺失电子地图数据,并存储至预置的缺失数据库中。

前述步骤105,具体实现可采用以下两种方式实现:

方式1:从所述待编码地址对应的第一个地址片段开始,遍历所述待编码地址的地址片段,每遍历一个地址片段,执行以下操作,直到遍历完所述待编码地址的倒数第二个地址片段为止:将该遍历的地址片段与已经遍历的地址片段按照在待编码地址中的位置顺序组合成一个新地址;并对该新地址进行地理编码,若地理编码失败则将该新地址确定为缺失电子地图数据,并存储至预置的缺失数据库中。

例如,待编码地址c1c2c3c4依次包括地址片段c1、c2、c3、c4,则从待编码地址的第一个地址片段开始依次遍历:遍历c1,将c1作为新地址进行地理编码,若地理编码失败则将该c1作为缺失电子地图数据数据;遍历c2,将c1c2作为新地址进行地理编码,若地理编码失败则将该c1c2作为缺失电子地图数据;遍历c3,将c1c2c3作为新地址进行地理编码,若地理编码失败则将该c1c2c3作为缺失电子地图数据。

更优的,由于待编码地址中位于前面的地址片段的行政级别高于后面的地址片段,因此,本发明实施例中,还可以进行如下操作:从待编码地址的第一个地址片段开始依次遍历,遍历c1,将c1作为新地址进行地理编码,若地理编码失败则将该c1作为缺失电子地图数据数据,并直接将c1c2、c1c2c3、这三个新地址确定为缺失电子地图数据;若地理编码成功,则继续遍历c2,对c1c2进行地理编码,若失败则直接将c1c2c3确定为缺失电子地图数据,若成功则继续遍历c3。

方式2:采用倒序递减方式,从所述待编码地址最后一个的地址片段开始,依次递减位于最后的地址片段,每递减一个地址片段,执行以下操作,直至递减完所述待编码地址的第一个地址片段为止:将递减该地址片段后剩余的地址片段组成的地址作为新地址;并对该新地址进行地理编码,若地理编码失败则将该新地址确定为缺失电子地图数据,并存储至预置的缺失数据库中。

例如,待编码地址c1c2c3c4依次包括地址片段c1、c2、c3、c4,则待编码地址位于最后一个的地址片段开始依次递减:将c1c2c3c4中位于最后的地址片段c4删除得到新地址c1c2c3,对该新地址进行地理编码,若失败,则继续将c1c2c3中位于最后的地址片段c3删除得到新地址c1c2;对该新地址c1c2进行地理编码,若编码失败,则删除位于最后的地址片段c2得到新地址c1,对c1进行地理编码,以此类推。

更优地,本发明实施例,还可以进行以下操作:将c1c2c3c4中位于最后的地址片段c4删除得到新地址c1c2c3,对该新地址进行地理编码,若成功则结束流程;若失败,则继续将c1c2c3中位于最后的地址片段c3删除得到新地址c1c2;对该新地址c1c2进行地理编码,若成功则结束流程,若编码失败则删除位于最后的地址片段c2得到新地址c1,对c1进行地理编码,以此类推。

优选地,本发明实施例,确定待编码地址为缺失电子地图数据时,根据该待编码地址确定出缺失电子地图数据之后,建立这些缺失电子地图数据的父子关系,如待编码地址为c1c2c3c4,确定出c1c2、c1c2c3和c1c2c3c4均为缺失电子地图数据,由于包含的地址片段越少的新地址包含的地理区域范围越广,则建立c1c2、c1c2c3和c1c2c3c4的父子关系为:c1c2为父节点,c1c2c3为父节点的下级子节点,c1c2c3c4为c1c2c3的下级子节点。

优选地,为更进一步为完善电子地图数据库提供较好的依据,以便采集人员能够优先补充重要度较高的缺失电子地图数据,本发明实施例还可以在前述图1所示的方法流程中,包括以下步骤106~108,如图2所示:

步骤106:确定所述缺失电子地图数据的数据缺失类型。

其中,数据缺失类型包括:行政区类型、道路类型、小区类型、门牌号类型、楼牌号类型。其中前述数据缺失类型的优先级从高到低的顺序依次为:行政区类型、道路类型、小区类型、门牌号类型、楼牌号类型。

步骤106中,确定缺失电子地图数据的数据缺失类型,具体可如下:判断缺失电子地图数据的最后一个地址片段的类型,将该类型与前述数据缺失类型进行比对,将比对上的数据缺失类型确定为该缺失电子地图数据的数据缺失类型。例如:若缺失电子地图数据的最后一个地址片段为行政区划,则确定该电子地图数据的数据缺失类型为行政区类型,如缺失电子地图数据为“xx市xx区”,则该缺失电子地图数据的数据缺失类型为行政区类型;如缺失电子地图数据为“xx市xx区xx路”,则该缺失电子地图数据的数据缺失类型为道路类型;还如缺失电子地图数据为“xx市xx区xx路xx小区”,则该缺失电子地图数据的数据缺失类型为小区类型;还如缺失电子地图数据为“xx市xx区xx路xx小区xx号”,则该缺失电子地图数据的数据缺失类型为门牌号类型。

步骤107:根据所述数据缺失类型的优先级以及缺失电子地图数据的缺失频次,确定所述缺失电子地图数据的重要度。

其中,缺失电子地图数据的数据缺失类型的优先级越高则其重要度越大;缺失电子地图数据的缺失频次越多则其重要度越大。

步骤107中,根据所述数据缺失类型的优先级以及缺失电子地图数据的缺失频次,确定所述缺失电子地图数据的重要度,具体实现可如下:缺失电子地图数据的数据缺失类型越高则对应的重要度越高,若数据缺失类型相同则缺失频次越高其对应的重要度越高。

步骤108:将所述缺失数据库中的缺失电子地图数据按照重要度从高到低的顺序进行排序,并将排序后的缺失数据库中的缺失电子地图数据存储至预置的采集数据库中。

通过本发明实施例一的方案,在接收到携带有待编码地址的地理编码请求时,对所述地理编码请求中的待编码地址进行分词,得到组成所述待编码地址的地址片段;对所述待编码地址对应的地址片段进行地理编码,当地理编码失败时,将所述待编码地址确定为缺失电子地图数据,并存储至预置的缺失数据库中;对所述待编码地址对应的地址片段,按照其在待编码地址中的位置顺序,进行重新组合,得到至少一个包含所述待编码地址对应的部分地址片段的新地址,并对新地址进行地理编码,若地理编码失败则将该新地址确定为缺失电子地图数据,并存储至预置的缺失数据库中。本方案,能够通过地理编码方式确定出缺失电子地图数据,并对所述待编码地址对应的地址片段按照其在待编码地址中的位置顺序进行重新组合,得到至少一个包含所述待编码地址对应的部分地址片段的新地址,并对新地址进行地理编码,若地理编码失败则将该新地址确定为缺失电子地图数据,最后将确定出的缺失电子地图数据存储至预置的缺失数据库中,为后续补充电子地图数据提供依据,从而能够有针对性的完善电子地图数据库,继而更进一步提高后续地理编码的成功率。

实施例二:

如图3所示,为本发明实施例二提供的一种数据查找设备的结构示意图。所述设备包括:接收模块31、分词模块32、第一缺失电子地图数据确定模块33和第二缺失电子地图数据确定模块34,其中:

接收模块31,用于接收携带有待编码地址的地理编码请求;

分词模块32,用于对所述地理编码请求中的待编码地址进行分词,得到组成所述待编码地址的地址片段;

第一缺失电子地图数据确定模块33,用于对所述待编码地址对应的地址片段进行地理编码,当地理编码失败时,将所述待编码地址确定为缺失电子地图数据,并存储至预置的缺失数据库中,并触发第二缺失电子地图数据确定模块34;

第二缺失电子地图数据确定模块34,用于对所述待编码地址对应的地址片段,按照其在待编码地址中的位置顺序,进行重新组合,得到至少一个包含所述待编码地址对应的部分地址片段的新地址,并对新地址进行地理编码,若地理编码失败则将该新地址确定为缺失电子地图数据,并存储至预置的缺失数据库中。

可选地,所述确定设备还包括:删除模块35,其中:

删除模块35,用于在分词模块32对所述地理编码请求中的待编码地址进行分词之前,根据预置的无效词词库,确定出所述待编码地址中的无效词,并删除所述待编码地址中的无效词;针对删除无效词之后的待编码地址,触发所述分词模块32。

可选地,所述确定设备还包括:匹配模块36,其中:

所述匹配模块36,用于在分词模块32对所述地理编码请求中的待编码地址进行分词之前,将所述待编码地址与预置非标准地址词库进行匹配,若匹配成功则确定所述待编码地址为非标准地址,若匹配失败则确定所述待编码地址为标准地址;

所述分词模块32,具体用于:当所述待编码地址为非标准地址时,根据预置的通用分词词库对所述待编码地址进行分词;当所述待编码地址为标准地址时,根据预置的标准分词词库对所述待编码地址进行分词。

具体地,所述第二缺失电子地图数据确定模块34,具体用于:

从所述待编码地址对应的第一个地址片段开始,遍历所述待编码地址的地址片段,每遍历一个地址片段,则将该遍历的地址片段与已经遍历的地址片段按照在待编码地址中的位置顺序组合成一个新地址;并对该新地址进行地理编码,若地理编码失败则将该新地址确定为缺失电子地图数据,并存储至预置的缺失数据库中,直到遍历完所述待编码地址的倒数第二个地址片段为止;

或者,

采用倒序递减方式,从所述待编码地址最后一个的地址片段开始,依次递减位于最后的地址片段,每递减一个地址片段,则将递减该地址片段后剩余的地址片段组成的地址作为新地址;并对该新地址进行地理编码,若地理编码失败则将该新地址确定为缺失电子地图数据,并存储至预置的缺失数据库中,直到递减完所述待编码地址的第一个地址片段为止。

可选地,所述设备还可包括:数据缺失类型确定模块37、重要度确定模块38和排序模块39,其中:

数据缺失类型确定模块37,用于确定所述缺失电子地图数据的数据缺失类型;

重要度确定模块38,用于根据所述数据缺失类型的优先级以及缺失电子地图数据的缺失频次,确定所述缺失电子地图数据的重要度;

排序模块39,用于将所述缺失数据库中的缺失电子地图数据按照重要度从高到低的顺序进行排序,并将排序后的缺失数据库中的缺失电子地图数据存储至预置的采集数据库中。

本领域的技术人员应明白,本发明的实施例可提供为方法、装置(设备)、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1