一种获取地理位置点信息的方法和装置与流程

文档序号:23724903发布日期:2021-01-26 15:14阅读:92来源:国知局
一种获取地理位置点信息的方法和装置与流程

[0001]
本申请涉及计算机应用技术领域,特别涉及大数据技术领域中的一种获取地理位置点信息的方法和装置。


背景技术:

[0002]
地图类产品主要的目标就是刻画真实世界,从而帮助用户查询地理位置点的信息并进一步满足各式各样的出行需求。然而,现实中地理位置点的信息会因为各种原因而发生变更。如果地图类产品采集的地理位置点的信息不准确,会导致用户无法按需找到目的地。
[0003]
当前业界通用的地理位置点信息的获取方法采用的是众源获取加上人工核实。这个方法依赖于各个渠道上报的地理位置点的信息,比如店家上报、用户上传、互联网情报等,然后通过熟悉业务的内部工作人员基于各种信息人工审核并生效上线。然而,这种方法严重依赖于人力,从而带来效率低下,信息更新不及时,且覆盖率较低等问题。


技术实现要素:

[0004]
有鉴于此,本申请提供了一种获取地理位置点信息的方法和装置,从而实现地理位置点信息的自动发现。
[0005]
第一方面,本申请提供了一种获取地理位置点信息的方法,包括:
[0006]
获取新产生的空间关系列表,所述空间关系列表包含一个以上的空间关系数据,所述空间关系数据包括两个地理位置点之间的空间关系信息;
[0007]
将所述空间关系列表中的空间关系数据进行串连,得到至少一个串连集合;
[0008]
若串连集合中至少有一个空间关系数据在已有知识库中存在,则将该串连集合中的空间关系数据写入知识库;
[0009]
对新写入知识库的空间关系数据所包含的地理位置点进行分析,得到所述新写入知识库的空间关系数据所包含的地理位置点信息。
[0010]
第二方面,本申请提供了一种获取地理位置点信息的装置,包括:
[0011]
空间关系获取单元,用于获取新产生的空间关系列表,所述空间关系列表包含一个以上的空间关系数据,所述空间关系数据包括两个地理位置点之间的空间关系信息;
[0012]
空间关系串连单元,用于将所述空间关系列表中的空间关系数据进行串连,得到至少一个串连集合;
[0013]
知识库处理单元,用于若串连集合中至少有一个空间关系数据在已有知识库中存在,则将该串连集合中的空间关系数据写入知识库;
[0014]
信息生成单元,用于对新写入知识库的空间关系数据所包含的地理位置点进行分析,得到所述新写入知识库的空间关系数据所包含的地理位置点信息。
[0015]
第三方面,本申请提供了一种电子设备,包括:
[0016]
至少一个处理器;以及
[0017]
与所述至少一个处理器通信连接的存储器;其中,
[0018]
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的方法。
[0019]
第四方面,本申请提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行上述的方法。
[0020]
通过本申请所提供的上述技术方案,能够实现地理位置点信息的自动发现,大大降低了对于人力的依赖,提高了效率且降低了人力成本。
[0021]
上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
[0022]
附图用于更好地理解本方案,不构成对本申请的限定。其中:
[0023]
图1示出了可以应用本申请实施例的方法或装置的示例性系统架构;
[0024]
图2为本申请实施例提供的主要方法流程图;
[0025]
图3为本申请实施例提供的一种详细方法流程图;
[0026]
图4为本申请实施例提供的一种产生空间关系列表的方法流程图;
[0027]
图5为本申请实施例提供的利用拍摄参数计算地理位置点坐标的示意图;
[0028]
图6为本申请实施例提供的另一种产生空间关系列表的方法流程图;
[0029]
图7为本申请实施例提供的地理位置点空间关系提取模型的结构示意图;
[0030]
图8为本申请实施例提供的装置结构图;
[0031]
图9是用来实现本申请实施例的电子设备的框图。
具体实施方式
[0032]
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0033]
图1示出了可以应用本申请实施例的方法或装置的示例性系统架构。如图1所示,该系统架构可以包括终端设备101和102,网络103和服务器104。网络103用以在终端设备101、102和服务器104之间提供通信链路的介质。网络103可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0034]
用户可以使用终端设备101和102通过网络103与服务器104交互。终端设备101和102上可以安装有各种应用,例如地图类应用、网页浏览器应用、通信类应用等。
[0035]
终端设备101和102可以是能够运行地图类应用的各类用户设备。包括但不限于智能手机、平板电脑、pc、智能电视等等。本申请所提供的获取地理位置点信息的装置可以设置并运行于上述服务器104中,也可以运行于独立于服务器104的设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块,在此不做具体限定。服务器104可以与地图数据库105之间进行交互,具体地,服务器104可以从地图数据库105中获取数据,也可以将数据存储于地图数据库105中。地图数据库105中存储有包括地理位置点的相关数据,例如状态、坐标信息等。
[0036]
例如,获取地理位置点信息的装置设置并运行于上述服务器104中,服务器104采用本申请实施例提供的方法进行地理位置点信息的获取,然后利用获取的地理位置点信息更新地图数据库105。服务器104能够响应于终端设备101、102的查询请求,查询地图数据库105,并向终端设备101、102返回所查询地理位置点的相关信息,包括地理位置点的状态、坐标信息、基于地理位置点信息的路线查询信息、导航信息,等等。
[0037]
服务器104可以是单一服务器,也可以是多个服务器构成的服务器群组。另外104除了以服务器的形式存在之外,也可以是具有较高计算性能的其他计算机系统或处理器。应该理解,图1中的终端设备、网络、服务器和数据库的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络、服务器和数据库。
[0038]
本申请中涉及的地理位置点指的是地图类应用中的地理位置点,该地理位置点可以供用户查询、浏览,向用户展现等。这些地理位置点具有坐标(例如经纬度)、名称、行政地址、类型、状态等基本属性。其中地理位置点可以包括但不限于poi(point of interest,兴趣点)、aoi(area of interest,兴趣面)、roi(regin of interest,兴趣区域)等。在后续实施例中均以poi为例进行描述。poi是地理信息系统中的一个术语,泛指一切可以抽象为点的地理对象,一个poi可以是一栋房子、一个商铺、一个邮筒、一个公交站、一所学校、一个医院,等等。poi的主要用途是对事物或事件的位置进行描述,从而增强对事物或事件位置的描述能力和查询能力。
[0039]
图2为本申请实施例提供的主要方法流程图,如图2中所示,该方法可以包括以下步骤:
[0040]
在201中,获取新产生的空间关系列表。
[0041]
本申请中新产生的空间关系列表是从专业采集的实景图像、众源采集的实景图像和互联网文本的至少一种中提取地理位置点之间的空间关系信息后得到的。
[0042]
获取到的空间关系列表包含一个以上的空间关系数据,空间关系数据包括两个地理位置点之间的空间关系信息。作为一种优选的实施方式,上述空间关系数据可以包含两个相邻地理位置点之间的空间关系信息。
[0043]
例如,空间关系数据可以采用四元组的形式表示,四元组r=<s,o,p,a>,其中,s和o为地理位置点的信息,例如可以采用地理位置点的唯一id,p为空间关系类型,a为空间关系取值。
[0044]
其中,空间关系的类型主要包括一些方位上的空间关系类型,例如东、南、西、北、东南、东北、西南、西北、左边、右边、楼上、楼下等等。取值可以包括距离的取值、楼层的取值等等。例如,四元组<清华科技园,清华大学东南门,南,100米>表示“清华科技园在清华大学东南门向南100米”。
[0045]
在202中,将新产生的空间关系列表中的空间关系数据进行串连,得到至少一个串连集合。
[0046]
在本步骤中,将空间关系数据进行串连时,如果两个空间关系数据包含一个相同的地理位置点,则这两个空间关系数据可以进行串连,依次类推,可以将多个空间关系数据串连起来构成一个串连集合。如果一个空间关系数据在新产生的空间关系列表中和其他空间关系数据均无法串连,则该空间关系数据自己构成一个串连集合。
[0047]
举个例子,假设新产生的空间关系列表中包含如下四元组:
[0048]
<s,o,p,a>、<s1,s,p1,a1>、<o,o1,p2,a2>、<s2,o2,p3,a3>
[0049]
那么,<s,o,p,a>、<s1,s,p1,a1>、<o,o1,p2,a2>构成一个串连集合;<s2,o2,p3,a3>构成一个串连集合。
[0050]
在203中,若串连集合中至少有一个空间关系数据在已有知识库中存在,则将该串连集合中的空间关系数据写入知识库。
[0051]
在本申请实施例中,知识库中存储有空间关系数据,每一次确定出的可信任的空间关系数据都被存储如空间关系数据。对于新产生的空间关系列表得到的串连集合而言,如果至少有一个空间关系数据在已有知识库中存在,则说明该至少一个空间关系是可信的。而串连集合中每一个空间关系都是与该可信的空间关系存在串连联系的,因此可以认为该串连集合中的空间关系数据都是可信的,将其写入知识库。
[0052]
在204中,对新写入知识库的空间关系数据所包含的地理位置点进行分析,得到所述新写入知识库的空间关系数据所包含的地理位置点信息。
[0053]
本步骤中得到的地理位置点信息可以包括地理位置点的坐标信息和/或地理位置点的状态信息。其中状态信息主要体现于地理位置点的变更,例如新增、关闭和变更等。
[0054]
作为一种优选的实施方式,利用新写入知识库的空间关系数据所包含的至少一个地理位置点的已知坐标信息,得到新写入知识库的空间关系数据中其他地理位置点的坐标信息。其中,上述已知坐标信息可以由该地理数据库中获取,也可以由专业采集的实景图像得到。
[0055]
作为一种优选的实施方式,可以将新写入知识库的空间关系数据与已有知识库的空间关系数据进行比对,得到新写入知识库的空间关系数据所对应区域的地理位置点状态信息。
[0056]
在本申请实施例中,地图数据库中可以存储有地理位置点的相关信息,因此,在本步骤中确定出的各地理位置点的信息也存入地理数据库中。
[0057]
可以看出,本申请利用新产生的空间关系数据进行处理能够实现地理位置点信息的自动发现,大大降低了对人力的依赖,提高了效率且降低了人力成本。
[0058]
传统依赖人工上报地理位置点信息并进行人工审核的方式,时效性和信息覆盖率完全依赖人工所采集的内容,而本申请提供的方式则基于空间关系数据确定地理位置信息,在时效性和信息覆盖率上得到了显著的提升。
[0059]
传统依赖人工上报地理位置点信息并进行人工审核的方式可能因用户行为的错误、用户设备的错误等造成地理位置点信息的不准确,而本申请提供的方式降低了对用户行为和用户设备的依赖,提高了地理位置点信息的准确性。
[0060]
图3为本申请实施例提供的一种详细方法流程图,如图3中所示,该方法可以包括以下步骤:
[0061]
在301中,从专业采集的实景图像、众源采集的实景图像和互联网文本的至少一种中提取相邻地理位置点之间的空间关系信息,得到新产生的空间关系列表。
[0062]
本步骤中涉及的提取相邻地理位置点之间的空间关系信息的优选实施方式,将在后续实施例中进行详细描述。
[0063]
在302中,将新产生的空间关系列表中的空间关系数据进行串连,得到至少一个串连集合。
[0064]
本步骤同实施例二中的步骤202,在此不做赘述。
[0065]
然后分别针对各串连集合执行以下步骤:
[0066]
在303中,判断当前串连集合中是否至少有一个空间关系数据在已有知识库中存在,如果是,执行304;否则,执行306。
[0067]
作为一种优选实施方式,在执行本步骤之前,可以预先将地理位置区域划分为区格,相邻区格之间存在重叠区域。知识库中的空间关系数据预先依据所包含地理位置点的地理位置被对应至至少一个区格。
[0068]
由于定位精度可能达到百米以上的误差,因此,可以将地理位置区域划分为诸如1km
×
1km的区格,相邻区格之间存在一定的重叠,例如存在0.5km的重叠。这样,对于任意一个地理位置点的坐标都落在区格范围内,也能够有效避免地理位置点处于区格边缘时可能导致相邻地理位置点无法落在同一个区格内的问题。
[0069]
可以对每个区格进行编号,并采用坐标落在该区格内的相邻地理位置点对应的空间关系数据进行索引。例如,某个四元组数据r
x
,其包含的两个地理位置点的坐标落在区格s
i
中,那么就认为该四元组数据r
x
对应区格s
i

[0070]
对于任意一个空间关系数据即四元组,都可以获取到其所包含两个相邻地理位置点的模糊坐标信息。因为通常除了专业设备之外,其他设备采集的地理位置点的坐标信息都多多少少存在一些定位精度的问题,在本申请实施例中,对于终端设备采集的地理位置点的坐标信息可以统一取一个定位精度,例如仅保留小数点后一位,并且认为该坐标信息是模糊坐标信息。本申请中,在取模糊坐标信息的定位精度时,可以依据上述区格在划分时采用的大小来进行相应确定。
[0071]
作为一种预选的实施方式,本步骤可以分别将当前串连集合中的各空间关系数据作为当前空间关系数据执行:确定当前空间关系数据所包含地理位置点所属的区格;在知识库中该区格对应的空间关系数据中查询当前空间关系数据,如果查询到,则确定已有知识库中存在当前空间关系数据;否则,确定已有知识库中不存在当前空间关系数据。
[0072]
在本申请所提供的优选实施方式中,由于空间关系数据包含的相邻的地理位置点一定是位于同一区格的,因此可以在知识库中该区格对应的空间关系数据中查询当前空间关系数据。其中,在确定当前空间关系所包含地理位置点所属的区格时,可以依据当前空间关系所包含地理位置点的模糊坐标信息确定所属的区格。
[0073]
在304中,将该串连集合中的空间关系数据写入知识库。
[0074]
在305中,判断是否还有未处理的串连集合,如果有,则继续对下一串连集合转至执行303,否则执行308。
[0075]
如果串连集合中的某个空间关系数据在已有知识库中存在,因为知识库中存储的空间关系数据是认为正确的空间关系数据,且该串连集合中的各空间关系数据是与该正确的空间关系数据是存在合理串连关系的,因此可以认为该串连集合中包含的空间关系数据也是正确的,可以将其写入知识库。
[0076]
举个例子,新产生的空间关系数据列表中,<s,o,p,a>、<s1,s,p1,a1>、<o,o1,p2,a2>构成一个串连集合,若已有知识库中存在<o,o1,p2,a2>,那么将<s,o,p,a>、<s1,s,p1,a1>、<o,o1,p2,a2>写入知识库。
[0077]
在306中,判断当前串连集合中是否存在由专业采集的实景图像得到的空间关系
数据,如果是,执行304;否则,执行307。
[0078]
如果串连集合中的某个空间关系数据在已有知识库中不存在,可以进一步判断当前串连集合中是否存在由专业采集的实景图像。以为专业采集的实景图像无论是在人员素质上设备精度上都认为是可信的、准确的,因此,如果当前串连集合中某个空间关系数据是由专业采集的实景图像得到的,那么可以认为该空间关系数据是正确的,且该串连集合中的各空间关系数据是与该正确的空间关系数据是存在合理串连关系的,因此可以认为该串连集合中包含的空间关系数据也是正确的,可以将其写入知识库。
[0079]
在307中,将该串连集合中的空间关系数据写入待核实列表,转至执行305。
[0080]
如果串连集合中的空间关系数据在已有知识库中不存在,并且也不存在由专业采集的实景图像得到的空间关系数据,那么可以将该串连集合中的空间关系数据写入待核实列表。并且,可以进一步通知专业采集团队,后续由专业采集团队对待核实列表中对应区域的各地理位置点的信息进行采集和核实。
[0081]
待所有串连集合都处理完毕后,执行308,即利用新写入知识库的空间关系数据所包含的至少一个地理位置点的已知坐标信息,得到新写入知识库的空间关系数据中其他地理位置点的坐标信息。
[0082]
上述已知坐标信息指的是精确坐标信息,其定位精度要高于上述的模糊坐标信息。
[0083]
作为一种优选的实施方式,若新写入知识库的空间关系数据包含由专业采集的实景图像得到的空间关系数据,则利用专业采集的实景图像携带的地理位置点的坐标信息对新写入知识库的空间关系数据包含的其他地理位置点进行基于空间关系的推算,得到其他地理位置点的坐标信息并写入地图数据库。
[0084]
由于空间关系数据中包含的是相邻两个地理位置点之间的空间关系信息,因此,若知道其中一个地理位置点的坐标信息,则就可以进行基于空间关系的推算得到另外一个地理位置点的坐标。新写入知识库的空间关系数据是存在串连关系的,这样基于多个空间关系数据进行推算,就可以得到新写入知识库的空间关系数据所包含地理位置点的坐标信息。
[0085]
作为另一种优选的实施方式,若新写入知识库的空间关系数据包含的地理位置点在已有地图数据库中存在精确坐标信息,则利用存在精确坐标信息的地理位置点对新写入知识库的空间关系数据包含的其他地理位置点进行基于空间关系的推算,得到其他地理位置点的坐标信息并写入地图数据库。
[0086]
在本申请实施例中,地图数据库中存储有已知精确坐标信息的地理位置点,地图类产品在上线时使用的就是地图数据库中的坐标信息。若新写入知识库的空间关系数据中存在某个地理位置点在已有地图数据库中存在精确坐标信息,新写入知识库的空间关系数据是存在串连关系的,那么基于空间关系的推算就能够得到其他地理位置点的坐标信息。
[0087]
基于本步骤就可以得到一批地理位置点的坐标信息。在一些场景下,除了需要地理位置点的坐标信息之外,还需要及时获知地理位置点的状态变更。那么可以进一步执行309,即确定新写入知识库的空间关系数据中地理位置点的状态变更信息。
[0088]
作为一种优选的实施方式,若新写入知识库的空间关系数据包含的相邻两个地理位置点在已有知识库中并不相邻,则确定已有知识库中该相邻两个地理位置点之间的地理
位置点的状态为关闭,删除知识库中包含状态为关闭的地理位置点的空间关系数据。
[0089]
例如,若新写入知识库的空间关系数据包括<s,o,p,a>,而已有知识库中地理位置点s和o并不相邻,而是存在<s,s4,p4,a4>和<s4,o,p5,a5>,那么说明地理位置点s4已经不存在,即处于关闭状态。可以进一步删除知识库包含s4的空间关系数据。
[0090]
作为一种优选的实施方式,若新写入知识库的空间关系数据所包含地理位置点a的坐标信息与已有地图数据库中另一地理位置点b的坐标信息重叠,则确定地理位置点b的状态为变更,地理位置点a的状态为新增,删除知识库中包含状态为变更的地理位置点的空间关系数据。
[0091]
作为一种优选的实施方式,若新写入知识库的空间关系数据所包含的地理位置点在已有地图数据库中不存在,则确定该地理位置点的状态为新增。
[0092]
对于上述实施例中步骤201和301中,新产生空间关系列表的具体方式,列举两个实施例进行详细描述。
[0093]
图4为本申请实施例提供的一种产生空间关系列表的方法流程图,如图4中所示,该方法可以包括以下步骤:
[0094]
在401中,对各终端设备采集的实景图像进行招牌识别,确定实景图像中包含的地理位置点对。
[0095]
在本申请中,利用的是终端设备对地理位置点进行拍摄得到的实景图像来确定地理位置点之间的空间关系。其中,终端设备对地理位置点进行拍摄得到的实景图像可以是从专业采集的实景图像,也可以是众源采集的实景图像。
[0096]
获取各终端设备采集的实景图像后,可以对实景图像进行招牌识别,筛选出包含至少两个招牌的实景图像。然后对包含至少两个招牌的实景图像进行招牌的文字识别,确定实景图像中包含的地理位置点对。本申请中涉及的地理位置点对由两个不同的地理位置点构成。
[0097]
其中,实景图像指的是终端设备在实地对地理位置点进行拍摄得到的图像。本申请中使用的实景图像需要包含至少两个招牌,以便后续利用实景图像的拍摄参数确定两个招牌所对应地理位置点之间的空间关系。所谓招牌指的是挂在地理位置点对应的建筑物门前作为标志的牌子。例如在店铺门口挂出的店名招牌、在学校门口的学校名称的招牌,等等。
[0098]
在对实景图像进行招牌判别时,可以利用预先训练得到的招牌判别模型。首先对实景图像进行区域划分,因为一般情况下实景图像中的招牌是一个封闭区域,因此可以对实景图像进行区域的识别和划分,对于确定出的封闭区域输入招牌判别模型,由招牌判别模型输出该封闭区域是否为招牌区域的判别结果。
[0099]
其中招牌判别模型实际上是一个分类模型,可以预先收集一些实景图像在其中标注出招牌区域和非招牌区域分别作为正、负样本,然后训练分类模型而得到该招牌判别模型。
[0100]
在对包含至少两个招牌的实景图像进行招牌的文字识别,确定实景图像中包含的地理位置点对时,可以首先基于实景图像之间的定位距离,对筛选出的实景图像进行聚类,得到一个以上的相似定位类簇。然后分别对各相似定位类簇中的图像进一步基于内容相似度进行聚类,得到一个以上的相似内容类簇,使得各相似定位类簇中包含的实景图像都是
拍摄位置比较接近的。再分别对各相似定位类簇中的图像进一步基于内容相似度进行聚类,得到一个以上的相似内容类簇。再分别对各相似内容类簇中的实景图像进行招牌判别,确定招牌区域。对各实景图像中确定出的招牌区域进行id(标识)唯一化处理。确定各实景图像包含的招牌区域id序列并从中获取频繁项序列。再对频繁项序列中各id对应的招牌区域进行文字识别。针对包含频繁项序列的实景图像,从频繁项序列中选择n-1个地理位置点对,该n-1个地理位置点对构成的集合包含该频繁项序列中所有招牌id对应的地理位置点,且各地理位置点对在实景图像中对应的招牌距离之和最小,n为频繁项序列中包含的招牌数量。
[0101]
在402中,获取同一终端设备采集的包含同一地理位置点对的至少两张实景图像。
[0102]
挖掘出各实景图像的地理位置点对之后,可以利用各地理位置点对建立实景图像的倒排索引。本步骤可以通过查找倒排索引来获取同一地理位置点对的实景图像,但需要保证获取的实景图像是同一终端设备采集的,且数量为至少两张。
[0103]
在403中,利用至少两张实景图像的拍摄参数,确定所述同一地理位置点对的空间关系。
[0104]
本步骤中涉及的拍摄参数主要包括:
[0105]
1)实景图像的定位坐标即拍摄该实景图像的拍摄点的坐标,通常终端设备在进行图像拍摄时,会获取终端设备当前的定位坐标作为所拍摄图像的定位坐标。
[0106]
2)对实景图像中地理位置点对的招牌的拍摄角度和拍摄距离。
[0107]
由于拍摄设备的设置或功能上的原因,有些实景图像具备上述拍摄参数,有些实景图像则不具备上述拍摄参数。在本申请中,仅获取并利用具备上述拍摄参数的实景图像来确定地理位置点对的空间关系。
[0108]
本步骤中主要利用实景图像的上述拍摄参数,基于诸如正弦定理和余弦定理等几何关系进行计算,从而得到地理位置点对中两个地理位置点的坐标;基于两个地理位置点的坐标,确定两个地理位置点的空间关系。
[0109]
以图5为例,假设同一终端设备拍摄的两张实景图像中均包含地理位置点m和地理位置点n构成的地理位置点对。第一张实景图像中对应的拍摄位置坐标为拍摄点a,图中的夹角α和β可以由拍摄角度确定。第二张实景图像中对应的拍摄位置坐标为拍摄点b,图中的夹角γ和δ可以由拍摄角度确定。两个拍摄点之间的距离x可以由两张实景图像的定位坐标得到。
[0110]
根据正弦定理,可以得到地理位置点m与拍摄点a的距离p,以及地理位置点n与拍摄点a的距离q:
[0111][0112][0113]
根据这些距离信息和夹角信息、拍摄点a和b的定位坐标,就可以确定出两个地理位置点的坐标。
[0114]
另外需要说明的是,由于同一终端设备可能会拍摄包含同一地理位置点对(m,n)的实景图像数量多于两张,而通过本步骤中的方式实际上可以利用两两的实景图像确定出
上述地理位置点m和n的多个坐标。对于这种情况,可以将确定出的地理位置点m的多个坐标进行诸如求平均、取聚类中心、求中值等方式进行处理后,得到地理位置点m的坐标。同理将确定出的地理位置点n的多个坐标进行诸如求平均、取聚类中心、求中值等方式进行处理后,得到地理位置点n的坐标。
[0115]
在得到两个地理位置点的坐标之后,就能够确定出两个地理位置点在空间上的相对位置关系,例如在方向上的关系以及距离关系等。
[0116]
本申请实施例中涉及的空间关系的信息可以包括:空间关系的类型和取值。空间关系的类型主要包括一些方位上的空间关系类型,例如东、南、西、北、东南、东北、西南、西北、左边、右边、楼上、楼下等等。取值可以包括距离的取值、楼层的取值等等。可以看出,地理位置点的空间关系是相对的。
[0117]
图6为本申请实施例提供的另一种产生空间关系列表的方法流程图,如图6中所示,该方法可以包括以下步骤:
[0118]
在601中,从互联网获取包含地理位置点信息的文本。
[0119]
在本申请中,可以从地理位置点关联的官网中获取包含地理位置点信息的文本,例如从海底捞官网上获取到“海底捞北京市海淀区清河中街五彩城购物中心六层”的文本,从招商银行获取到“招商银行北京清华园支行海淀区清华科技园,科技大厦b座g层,清华大学东门向南200米”。
[0120]
除了上述数据源之外,也可以从其他数据源获取包含地理位置点信息的文本。
[0121]
在602中,将该文本输入预先训练得到的地理位置点空间关系提取模型,获取地理位置点空间关系提取模型输出的空间关系的信息;其中地理位置空间关系提取模型包括嵌入层、transformer层和映射层。
[0122]
本申请实施例中涉及的地理位置点空间关系提取模型的结构可以如图7中所示,嵌入层可以包括多个嵌入层。
[0123]
首先,对于文本可以看作由至少一个语句构成的序列,首先可以在文本之前增加分隔符[cls],语句之间增加分隔符[sep],每个字符和分隔符都分别作为一个token。输入序列x可以表示成x={x1,x2,

,x
n
},n为token的数量,x
i
表示其中一个token。需要说明的是,本申请中嵌入层以字符为粒度作为token,能够有效解决长尾词的问题。
[0124]
第一嵌入层,图中表示为token embedding,用于对文本中各token(元素)进行字符编码,文本中的token可以包括文本中的字符以及分隔符。
[0125]
第二嵌入层,图中表示为position embedding,用于对各token进行位置编码,可以对各token在文本中的位置信息,例如对各token按顺序进行位置编号,对各位置编号进行编码。
[0126]
第三嵌入层,图中表示为sentence embedding,用于对各token所属语句标识进行编码。例如对文本中的语句进行按顺序编号作为语句标识,对各token所属语句标识进行编码。
[0127]
经过上述各嵌入层后,各token、位置信息和所属语句标识被转化为稠密向量表示。其中,e
i
表示第i个token的向量表示,e
xi
表示第i个token作为字符的向量表示,是通过查找词向量矩阵,将字符转换成稠密向量得到的。e
qi
表示第i个token的位置的向量表示,是通过查找词向量矩阵,将位置转换为稠密向量得到的。e
si
表示第i个token所述语句标识的
向量表示,是通过查找词向量矩阵,将语句表示转换为稠密向量得到的。
[0128]
各嵌入层的编码结果输出至transformer层(图中表示为multi-layer transformer),transformer层进行多层的attention(注意力)机制处理后,输出隐向量。例如,将一个稠密向量序列e={e1,e2,

,e
n
},输出是包含上下文信息的隐向量序列h=φ
θ
(e)={h1,h2,

,h
n
}。其中,n为输入的序列长度,即包含的token数量。
[0129]
映射层可以包括crf(conditional random field,条件随机场),用于利用transformer层输出的隐向量,预测输入模型的文本包含的空间关系的信息。
[0130]
在得到隐向量的序列h={h1,h2,

,h
n
}后,我们使用crf预测标签,从而得到模型的输出y={y1,y2,

,y
n
},其中y
i
是对应的输入x
i
的预测标签。
[0131]
对于每个token x
i
,我们可以通过如下公式得到一个概率分布,我们可以通过如下公式得到一个概率分布表了输出标签的数量。
[0132][0133]
随后对于每个预测序列y={y1,y2,

,y
n
},我们可以得到这个序列的得分:
[0134][0135]
最终,我们可以使用softmax(全连接层)层得到每个预测序列y的概率p
r

[0136][0137]
其中,指得到的所有预测序列中的任一个。
[0138]
最终取概率最大的预测序列y,该预测序列中包括对地理位置点空间关系信息的预测,包括空间关系的类型和取值。更进一步地,预测序列中还包括对地理位置点的预测。最终可以表示成一个四元组r=<s,o,p,a>,其中,s和o为地理位置点,p为空间关系类型,a为空间关系取值。
[0139]
经过上述地理位置点空间关系提取模型后,输入文本“海底捞北京市海淀区清河中街五彩城购物中心六层”从中提取出地理位置点“海底捞”和“五彩城”的空间关系类型为“楼层”,取值为“6层”,可以表示成一个四元组r=<海底捞,五彩城,楼层,6层>。
[0140]
输入文本“招商银行北京清华园支行海淀区清华科技园,科技大厦b座g层,清华大学东门向南200米”从中提取出地理位置点“招商银行”和“清华大学东门”的空间位置关系类型为“南”,取值为“200米”,可以表示成四元组r=<招商银行,清华大学东门,南,200米>。
[0141]
从该实施例中可以看出,本申请能够从互联网中包含地理位置点信息的文本中提取出地理位置点空间关系信息。
[0142]
并且,本申请实施例中定义了一套表示空间关系的描述体系,与常识类知识图谱中的三元组<实体1,实体2,关系>类似,采用<地理位置点1,地理位置点2,空间关系类型,空间关系取值>,使得空间关系的表达更规范统一,使得空间关系知识的系统化的计算、推理、
存储成为可能。
[0143]
在上述提取地理位置点空间关系信息的过程中,地理位置点空间关系提取模型是重点之一。
[0144]
以上是对本申请所提供方法进行的详细描述,下面对本申请所提供的装置进行详细描述。
[0145]
图8为本申请实施例提供的获取地理位置点信息的装置结构图,装置可以是位于服务器端的应用,或者还可以为位于服务器端的应用中的插件或软件开发工具包(software development kit,sdk)等功能单元,或者,还可以位于计算机系统,本发明实施例对此不进行特别限定。如图8中所示,该装置可以包括:空间关系获取单元01、空间关系串连单元02、知识库处理单元03和信息生成单元04。其中,各组成单元的主要功能如下:
[0146]
空间关系获取单元01,用于获取新产生的空间关系列表,空间关系列表包含一个以上的空间关系数据,空间关系数据包括两个地理位置点之间的空间关系信息。
[0147]
其中,新产生的空间关系列表是从专业采集的实景图像、众源采集的实景图像和互联网文本的至少一种中提取相邻地理位置点之间的空间关系信息后得到的。
[0148]
空间关系串连单元02,用于将空间关系列表中的空间关系数据进行串连,得到至少一个串连集合。
[0149]
将空间关系数据进行串连时,如果两个空间关系数据包含一个相同的地理位置点,则这两个空间关系数据可以进行串连,依次类推,可以将多个空间关系数据串连起来构成一个串连集合。如果一个空间关系数据在新产生的空间关系列表中和其他空间关系数据均无法串连,则该空间关系数据自己构成一个串连集合。
[0150]
知识库处理单元03,用于若串连集合中至少有一个空间关系数据在已有知识库中存在,则将该串连集合中的空间关系数据写入知识库。
[0151]
作为一种优选的实施方式,知识库处理单元03可以分别将串连集合中的各空间关系数据作为当前空间关系数据执行:
[0152]
确定当前空间关系数据所包含地理位置点所属的区格;
[0153]
在知识库中该区格对应的空间关系数据中查询当前空间关系数据,如果查询到,则确定已有知识库中存在当前空间关系数据;否则,确定已有知识库中不存在当前空间关系数据。
[0154]
其中,地理位置区域被预先划分为区格,相邻区格之间存在重叠区域;知识库处理单元03可以预先依据所包含地理位置点的地理位置将知识库中的空间关系数据对应至至少一个区格。
[0155]
作为一种优选的实施方式,知识库处理单元03在确定当前空间关系所包含地理位置点所属的区格时,可以依据当前空间关系所包含地理位置点的模糊坐标信息确定所属的区格;已知坐标信息包括精确坐标信息;其中,模糊坐标信息的精确度小于精确坐标信息。
[0156]
更进一步地,若串连集合中所有空间关系数据在已有知识库中均不存在,则知识库处理单元03确定该串连集合中是否存在由专业采集的实景图像得到的空间关系数据,如果是,则将该串连集合中的空间关系数据写入知识库。
[0157]
更进一步地,若该串连集合中不存在由专业采集的实景图像得到的空间关系数据,则知识库处理单元03可以将该串连集合中的空间关系数据写入待核实列表。并且,可以
进一步通知专业采集团队,后续由专业采集团队对待核实列表中对应区域的各地理位置点的信息进行采集和核实。
[0158]
信息生成单元04,用于对新写入知识库的空间关系数据所包含的地理位置点进行分析,得到所述新写入知识库的空间关系数据所包含的地理位置点信息。
[0159]
其中,信息生成单元04可以利用新写入知识库的空间关系数据所包含的至少一个地理位置点的已知坐标信息,得到新写入知识库的空间关系数据中其他地理位置点的坐标信息。
[0160]
作为一种优选的实施方式,若新写入知识库的空间关系数据包含由专业采集的实景图像得到的空间关系数据,则信息生成单元04利用专业采集的实景图像携带的地理位置点的坐标信息对新写入知识库的空间关系数据包含的其他地理位置点进行基于空间关系的推算,得到其他地理位置点的坐标信息并写入地图数据库。
[0161]
作为一种优选的实施方式,若新写入知识库的空间关系数据包含的地理位置点在已有地图数据库中存在精确坐标信息,则信息生成单元04利用存在精确坐标信息的地理位置点对新写入知识库的空间关系数据包含的其他地理位置点进行基于空间关系的推算,得到其他地理位置点的坐标信息并写入地图数据库。
[0162]
另外,信息生成单元04可以执行以下方式中的至少一种来确定新写入知识库的空间关系数据包含的地理位置点的状态信息:
[0163]
若新写入知识库的空间关系数据包含的相邻两个地理位置点在已有知识库中并不相邻,则确定已有知识库中该相邻两个地理位置点之间的地理位置点的状态为关闭,删除知识库中包含状态为关闭的地理位置点的空间关系数据。
[0164]
若新写入知识库的空间关系数据所包含一个地理位置点的坐标信息与已有地图数据库中另一地理位置点的坐标信息重叠,则确定另一地理位置点的状态为变更,一个地理位置点的状态为新增,删除知识库中包含状态为变更的地理位置点的空间关系数据。
[0165]
若新写入知识库的空间关系数据所包含的地理位置点在已有地图数据库中不存在,则确定该地理位置点的状态为新增。
[0166]
在通过本申请实施例所提供的方式得到新入库的地理位置点的坐标信息和状态变更信息后,可以应用于多种场景。诸如,当获取到来自终端设备的位置查询请求时,可以基于更新后的地图数据库进行查询并返回相应的位置信息。再诸如,当获取到来自终端设备的导航请求后,可以基于更新后的地图数据库进行查询并返回导航结果。再诸如,当获取到来自终端设备的路线查询请求后,可以基于更新后的地图数据库进行查询并返回路线结果。等等。
[0167]
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
[0168]
如图9所示,是根据本申请实施例的获取地理位置点信息的方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
[0169]
如图9所示,该电子设备包括:一个或多个处理器901、存储器902,以及用于连接各
部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示gui的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图9中以一个处理器901为例。
[0170]
存储器902即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的获取地理位置点信息的方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的获取地理位置点信息的方法。
[0171]
存储器902作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的获取地理位置点信息的方法对应的程序指令/单元。处理器901通过运行存储在存储器902中的非瞬时软件程序、指令以及单元,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的获取地理位置点信息的方法。
[0172]
存储器902可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据该电子设备的使用所创建的数据等。此外,存储器902可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器902可选包括相对于处理器901远程设置的存储器,这些远程存储器可以通过网络连接至该电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0173]
该电子设备还可以包括:输入装置903和输出装置904。处理器901、存储器902、输入装置903和输出装置904可以通过总线或者其他方式连接,图9中以通过总线连接为例。
[0174]
输入装置903可接收输入的数字或字符信息,以及产生与该电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置904可以包括显示设备、辅助照明装置(例如,led)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(lcd)、发光二极管(led)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
[0175]
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用asic(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
[0176]
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些
计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(pld)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
[0177]
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
[0178]
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
[0179]
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
[0180]
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
[0181]
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1