地理信息处理方法、装置、电子设备及介质与流程

文档序号:18900584发布日期:2019-10-18 21:53阅读:229来源:国知局
地理信息处理方法、装置、电子设备及介质与流程

本公开涉及信息处理领域,具体涉及一种地理信息处理方法、装置、电子设备及介质。



背景技术:

随着大数据和人工智能,尤其是认知智能技术的发展,金融科技正在越来越多的应用新技术来为社会提供服务。传统金融服务的核心业务,例如反欺诈识别、风控、贷前贷后管理均是基于人工数据处理的结果来完成的,这在业务规模较小,服务区域较为固定的情况下还能够较好地应对。但随着金融服务业的互联网化,金融服务的大量业务从线下转移到线上,以及业务规模的快速增长,人工处理方式对于海量数据处理任务的局限性变得越来越大,这就使得基于互联网数据采集和人工智能处理的方法越来越多的取代了人工工作。然而,由于当前人工智能算法的局限,在一些具体的数据处理任务上,比如地理位置信息的处理,如何精准地对于输入地理位置信息进行识别,这对于机器处理来说仍然具有较大的挑战。



技术实现要素:

针对现有技术中的上述技术问题,本公开实施例提出了一种地理信息处理方法、装置、电子设备及介质。

本公开实施例的第一方面提供了一种地理信息处理方法,包括:

获取待处理地理信息;

确定与所述待处理地理信息对应的预设精度地理位置信息;

比较所述预设精度地理位置信息与预设地理信息网格,得到所述待处理地理信息之间的关系,其中,所述预设地理信息网格是预先设置的基于关联关系的地理信息网格。

在一些实施例中,所述确定与所述待处理地理信息对应的预设精度地理位置信息,包括:

获取预设精度地理位置网格,其中,所述预设精度地理位置网格包括地理信息关键词与预设精度地理位置信息之间的对应关系;

提取所述待处理地理信息的地理信息关键词;

将所述地理信息关键词输入至所述预设精度地理位置网格中,根据所述地理信息关键词与预设精度地理位置信息之间的对应关系,确定与所述待处理地理信息对应的预设精度地理位置信息。

在一些实施例中,所述比较所述预设精度地理位置信息与预设地理信息网格,得到所述待处理地理信息之间的关系,包括:

获取所述预设地理信息网格属性信息;

比较所述预设精度地理位置信息与所述预设地理信息网格属性信息,确定所述预设精度地理位置信息归属的预设地理信息网格;

根据归属预设地理信息网格之间的关系确定所述待处理地理信息之间的关系。

在一些实施例中,还包括:

生成预设地理信息网格。

在一些实施例中,所述生成预设地理信息网格,包括:

确定网格目标区域;

获取位于所述网格目标区域中的第一对象的地理信息以及与所述第一对象关联的第二对象的地理信息;

确定与所述第一对象的地理信息对应的第一预设精度地理位置信息以及与所述第二对象的地理信息对应的第二预设精度地理位置信息;

确定最小候选网格,使得所述候选网格能够覆盖所述第一预设精度地理位置信息和第二预设精度地理位置信息;

遍历所述网格目标区域中的所有对象,得到多个候选网格;

从所述多个候选网格中确定一组候选网格作为所述网格目标区域对应的目标地理信息网格。

在一些实施例中,所述从所述多个候选网格中确定一组候选网格作为所述网格目标区域对应的目标地理信息网格,被实施为:

根据所述候选网格中对象的数量、对象的密集度、尺寸大小,从所述多个候选网格中确定一组候选网格作为所述网格目标区域对应的目标地理信息网格,使得所述目标地理信息网格覆盖或部分覆盖所述网格目标区域。

在一些实施例中,所述生成预设地理信息网格,还包括:

根据预设地理调整信息对于所述目标地理信息网格进行调整。

本公开实施例的第二方面提供了一种地理信息处理装置,包括:

获取模块,被配置为获取待处理地理信息;

确定模块,被配置为确定与所述待处理地理信息对应的预设精度地理位置信息;

比较模块,被配置为比较所述预设精度地理位置信息与预设地理信息网格,得到所述待处理地理信息之间的关系,其中,所述预设地理信息网格是预先设置的基于关联关系的地理信息网格。

在一些实施例中,所述确定模块包括:

第一获取子模块,被配置为获取预设精度地理位置网格,其中,所述预设精度地理位置网格包括地理信息关键词与预设精度地理位置信息之间的对应关系;

提取子模块,被配置为提取所述待处理地理信息的地理信息关键词;

第一确定子模块,被配置为将所述地理信息关键词输入至所述预设精度地理位置网格中,根据所述地理信息关键词与预设精度地理位置信息之间的对应关系,确定与所述待处理地理信息对应的预设精度地理位置信息。

在一些实施例中,所述比较模块包括:

第二获取子模块,被配置为获取所述预设地理信息网格属性信息;

比较子模块,被配置为比较所述预设精度地理位置信息与所述预设地理信息网格属性信息,确定所述预设精度地理位置信息归属的预设地理信息网格;

第二确定子模块,被配置为根据归属预设地理信息网格之间的关系确定所述待处理地理信息之间的关系。

在一些实施例中,还包括:

生成模块,被配置为生成预设地理信息网格。

在一些实施例中,所述生成模块包括:

第三确定子模块,被配置为确定网格目标区域;

第三获取子模块,被配置为获取位于所述网格目标区域中的第一对象的地理信息以及与所述第一对象关联的第二对象的地理信息;

第四确定子模块,被配置为确定与所述第一对象的地理信息对应的第一预设精度地理位置信息以及与所述第二对象的地理信息对应的第二预设精度地理位置信息;

第五确定子模块,被配置为确定最小候选网格,使得所述候选网格能够覆盖所述第一预设精度地理位置信息和第二预设精度地理位置信息;

遍历子模块,被配置为遍历所述网格目标区域中的所有对象,得到多个候选网格;

第六确定子模块,被配置为从所述多个候选网格中确定一组候选网格作为所述网格目标区域对应的目标地理信息网格。

在一些实施例中,所述第六确定子模块被配置为:

根据所述候选网格中对象的数量、对象的密集度、尺寸大小,从所述多个候选网格中确定一组候选网格作为所述网格目标区域对应的目标地理信息网格,使得所述目标地理信息网格覆盖或部分覆盖所述网格目标区域。

在一些实施例中,所述生成模块还包括:

调整子模块,被配置为根据预设地理调整信息对于所述目标地理信息网格进行调整。

本公开实施例的第三方面提供了一种计算机程序产品,所述计算机程序产品包括存储在计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,可用来实现如前述各实施例所述的方法。

本公开实施例通过设置预设的非固定的基于关联关系的地理信息网格,将与待处理地理信息对应的预设精度地理位置信息输入其中,来得到待处理地理信息之间的关系。本公开实施例能够提高地理信息关系判断的精确度,并且可根据应用环境的不同以及实际地理信息对于地理信息网格进行调整,以进一步提高地理位置关系判断的有效性。

附图说明

通过参考附图会更加清楚的理解本公开的特征和优点,附图是示意性的而不应理解为对本公开进行任何限制,在附图中:

图1是根据本公开的一些实施例所示的一种地理信息处理方法的流程图;

图2是本公开所适用的人工智能处理系统结构框图;

图3是一个图谱数据库示例图;

图4是根据本公开的一些实施例所示的地理信息处理方法的步骤s104的流程示意图;

图5是根据本公开的一些实施例所示的地理信息处理方法的步骤s106的流程示意图;

图6是一个地理信息网格示意图;

图7是根据本公开的另一些实施例所示的一种地理信息处理方法的流程图;

图8是根据本公开的一些实施例所示的地理信息处理方法的步骤s706的流程示意图;

图9是一个存在有多个候选网格的网格示意图;

图10是另一个存在有多个候选网格的网格示意图;

图11是根据本公开的另一些实施例所示的地理信息处理方法的步骤s706的流程示意图;

图12中展示了一个包含有河流的地理调整信息对候选网格生成的影响示意图;

图13是根据本公开的一些实施例所示的一种地理信息处理装置的结构框图;

图14是根据本公开的一些实施例所示的地理信息处理装置的确定模块1320的结构框图;

图15是根据本公开的一些实施例所示的地理信息处理装置的比较模块1330的结构框图;

图16是根据本公开的另一些实施例所示的一种地理信息处理装置的结构框图;

图17是根据本公开的一些实施例所示的地理信息处理装置的生成模块1630的结构框图;

图18是根据本公开的另一些实施例所示的地理信息处理装置的生成模块1630的结构框图;

图19是根据本公开的一些实施例所示的电子设备的示意图;

图20是适于用来实现根据本公开实施例的地理信息处理方法的通用型计算机节点的结构示意图。

具体实施方式

在下面的详细描述中,通过示例阐述了本公开的许多具体细节,以便提供对相关披露的透彻理解。然而,对于本领域的普通技术人员来讲,本公开显而易见的可以在没有这些细节的情况下实施。应当理解的是,本公开中使用“系统”、“装置”、“单元”和/或“模块”术语,是用于区分在顺序排列中不同级别的不同部件、元件、部分或组件的一种方法。然而,如果其他表达式可以实现相同的目的,这些术语可以被其他表达式替换。

应当理解的是,当设备、单元或模块被称为“在……上”、“连接到”或“耦合到”另一设备、单元或模块时,其可以直接在另一设备、单元或模块上,连接或耦合到或与其他设备、单元或模块通信,或者可以存在中间设备、单元或模块,除非上下文明确提示例外情形。例如,本公开所使用的术语“和/或”包括一个或多个相关所列条目的任何一个和所有组合。

本公开所用术语仅为了描述特定实施例,而非限制本公开范围。如本公开说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的特征、整体、步骤、操作、元素和/或组件,而该类表述并不构成一个排它性的罗列,其他特征、整体、步骤、操作、元素和/或组件也可以包含在内。

参看下面的说明以及附图,本公开的这些或其他特征和特点、操作方法、结构的相关元素的功能、部分的结合以及制造的经济性可以被更好地理解,其中说明和附图形成了说明书的一部分。然而,可以清楚地理解,附图仅用作说明和描述的目的,并不意在限定本公开的保护范围。可以理解的是,附图并非按比例绘制。

本公开中使用了多种结构图用来说明根据本公开的实施例的各种变形。应当理解的是,前面或下面的结构并不是用来限定本公开。本公开的保护范围以权利要求为准。

图1是根据本公开的一些实施例所示的一种地理信息处理方法的流程示意图,如图1所示,所述地理信息处理方法包括以下步骤:

s102,获取待处理地理信息。

s104,确定与所述待处理地理信息对应的预设精度地理位置信息。

s106,比较所述预设精度地理位置信息与预设地理信息网格,得到所述待处理地理信息之间的关系,其中,所述预设地理信息网格是预先设置的基于关联关系的地理信息网格。

上文提及,随着大数据和人工智能,尤其是认知智能技术的发展,金融科技正在越来越多的应用新技术来为社会提供服务。传统金融服务的核心业务,例如反欺诈识别、风控、贷前贷后管理均是基于人工数据处理的结果来完成的,这在业务规模较小,服务区域较为固定的情况下还能够较好地应对。但随着金融服务业的互联网化,金融服务的大量业务从线下转移到线上,以及业务规模的快速增长,人工处理方式对于海量数据处理任务的局限性变得越来越大,这就使得基于互联网数据采集和人工智能处理的方法越来越多的取代了人工工作。然而,由于当前人工智能算法的局限,在一些具体的数据处理任务上,比如地理位置信息的处理,如何精准地对于输入地理位置信息进行识别,这对于机器处理来说仍然具有较大的挑战。

首先以智能风控系统为例介绍下本公开所适用的人工智能处理系统,如图2所示,用户通过互联网前端系统,例如sdk、h5页面、互联网app程序提交金融进项申请,该金融进项申请通过有线或无线通信网络接入任务匹配服务器,在任务匹配服务器中,所述金融进项申请被自动匹配到不同的金融服务供应商,之后对于所述金融进项数据进行数据预处理,存入图谱数据库中,其中,所述图谱数据库用于存储大量关于金融业务的知识图谱数据,以为后续的风控判断提供数据支持。进一步地,基于所述金融进项数据可以生成一个风控分析任务,该任务通过图查询的方式从图谱数据库中得到与该进项相关的关系数据,再将这些关系数据输入至变量计算模块,得到与所述关系数据对应的评估变量,然后将所述评估变量输入至预先得到的反欺诈评估模型中,完成基于所述金融进项申请的反欺诈识别。

其中,所述图谱数据库是一种基于关系的数据库,具体地,所述图谱数据库中设置有多个存储节点以及连接不同存储节点之间的边,不同的存储节点对应现实世界中的实体,而存储节点之间的关系则对应实体之间的关系,所述存储节点与关系还可进一步包括不同的属性,以表征实体的类型和关系的类型。图3是一个图谱数据库示例图,如图3所示,该图谱数据库中的节点“张明”和“李强”为两个个人实体,每个个人实体通过例如“工作于”、“拥有电话”等关系与其他的“公司”、“手机号”等实体节点连接,通过归属关系与“进项”实体节点连接,而“张明”和“李强”这两个个人实体通过“推荐人”的关系相连。

在图3所示的图谱数据库中,一些节点数据具有较好的唯一性,并且是通过格式化的数据采集方式获得的,比如身份证号码、电话号码等数据,而一些与地理位置相关的节点数据,往往是以自然语言信息的形式存在的,由于人工书写的随意性,自然语言信息通常缺乏唯一性,比如“海淀区中关村鼎好大厦”和“北京市海淀区鼎好”虽然数据内容不同,但实际上却对应于同一建筑,因此机器在对该类自然语言信息处理时就会存在较大的困难,并且数据处理错误率较高。目前一种通用的解决方案是将相关的地理位置信息文本输入至地理信息系统(gis)中,获得相应的经纬度信息,然后根据一个固定的判断网格来确定不同的地理位置信息是否为同一位置,其中,所述固定的判断网格是按照预定的尺寸和位置设置的,处于同一判断网格内部的地理位置被视作同一位置,但上述固定网格对于不同节点间是否存在关联关系却并不适用,这是因为,在空间中被视作同一位置的地址,将有可能在图谱数据库中建立对应的关系边,但实际上两者直接并不一定存在关联关系,因此,简单的固定网格无法满足地理位置信息分析的高精度需求。比如,“北京市海淀区中关村北大街”和“北京市鼎好大厦”这两个地理位置信息尽管并不属于同一区域,但由于其位于相同的网格中,因此会被默认为处于相同或相邻的位置,而实际上,这两个地理位置信息既不相同也不相邻,这就为后续的关系判断提供了错误的数据基础。另外,虽然固定网格的尺寸可以进行调整,但在实际应用中,却很难确定一个非常准确的网格大小,因为如果所述固定网格的颗粒度设置地过大,则可能无法有效区分不同的地理位置,而如果所述固定网格的颗粒度设置地过小,则有可能无法建立对应的连接关系,由此可见,固定的网格虽然能够在一定程度上处理自然语言信息的不确定性问题,但是却不能较为准确且智能地识别基于关系的图谱数据库数据,进而无法提供更为精准的空间区域划分和位置关系判断。

为了解决上述固定网络存在的问题,在一些实施例中,提出一种地理信息处理方法,该方法通过设置预设的非固定的基于关联关系的地理信息网格,将与待处理地理信息对应的预设精度地理位置信息输入其中,来得到待处理地理信息之间的关系。本公开实施例能够提高地理信息关系判断的精确度,并且可根据应用环境的不同以及实际地理信息对于地理信息网格进行调整,以进一步提高地理位置关系判断的有效性。

在一些实施例中,所述待处理地理信息为待处理并期待能够获得互相之间的关系的地理信息,比如可以为居住地址信息、工作地址信息、瞬时位置信息等信息。

其中,所述预设精度指的是预先设置的地理位置信息生成精度。在一些实施例中,所述预设精度高于预设精度阈值,也就是说,在该实施例中,为了提高后续地理信息关系判断的有效性,首先可借助高分辨率的固定地理信息网格将所述待处理地理信息转换为高精度的地理位置信息,比如借助gis系统将所述待处理地理信息转换为高精度的经纬度信息,再进行后续地理位置关系的判断。

在一些实施例中,所述关联关系指的是实体节点,比如个人个体之间所存在的关联关系,比如可以为个人个体之间的社交关系、个人个体在参与某一行为时与其他个人个体之间发生的关联关系、不同个人个体基于某一事件而产生的关联关系等等。

即在一些可选的实施例中,如图4所示,所述步骤s104,即确定与所述待处理地理信息对应的预设精度地理位置信息的步骤,包括以下步骤:

s402,获取预设精度地理位置网格。

s404,提取所述待处理地理信息的地理信息关键词。

s406,将所述地理信息关键词输入至所述预设精度地理位置网格中,根据所述地理信息关键词与预设精度地理位置信息之间的对应关系,确定与所述待处理地理信息对应的预设精度地理位置信息。

其中,所述预设精度地理位置网格为高于预设精度阈值的地理位置网格,其包括地理信息关键词与预设精度地理位置信息之间的对应关系,确定了地理信息关键词之后即可根据所述地理信息关键词与预设精度地理位置信息之间的对应关系,得到与所述待处理地理信息对应的高精度地理位置信息。

在一些可选的实施例中,如图5所示,所述步骤s106,即比较所述预设精度地理位置信息与预设地理信息网格,得到所述待处理地理信息之间的关系的步骤,包括以下步骤:

s502,获取所述预设地理信息网格属性信息。

s504,比较所述预设精度地理位置信息与所述预设地理信息网格属性信息,确定所述预设精度地理位置信息归属的预设地理信息网格。

s506,根据归属预设地理信息网格之间的关系确定所述待处理地理信息之间的关系。

其中,所述预设地理信息网格属性信息可包括以下信息中的一种或多种:网格的形状,比如是圆形、矩形、菱形、多边形还是不规则图形;网格的位置,比如网格顶点坐标、网格中心点坐标;网格的尺寸,比如网格的长度、宽度、半径等等。

获取所述预设地理信息网格属性信息之后,就可将所述预设精度地理位置信息与所述预设地理信息网格属性信息相比较,来确定所述预设精度地理位置信息属于哪个预设地理信息网格,然后再根据预设地理信息网格之间的关系来确定所述待处理地理信息之间的关系。比如,如图6所示,图6中展示了3个网格:网格1、网格2和网格3,其中,属于同一网格2的不同实体节点可以视作处于同一位置或者存在相邻的关系。

在一些可选的实施例中,所述比较所述预设精度地理位置信息与预设地理信息网格,得到所述待处理地理信息之间的关系之前,所述方法还包括生成预设地理信息网格的步骤,即如图7所示,所述方法包括以下步骤:

s702,获取待处理地理信息。

s704,确定与所述待处理地理信息对应的预设精度地理位置信息。

s706,生成预设地理信息网格。

s708,比较所述预设精度地理位置信息与预设地理信息网格,得到所述待处理地理信息之间的关系。

其中,所述预设地理信息网格是一种基于关联关系的地理信息网格,也就是说,所述预设地理信息网格是基于关联关系数据而生成的。

在一些可选的实施例中,如图8所示,步骤s706,即生成预设地理信息网格的步骤,包括以下步骤:

s802,确定网格目标区域。

s804,获取位于所述网格目标区域中的第一对象的地理信息以及与所述第一对象关联的第二对象的地理信息。

s806,确定与所述第一对象的地理信息对应的第一预设精度地理位置信息以及与所述第二对象的地理信息对应的第二预设精度地理位置信息。

s808,确定最小候选网格,使得所述候选网格能够覆盖所述第一预设精度地理位置信息和第二预设精度地理位置信息。

s810,遍历所述网格目标区域中的所有对象,得到多个候选网格。

s812,从所述多个候选网格中确定一组候选网格作为所述网格目标区域对应的目标地理信息网格。

由于所述地理信息网格为基于关系的网格,因此需要借助关联关系数据来生成所述地理信息网格。

具体地,首先确定所述地理信息网格所应用的区域范围,即网格目标区域,比如,北京市海淀区。

然后获取位于所述网格目标区域中的第一对象的地理信息以及与所述第一对象关联的第二对象的地理信息,比如,获取海淀区内的第一实体节点的地理信息,然后基于节点之间的关系,获得与所述第一实体节点存在关联关系的第二实体节点的地理信息,其中,所示地理信息指的是地理文本信息或者低于预设精度的地理信息,所述第二实体节点可以为一个也可以为两个或多个。

然后确定与所述第一对象的地理信息对应的第一预设精度地理位置信息以及与所述第二对象的地理信息对应的第二预设精度地理位置信息;其中,所述第一预设精度和第二预设精度均高于预设精度阈值,所述预设精度地理位置信息可借助地理信息系统对于地理文本信息或低于预设精度的地理信息转换得到。

然后,确定一个最小候选网格,使得所述候选网格能够覆盖所述第一预设精度地理位置信息和第二预设精度地理位置信息,这样就得到了一个能够体现所述第一实体节点的关联关系的网格以及该网格的属性信息。

然后,根据上述方法,遍历所述网格目标区域中的所有对象,得到多个候选网格,即与其他实体节点对应的、能够体现其他实体节点的关联关系的网格以及每个网格的属性信息。这样,对于所述网格目标区域,即海淀区,可得到多个分别体现不同实体节点关联关系的候选网格,其中,所述候选网格可能存在重叠或交叉的情况,如图9所示。

最后,从所述多个候选网格中确定一组候选网格作为所述网格目标区域对应的目标地理信息网格。

为了准确地反映网格目标区域中各实体节点之间的关联关系,在一些可选的实施例中,根据所述候选网格中对象的数量、对象的密集度、尺寸大小,确定一组候选网格作为所述网格目标区域对应的目标地理信息网格,同时使得所述目标地理信息网格覆盖或部分覆盖所述网格目标区域。其中,所述部分覆盖可被认为是高度覆盖,即覆盖区域面积与网格目标区域总面积之间的比例高于预设比例阈值。

比如,可首先根据所述候选网格中对象的数量对于候选网格按照从大到小的顺序进行排序,然后依次选择对象数量最大的候选网格作为目标地理信息子网格,使得最终确定的目标地理信息子网格组能够覆盖或部分覆盖所述网格目标区域,并且重叠区域最小。在一些可选的实施例中,为了避免重叠区域过多而导致的数据有效性问题,若候选网格之间的重叠度较高,且其中一个候选网格被选作目标地理信息子网格后,可暂时将该目标地理信息子网格中的节点删除,之后再对剩余的候选网格进行基于对象数量的排序和选择,如图10所示的位于中部的候选网格就由于与其左侧的候选网格重叠度较高,在左侧候选网格被选作目标地理信息子网格时,该候选网格就在后续的排序和选择中被排除了。

当然,由于实体节点之间有可能存在跨区、跨城市、跨网格目标区域的关联关系,因此在生成所述候选网格时,有可能出现一些少量的位于网格目标区域外的关联节点噪声,此时,可对所述少量的关联节点噪声进行删除,由于关联节点噪声相对数量较少,因此该删除操作不会影响所述候选网格的准确性。

通过上述方法,就借助实体节点之间的关联关系数据生成了一个能够充分体现节点之间的关联关系、降低空间关联度、提高非空间关联度的地理信息网格。与传统对于空间进行均匀划分的固定网格不同,组成本公开地理信息网格的子网格的形状、大小都有可能不同,因此能够充分反映各实体节点除空间外的其他维度的关联性。

其中,所述实体节点之间的关联关系可根据实际应用的需要进行设置,比如可以为个人正常的社交圈,也可以为以个人个体为单位的社交兴趣组、欺诈团伙等团体,当然也可以为其他关联关系。

接下来以欺诈团伙为例对于所述预设地理信息网格的生成进行解释和说明。首先确定所述地理信息网格所应用的区域范围,即网格目标区域为北京市海淀区;然后将某一欺诈团伙成员的地理文本信息输入gis系统中,得到每个成员对应的高精度经纬度信息;基于欺诈团伙成员的高精度经纬度信息生成一个能够覆盖所述有成员节点的矩形框,并将该矩形框作为一个最终有可能成为海淀区目标地理信息网格的一部分的候选网格,如图10中黑色节点所形成的网格所示,图10中,黑色节点代表该欺诈团伙对应的网格,其他节点代表根据其他关联关系所形成的候选网格。

在一些可选的实施例中,步骤s706,即生成预设地理信息网格的步骤,还包括根据预设地理调整信息对于所述目标地理信息网格进行调整的步骤,即如图11所示,步骤s706,即生成预设地理信息网格的步骤,包括以下步骤:

s1102,确定网格目标区域。

s1104,获取位于所述网格目标区域中的第一对象的地理信息以及与所述第一对象关联的第二对象的地理信息。

s1106,确定与所述第一对象的地理信息对应的第一预设精度地理位置信息以及与所述第二对象的地理信息对应的第二预设精度地理位置信息。

s1108,确定最小候选网格,使得所述候选网格能够覆盖所述第一预设精度地理位置信息和第二预设精度地理位置信息。

s1110,遍历所述网格目标区域中的所有对象,得到多个候选网格。

s1112,从所述多个候选网格中确定一组候选网格作为所述网格目标区域对应的目标地理信息网格。

s1114,根据预设地理调整信息对于所述目标地理信息网格进行调整。

考虑到在不同的应用场景中有可能遇到多种可变的影响因素,因此在一种实施方式中,还可根据预设地理调整信息对于所述目标地理信息网格进行调整或划分,以能够更为真实地体现地理信息,提高地理信息的可信度。比如当得到的目标地理信息网格中的其中一个候选网格为一个跨河流的网格时,可根据河流的地理位置信息将所述候选网格拆分为两个分别位于河流两侧的两个候选网格。

其中,所述预设地理调整信息指的是预先设置的、有可能会对于目标地理信息网格的结构产生影响的信息,比如河流、山川、高速公路、行政区域划分等地理分割信息、长期地理损坏信息、长期地理修复信息等等。

在另外一种实施方式中,为了节省数据计算量、提高数据计算效率,避免重复工作,可在最初生成候选网格时就考虑上述预设地理调整信息,即在生成候选网格时就基于所述预设地理调整信息对于实体节点之间的关联关系进行预处理,比如,若两个原本存在关联关系的实体节点之间存在有效地理调整信息,则可将这两个实体节点修改为不存在关联关系。

即,所述步骤s804,即获取位于所述网格目标区域中的第一对象的地理信息以及与所述第一对象关联的第二对象的地理信息的步骤,可被实施为:

确定位于所述网格目标区域中的第一对象。

获取预设地理调整信息,并根据所述预设地理调整信息以及与所述第一对象之间的关联关系确定与所述第一对象关联的第二对象。

获取所述第一对象和第二对象的地理信息。

图12中展示了一个包含有河流的地理调整信息对候选网格生成的影响,在该场景下,位于河流两侧的两个实体节点之间的关联关系首先被删除,如图中虚线所示,然后再基于目前的关联关系生成对应的候选网格。

这样在应用了上述方法之后,得到的目标地理信息网格就能够充分地体现实体节点之间的关联性,从而为实体节点的后续行为或事件的判断提供了有效的数据支持,进而提高后续行为或事件判断的准确性和精准度。图9为根据本公开一实施例得到的部分目标地理信息网格的示意图,图9中的候选网格部分覆盖网格目标区域,其网格1可能代表一个较大的企业园区,其内部包括多个建筑,处在该区域内不同建筑的个人个体均隶属于同一集团企业,因此处于该网格中的个人个体存在较强的关联性;网格1和网格2中间存在有一条高速公路,因此尽管两网格距离较近,也会被视作不同的网格区域,因为处在这两个网格对应的地理区域内的人进行交流时会存在较大的障碍或成本;网格中间的空间区域被认为是孤立的,处在该区域内的实体节点比如为社交关系较少的个体,其可使用其他固定地理信息网格进行处理或者不做任何处理。

以上是本公开提供的地理信息处理方法的具体实施方式。

图13是根据本公开的一些实施例所示的地理信息处理装置示意图。如图13所示,所述地理信息处理装置1300包括:

获取模块1310,被配置为获取待处理地理信息。

确定模块1320,被配置为确定与所述待处理地理信息对应的预设精度地理位置信息。

比较模块1330,被配置为比较所述预设精度地理位置信息与预设地理信息网格,得到所述待处理地理信息之间的关系,其中,所述预设地理信息网格是预先设置的基于关联关系的地理信息网格。

上文提及,随着大数据和人工智能,尤其是认知智能技术的发展,金融科技正在越来越多的应用新技术来为社会提供服务。传统金融服务的核心业务,例如反欺诈识别、风控、贷前贷后管理均是基于人工数据处理的结果来完成的,这在业务规模较小,服务区域较为固定的情况下还能够较好地应对。但随着金融服务业的互联网化,金融服务的大量业务从线下转移到线上,以及业务规模的快速增长,人工处理方式对于海量数据处理任务的局限性变得越来越大,这就使得基于互联网数据采集和人工智能处理的方法越来越多的取代了人工工作。然而,由于当前人工智能算法的局限,在一些具体的数据处理任务上,比如地理位置信息的处理,如何精准地对于输入地理位置信息进行识别,这对于机器处理来说仍然具有较大的挑战。

为了解决上述固定网络存在的问题,在一些实施例中,提出一种地理信息处理装置,该装置通过设置预设的非固定的基于关联关系的地理信息网格,将与待处理地理信息对应的预设精度地理位置信息输入其中,来得到待处理地理信息之间的关系。本公开实施例能够提高地理信息关系判断的精确度,并且可根据应用环境的不同以及实际地理信息对于地理信息网格进行调整,以进一步提高地理位置关系判断的有效性。

在一些实施例中,所述待处理地理信息为待处理并期待能够获得互相之间的关系的地理信息,比如可以为居住地址信息、工作地址信息、瞬时位置信息等信息。

其中,所述预设精度指的是预先设置的地理位置信息生成精度。在一些实施例中,所述预设精度高于预设精度阈值,也就是说,在该实施例中,为了提高后续地理信息关系判断的有效性,首先可借助高分辨率的固定地理信息网格将所述待处理地理信息转换为高精度的地理位置信息,比如借助gis系统将所述待处理地理信息转换为高精度的经纬度信息,再进行后续地理位置关系的判断。

在一些实施例中,所述关联关系指的是实体节点,比如个人个体之间所存在的关联关系,比如可以为个人个体之间的社交关系、个人个体在参与某一行为时与其他个人个体之间发生的关联关系、不同个人个体基于某一事件而产生的关联关系等等。

即在一些可选的实施例中,如图14所示,所述确定模块1320包括:

第一获取子模块1410,被配置为获取预设精度地理位置网格,其中,所述预设精度地理位置网格包括地理信息关键词与预设精度地理位置信息之间的对应关系。

提取子模块1420,被配置为提取所述待处理地理信息的地理信息关键词。

第一确定子模块1430,被配置为将所述地理信息关键词输入至所述预设精度地理位置网格中,根据所述地理信息关键词与预设精度地理位置信息之间的对应关系,确定与所述待处理地理信息对应的预设精度地理位置信息。

其中,所述预设精度地理位置网格为高于预设精度阈值的地理位置网格,其包括地理信息关键词与预设精度地理位置信息之间的对应关系,确定了地理信息关键词之后即可根据所述地理信息关键词与预设精度地理位置信息之间的对应关系,得到与所述待处理地理信息对应的高精度地理位置信息。

在一些可选的实施例中,如图15所示,所述比较模块1330包括:

第二获取子模块1510,被配置为获取所述预设地理信息网格属性信息。

比较子模块1520,被配置为比较所述预设精度地理位置信息与所述预设地理信息网格属性信息,确定所述预设精度地理位置信息归属的预设地理信息网格。

第二确定子模块1530,被配置为根据归属预设地理信息网格之间的关系确定所述待处理地理信息之间的关系。

其中,所述预设地理信息网格属性信息可包括以下信息中的一种或多种:网格的形状,比如是圆形、矩形、菱形、多边形还是不规则图形;网格的位置,比如网格顶点坐标、网格中心点坐标;网格的尺寸,比如网格的长度、宽度、半径等等。

获取所述预设地理信息网格属性信息之后,就可将所述预设精度地理位置信息与所述预设地理信息网格属性信息相比较,来确定所述预设精度地理位置信息属于哪个预设地理信息网格,然后再根据预设地理信息网格之间的关系来确定所述待处理地理信息之间的关系。比如,如图6所示,属于同一网格的不同实体节点可以视作处于同一位置或者存在相邻的关系。

在一些可选的实施例中,所述比较模块1330之前,所述装置还包括生成预设地理信息网格的部分,即如图16所示,所述装置1600包括:

获取模块1610,被配置为获取待处理地理信息。

确定模块1620,被配置为确定与所述待处理地理信息对应的预设精度地理位置信息。

生成模块1630,被配置为生成预设地理信息网格。

比较模块1640,被配置为比较所述预设精度地理位置信息与预设地理信息网格,得到所述待处理地理信息之间的关系,其中,所述预设地理信息网格是预先设置的基于关联关系的地理信息网格。

其中,所述预设地理信息网格是一种基于关联关系的地理信息网格,也就是说,所述预设地理信息网格是基于关联关系数据而生成的。

在一些可选的实施例中,如图17所示,所述生成模块1630包括:

第三确定子模块1710,被配置为确定网格目标区域。

第三获取子模块1720,被配置为获取位于所述网格目标区域中的第一对象的地理信息以及与所述第一对象关联的第二对象的地理信息。

第四确定子模块1730,被配置为确定与所述第一对象的地理信息对应的第一预设精度地理位置信息以及与所述第二对象的地理信息对应的第二预设精度地理位置信息。

第五确定子模块1740,被配置为确定最小候选网格,使得所述候选网格能够覆盖所述第一预设精度地理位置信息和第二预设精度地理位置信息。

遍历子模块1750,被配置为遍历所述网格目标区域中的所有对象,得到多个候选网格。

第六确定子模块1760,被配置为从所述多个候选网格中确定一组候选网格作为所述网格目标区域对应的目标地理信息网格。

由于所述地理信息网格为基于关系的网格,因此需要借助关联关系数据来生成所述地理信息网格。

具体地,第三确定子模块1710确定所述地理信息网格所应用的区域范围,即网格目标区域,比如,北京市海淀区。

第三获取子模块1720获取位于所述网格目标区域中的第一对象的地理信息以及与所述第一对象关联的第二对象的地理信息,比如,获取海淀区内的第一实体节点的地理信息,然后基于节点之间的关系,获得与所述第一实体节点存在关联关系的第二实体节点的地理信息,其中,所示地理信息指的是地理文本信息或者低于预设精度的地理信息,所述第二实体节点可以为一个也可以为两个或多个。

第四确定子模块1730确定与所述第一对象的地理信息对应的第一预设精度地理位置信息以及与所述第二对象的地理信息对应的第二预设精度地理位置信息;其中,所述第一预设精度和第二预设精度均高于预设精度阈值,所述预设精度地理位置信息可借助地理信息系统对于地理文本信息或低于预设精度的地理信息转换得到。

第五确定子模块1740确定一个最小候选网格,使得所述候选网格能够覆盖所述第一预设精度地理位置信息和第二预设精度地理位置信息,这样就得到了一个能够体现所述第一实体节点的关联关系的网格以及该网格的属性信息。

遍历子模块1750根据上述方法,遍历所述网格目标区域中的所有对象,得到多个候选网格,即与其他实体节点对应的、能够体现其他实体节点的关联关系的网格以及每个网格的属性信息。这样,对于所述网格目标区域,即海淀区,可得到多个分别体现不同实体节点关联关系的候选网格,其中,所述候选网格可能存在重叠或交叉的情况,如图9所示。

第六确定子模块1760从所述多个候选网格中确定一组候选网格作为所述网格目标区域对应的目标地理信息网格。

为了准确地反映网格目标区域中各实体节点之间的关联关系,在一些可选的实施例中,第六确定子模块1760根据所述候选网格中对象的数量、对象的密集度、尺寸大小,确定一组候选网格作为所述网格目标区域对应的目标地理信息网格,同时使得所述目标地理信息网格覆盖或部分覆盖所述网格目标区域。其中,所述部分覆盖可被认为是高度覆盖,即覆盖区域面积与网格目标区域总面积之间的比例高于预设比例阈值。

比如,可首先根据所述候选网格中对象的数量对于候选网格按照从大到小的顺序进行排序,然后依次选择对象数量最大的候选网格作为目标地理信息子网格,使得最终确定的目标地理信息子网格组能够覆盖或部分覆盖所述网格目标区域,并且重叠区域最小。在一些可选的实施例中,为了避免重叠区域过多而导致的数据有效性问题,若候选网格之间的重叠度较高,且其中一个候选网格被选作目标地理信息子网格后,可暂时将该目标地理信息子网格中的节点删除,之后再对剩余的候选网格进行基于对象数量的排序和选择,如图10所示的位于中部的候选网格就由于与其左侧的候选网格重叠度较高,在左侧候选网格被选作目标地理信息子网格时,该候选网格就在后续的排序和选择中被排除了。

当然,由于实体节点之间有可能存在跨区、跨城市、跨网格目标区域的关联关系,因此在生成所述候选网格时,有可能出现一些少量的位于网格目标区域外的关联节点噪声,此时,可对所述少量的关联节点噪声进行删除,由于关联节点噪声相对数量较少,因此该删除操作不会影响所述候选网格的准确性。

通过上述方法,就借助实体节点之间的关联关系数据生成了一个能够充分体现节点之间的关联关系、降低空间关联度、提高非空间关联度的地理信息网格。与传统对于空间进行均匀划分的固定网格不同,组成本公开地理信息网格的子网格的形状、大小都有可能不同,因此能够充分反映各实体节点除空间外的其他维度的关联性。

其中,所述实体节点之间的关联关系可根据实际应用的需要进行设置,比如可以为个人正常的社交圈,也可以为以个人个体为单位的社交兴趣组、欺诈团伙等团体,当然也可以为其他关联关系。

接下来以欺诈团伙为例对于所述预设地理信息网格的生成进行解释和说明。首先确定所述地理信息网格所应用的区域范围,即网格目标区域为北京市海淀区;然后将某一欺诈团伙成员的地理文本信息输入gis系统中,得到每个成员对应的高精度经纬度信息;基于欺诈团伙成员的高精度经纬度信息生成一个能够覆盖所述有成员节点的矩形框,并将该矩形框作为一个最终有可能成为海淀区目标地理信息网格的一部分的候选网格,如图10中黑色节点所形成的网格所示,图10中,黑色节点代表该欺诈团伙对应的网格,其他节点代表根据其他关联关系所形成的候选网格。

在一些可选的实施例中,所述生成模块1630还包括根据预设地理调整信息对于所述目标地理信息网格进行调整的部分,即如图18所示,所述生成模块1630包括:

第三确定子模块1810,被配置为确定网格目标区域。

第三获取子模块1820,被配置为获取位于所述网格目标区域中的第一对象的地理信息以及与所述第一对象关联的第二对象的地理信息。

第四确定子模块1830,被配置为确定与所述第一对象的地理信息对应的第一预设精度地理位置信息以及与所述第二对象的地理信息对应的第二预设精度地理位置信息。

第五确定子模块1840,被配置为确定最小候选网格,使得所述候选网格能够覆盖所述第一预设精度地理位置信息和第二预设精度地理位置信息。

遍历子模块1850,被配置为遍历所述网格目标区域中的所有对象,得到多个候选网格。

第六确定子模块1860,被配置为从所述多个候选网格中确定一组候选网格作为所述网格目标区域对应的目标地理信息网格。

调整子模块1870,被配置为根据预设地理调整信息对于所述目标地理信息网格进行调整。

考虑到在不同的应用场景中有可能遇到多种可变的影响因素,因此在一种实施方式中,还可根据预设地理调整信息对于所述目标地理信息网格进行调整或划分,以能够更为真实地体现地理信息,提高地理信息的可信度。比如当得到的目标地理信息网格中的其中一个候选网格为一个跨河流的网格时,可根据河流的地理位置信息将所述候选网格拆分为两个分别位于河流两侧的两个候选网格。

其中,所述预设地理调整信息指的是预先设置的、有可能会对于目标地理信息网格的结构产生影响的信息,比如河流、山川、高速公路、行政区域划分等地理分割信息、长期地理损坏信息、长期地理修复信息等等。

在另外一种实施方式中,为了节省数据计算量、提高数据计算效率,避免重复工作,可在最初生成候选网格时就考虑上述预设地理调整信息,即在生成候选网格时就基于所述预设地理调整信息对于实体节点之间的关联关系进行预处理,比如,若两个原本存在关联关系的实体节点之间存在有效地理调整信息,则可将这两个实体节点修改为不存在关联关系。

即,所述第三获取子模块1720或第三获取子模块1820可被配置为:

确定位于所述网格目标区域中的第一对象。

获取预设地理调整信息,并根据所述预设地理调整信息以及与所述第一对象之间的关联关系确定与所述第一对象关联的第二对象。

获取所述第一对象和第二对象的地理信息。

图12中展示了一个包含有河流的地理调整信息对候选网格生成的影响,在该场景下,位于河流两侧的两个实体节点之间的关联关系首先被删除,如图中虚线所示,然后再基于目前的关联关系生成对应的候选网格。

这样在应用了上述方法之后,得到的目标地理信息网格就能够充分地体现实体节点之间的关联性,从而为实体节点的后续行为或事件的判断提供了有效的数据支持,进而提高后续行为或事件判断的准确性和精准度。图9为根据本公开一实施例得到的部分目标地理信息网格的示意图,图9中的候选网格部分覆盖网格目标区域,其网格1可能代表一个较大的企业园区,其内部包括多个建筑,处在该区域内不同建筑的个人个体均隶属于同一集团企业,因此处于该网格中的个人个体存在较强的关联性;网格1和网格2中间存在有一条高速公路,因此尽管两网格距离较近,也会被视作不同的网格区域,因为处在这两个网格对应的地理区域内的人进行交流时会存在较大的障碍或成本;网格中间的空间区域被认为是孤立的,处在该区域内的实体节点比如为社交关系较少的个体,其可使用其他固定地理信息网格进行处理或者不做任何处理。

参考附图19,为本公开一个实施例提供的电子设备示意图。如图19所示,该电子设备1900包括:

存储器1930以及一个或多个处理器1910;

其中,所述存储器1930与所述一个或多个处理器1910通信连接,所述存储器1930中存储有可被所述一个或多个处理器执行的指令1932,所述指令1932被所述一个或多个处理器1910执行,以使所述一个或多个处理器1910执行上述地理信息处理步骤。

本公开的一个实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被执行后执行上述地理信息处理步骤。

综上所述,本公开提出了一种地理信息处理方法、装置、电子设备及其计算机可读存储介质。本公开实施例通过设置预设的非固定的基于关联关系的地理信息网格,将与待处理地理信息对应的预设精度地理位置信息输入其中,来得到待处理地理信息之间的关系。本公开实施例能够提高地理信息关系判断的精确度,并且可根据应用环境的不同以及实际地理信息对于地理信息网格进行调整,以进一步提高地理位置关系判断的有效性。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述装置实施例中的对应描述,在此不再赘述。

尽管此处所述的主题是在结合操作系统和应用程序在计算机系统上的执行而执行的一般上下文中提供的,但本领域技术人员可以认识到,还可结合其他类型的程序模块来执行其他实现。一般而言,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、组件、数据结构和其他类型的结构。本领域技术人员可以理解,此处所述的本主题可以使用其他计算机系统配置来实践,包括手持式设备、多处理器系统、基于微处理器或可编程消费电子产品、小型计算机、大型计算机等,也可使用在其中任务由通过通信网络连接的远程处理设备执行的分布式计算环境中。在分布式计算环境中,程序模块可位于本地和远程存储器存储设备的两者中。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本公开的范围。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对原有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。比如,典型地,本公开的技术方案可通过至少一个如图20所示的通用型计算机节点2010来实现和/或传播。在图20中,通用型计算机节点2010包括:计算机系统/服务器2012、外设2014和显示设备2016;其中,所述计算机系统/服务器2012包括处理单元2020、输入/输出接口2022、网络适配器2024和存储器2030,内部通常通过总线实现数据传输;进一步地,存储器2030通常由多种存储设备组成,比如,ram(randomaccessmemory,随机存储器)2032、缓存2034和存储系统(一般由一个或多个大容量非易失性存储介质组成)2036等;实现本公开技术方案的部分或全部功能的程序2040保存在存储器2030中,通常以多个程序模块2042的形式存在。

而前述的计算机可读取存储介质包括以存储如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方式或技术来实现的物理易失性和非易失性、可移动和不可因东介质。计算机可读取存储介质具体包括,但不限于,u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、可擦除可编程只读存储器(eprom)、电可擦可编程只读存储器(eeprom)、闪存或其他固态存储器技术、cd-rom、数字多功能盘(dvd)、hd-dvd、蓝光(blue-ray)或其他光存储设备、磁带、磁盘存储或其他磁性存储设备、或能用于存储所需信息且可以由计算机访问的任何其他介质。

应当理解的是,本公开的上述具体实施方式仅仅用于示例性说明或解释本公开的原理,而不构成对本公开的限制。因此,在不偏离本公开的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。此外,本公开所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1