一种基于最近邻算法预测人房一致性处理方法及系统与流程

文档序号:17627443发布日期:2019-05-10 23:48阅读:344来源:国知局
一种基于最近邻算法预测人房一致性处理方法及系统与流程

本公开属于数据处理领域,尤其涉及一种基于最近邻算法预测人房一致性处理方法及系统。



背景技术:

本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。

随着经济社会的发展和生活节奏的加速,生存要素中的“吃、穿、行”变动十分频繁,唯有“住”的要素变动相对较小。但目前,“管房”与“管人”却始终相脱节,管人的不管房,管房的不管人。发明人发现现有的数据查询存在以下问题:(1)数据烟囱问题,查询是孤立的,依据身份证号码产生结果数据;(2)基于公安数据,搜索出的户籍地址、车辆登记地址需要人工判断常住位置是否与之相近,耗费人力、物力。



技术实现要素:

根据本公开的一个或多个实施例的一个方面,提供一种基于最近邻算法预测人房一致性处理方法,其能够快速分析目标人群的常住地址,提高了公安民警对目标人进行人房一致分析,常住地址排查,空置房屋、出租房屋排查的效率。

本公开的一种基于最近邻算法预测人房一致性处理方法,包括:

将预设地理区域内的户籍数据和车辆数据相关联存储,车辆数据和卡口过车数据相关联存储;其中,户籍数据包括居住地址数据、户主及同户关系人姓名和身份证号码;

根据目标人的身份证号码,查询出目标人的户籍数据,进而得到目标人及其关系人所属的车辆数据;

根据目标人及其关系人所属的车辆数据,获取相应卡口过车数据,通过卡口过车数据对车辆进行轨迹分析,得到数量落脚次数超过预设阈值的卡口;

将数量落脚次数超过预设阈值的卡口坐标以及户籍数据中的居住地址数据分别对应转换为卡口平面坐标和居住地址平面坐标,进而构建出k-d树;

利用最近邻搜索算法,查找出k-d树中与当前居住地址平面坐标点距离最近的卡口坐标点,若当前居住地址平面坐标点与最近的卡口坐标点之间距离在预设范围内,则判定人房一致;否则判定人房不一致。

在一个或多个实施例中,通过卡口过车数据对车辆进行轨迹分析的过程为:

通过卡口轨迹获取预设时间段内每天最后一次出现的卡口位置信息;

建立以身份证为键,卡口信息为值的卡口集合,卡口信息包含卡口的名称和卡口gps位置信息。

在一个或多个实施例中,利用最近邻搜索算法,查找出k-d树中与当前居住地址平面坐标点距离最近的卡口坐标点的过程为:

从k-d树的根节点开始,通过最近邻搜索,如果节点的分割维度值小于查找点的维度值表示查找点位于左子树空间中,则进入左子树,如果大于则进入右子树,直到达到叶子节点为止,将搜索路径上的每一个节点都加入到路径中;

然后再回溯搜索路径,并判断未加入路径的其他子节点空间中是否可能有距离搜索点更近的节点,如果有可能,则遍历子节点空间,并将遍历到的节点加入到搜索路径中,重复这个过程直到搜索路径为空。

在一个或多个实施例中,所述基于最近邻算法预测人房一致性处理方法,还包括:

当人房不一致时,获取与户籍数据相关联的缴费数据;

判定缴费数据是否存在,若是,则判定房屋出租;否则,判定房屋空置。

在一个或多个实施例中,所述缴费数据包括水缴费数据、电缴费数据、天燃气缴费数据和暖气缴费数据。

根据本公开的一个或多个实施例的另一个方面,提供一种基于最近邻算法预测人房一致性处理系统,其能够快速分析目标人群的常住地址,提高了公安民警对目标人进行人房一致分析,常住地址排查,空置房屋、出租房屋排查的效率。

本公开的一种基于最近邻算法预测人房一致性处理系统,包括存储器和处理器;

所述存储器用于存储户籍数据、与户籍数据相关联的车辆数据,以及车辆相关联的卡口过车数据;

所述处理器包括:

数据获取模块,其用于获取户籍数据、与户籍数据相关联的车辆数据,以及车辆相关联的卡口过车数据;所述户籍数据包括居住地址数据、户主及同户关系人姓名和身份证号码;

目标人数据查询模块,其用于根据目标人的身份证号码,查询出目标人的户籍数据,进而得到目标人及其关系人所属的车辆数据;

落脚卡口数据获取模块,其用于根据目标人及其关系人所属的车辆数据,获取相应卡口过车数据,通过卡口过车数据对车辆进行轨迹分析,得到数量落脚次数超过预设阈值的卡口;

k-d树构建模块,其用于将数量落脚次数超过预设阈值的卡口坐标以及户籍数据中的居住地址数据分别对应转换为卡口平面坐标和居住地址平面坐标,进而构建出k-d树;

人房一致判定模块,其用于利用最近邻搜索算法,查找出k-d树中与当前居住地址平面坐标点距离最近的卡口坐标点,若当前居住地址平面坐标点与最近的卡口坐标点之间距离在预设范围内,则判定人房一致;否则判定人房不一致。

在一个或多个实施例中,在所述落脚卡口数据获取模块中,通过卡口过车数据对车辆进行轨迹分析的过程为:

通过卡口轨迹获取预设时间段内每天最后一次出现的卡口位置信息;

建立以身份证为键,卡口信息为值的卡口集合,卡口信息包含卡口的名称和卡口gps位置信息。

在一个或多个实施例中,在所述人房一致判定模块中,利用最近邻搜索算法,查找出k-d树中与当前居住地址平面坐标点距离最近的卡口坐标点的过程为:

从k-d树的根节点开始,通过最近邻搜索,如果节点的分割维度值小于查找点的维度值表示查找点位于左子树空间中,则进入左子树,如果大于则进入右子树,直到达到叶子节点为止,将搜索路径上的每一个节点都加入到路径中;

然后再回溯搜索路径,并判断未加入路径的其他子节点空间中是否可能有距离搜索点更近的节点,如果有可能,则遍历子节点空间,并将遍历到的节点加入到搜索路径中,重复这个过程直到搜索路径为空。

在一个或多个实施例中,所述处理器,还包括:

房屋出租及空置判定模块,其用于当人房不一致时,获取与户籍数据相关联的缴费数据;

判定缴费数据是否存在,若是,则判定房屋出租;否则,判定房屋空置。

在一个或多个实施例中,所述缴费数据包括水缴费数据、电缴费数据、天燃气缴费数据和暖气缴费数据。

本公开的有益效果是:

(1)本公开通过车辆落脚地址与户籍地址、房屋地址进行最近邻分析,能够快速分析目标人群的常住地址,提高了公安民警对目标人进行人房一致分析,常住地址排查,空置房屋、出租房屋排查的效率。

(2)本公开通过核准本城或来城人员的实际居住地或落脚点,达到查房知人、查人知住”的服务管理效果,本公开的人房一致的分析,提高了公安针对特定人群打击分析的能力,为租赁房屋的集中排查、编码登记,实现全覆盖纳管提供了良好的思路。

附图说明

构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。

图1是本公开的一种基于最近邻算法预测人房一致性处理方法实施例流程图。

图2是本公开的一种基于最近邻算法预测人房一致性处理方法具体实施例流程图。

图3是k-d树示例图。

图4是本公开的一种基于最近邻算法预测人房一致性处理系统实施例结构示意图。

具体实施方式

应该指出,以下详细说明都是例示性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

通过本公开的预测人房一致性处理方法及系统,能够检索目标人的户籍地址、结合政府接口提供的住建房屋数据,通过一标三实系统进行坐标转换,建立最近邻算法分析,对综合研判分析应用提供了更好的思路,为实有人口的动态管理提供了方向。

其中,“一标”是指标准地址,相对于当前部分不统一、不标准的地址信息,上级部门明确新的地址标准由“行政区划+乡镇街道+街路巷+门牌号+小区(组)+楼排号+单元号+户室”等要素组成;

“三实”是指标准地址下的“实有人口、实有房屋、实有单位”。“标准地址、实有人口、实有房屋、实有单位”,简称“一标三实”。

k-d树是从bst(binarysearchtree)发展而来,是一种高维索引树形数据结构,常用于大规模高维数据密集的查找比对的使用场景中,主要是最近邻查找(nearestneighbor)以及近似最近邻查找(approximatenearestneighbor)。在计算机视觉(cv)中主要是图像检索和识别中的高维特征向量的查找和比对。

其中,实有人口是一个相对居住地的人的概念,体现了管理人口的动态化理念,相比过去以户籍管理为主的静态人口管理模式,是一个飞跃。

如图1和图2所示,本实施例的一种基于最近邻算法预测人房一致性处理方法,包括:

s101:将预设地理区域内的户籍数据和车辆数据相关联存储,车辆数据和卡口过车数据相关联存储;其中,户籍数据包括居住地址数据、户主及同户关系人姓名和身份证号码。

具体地,获取户籍数据、与户籍数据相关联的车辆数据,以及车辆相关联的卡口过车数据。

其中,所述缴费数据包括水缴费数据、电缴费数据、天燃气缴费数据和暖气缴费数据。

在具体实施中,户籍数据可从公安内部数据库来获取;

缴费数据可从政府数据库来获取。

s102:根据目标人的身份证号码,查询出目标人的户籍数据,进而得到目标人及其关系人所属的车辆数据。

在具体实施中,根据目标人查询得到户籍信息,姓名、身份证号码、户籍地址、同户关系人信息(过滤集体户)。

查询目标人及其关系人查询名下的车辆信息,得到车辆信息:

s103:根据目标人及其关系人所属的车辆数据,获取相应卡口过车数据,通过卡口过车数据对车辆进行轨迹分析,得到数量落脚次数超过预设阈值的卡口。

在具体实施中,通过卡口过车数据对车辆进行轨迹分析的过程为:

通过卡口轨迹获取预设时间段内每天最后一次出现的卡口位置信息;

建立以身份证为键,卡口信息为值的卡口集合,卡口信息包含卡口的名称和卡口gps位置信息,其格式为:

{(车辆1,(卡口1,卡口1,卡口1,卡口2,卡口n.....))}。

例如:对每个车辆出现的卡口进行数量排序,得到数量落脚次数前三的卡口。

s104:将数量落脚次数超过预设阈值的卡口坐标以及户籍数据中的居住地址数据分别对应转换为卡口平面坐标和居住地址平面坐标,进而构建出k-d树。

gps坐标是由经度,纬度,海拔组成,精度和纬度都是角度,海拔是高度,构建在k-d树的时候,不能直接用gps的坐标,要将经纬度转换为平面坐标.才能用于构建k-d树,如图3所示。

具体地,建立k-d树可遵循以下步骤:

1)建立一维数组,存储每一个点的索引,并进行随机打乱。

2)定义合适的k-d树函数定义,方便进行递归建树。

3)编写分割维度函数。

4)编写选择分割节点函数。

5)k-d树函数功能实现:选择分割维度,选择分割节点,将节点左边的数据进行递归建立左子树,将节点右边的数据进行递归建立右子树。

s105:利用最近邻搜索算法,查找出k-d树中与当前居住地址平面坐标点距离最近的卡口坐标点,若当前居住地址平面坐标点与最近的卡口坐标点之间距离在预设范围内,则判定人房一致;否则判定人房不一致。

具体地,利用最近邻搜索算法,查找出k-d树中与当前居住地址平面坐标点距离最近的卡口坐标点的过程为:

从k-d树的根节点开始,通过最近邻搜索,如果节点的分割维度值小于查找点的维度值表示查找点位于左子树空间中,则进入左子树,如果大于则进入右子树,直到达到叶子节点为止,将搜索路径上的每一个节点都加入到路径中;

然后再回溯搜索路径,并判断未加入路径的其他子节点空间中是否可能有距离搜索点更近的节点,如果有可能,则遍历子节点空间,并将遍历到的节点加入到搜索路径中,重复这个过程直到搜索路径为空。

例如:若当前居住地址平面坐标点与最近的卡口坐标点之间距离在预设范围(两公里)内,判定人房一致;若当前居住地址平面坐标点与最近的卡口坐标点之间距离超出预设范围(两公里),判定人房不一致。

在另一实施例中,所述基于最近邻算法预测人房一致性处理方法,还包括:

当人房不一致时,获取与户籍数据相关联的缴费数据;

判定缴费数据是否存在,若是,则判定房屋出租;否则,判定房屋空置。

本公开通过车辆落脚地址与户籍地址、房屋地址进行最近邻分析,能够快速分析目标人群的常住地址,提高了公安民警对目标人进行人房一致分析,常住地址排查,空置房屋、出租房屋排查的效率。

通过核准本城或来城人员的实际居住地或落脚点,达到查房知人、查人知住”的服务管理效果,本公开的人房一致的分析,提高了公安针对特定人群打击分析的能力,为租赁房屋的集中排查、编码登记,实现全覆盖纳管提供了良好的思路。

图4是本公开的一种基于最近邻算法预测人房一致性处理系统结构实施例示意图。

如图4所示,本实施例的一种基于最近邻算法预测人房一致性处理系统,包括存储器和处理器;

所述存储器用于存储户籍数据、与户籍数据相关联的车辆数据,以及车辆相关联的卡口过车数据;

所述处理器包括:

(1)数据获取模块,其用于获取户籍数据、与户籍数据相关联的车辆数据,以及车辆相关联的卡口过车数据;所述户籍数据包括居住地址数据、户主及同户关系人姓名和身份证号码。

具体地,所述缴费数据包括水缴费数据、电缴费数据、天燃气缴费数据和暖气缴费数据。

在具体实施中,户籍数据可从公安内部数据库来获取;

缴费数据可从政府数据库来获取。

(2)目标人数据查询模块,其用于根据目标人的身份证号码,查询出目标人的户籍数据,进而得到目标人及其关系人所属的车辆数据。

在具体实施中,根据目标人查询得到户籍信息,姓名、身份证号码、户籍地址、同户关系人信息(过滤集体户)。

查询目标人及其关系人查询名下的车辆信息,得到车辆信息:

(3)落脚卡口数据获取模块,其用于根据目标人及其关系人所属的车辆数据,获取相应卡口过车数据,通过卡口过车数据对车辆进行轨迹分析,得到数量落脚次数超过预设阈值的卡口。

在具体实施中,通过卡口过车数据对车辆进行轨迹分析的过程为:

通过卡口轨迹获取预设时间段内每天最后一次出现的卡口位置信息;

建立以身份证为键,卡口信息为值的卡口集合,卡口信息包含卡口的名称和卡口gps位置信息,其格式为:

{(车辆1,(卡口1,卡口1,卡口1,卡口2,卡口n.....))}。

例如:对每个车辆出现的卡口进行数量排序,得到数量落脚次数前三的卡口。

(4)k-d树构建模块,其用于将数量落脚次数超过预设阈值的卡口坐标以及户籍数据中的居住地址数据分别对应转换为卡口平面坐标和居住地址平面坐标,进而构建出k-d树。

gps坐标是由经度,纬度,海拔组成,精度和纬度都是角度,海拔是高度,构建在k-d树的时候,不能直接用gps的坐标,要将经纬度转换为平面坐标.才能用于构建k-d树,如图3所示。

具体地,建立k-d树可遵循以下步骤:

1)建立一维数组,存储每一个点的索引,并进行随机打乱。

2)定义合适的k-d树函数定义,方便进行递归建树。

3)编写分割维度函数。

4)编写选择分割节点函数。

5)k-d树函数功能实现:选择分割维度,选择分割节点,将节点左边的数据进行递归建立左子树,将节点右边的数据进行递归建立右子树。

(5)人房一致判定模块,其用于利用最近邻搜索算法,查找出k-d树中与当前居住地址平面坐标点距离最近的卡口坐标点,若当前居住地址平面坐标点与最近的卡口坐标点之间距离在预设范围内,则判定人房一致;否则判定人房不一致。

具体地,利用最近邻搜索算法,查找出k-d树中与当前居住地址平面坐标点距离最近的卡口坐标点的过程为:

从k-d树的根节点开始,通过最近邻搜索,如果节点的分割维度值小于查找点的维度值表示查找点位于左子树空间中,则进入左子树,如果大于则进入右子树,直到达到叶子节点为止,将搜索路径上的每一个节点都加入到路径中;

然后再回溯搜索路径,并判断未加入路径的其他子节点空间中是否可能有距离搜索点更近的节点,如果有可能,则遍历子节点空间,并将遍历到的节点加入到搜索路径中,重复这个过程直到搜索路径为空。

例如:若当前居住地址平面坐标点与最近的卡口坐标点之间距离在预设范围(两公里)内,判定人房一致;若当前居住地址平面坐标点与最近的卡口坐标点之间距离超出预设范围(两公里),判定人房不一致。

在另一实施例中,所述处理器,还包括:

房屋出租及空置判定模块,其用于当人房不一致时,获取与户籍数据相关联的缴费数据;

判定缴费数据是否存在,若是,则判定房屋出租;否则,判定房屋空置。

本公开通过车辆落脚地址与户籍地址、房屋地址进行最近邻分析,能够快速分析目标人群的常住地址,提高了公安民警对目标人进行人房一致分析,常住地址排查,空置房屋、出租房屋排查的效率。

通过核准本城或来城人员的实际居住地或落脚点,达到查房知人、查人知住”的服务管理效果,本公开的人房一致的分析,提高了公安针对特定人群打击分析的能力,为租赁房屋的集中排查、编码登记,实现全覆盖纳管提供了良好的思路。

本领域内的技术人员应明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本公开是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory,rom)或随机存储记忆体(randomaccessmemory,ram)等。

上述虽然结合附图对本公开的具体实施方式进行了描述,但并非对本公开保护范围的限制,所属领域技术人员应该明白,在本公开的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本公开的保护范围以内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1