基于大数据查找嫌疑车辆的方法和系统与流程

文档序号:14250884阅读:584来源:国知局
基于大数据查找嫌疑车辆的方法和系统与流程

本发明属于数据查找技术领域,具体涉及一种基于大数据查找嫌疑车辆的方法和系统。



背景技术:

随着社会的发展,技术的进步,汽车逐渐走进了千家万户,拥有一辆车不再是专属于一部分人的梦想,也不再是一个身份的象征。然而技术的进步在给普通人带来方便、快捷的同时,也成为了一些不法分子犯罪的利器,在当前利用汽车作为犯罪工具的事件层出不穷:比如肇事逃逸、驾车逃窜、驾车跟踪等等。而且部分涉车案件中,嫌疑人会采用频繁的更改车牌号码、遮盖车牌号码或修改车牌号码的方式躲避追踪。他们的这些举动给案件的侦破,查找、追踪嫌疑车辆带来了很大的难度。

在现有的车辆追踪中,如果遇到上述情况,办案民警在确定车辆品牌、型号后会一张张的查看过车图片,分辨车辆的撞击特征等查找嫌疑车辆。这种搜索方式效率很低,而且需要投入大量的人力,而警力有限,且案件的侦破需争分夺秒,如果不能在案发尽快找到嫌疑车辆,可能造成严重的经济损失,甚至造成人员伤亡。

因此,针对上述问题,提供一种基于大数据查找嫌疑车辆的方法和系统,是本技术领域亟待解决的技术问题。



技术实现要素:

有鉴于此,本发明提供了一种基于大数据查找嫌疑车辆的方法和系统,基于海量的过车数据,利用hadoop平台,根据初步判定的车型搜索出嫌疑车辆,缩小嫌疑车辆的搜索范围,为案件侦破提供支撑,极大地节省了警力,缩短了确定嫌疑车辆的时间,提高了案件的侦破效率。

为解决上述技术问题,本发明提供了一种基于大数据查找嫌疑车辆的方法,包括:

条件筛选步骤:根据所述嫌疑车辆指定筛选条件,并确定目标卡口及所述嫌疑车辆经过所述目标卡口的时间范围,其中,所述筛选条件包括:所述嫌疑车辆的车型、颜色及嫌疑车牌号码,所述目标卡口包括至少一个主卡口,n个上游卡口和m个下游卡口,其中,n和m均为大于或者等于2的正整数;

行车路线计算步骤:计算所述目标卡口的次序关系以获得行车路线,所述行车路线包括上游行车路线和下游行车路线,计算所述上游行车路线和所述下游行车路线的过车时间正态分布数据,其中,所述上游行驶路线至少为一条,所述下游行车路线至少为一条,所述上游行驶路线的所述目标卡口次序关系为以唯一确定的所述上游卡口为起点,以所述主卡口为终点,所述下游行行车路线的所述目标卡口的次次序关系为以所述主卡口为起点,以唯一确定的所述下游卡口为终点,所述过车时间正态分布数据分为上游过车时间正态分布数据和下游过车时间正态分布数据,所述上游过车时间正态分布数据包括每一条所述上游行车路线的平均过车时间和标准差,所述下游过车时间正态分布数据包括每一条所述下游行车路线的平均过车时间和标准差;

嫌疑车辆筛选步骤:将在所述主卡口且在所述时间范围内出现的具有指定车型、颜色的所述车辆作为所述目标车辆,并将每个所述目标车辆遍历每一条所述上游行驶路线和每一条所述下游行车路线以分别获得上游实际行车时间和下游实际行车时间,计算出所述上游实际行车时间不符合所述上游过车时间正态分布数据的所述目标车辆及所述下游实际行车时间不符合所述下游过车时间正态分布数据的所述目标车辆以获得初级嫌疑车辆集合;

数据清洗步骤:利用第一时间和第二时间的历史过车数据对所述初级嫌疑车辆集合进行数据清洗,将在所述历史过车数据中出现过的所述目标车辆由所述初级嫌疑车辆集合中移除以获得最终嫌疑车辆集合,其中,所述第一时间和所述第二时间为与所述嫌疑车辆经过所述目标卡口的时间范围相同,所述第一时间为所述嫌疑车辆过车当天之前的至少为一天,所述第二时间为所述嫌疑车辆过车当天之后的至少为一天,所述第一时间、所述第二时间与所述嫌疑车辆的过车当天分别间隔至少两天。

进一步地,所述最终嫌疑车辆集合还包括:无车牌或遮挡车牌的车辆信息。

进一步地,所述行车路线计算步骤为:

统计在所述主卡口及所述上游卡口的出现的车辆的车牌号码,并将所述车牌号码根据出现次数进行降序排列,出现次数相同的所述车牌号码具有相同的次序编号,根据所述次序编号排在前的所述车牌号码的车辆出现时间的先后顺序排列出具有唯一起点且以所述主卡口为终点的多个所述目标卡口的次序关系,即为上游行驶路线,针对每一条所述上游行驶路线内的所有车辆及两两所述目标卡口之间的所述过车时间,以计算出每一条所述上游行驶路线的过车平均时间及标准差;

统计在所述主卡口及所述下游卡口的出现的车辆的车牌号码,并将所述车牌号码根据出现次数进行降序排列,出现次数相同的所述车牌号码具有相同的次序编号,根据所述次序编号排在前的所述车牌号码排列出具有唯一终点且以所述主卡口为起点的多个所述目标卡口的次序关系,即为下游行驶路线,针对每一条所述下游行驶路线内的所有车辆及两两所述目标卡口之间的所述过车时间,以计算出每一条所述下游行驶路线的过车平均时间及标准差。

进一步地,所述嫌疑车辆筛选步骤为:

将所述目标车辆的车辆信息保存到第一集合,将所述第一集合中的所述目标车辆遍历每一条所述上游行驶路线,将出现次数大于等于且在前两个所述上游卡口至少出现一次的所述目标车辆的车辆信息移除所述第一集合后得到第二集合,统计所述第二集合中的所述目标车辆的上游实际行车时间,将所述上游实际行车时间不符合所述上游过车时间正态分布数据的所述目标车辆存储到第一嫌疑车辆集合,将所述第一集合中的所述目标车辆遍历每一条所述下游行驶路线,将出现次数大于等于且在后两个所述下游卡口至少出现一次的所述目标车辆的车辆信息移除所述第一集合后得到第三集合,统计所述第三集合中的所述目标车辆的下游实际行车时间,将所述下游实际行车时间不符合所述下游过车时间正态分布数据的所述目标车辆存储到第二嫌疑车辆集合,合并所述第一嫌疑车辆集合和所述第二嫌疑车辆集合以得到初级嫌疑车辆集合。

进一步地,所述筛选条件还包括:年检标形态、是否放下遮阳板和/或副驾驶是否有人。

为了解决上述技术问题,本发明还提供了一种基于大数据查找嫌疑车辆的系统,利用hadoop平台对嫌疑车辆进行查找,包括:

条件筛选模块,用于根据所述嫌疑车辆指定筛选条件,并确定目标卡口及所述嫌疑车辆经过所述目标卡口的时间范围,其中,所述筛选条件包括:所述嫌疑车辆的车型、颜色及嫌疑车牌号码,所述目标卡口包括至少一个主卡口,n个上游卡口和m个下游卡口,其中,n和m均为大于或者等于2的正整数;

行车路线计算模块,与所述条件筛选模块相耦接,用于计算所述目标卡口的次序关系以获得行车路线,所述行车路线包括上游行车路线和下游行车路线,计算所述上游行车路线和所述下游行车路线的过车时间正态分布数据,其中,所述上游行驶路线至少为一条,所述下游行车路线至少为一条,所述上游行驶路线的所述目标卡口次序关系为以唯一确定的所述上游卡口为起点,以所述主卡口为终点,所述下游行行车路线的所述目标卡口的次序关系为以所述主卡口为起点,以唯一确定的所述下游卡口为终点,所述过车时间正态分布数据分为上游过车时间正态分布数据和下游过车时间正态分布数据,所述上游过车时间正态分布数据包括每一条所述上游行车路线的平均过车时间和标准差,所述下游过车时间正态分布数据包括每一条所述下游行车路线的平均过车时间和标准差;

嫌疑车辆筛选模块,分别与所述条件筛选模块和所述行车路线计算模块相耦接,用于将在所述主卡口且在所述时间范围内出现的具有指定车型、颜色的所述车辆作为所述目标车辆,并将每个所述目标车辆遍历每一条所述上游行驶路线和每一条所述下游行车路线以分别获得上游实际行车时间和下游实际行车时间,计算出所述上游实际行车时间不符合所述上游过车时间正态分布数据的所述目标车辆及所述下游实际行车时间不符合所述下游过车时间正态分布数据的所述目标车辆以获得初级嫌疑车辆集合;

数据清洗模块,与所述嫌疑车辆筛选模块相耦接,用于利用第一时间和第二时间的历史过车数据对所述初级嫌疑车辆集合进行数据清洗,将在所述历史过车数据中出现过的所述目标车辆由所述初级嫌疑车辆集合中移除以获得最终嫌疑车辆集合,其中,所述第一时间和所述第二时间为与所述嫌疑车辆经过所述目标卡口的时间范围相同,所述第一时间为所述嫌疑车辆过车当天之前的至少为一天,所述第二时间为所述嫌疑车辆过车当天之后的至少为一天,所述第一时间、所述第二时间与所述嫌疑车辆的过车当天分别间隔至少两天。

进一步地,所述最终嫌疑车辆集合还包括无车牌或遮挡车牌的车辆信息。

进一步地,所述行车路线计算模块,包括上游行车路线计算模块和下游行车路线计算模块;其中,

所述上游行车路线计算模块,用于统计在所述主卡口及所述上游卡口的出现的车辆的车牌号码,并将所述车牌号码根据出现次数进行降序排列,出现次数相同的所述车牌号码具有相同的次序编号,根据所述次序编号排在前的所述车牌号码的车辆出现时间的先后顺序排列出具有唯一起点且以所述主卡口为终点的多个所述目标卡口的次序关系,即为上游行驶路线,针对每一条所述上游行驶路线内的所有车辆及两两所述目标卡口之间的所述过车时间,以计算出每一条所述上游行驶路线的过车平均时间及标准差;

所述下游行车路线计算模块,用于统计在所述主卡口及所述下游卡口的出现的车辆的车牌号码,并将所述车牌号码根据出现次数进行降序排列,出现次数相同的所述车牌号码具有相同的次序编号,根据所述次序编号排在前的所述车牌号码的车辆出现时间的先后顺序排列出具有唯一终点且以所述主卡口为起点的多个所述目标卡口的次序关系,即为下游行驶路线,针对每一条所述下游行驶路线内的所有车辆及两两所述目标卡口之间的所述过车时间,以计算出每一条所述下游行驶路线的过车平均时间及标准差。

进一步地,所述嫌疑车辆筛选模块为:

将所述目标车辆的车辆信息保存到第一集合,将所述第一集合中的所述目标车辆遍历每一条所述上游行驶路线,将出现次数大于等于且在前两个所述上游卡口至少出现一次的所述目标车辆的车辆信息移除所述第一集合后得到第二集合,统计所述第二集合中的所述目标车辆的上游实际行车时间,将所述上游实际行车时间不符合所述上游过车时间正态分布数据的所述目标车辆存储到第一嫌疑车辆集合,将所述第一集合中的所述目标车辆遍历每一条所述下游行驶路线,将出现次数大于等于且在后两个所述下游卡口至少出现一次的所述目标车辆的车辆信息移除所述第一集合后得到第三集合,统计所述第三集合中的所述目标车辆的下游实际行车时间,将所述下游实际行车时间不符合所述下游过车时间正态分布数据的所述目标车辆存储到第二嫌疑车辆集合,合并所述第一嫌疑车辆集合和所述第二嫌疑车辆集合以得到初级嫌疑车辆集合。

进一步地,所述筛选条件模块,还包括:预留筛选条件接口,用于增加所述筛选条件,所述筛选条件还包括:年检标形态、是否放下遮阳板和/或副驾驶是否有人。

与现有技术相比,本申请所述的基于大数据查找嫌疑车辆的方法和系统,达到了如下效果:

(1)本发明针对涉案嫌疑车辆在涉案过程中,利用频繁更换车牌、更改车牌号码、遮挡号牌等方式,使得其被拍摄到的车辆号码是非连续性的特点,提出了一种基于大数据查找嫌疑车辆的方法和系统,可以动态分析过车卡口的次序关系、过车时间的正态分布,不受事发时的天气、路况等因素所影响,并基于动态的次序关系以及过车时间的正态分布,为车辆在上、下游通过的比对分析提供了相对精确的数据;

(2)本发明提供的种基于大数据查找嫌疑车辆的方法和系统,基于海量的过车数据,利用hadoop平台,根据初步判定的车型搜索出嫌疑车辆,缩小嫌疑车辆的搜索范围,为案件侦破提供支撑,极大地节省了警力,缩短了确定嫌疑车辆的时间,提高了案件的侦破效率;

(3)本发明提供的基于大数据查找嫌疑车辆的方法和系统,可以建立在廉价的商用机上,并可根据数据量的大小等实际情况确定集群的大小,能够同时并发计算海量的数据,在进行计算时,可以首先同时利用各节点机器的运算能力进行数据量较大且繁琐的计算,从而降低统计时间;

(4)本发明提供的基于大数据查找嫌疑车辆的方法和系统,在得出初步的嫌疑车判定结果时,可以充分的利用所分析到车辆特征,如:年检标走向、是否放下遮阳板及副驾驶上是否有人等条件对结果进行进一步过滤,为进一步的扩展应用留下充足的接口空间,并可提高嫌疑车判定的正确率。

当然,实施本发明的任一产品必不特定需要同时达到以上所述的所有技术效果。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1为发明中的基于大数据查找嫌疑车辆的方法的流程图;

图2为本发明中基于大数据查找嫌疑车辆的方法的行车路线计算步骤的流程图;

图3为本发明中基于大数据查找嫌疑车辆的系统的结构示意图;

图4为本发明中基于大数据查找嫌疑车辆的方法的行车路线计算模块的结构示意图。

具体实施方式

如在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可理解,硬件制造商可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名称的差异来作为区分组件的方式,而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”为一开放式用语,故应解释成“包含但不限定于”。“大致”是指在可接收的误差范围内,本领域技术人员能够在一定误差范围内解决所述技术问题,基本达到所述技术效果。此外,“耦接”一词在此包含任何直接及间接的电性耦接手段。因此,若文中描述一第一装置耦接于一第二装置,则代表所述第一装置可直接电性耦接于所述第二装置,或通过其他装置或耦接手段间接地电性耦接至所述第二装置。说明书后续描述为实施本申请的较佳实施方式,然所述描述乃以说明本申请的一般原则为目的,并非用以限定本申请的范围。本申请的保护范围当视所附权利要求所界定者为准。

另外,本说明书并没有将权利要求书公开的构件和方法步骤限定于实施方式的构件和方法步骤。特别是,在实施方式中记载的结构部件的尺寸、材质、形状、其结构顺序和邻接顺序以及制造方法等只要没有具体的限定,就仅作为说明例,而不是将本发明的范围限定于此。附图中所示的结构部件的大小和位置关系是为了清楚地进行说明而放大示出。

以下结合附图对本申请作进一步详细说明,但不作为对本申请的限定。

实施例1

针对涉案嫌疑车辆在涉案过程中,利用频繁更换车牌、更改车牌号码、遮挡号牌等方式,使得其被拍摄到的车辆号码是非连续性的特点,本实施例提供了一种基于大数据查找嫌疑车辆的方法,一下结合附图进行说明。

图1为发明中的基于大数据查找嫌疑车辆的方法的流程图。请参见图1,该方法,利用hadoop平台对嫌疑车辆进行查找,包括:

步骤s101:条件筛选步骤

根据所述嫌疑车辆指定筛选条件,并确定目标卡口及所述嫌疑车辆经过所述目标卡口的时间范围,其中,所述筛选条件包括:所述嫌疑车辆的车型、颜色及嫌疑车牌号码,所述目标卡口包括至少一个主卡口,n个上游卡口和m个下游卡口,其中,n和m均为大于或者等于2的正整数。

步骤s102:行车路线计算步骤

计算所述目标卡口的次序关系以获得行车路线,所述行车路线包括上游行车路线和下游行车路线,计算所述上游行车路线和所述下游行车路线的过车时间正态分布数据,其中,所述上游行驶路线至少为一条,所述下游行车路线至少为一条,所述上游行驶路线的所述目标卡口次序关系为以唯一确定的所述上游卡口为起点,以所述主卡口为终点,所述下游行行车路线的所述目标卡口的次序关系为以所述主卡口为起点,以唯一确定的所述下游卡口为终点,所述过车时间正态分布数据分为上游过车时间正态分布数据和下游过车时间正态分布数据,所述上游过车时间正态分布数据包括每一条所述上游行车路线的平均过车时间和标准差,所述下游过车时间正态分布数据包括每一条所述下游行车路线的平均过车时间和标准差。

步骤s103:嫌疑车辆筛选步骤

将在所述主卡口且在所述时间范围内出现的具有指定车型、颜色的所述车辆作为所述目标车辆,并将每个所述目标车辆遍历每一条所述上游行驶路线和每一条所述下游行车路线以分别获得上游实际行车时间和下游实际行车时间,计算出所述上游实际行车时间不符合所述上游过车时间正态分布数据的所述目标车辆及所述下游实际行车时间不符合所述下游过车时间正态分布数据的所述目标车辆以获得初级嫌疑车辆集合。

步骤s104:数据清洗步骤

利用第一时间和第二时间的历史过车数据对所述初级嫌疑车辆集合进行数据清洗,将在所述历史过车数据中出现过的所述目标车辆由所述初级嫌疑车辆集合中移除以获得最终嫌疑车辆集合,其中,所述第一时间和所述第二时间为与所述嫌疑车辆经过所述目标卡口的时间范围相同,所述第一时间为所述嫌疑车辆过车当天之前的至少为一天,所述第二时间为所述嫌疑车辆过车当天之后的至少为一天,所述第一时间、所述第二时间与所述嫌疑车辆的过车当天分别间隔至少两天。

本实施例中的基于大数据查找嫌疑车辆的方法,可以动态分析过车卡口的次序关系、过车时间的正态分布,不受事发时的天气、路况等因素所影响,并基于动态的次序关系以及过车时间的正态分布,为车辆在上、下游通过的比对分析提供了相对精确的数据;基于海量的过车数据,利用hadoop平台,根据初步判定的车型搜索出嫌疑车辆,缩小嫌疑车辆的搜索范围,为案件侦破提供支撑,极大地节省了警力,缩短了确定嫌疑车辆的时间,提高了案件的侦破效率;可以建立在廉价的商用机上,并可根据数据量的大小等实际情况确定集群的大小,能够同时并发计算海量的数据,在进行计算时,可以首先同时利用各节点机器的运算能力进行数据量较大且繁琐的计算,从而降低统计时间。

进一步地,为了避免未将嫌疑车辆统计入最终嫌疑车辆集合,所述最终嫌疑车辆集合还应当包括无车牌或遮挡车牌的车辆信息。

进一步地,所述筛选条件还包括:年检标形态、是否放下遮阳板和/或副驾驶是否有人。通过增加筛选条件,能够对初级嫌疑车辆集合进行进一步过滤,以提高嫌疑车判定的正确率。

图2为本发明中基于大数据查找嫌疑车辆的方法的行车路线计算步骤的流程图。请参见图2,进一步地,步骤s102,包括步骤s1021和步骤s1022。下游行车路线计算。

步骤s1021:上游行车路线计算

上游行车路线计算统计在所述主卡口及所述上游卡口的出现的车辆的车牌号码,并将所述车牌号码根据出现次数进行降序排列,出现次数相同的所述车牌号码具有相同的次序编号,根据所述次序编号排在前的所述车牌号码的车辆出现时间的先后顺序排列出具有唯一起点且以所述主卡口为终点的多个所述目标卡口的次序关系,即为上游行驶路线,针对每一条所述上游行驶路线内的所有车辆及两两所述目标卡口之间的所述过车时间,以计算出每一条所述上游行驶路线的过车平均时间及标准差。需要说明的是,本发明中的是指对n/2向下取整,当n为偶数时,等于n/2,当n为奇数时,等于(n+1)/2。

s1022:下游行车路线计算

统计在所述主卡口及所述下游卡口的出现的车辆的车牌号码,并将所述车牌号码根据出现次数进行降序排列,出现次数相同的所述车牌号码具有相同的次序编号,根据所述次序编号排在前的所述车牌号码的车辆出现时间的先后顺序排列出具有唯一终点且以所述主卡口为起点的多个所述目标卡口的次序关系,即为下游行驶路线,针对每一条所述下游行驶路线内的所有车辆及两两所述目标卡口之间的所述过车时间,以计算出每一条所述下游行驶路线的过车平均时间及标准差。

进一步地,步骤s103为:

将所述目标车辆的车辆信息保存到第一集合,将所述第一集合中的所述目标车辆遍历每一条所述上游行驶路线,将出现次数大于等于且在前两个所述上游卡口至少出现一次的所述目标车辆的车辆信息移除所述第一集合后得到第二集合,统计所述第二集合中的所述目标车辆的上游实际行车时间,将所述上游实际行车时间不符合所述上游过车时间正态分布数据的所述目标车辆存储到第一嫌疑车辆集合,将所述第一集合中的所述目标车辆遍历每一条所述下游行驶路线,将出现次数大于等于且在后两个所述下游卡口至少出现一次的所述目标车辆的车辆信息移除所述第一集合后得到第三集合,统计所述第三集合中的所述目标车辆的下游实际行车时间,将所述下游实际行车时间不符合所述下游过车时间正态分布数据的所述目标车辆存储到第二嫌疑车辆集合,合并所述第一嫌疑车辆集合和所述第二嫌疑车辆集合以得到初级嫌疑车辆集合。

实施例2

为了解决上述技术问题,本发明还提供了一种基于大数据查找嫌疑车辆的系统,图3为本发明中基于大数据查找嫌疑车辆的系统的结构示意图,请参见图3,该系统,利用hadoop平台对嫌疑车辆进行查找,包括:条件筛选模块1、行车路线计算模块、嫌疑车辆筛选模块3和数据清洗模块4。

条件筛选模块1,用于根据所述嫌疑车辆指定筛选条件,并确定目标卡口及所述嫌疑车辆经过所述目标卡口的时间范围,其中,所述筛选条件包括:所述嫌疑车辆的车型、颜色及嫌疑车牌号码,所述目标卡口包括至少一个主卡口,n个上游卡口和m个下游卡口,其中,n和m均为大于或者等于2的正整数。

行车路线计算模块2,与所述条件筛选模块1相耦接,用于计算所述目标卡口的次序关系以获得行车路线,所述行车路线包括上游行车路线和下游行车路线,计算所述上游行车路线和所述下游行车路线的过车时间正态分布数据,其中,所述上游行驶路线至少为一条,所述下游行车路线至少为一条,所述上游行驶路线的所述目标卡口次序关系为以唯一确定的所述上游卡口为起点,以所述主卡口为终点,所述下游行行车路线的所述目标卡口的次序关系为以所述主卡口为起点,以唯一确定的所述下游卡口为终点,所述过车时间正态分布数据分为上游过车时间正态分布数据和下游过车时间正态分布数据,所述上游过车时间正态分布数据包括每一条所述上游行车路线的平均过车时间和标准差,所述下游过车时间正态分布数据包括每一条所述下游行车路线的平均过车时间和标准差。

嫌疑车辆筛选模块3,分别与所述条件筛选模块1和所述行车路线计算模块2相耦接,用于将在所述主卡口且在所述时间范围内出现的具有指定车型、颜色的所述车辆作为所述目标车辆,并将每个所述目标车辆遍历每一条所述上游行驶路线和每一条所述下游行车路线以分别获得上游实际行车时间和下游实际行车时间,计算出所述上游实际行车时间不符合所述上游过车时间正态分布数据的所述目标车辆及所述下游实际行车时间不符合所述下游过车时间正态分布数据的所述目标车辆以获得初级嫌疑车辆集合。

数据清洗模块4,与所述嫌疑车辆筛选模块3相耦接,用于利用第一时间和第二时间的历史过车数据对所述初级嫌疑车辆集合进行数据清洗,将在所述历史过车数据中出现过的所述目标车辆由所述初级嫌疑车辆集合中移除以获得最终嫌疑车辆集合,其中,所述第一时间和所述第二时间为与所述嫌疑车辆经过所述目标卡口的时间范围相同,所述第一时间为所述嫌疑车辆过车当天之前的至少为一天,所述第二时间为所述嫌疑车辆过车当天之后的至少为一天,所述第一时间、所述第二时间与所述嫌疑车辆的过车当天分别间隔至少两天。

本实施例中的基于大数据查找嫌疑车辆的方法,可以动态分析过车卡口的次序关系、过车时间的正态分布,不受事发时的天气、路况等因素所影响,并基于动态的次序关系以及过车时间的正态分布,为车辆在上、下游通过的比对分析提供了相对精确的数据;基于海量的过车数据,利用hadoop平台,根据初步判定的车型搜索出嫌疑车辆,缩小嫌疑车辆的搜索范围,为案件侦破提供支撑,极大地节省了警力,缩短了确定嫌疑车辆的时间,提高了案件的侦破效率;可以建立在廉价的商用机上,并可根据数据量的大小等实际情况确定集群的大小,能够同时并发计算海量的数据,在进行计算时,可以首先同时利用各节点机器的运算能力进行数据量较大且繁琐的计算,从而降低统计时间。

进一步地,为了避免未将嫌疑车辆统计入最终嫌疑车辆集合,所述最终嫌疑车辆集合还应当包括无车牌或遮挡车牌的车辆信息。

进一步地,所述筛选条件模块,还包括:预留筛选条件接口,用于增加所述筛选条件,所述筛选条件还包括:年检标形态、是否放下遮阳板和副驾驶是否有人。通过增加预留筛选条件接口,能够增加筛选条件,对初级嫌疑车辆集合进行进一步过滤以提高嫌疑车判定的正确率。

图4为本发明中基于大数据查找嫌疑车辆的方法的行车路线计算模块的结构示意图。请参见图4,进一步地,行车路线计算模块2包括上游行车路线计算模块201和下游行车路线计算模块202。

上游行车路线计算模块201,用于计算上游行车路线,具体为:

上游行车路线计算统计在所述主卡口及所述上游卡口的出现的车辆的车牌号码,并将所述车牌号码根据出现次数进行降序排列,出现次数相同的所述车牌号码具有相同的次序编号,根据所述次序编号排在前的所述车牌号码的车辆出现时间的先后顺序排列出具有唯一起点且以所述主卡口为终点的多个所述目标卡口的次序关系,即为上游行驶路线,针对每一条所述上游行驶路线内的所有车辆及两两所述目标卡口之间的所述过车时间,以计算出每一条所述上游行驶路线的过车平均时间及标准差。

下游行车路线计算模块202,用于计算下游行车路线,具体为:

统计在所述主卡口及所述下游卡口的出现的车辆的车牌号码,并将所述车牌号码根据出现次数进行降序排列,出现次数相同的所述车牌号码具有相同的次序编号,根据所述次序编号排在前的所述车牌号码的车辆出现时间的先后顺序排列出具有唯一终点且以所述主卡口为起点的多个所述目标卡口的次序关系,即为下游行驶路线,针对每一条所述下游行驶路线内的所有车辆及两两所述目标卡口之间的所述过车时间,以计算出每一条所述下游行驶路线的过车平均时间及标准差。

进一步地,嫌疑车辆筛选模块3,将所述目标车辆的车辆信息保存到第一集合,将所述第一集合中的所述目标车辆遍历每一条所述上游行驶路线,将出现次数大于等于且在前两个所述上游卡口至少出现一次的所述目标车辆的车辆信息移除所述第一集合后得到第二集合,统计所述第二集合中的所述目标车辆的上游实际行车时间,将所述上游实际行车时间不符合所述上游过车时间正态分布数据的所述目标车辆存储到第一嫌疑车辆集合,将所述第一集合中的所述目标车辆遍历每一条所述下游行驶路线,将出现次数大于等于且在后两个所述下游卡口至少出现一次的所述目标车辆的车辆信息移除所述第一集合后得到第三集合,统计所述第三集合中的所述目标车辆的下游实际行车时间,将所述下游实际行车时间不符合所述下游过车时间正态分布数据的所述目标车辆存储到第二嫌疑车辆集合,合并所述第一嫌疑车辆集合和所述第二嫌疑车辆集合以得到初级嫌疑车辆集合。

实施例3

为了便于理解,以具体实施例的方式对本发明进行说明。

一辆黑色奥迪a6为嫌疑车辆,其车牌号为鲁a12345,该嫌疑车辆在2017年10月8日下午3点经过了卡口k,由东南向西北方向行驶,因此,指定筛选条件为车型为黑色奥迪a6,车辆为黑色,车牌号为鲁a12345,并将卡口k作为主卡口,将卡口k东南方向的n个卡口作为上游卡口,将卡口k西北方向的m个卡口作为上游卡口,其中,n和m均等于10。需要说明的是,n和m的值为10仅是示例性说明。为了便于说明10个上游卡口依次标记为ku1、ku2、ku3至ku10,10个下游卡口依次标记为kd1、kd2、kd3至kd10,其中,由ku1至ku10距离主卡口k的距离逐渐减小,由kd1至kd10距离主卡口k的距离逐渐增加。指定主卡口的过车时间范围为下午2点50分至3点10分,并根据各上游卡口和各下游卡口与主卡口k的距离,依次设定各上游卡口和各下游卡口的过车时间。

利用nosql计算出在主卡口k中出现,且在上游卡口中也出现的车牌号。并统计出每一车牌号在上游卡口中出现的次数。根据出现次数进行降序排列,取排名在前的车牌号码。其中出现次数相同的车牌号,其排名视为同名次;如果所取的前排名中,某辆车的过车次数为1,则舍弃掉。

利用在上游卡口中出现次数在前次的车牌号码,根据其出现时间的先后关系,排列出卡口的具有唯一起点的多个卡口的次序关系。卡口的次序关系即为上游行车路线的走向,可以用ku1ku2…k表示。对于出现的多条次序路线使用ru1,ru2,……,rux来表示。

针对上游行车路线ru1总结其路线内的所有车辆以及两两卡口之间的过车时间,计算出该上游行车路线的过车平均时间tu1以及标准差xu1。利用同样的方法计算出上游路线的所有路线的平均过车时间以及标准差。

利用同样的方法计算出下游行车路线及每一条下游行车路线的平均过车时间以及标准差。

将符合筛选条件的车辆统计入第一集合中保存。为了避免漏掉嫌疑车辆。将第一集合中的每一个车辆遍历每一条行车路线的上游卡口,若某辆车出现次数大于等于且在前两个上游卡口之一或全部出现,则认为其在上游正常行车,将其从第一集合中移除以获得第二集合,统计所述第二集合中的所述目标车辆的上游实际行车时间,将所述上游实际行车时间不符合所述上游过车时间正态分布数据的所述目标车辆存储到第一嫌疑车辆集合。将第一集合中的每一个车辆遍历每一条行车路线的上游卡口,若某辆车出现次数大于等于且在前两个上游卡口之一或全部出现,则认为其在上游正常行车,将其从第一集合中移除以获得第二集合。统计第二集合中的目标车辆的上游实际行车时间,将上游实际行车时间不符合上游过车时间正态分布数据的目标车辆存储到第一嫌疑车辆集合。将第一集合中的目标车辆遍历每一条下游行驶路线,将出现次数大于等于且在后两个下游卡口至少出现一次的目标车辆的车辆信息移除第一集合后得到第三集合,统计第三集合中的目标车辆的下游实际行车时间,将下游实际行车时间不符合下游过车时间正态分布数据的目标车辆存储到第二嫌疑车辆集合,合并第一嫌疑车辆集合和第二嫌疑车辆集合以得到初级嫌疑车辆集合。

将2017年10月1日志2017年10月5日作为第一时间,将2017年10月11日志2017年10月15日作为第二时间,且第一时间和第二时间均为下午2点50分至3点10分(经过主卡口k的时间),并利用第一时间和第二时间的历史过车数据对初级嫌疑车辆集合进行清洗。

将在所述历史过车数据中出现过的所述目标车辆由所述初级嫌疑车辆集合中移除以获得最终嫌疑车辆集合。

通过本发明提供的方法和系统,能够将嫌疑车辆的范围缩小,为案件侦破提供支撑,极大地节省了警力,缩短了确定嫌疑车辆的时间,提高了案件的侦破效率。

与现有技术相比,本申请所述的基于大数据查找嫌疑车辆的方法和系统,达到了如下效果:

(1)本发明针对涉案嫌疑车辆在涉案过程中,利用频繁更换车牌、更改车牌号码、遮挡号牌等方式,使得其被拍摄到的车辆号码是非连续性的特点,提出了一种基于大数据查找嫌疑车辆的方法和系统,可以动态分析过车卡口的次序关系、过车时间的正态分布,不受事发时的天气、路况等因素所影响,并基于动态的次序关系以及过车时间的正态分布,为车辆在上、下游通过的比对分析提供了相对精确的数据;

(2)本发明提供的种基于大数据查找嫌疑车辆的方法和系统,基于海量的过车数据,利用hadoop平台,根据初步判定的车型搜索出嫌疑车辆,缩小嫌疑车辆的搜索范围,为案件侦破提供支撑,极大地节省了警力,缩短了确定嫌疑车辆的时间,提高了案件的侦破效率;

(3)本发明提供的基于大数据查找嫌疑车辆的方法和系统,可以建立在廉价的商用机上,并可根据数据量的大小等实际情况确定集群的大小,能够同时并发计算海量的数据,在进行计算时,可以首先同时利用各节点机器的运算能力进行数据量较大且繁琐的计算,从而降低统计时间;

(4)本发明提供的基于大数据查找嫌疑车辆的方法和系统,在得出初步的嫌疑车判定结果时,可以充分的利用所分析到车辆特征,如:年检标走向、是否放下遮阳板及副驾驶上是否有人等条件对结果进行进一步过滤,为进一步的扩展应用留下充足的接口空间,并可提高嫌疑车判定的正确率。

当然,实施本发明的任一产品必不特定需要同时达到以上所述的所有技术效果。

由于方法部分已经对本申请实施例进行了详细描述,这里对实施例中涉及的结构与方法对应部分的展开描述省略,不再赘述。对于结构中具体内容的描述可参考方法实施例的内容,这里不再具体限定。

上述说明示出并描述了本申请的若干优选实施例,但如前所述,应当理解本申请并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述申请构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本申请的精神和范围,则都应在本申请所附权利要求的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1