一种基于大数据分析昼伏夜出车辆的方法及装置与流程

文档序号:14043632阅读:1304来源:国知局

本发明涉及大数据分析与智能交通控制技术领域,具体地说,是涉及一种基于大数据分析昼伏夜出车辆的方法及装置。



背景技术:

随着生活水平的提高,越来越多的人选择开车出行,汽车保有量越来越大。道路、路口的卡口、电警等设备也越来越多,每天都会产生海量的过车数据。民警在利用这些视频或图片排查嫌疑车辆时,工作量非常大。由于各个地市的警力有限,往往在寻找线索的过程中就耗费大量时间,以致错失许多重要线索及机会。而犯罪嫌疑人在实时犯罪时,很多会选择白天隐匿,夜晚出行,躲避警察的盘查,降低曝光率。民警在通过这个规律缩小目标范围时,还需要一定的分析处理经验,许多一线的民警由于经验不足,不能完全胜任。

常规的系统会将车辆数据存储在关系型数据库中,但无法承载海量数据,针对大量数据的查询,也要耗费大量的时间和资源。随着数据量的增加,硬件扩展也需要很高的费用。

昼夜时间分界点是一个比较抽象的主观概念,且不同的季节和地域其昼夜时间分界点也是有变化的,如指定一个准确的时间作为分界点,不能够准确体现出车辆真实的昼夜规律,也不能够适应不同的地域和季节。



技术实现要素:

本发明所要解决的技术问题是:用电脑分析代替人工筛查昼伏夜出车辆,解决筛选嫌疑车时,车辆数据太多花费时间过多的问题,以及对民警经验要求较高的问题;使用大数据平台分布式存储系统储存过车数据,解决数据量增加,硬件扩展性不好及费用高的问题;使用大数据平台分布式计算框架分析数据,解决无法分析大量数据,且分析时间太长的问题;根据每日车辆出行数量的变化,动态计算其昼夜时间分界点,解决昼夜分界与车辆出行规律不符和不能够适应不同地域和季节的问题。

为解决上述技术问题,本发明提供了一种基于大数据分析昼伏夜出车辆的方法,包括步骤:

获取车辆信息并储存:获取经过交通卡口的图片和视频的非结构化车辆信息,经过结构化系统解析为车辆的结构化信息,发送至分布式文件系统内存储;

分时段统计过车数据:每隔一定时间记录该时间段内的过车数据,并计算相邻时间段内增幅;

计算昼夜分界时间点:将一天中最高增幅的中间时间点作为昼的起始时间点,一天中第二个最低增幅的中间点作为夜的起始时间点,统计多天内的过车数据后,计算出当前区域、当前时间的昼夜分界时间点;

判断车辆昼伏夜出:通过分布式计算框架判断目标车辆是否属于昼伏夜出,所述分布式计算框架分为map阶段和reduce阶段,其中,

map阶段按照设定的起始时间、结束时间、昼夜比例、位置信息,从所述分布式文件系统内提取符合时间和位置的车辆数据作为map阶段的输入信息,将车辆数据按照车牌号码分组,输出结果为<k,v>,其中k为车牌号码,v为车辆的过车信息;

map阶段的输出结果作为reduce阶段的输入信息,根据车牌号码k的不同,将不同车牌号码的过车数据发送至对应的reduce节点处理,使不同的reduce节点达到负载均衡,根据昼夜分界时间点,将每个车牌号码的全部过车数据分为白昼出行和夜晚出行分别统计,计算出昼夜出行的比例,以此判断出该车辆是否属于昼伏夜出,当属于昼伏夜出时将该车辆的分析结果进行存储。

优选地,所述分布式文件系统,进一步为,hdfs或gfs。

优选地,所述分时段统计过车数据:每隔一定时间记录该时间段内的过车数据,并计算相邻时间段内增幅,进一步为,

每隔半小时记录过车数据,并计算相邻时间段内增幅,对节假日、工作日分别进行累计统计。

优选地,还包括,判断出车辆是否属于昼伏夜出,当不属于昼伏夜出时将该车辆数据丢弃。

本发明还公开了一种基于大数据分析昼伏夜出车辆的装置,包括交通卡口电子拍摄设备、分时段统计过车数据系统、昼夜分界时间点计算系统、结构化系统、非结构化存储系统、分布式存储系统和分布式计算系统,其中,

所述交通卡口电子拍摄设备,与所述非结构化存储系统相耦接,获取经过交通卡口的图片和视频的非结构化车辆信息,发送至非结构化存储系统;

所述非结构化存储系统,分别与所述交通卡口电子拍摄设备和结构化系统相耦接,接收所述交通卡口电子拍摄设备发送的非结构化车辆信息进行存储,并与所述结构化系统进行交互;

所述结构化系统,分别与所述非结构化存储系统和分布式存储系统相耦接,用于调取非结构化存储系统中的非结构化车辆信息进行解析得到结构化数据并发送至分布式存储系统进行存储;

所述分布式存储系统,分别与所述结构化系统和分布式计算系统相耦接,用于存储所述结构化系统发送的结构化数据,并与所述分布式计算系统进行数据交互;

所述分时段统计过车数据系统,与所述昼夜分界点计算系统相耦接,进行分时段的记录过车数量,将数据发送至所述昼夜分界点计算系统;

所述昼夜分界点计算系统,与所述分时段统计过程系统和分布式计算系统相耦接,用于计算出昼夜分界时间点,并将该昼夜分界时间点发送至分布式计算系统;

所述分布式计算系统,分别与所述分布式存储系统和昼夜分界点计算系统相耦接,通过分布式计算框架判断目标车辆是否属于昼伏夜出,所述分布式计算框架分为map阶段和reduce阶段,其中,

map阶段按照设定的起始时间、结束时间、昼夜比例、位置信息,从所述分布式文件系统内提取符合时间和位置的车辆数据作为map阶段的输入信息,将车辆数据按照车牌号码分组,输出结果为<k,v>,其中k为车牌号码,v为车辆的过车信息;

map阶段的输出结果作为reduce阶段的输入信息,根据车牌号码k的不同,将不同车牌号码的过车数据发送至对应的reduce节点处理,使不同的reduce节点达到负载均衡,根据昼夜分界时间点,将每个车牌号码的全部过车数据分为白昼出行和夜晚出行分别统计,计算出昼夜出行的比例,以此判断出该车辆是否属于昼伏夜出,当属于昼伏夜出时将该车辆的分析结果进行存储。

优选地,所述分时段统计过车数据系统,每隔一定时间记录该时间段内的过车数据,并计算相邻时间段内增幅。

优选地,所述昼夜分界点计算系统,将一天中最高增幅的中间时间点作为昼的起始时间点,一天中第二个最低增幅的中间点作为夜的起始时间点,统计多天内的过车数据后,计算出当前区域、当前时间的昼夜分界时间点。

优选地,所述分布式文件系统,进一步为,hdfs或gfs。

优选地,所述分时段统计过车数据系统,对节假日、工作日分别进行累计统计。

优选地,所述分布式计算系统,判断出车辆是否属于昼伏夜出,当不属于昼伏夜出时将该车辆数据丢弃。

与现有技术相比,本发明所述的基于大数据分析昼伏夜出车辆的方法,达到了如下效果:

本发明使用计算机技术分析昼伏夜出车辆,能够在最短的时间内缩小排查嫌疑车辆的范围,提高民警的工作效率,降低对民警的专业要求。

本发明使用大数据平台分布式存储系统存储过车数量,可提高系统的可扩展性,降低硬件费用成本,并能提高系统的容错、容灾能力。

本发明使用大数据平台分布式计算框架分析数据,可承载大量数据的分析任务,并花费更少的时间,提高分析效率。

本发明根据每日车辆出行数量的变化,动态计算其昼夜时间分界点,使车辆昼伏夜出分析结果更符合真实规律,并能自动适应不同的季节和地域。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1为实施例1中基于大数据分析昼伏夜出车辆的方法流程图;

图2为实施例2中基于大数据分析昼伏夜出车辆的装置结构示意图;

图3为实施例3中非结构化车辆信息解析并存储的流程图;

图4为实施例3中计算昼夜时间分界点的流程图;

图5为实施例3中某地某一天过车数据统计图;

图6为实施例3中昼伏夜出任务处理过程流程图;

其中:201-交通卡口电子拍摄设备;202-分时段统计过车数据系统;203-昼夜分界时间点计算系统;204-结构化系统;205-非结构化存储系统;206-分布式存储系统;207-分布式计算系统。

具体实施方式

如在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可理解,硬件制造商可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名称的差异来作为区分组件的方式,而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”为一开放式用语,故应解释成“包含但不限定于”。“大致”是指在可接收的误差范围内,本领域技术人员能够在一定误差范围内解决所述技术问题,基本达到所述技术效果。此外,“耦接”一词在此包含任何直接及间接的电性耦接手段。因此,若文中描述一第一装置耦接于一第二装置,则代表所述第一装置可直接电性耦接于所述第二装置,或通过其他装置或耦接手段间接地电性耦接至所述第二装置。说明书后续描述为实施本发明的较佳实施方式,然所述描述乃以说明本发明的一般原则为目的,并非用以限定本发明的范围。本发明的保护范围当视所附权利要求所界定者为准。

以下结合附图对本发明作进一步详细说明,但不作为对本发明的限定。

实施例1:

结合图1,本实施例提供了一种基于大数据分析昼伏夜出车辆的方法,包括以下步骤:

步骤101:获取车辆信息并储存:获取经过交通卡口的图片和视频的非结构化车辆信息,经过结构化系统解析为车辆的结构化信息,发送至分布式文件系统内存储;

所述分布式文件系统包括但不限于hdfs或gfs。

步骤102:分时段统计过车数据:每隔一定时间记录该时间段内的过车数据,并计算相邻时间段内增幅;

例如可以每隔半小时记录过车数据,并计算相邻时间段内增幅,对节假日、工作日分别进行累计统计。

步骤103:计算昼夜分界时间点:将一天中最高增幅的中间时间点作为昼的起始时间点,一天中第二个最低增幅的中间点作为夜的起始时间点,统计多天内的过车数据后,计算出当前区域、当前时间的昼夜分界时间点;

步骤104:判断车辆昼伏夜出:通过分布式计算框架判断目标车辆是否属于昼伏夜出,所述分布式计算框架分为map阶段和reduce阶段,其中,

map阶段按照设定的起始时间、结束时间、昼夜比例、位置信息,从所述分布式文件系统内提取符合时间和位置的车辆数据作为map阶段的输入信息,将车辆数据按照车牌号码分组,输出结果为<k,v>,其中k为车牌号码,v为车辆的过车信息;

map阶段的输出结果作为reduce阶段的输入信息,根据车牌号码k的不同,将不同车牌号码的过车数据发送至对应的reduce节点处理,使不同的reduce节点达到负载均衡,根据昼夜分界时间点,将每个车牌号码的全部过车数据分为白昼出行和夜晚出行分别统计,计算出昼夜出行的比例,以此判断出该车辆是否属于昼伏夜出,当属于昼伏夜出时将该车辆的分析结果进行存储。

判断出车辆是否属于昼伏夜出,当不属于昼伏夜出时将该车辆数据丢弃。

实施例2:

结合图2,本实施例提供了一种基于大数据分析昼伏夜出车辆的装置,包括交通卡口电子拍摄设备、分时段统计过车数据系统、昼夜分界时间点计算系统、结构化系统、非结构化存储系统、分布式存储系统和分布式计算系统。

所述交通卡口电子拍摄设备,与所述非结构化存储系统相耦接,获取经过交通卡口的图片和视频的非结构化车辆信息,发送至非结构化存储系统;

所述非结构化存储系统,分别与所述交通卡口电子拍摄设备和结构化系统相耦接,接收所述交通卡口电子拍摄设备发送的非结构化车辆信息进行存储,并与所述结构化系统进行交互;

所述结构化系统,分别与所述非结构化存储系统和分布式存储系统相耦接,用于调取非结构化存储系统中的非结构化车辆信息进行解析得到结构化数据并发送至分布式存储系统进行存储;

所述分布式存储系统,分别与所述结构化系统和分布式计算系统相耦接,用于存储所述结构化系统发送的结构化数据,并与所述分布式计算系统进行数据交互;

所述分时段统计过车数据系统,与所述昼夜分界点计算系统相耦接,进行分时段的记录过车数量,将数据发送至所述昼夜分界点计算系统;

所述昼夜分界点计算系统,与所述分时段统计过程系统和分布式计算系统相耦接,用于计算出昼夜分界时间点,并将该昼夜分界时间点发送至分布式计算系统;

所述分布式计算系统,分别与所述分布式存储系统和昼夜分界点计算系统相耦接,通过分布式计算框架判断目标车辆是否属于昼伏夜出,所述分布式计算框架分为map阶段和reduce阶段,其中,

map阶段按照设定的起始时间、结束时间、昼夜比例、位置信息,从所述分布式文件系统内提取符合时间和位置的车辆数据作为map阶段的输入信息,将车辆数据按照车牌号码分组,输出结果为<k,v>,其中k为车牌号码,v为车辆的过车信息;

map阶段的输出结果作为reduce阶段的输入信息,根据车牌号码k的不同,将不同车牌号码的过车数据发送至对应的reduce节点处理,使不同的reduce节点达到负载均衡,根据昼夜分界时间点,将每个车牌号码的全部过车数据分为白昼出行和夜晚出行分别统计,计算出昼夜出行的比例,以此判断出该车辆是否属于昼伏夜出,当属于昼伏夜出时将该车辆的分析结果进行存储。

所述分时段统计过车数据系统,每隔一定时间记录该时间段内的过车数据,并计算相邻时间段内增幅。

所述昼夜分界点计算系统,将一天中最高增幅的中间时间点作为昼的起始时间点,一天中第二个最低增幅的中间点作为夜的起始时间点,统计多天内的过车数据后,计算出当前区域、当前时间的昼夜分界时间点。

所述分布式文件系统,进一步为,hdfs或gfs。

所述分时段统计过车数据系统,对节假日、工作日分别进行累计统计。

所述分布式计算系统,判断出车辆是否属于昼伏夜出,当不属于昼伏夜出时将该车辆数据丢弃。

实施例3:

在实施例1和实施例2的基础上,本实施例为应用实施例

卡口、电警等设备拍摄的图片、视频等非结构化车辆信息,需经过结构化系统解析为结构化数据,并存储在分布式文件系统里,包括但不限于hdfs、gfs等架构。如图3所示:交通卡口电子拍摄设备采集图片,储存图片及过车信息,然后将图片及过车信息进行结构化,存储在分布式文件存储系统内,分布式文件存储系统内存储的有过车信息、车辆信息、图片地址等信息。

每隔一定时间如半小时记录该时间段内的过车数据,并计算相邻时间段内的增幅。图5为某地市某一天统计的数据。经大量分析可得出如下结论:一天中第一个最高增幅的中间时间点可作为昼的起始时间点,一天中第二个最低增幅的中间时间点可作为夜的起始时间点。同时需针对节假日、工作日分别累计统计。在积累大量数据后,可计算出当前地域、当前时间的昼夜分界时间点。计算昼夜时间分界点的过程见图4:分时段记录过车数量,当为工作日时,调取工作日历史过车数量,计算工作日相邻时间段过车数量增幅,计算出昼夜分界时间点;当不是工作日时,调取非工作日历史过车数量,计算非工作日相邻时间段过车数量增幅,计算出昼夜分界时间点。这里所述的过车数量也就是过车数据。

分布式计算框架分为map阶段和reduce阶段。用户给定起始时间、结束时间、昼夜比例等信息,系统(也就是本申请所述的基于大数据分析昼伏夜出车辆的装置)可从分布式存储系统中提取符合时间、位置的车辆数据,map阶段的输入。在map阶段,将车辆数据按照车牌号码分组,该阶段输出的结果形式为<k,v>,其中k为车牌号码,v为车辆的过车信息。map阶段的输出作为reduce阶段的输入,根据k的不同,按照计算公式:reducer=(key.hashcode()&integer.max_value)%numreducetasks,得到当前的目的reduce。将不同的车牌号码的过车数据发送给对应的reduce节点处理,使不同reduce节点能够达到负载均衡。在此阶段,系统根据昼夜分界时间点,将每个车牌的所有过车数据分为白昼出行和夜晚出行分别统计,得出其昼夜出行的比例,以此判断该车辆是否属于昼伏夜出。如果属于就将该车辆的分析结果存储,否则将数据丢弃。昼伏夜出任务处理过程的流程图见图6:提出任务(也就是判断是否为昼伏夜出车辆的任务),提供过车的开始时间、结束时间、地域范围等条件,分布式存储系统提供所述过车数据,根据车牌号码分组,计算昼夜出现比例,符合昼伏夜出则保存过车信息,不符合昼伏夜出则丢弃过车信息。

举例:

设定车牌号码为“鲁a12345”,reduce个数numreducetasks为5,对应的reducer编号分别为:0、1、2、3、4。

计算其对应的reducer=(key.hashcode()&integer.max_value)%numreducetasks=(1708423251&2147483647)%5=1708423251%5=2,即该车辆数据map阶段的输出k对应是编号为2的第3个reducer。

计算该车辆在2017年10月1日到2017年10月10日是否是昼伏夜出出行,设定昼伏夜出比例为80%,即夜晚出行比例超过80%即为昼伏夜出。

假如一天中第一个最高增幅的中间时间点为07:20,即为昼的起始时间点,一天中第二个最低增幅的中间时间点为19:30,即为夜的起始时间点。车辆在00:00-07:19、19:30-23:59时间段内出现的认为是白天出行,车辆在07:20-19:29时间段内出行的认为是夜晚出行。

如果该车辆在2017年10月1日到2017年10月10日的白天出行次数为10次,夜晚出行次数为180次,其夜晚出行比例为:180/(180+10)*100%=94.7%,大于80%,即可将该车判定为昼伏夜出车辆。

与现有技术相比,本发明所述的基于大数据分析昼伏夜出车辆的方法,达到了如下效果:

本发明使用计算机技术分析昼伏夜出车辆,能够在最短的时间内缩小排查嫌疑车辆的范围,提高民警的工作效率,降低对民警的专业要求。

本发明使用大数据平台分布式存储系统存储过车数量,可提高系统的可扩展性,降低硬件费用成本,并能提高系统的容错、容灾能力。

本发明使用大数据平台分布式计算框架分析数据,可承载大量数据的分析任务,并花费更少的时间,提高分析效率。

本发明根据每日车辆出行数量的变化,动态计算其昼夜时间分界点,使车辆昼伏夜出分析结果更符合真实规律,并能自动适应不同的季节和地域。

上述说明示出并描述了本发明的若干优选实施例,但如前所述,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1