一种基于车辆轨迹的区域徘徊异常行为检测方法与流程

文档序号:12676945阅读:405来源:国知局
本发明涉及到异常行为模式识别
技术领域
,特别是一种基于车辆轨迹的区域徘徊异常行为检测方法。
背景技术
:随着信息化进程的加快,海量公路智能监测设备(简称电子卡口)被部署在城市的各级公路之上,逐步形成了网络化的车辆监测格局,为基于车辆轨迹的异常行为检测提供数据基础。与此同时,计算机性能的快速提升,分布式处理技术的飞速发展,也为海量数据的分析处理提供技术保障。目前,车辆异常行为检测研究大多是通过视频图像处理、模式识别等技术,直接识别车出辆的异常驾驶行为,如检测监控区域发生的违章逆行、变道、闯红灯等危险行为。而针对公共安全领域的研究还很少,如车辆的区域徘徊异常行为检测。徘徊异常行为主要是指:机动车辆在检查站或重要机构、学校、高档小区附近无目的性的来回移动的行为,这种异常行为看似无目的,却很可能是为盗抢车辆、入室盗窃等违法犯罪行为做准备,蕴含很大的安全隐患。若本发明能从海量的车辆轨迹数据中识别出具有区域徘徊异常行为的车辆,然后结合该车辆的基本信息进行系统的分析与研判,无论对案件的案前预警还是案后分析均有重要意义。在已有文献《基于车牌识别系统车辆轨迹的行为异常检测》中,提出了一种基于围绕质心累计转动角度的异常徘徊行为检测方法,通过计算某车辆的围绕质心的累计转动的角度(利用余弦公式)进行检测,若转动角度超过一定阈值,则判定该车辆在该区域内具有徘徊异常行为。然而针对某一目标徘徊的车辆轨迹并不一定会形成闭合曲线,很可能是杂乱无章并伴有一定时间停驻的轨迹。而且电子卡口的数量虽多,但并没有达到全城无死角覆盖的程度,采取这种方法发现的异常车辆多为在很大的环形区域内绕行的车辆,与公共安全领域所要发现的徘徊异常行为有一定差异,不能有效的发现危害公共安全的异常行为。技术实现要素:为解决上述技术问题,本发明提供了一种基于车辆轨迹的区域徘徊异常行为检测方法,其包括以下步骤:(1)轨迹数据预处理:以天为单位,将城市内所有电子卡口的记录数据汇总,所述记录数据均以车牌号、卡口编号、时间戳的形式存储于数据库中,并对缺失值和噪音数据采用删除操作;(2)生成车辆轨迹数据表VehicleTrajectory:定义2882个字段,分别为serialnumber、platenumber、1、2、3、...、2879、2880,将serialnumber和platenumber设置为联合主键,其中serialnumber为序列号,platenumber为车牌号,剩余的2880个字段分别代表一个连续的时间区间,每个时间区间的时长相同;然后将经过预处理后的轨迹数据,读入数据库表格,最后生成车辆轨迹数据表;(3)根据区域徘徊异常行为的模式和已有数据的轨迹信息,提取车辆轨迹的属性特征:包括途径卡口频次、途径卡口数量、停滞卡口与频繁卡口间距离、频次的波动程度以及时间集中度;(4)针对所述五个车辆轨迹属性特征,设置两种阈值,分别为基于统计数据的阈值设定方法与基于专家经验的阈值设定方法;(5)提取徘徊异常车辆常规信息:将车辆的属性特征值与其对应的阈值进行比较,若该车辆所有属性特征值均大于其阈值,则判定该车辆当天具有区域徘徊异常行为,并将其Outlier属性标为1;同时,根据其车牌号提取车辆的轨迹数据及包括车辆信息、车主或租赁人员信息的基本信息。较佳地,所述数据预处理具体包括:车辆牌号数据预处理:根据预设的车牌编码规则过滤特定的车辆,包括警车、军车、政府公车、出租车、公交车;同时对过滤后的普通车辆车牌号码使用单向Hash函数进行变换加密;卡口编号预处理:在预处理过程中需合并城市内具有相同功能的电子卡口,并进行统一编码;时间数据预处理:将一天二十四小时的时间划分为2880个小的时间区间,区间大小为30s,然后对所有时间区间进行统一编码,编码数字为1至2800;时间区间的编号转换公式为:时*60*2+分*2+秒/30+1;根据所述时间编码的转换公式,将所有记录数据中的时间转化为编码。较佳地,途径卡口频次的提取具体过程为:依次对每辆车经过各个卡口的频次进行统计:FREij表示当天序列号为i辆车在j卡口被记录的频次,初始值为0;Bt表示时间编号为t的时间段内该车辆被记录的卡口编号,若在该时刻车辆未被任意卡口所记录,则Bt为0;同时,在统计的过程中要对其前一时刻的数据进行检测,对t-1时刻的记录进行检测,若Bt=j且Bt-1=j,则忽略本条记录,否则进行频次累加,生成生成车辆轨迹频次表;并将该车辆途径卡口频次最大值记为最频繁卡口频次FREi,存储于车辆轨迹属性表;途径卡口数量的提取过程为:途径卡口数量NUM是指车辆当天累计经过卡口的数量,若经过卡口数量少于一定阈值,则该车辆发生异常徘徊行为的概率很低,此处不予考虑;途径卡口数量可直接对处理过的车辆轨迹频次表中不为零的元素数量进行统计,并将其存储于车辆轨迹属性表;停滞卡口与频繁卡口间距离D:将计算其停滞卡口与频繁卡口间的欧式距离D,以防止将只是在住所附近出入频繁的车辆误判为徘徊异常车辆;停滞点是指在一定时间阈值内车辆未被任何电子卡口所记录的点,出现在停滞点两端的电子卡口即为该车辆的停滞卡口,由于某一车辆停滞卡口与频繁卡口并不唯一,会产生多个D值,取其中最小值,作为该车辆停滞卡口与频繁卡口间距离Di,并将其存储于车辆轨迹属性表;频次的波动程度FL的提取过程为:根据车辆的行驶特征,即该类车辆在各个电子卡口被记录的频次的波动程度较小,且其经过频繁卡口的时间集中程较低,添加两个新的车辆轨迹属性特征:频次的波动程度以及时间集中度;频次的波动程度FL是指车辆在各个电子卡口被记录频次的离散程度值,通过车辆途径各个电子卡口频次的标准差来进行计算;首先从车辆频次表中提取该车辆的频次数据,FREi(FREi1,FREi2,FREi3,…,FREin-1,FREin),删除值为零的数据;然后计算剩余频次数值的标准差作为该车辆途径卡口频次的波动程度FLi,并将其存储于车辆轨迹属性表;时间集中度CRN的提取过程为:时间集中度CRN是用来度量车辆通过某一频繁卡口的时间集中程度,若集中程度较高,并超过一定阈值,则认为该车辆具有异常徘徊的嫌疑;通过滑动时间窗口来度量在一定时间阈值内车辆经过某一频繁卡口的频次,取其中最大值作为该车辆的时间集中度CRNi,并将其存储于车辆轨迹属性表。较佳地,所述基于统计数据的阈值设定方法为:根据格拉布斯(Grubbs)上侧检验原理,对车辆的途径卡口频次FRE和频次的波动程度FL两个车辆轨迹属性特征进行阈值设定,首先对频次FRE进行设定:a)提取所有车辆的最频繁卡口频次FREi;b)计算样本方差:c)确定检出水平α,查表得到其临界值G1-α(n);d)最后得到车辆途径卡口频次阈值FRE0:频次波动程度的阈值FL0设定方法与频次FRE设定方法相同;所述专家经验的阈值设定方法为:其余属性特征值包括NUM、D、CRN采用背对背的通信方式征询专家小组成员的特征阈值设定,经过几轮征询,使专家小组的意见趋于集中,最后得到符合城市特性及交通常规的阈值设定值。本发明具有以下有益效果:1、本发明通过对轨迹数据的处理,实现了非闭合轨迹区域徘徊异常行为车辆的自动识别,从而合理的发现、控制和处置可能发生的案件,切实有效的维护了人民群众的生命财产安全;2、现有轨迹数据通常是由数量不定的多维数据点序列表示,在实际的存储和处理过程中会造成很大困扰,而本发明在表示车辆轨迹时,提出一种新的车辆轨迹数据表示和存储形式——车辆轨迹数据表VehicleTrajectory,使数据在处理过程中更加直观、便捷高效;3、本发明对区域徘徊异常行为进行深入理解和全面考虑,从轨迹数据(车牌ID,位置,时间)三个维度中提取出五个具体的行为特征属性,并针对属性特征设定合理的阈值,有效降低误检的概率,使异常检测可解释性更强,精确度更高。当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。附图说明为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本发明实施例提供的基于车辆轨迹的案前预警平台整体构架图。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。图1展示了基于车辆轨迹的案前预警平台整体构架,包含数据预处理、车辆异常行为检测、案前预警综合研判及可视化四部分。本发明涉及到的主要内容包括数据预处理及区域徘徊异常行为检测,并将异常信息和车辆基本信息输入到案前预警综合研判模块,为基于车辆轨迹的案前预警平台的综合研判和可视化展示提供有力的数据支持。下面结合附图及实施例对本发明作进一步描述:实施例:一种基于车辆轨迹的区域徘徊异常行为自动识别方法,通过道路上海量的智能监测设备以及车牌自动识别技术ANPR(automaticnumberplaterecognition)获取城市内所有车辆的时空轨迹数据,并将数据读取到区域徘徊异常行为检测模块中进行异常行为的自动识别和案前预警。在异常检测过程中,模块首先对城市内所有被记录的轨迹数据进行预处理,包括特定车辆轨迹数据删除及车牌加密、时间转换、卡口转码等,并将预处理后的轨迹数据以车辆轨迹数据表的形式存储于数据库中;然后从生成的轨迹数据表中提取车辆的五个行为属性特征,并与发明中智能设定的阈值进行比较,从而识别出具有徘徊异常行为的车辆;最后提取异常车辆周期内所有异常信息及其基本信息输出到下一模块,为整个案前预警的综合研判和可视化展示提供数据支持。具体实施步骤如下:Step1输入轨迹数据通过智能监测设备以及车牌自动识别技术ANPR能够获取城市内所有车辆的时空轨迹数据,包含车辆的车牌号、通过卡口号以及通过的时间,然后以天为单位[00:00:00,24:00:00)将其汇总、输入到轨迹数据预处理模块中。Step2轨迹数据预处理由于本发明分析的主要对象是普通车辆,因此首先对输入的轨迹数据中缺失值和异常值进行删除处理,并根据国内车辆的车牌编码规则过滤特定的车辆,如警车、军车、政府公车、出租车、公交车等。随后对车辆轨迹的三维数据(车牌id、卡口号、通过时间)分别进行处理:a)车牌号预处理;出于保护隐私的考虑,将对过滤后的普通车辆车牌号码使用单向Hash函数进行加密变换。b)卡口编号预处理;由于城市内的主要交通线路通常会有多条车道,导致在某一路口以相同方向行驶的车辆会被记录为不同的卡口号,给异常识别过程中频繁卡口的发现造成不便。因此在预处理过程中将合并功能相同的卡口,对轨迹数据中的卡口号进行统一编码。c)时间数据预处理;为了使生成的车辆轨迹方便数据库存储和计算,一天二十四小时的时间被划分为2880个小的时间区间,然后按照其划分的区间将轨迹数据中的时间转换成统一的数字编码的形式,转换公式为:时*60*2+分*2+秒/30+1。然后将预处理过后的轨迹数据输入到区域徘徊异常检测模块,进行区域徘徊异常行为自动识别。预处理:Step3生成车辆轨迹数据表VehicleTrajectory车辆轨迹通常被表示为一个轨迹点序列,但是由于每个轨迹点是一个多维数据点且轨迹点的数量不定,在实际的存储和处理过程中会造成很大困扰。因此,在本发明中将轨迹数据以车辆轨迹数据表的形式存储,数据表结构如下:包含2882个字段,分别为serialnumber、platenumber、1、2、3、...、2879、2880,其中serialnumber(序列号)和platenumber(车牌号)为联合主键,剩余的2880个字段分别代表一个大小为30s的时间区间,即[00:00:00,00:00:30)、[00:00:30,00:01:00)、...、[23:59:00,23:59:30)、[23:59:30,24:00:00)。然后将经过预处理后的轨迹数据,如(******,B029,56),读入数据库表格,使VehicleTrajectory.56='B029'whereVehicleTrajectory.platenumber='******',最后生成车辆轨迹数据表:表1VehicleTrajectoryserialnumberplatenumber123...2878287928801******00B004...B016002******000...0003******0B1590...0004******000...B06400...........................Step4提取车辆i的行为属性特征在生成车辆轨迹数据表后,模型将按序列号i对其中的轨迹数据逐条进行处理,提取车辆轨迹的行为属性特征,分为下面五个步骤:Step4.1提取车辆i最频繁卡口频次FREi途径卡口频次FRE能够表达出车辆经过某一电子卡口的频繁程度,是识别区域徘徊异常的主要行为特征,遂对第i辆车经过各个卡口的频次进行统计。其中,FREij表示当天序列号为i的车辆在j卡口被记录的频次,初始值为0;Bt表示时间编号为t的时间段内该车辆被记录的卡口编号,若在该时刻车辆被j卡口所记录,且前一时刻未被任意卡口所记录,则FREij加1,否则不变。从而生成车辆轨迹频次表,并将该车辆途径卡口频次最大值记为最频繁卡口频次FREi,存储于车辆轨迹属性表。表2车辆轨迹频次表serialnumberplatenumberB001B002B003B004B005B006B007...1******0007010...2******0000000...3******1200002...4******2000008.................................Step4.2提取车辆i途径卡口数量NUMi途径卡口数量NUM是指车辆当天累计经过卡口的数量,将直接对处理过的车辆轨迹频次表中不为零的元素数量进行统计,得到车辆i的途径卡口数量NUMi,并将其存储于车辆轨迹属性表。Step4.3提取车辆i停滞卡口与频繁卡口间距离Di为防止将只是在住所附近出入频繁的车辆误判为徘徊异常车辆,本发明将计算车辆停滞卡口与频繁卡口间的距离Di。其中,(xi,fre,yi,fre)表示第i辆车频繁卡口的坐标,(xi,stay,yi,stay)表示第i辆车停滞卡口的坐标。由于某一车辆停滞卡口与频繁卡口并不唯一,需对它们进行遍历产生多个D值,取其中最小值,作为该车辆停滞卡口与频繁卡口间距离Di,并存储于车辆轨迹属性表。Step4.4提取车辆i频次波动程度FLi为防止将一些活动较频繁的车辆误判为徘徊异常车辆,则需要根据其行驶特征提取车辆的频次的波动程度FLi,即车辆在各个电子卡口被记录频次的离散程度值。首先从车辆频次表中提取该车辆的频次数据,FREi(FREi1,FREi2,FREi3,…,FREin-1,FREin),删除值为零的数据。然后计算频次序列的标准差作为该车辆途径卡口频次的波动程度FLi,存储于车辆轨迹属性表。Step4.5提取车辆i时间集中度CRNi时间集中度CRN是用来度量车辆通过某一频繁卡口的时间集中程度,用时间长度为3h的滑动时间窗口来度量车辆经过某一频繁卡口的频次,并取其中最大值作为该车辆的时间集中度CRNi,存储于车辆轨迹属性表。Step5读取各行为属性特征阈值针对上述五个车辆轨迹属性特征,本发明将给出阈值设定的计算方法以及专家设定的阈值。1)基于数据的阈值设定方法(FRE、FL)本发明将根据格拉布斯(Grubbs)原理,计算车辆的途径卡口频次FRE和频次的波动程度FL两个车辆轨迹属性特征的阈值:(以FRE属性特征为例,频次波动程度的阈值FL0设定方法与其相同)a)提取所有车辆的最频繁卡口频次FREi;b)计算样本方差:a)确定检出水平α,查表得到其临界值G1-α(n);b)最后得到车辆途径卡口频次阈值FRE0:2)基于专家经验的阈值设定方法(NUM、D、CRN)其余属性特征值(如NUM、D、CRN)只要在合理的阈值范围内即可,因此采用背对背的通信方式征询专家小组成员的特征阈值设定,经过几轮征询,使专家小组的意见趋于集中,最后得到符合城市特性及交通常规的阈值设定值(如NUM0、D0、CRN0)。最后,途径卡口数量阈值NUM0设定为6,停滞卡口与频繁卡口间距离阈值D0设定为2.5km,时间集中度阈值CRN0设定为FRE0/2。在一个周期内,阈值不变,仅计算一次,在处理过程中只需将结果读入即可。Step6区域徘徊异常识别上述步骤已将车辆特征属性信息从轨迹数据中提取出来,并存储于车辆轨迹属性表:表3车辆轨迹属性表车牌号FRENUMDFLCRNOutlier******8125.2615.2051******6101.209.2520******692.569.5620******7212.3524.2330.....................然后,将车辆的属性特征值与其对应的阈值进行比较,若该车辆所有属性特征值均大于其阈值,则判定该车辆当天具有区域徘徊异常行为,并将其Outlier属性标为1;否则将其Outlier属性标为0,并执行i++,检测下一条轨迹数据。Step7输出车辆基本信息提取Outlier为1的异常车辆轨迹信息,并根据其车牌号提取车辆的轨迹数据及其基本信息(包括车辆信息、车主或租赁人员信息),为整个案前预警模块的综合研判和可视化展示提供数据支持。Step8判断i是否等于nn表示当天被记录的机动车总量,若i<n,则i++处理下一条轨迹数据,返回步骤4;若i=n,则表示轨迹数据已经读取完毕,结束整个流程。以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属
技术领域
技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1