基于大数据分析的浮动车伴随行为模式挖掘方法

文档序号:9507007阅读:1469来源:国知局
基于大数据分析的浮动车伴随行为模式挖掘方法
【技术领域】
[0001] 本发明属于数据挖据技术领域,具体涉及到一种基于大数据分析的浮动车伴随行 为模式挖掘方法。
【背景技术】
[0002] 随着信息社会的发展特别是智能交通的发展,世界各地都在建立信息化的交通管 理系统,对交通车辆进行科学合理的管理和疏导。其中,从大量车辆数据中实时查找伴随行 为车辆对于监控、预防犯罪有着重要意义,因为类似绑架、勒索、贩毒等团伙作案,大多采用 多车同时行动的情况,因此,能够及时、准确、或离线的分析出多车长时间相伴而行的行为, 对监控、预防犯罪具有较高的价值。另外,也可以作为数据或设备异常供浮动车管理机构查 验。因为,如果两辆以上的车辆如果经常沿着同一路线长时间相伴而行,我们有理由怀疑是 否是人为或设备本身出现了故障,或者需要找出总是长时间相伴而行的原因。此外,大量两 客一危的车辆游移在城市的密集车流和人流中间,极易引发重大安全事故,如果两辆危险 车长时间距离100米以上的距离行驶,超出两个驾驶员相互识别的距离,那么一旦出现事 故,必将造成更大的损失,因此,如果能够及时识别相聚较近的危险车,及时预警规避,对于 预防重大安全事故也具备十分有益的价值。

【发明内容】

[0003] 本发明针对现有技术的不足,提供了一种基于大数据分析的浮动车伴随行为模式 挖掘方法。
[0004] 本发明中浮动车数据具体指车载GPS终端设备上传的实时数据。
[0005] 本发明的主要目标和内容即是,从不断持续上传的浮动车数据中计算出正在形 成伴随行为模式的车辆对。
[0006] 本发明技术方案的主要构思是:通过一个二维HashMap矩阵记录可疑车辆对的状 态,每分钟数据中寻找可疑车辆对并更新HashMap,并运用双阈值来判定车辆对是否已形成 伴随状态。
[0007] 本发明方法包括以下步骤:
[0008] ①预处理阶段:设定多个阈值;建立一个空的二维HashMap作为可疑集合,任意 有嫌疑两辆车A和B可以从中得到对应可疑参数;建立一个待处理的数据集。
[0009] ②如果超过终止时间,则退出;如果不超过,继续。
[0010] ③读入一分钟数据,更新待处理数据集,仅保留每辆车最多前一分钟数据。
[0011] ④在待处理数据集中寻找可疑车辆对,并将可疑关系更新至可疑集合中。
[0012] ⑤遍历可疑集合,对每个元素进行维护,清除摆脱嫌疑的车辆对,输出已出现问题 的车辆对。
[0013] 本发明具有的有益效果:
[0014] 1、本发明主要针对了当前大多数相关工作欠缺大量车辆实时进行捕捉能力的不 足。
[0015] 2、对于现实中大量车辆在地理上处于相对稀疏状态的特性,本发明采用HashMap 来存储大量车辆的相关关系使内存得到更充分利用。
[0016] 3、同时,本发明采用了关于连续时间的双阈值来记录、处理轨迹相似程度,更加简 单有效。
[0017] 本发明设计了合理的支持度指数,通过该指数,可以更加准确的捕捉时间和空间 上有显式伴随行为模式的车辆一一伴随时间更长、两车距离和越大的车辆可以更易被发 现。
【附图说明】
[0018] 图1是本发明方法的流程图。
【具体实施方式】
[0019] 以下结合附图对本发明作进一步说明。
[0020] 浮动车伴随行为模式定义:在海量交通流中两辆浮动车以较近的距离相伴而行, 并且保持较远的距离和时间,我们认为这两辆浮动车具有伴随的行为模式。
[0021] 浮动车伴随行为模式数学表达:
[0022] 定义1 :时间片
[0023] 在研究的时间[tQ,tn+At]区间内,将其分为η个时间片,则第i个时间片为 [ti,t;+Δ t] Ui= t o+n* Δ t/2)。时间片大小为Δ t,本实施例暂定lmin。
[0024] 定义 2 :车辆邻近状态 AS (Adjacent State)
[0025] (I) [h,tjA t]时间段内,A、B两车各有且仅有一个有效GPS数据,GPSjP GPS B。
[0026] (2) I GPSa-GPSb I = L代表A、B两点在地图上的距离。
[0027] (3) A车与B车在一个时间片内,其距离满足I GPSa-GPSb I〈minL,则认为A、B两车在 时间片[Uti+At]内邻近。minL为设定的一个可疑距离,本实施例中minL= 100m。
[0028] 定义3、浮动车伴随行为嫌疑支持度:
[0030] (2)浮动车伴随支持度指数 EASI (Explicit Accompany Support Index)
[0032] 从指数的公式中可以看到,两辆车处于邻近状态AS的时间片越多,伴随的支持度 指数就越高,处于邻近状态AS所经过的距离越长,伴随的支持度指数就越高。综合考虑了 浮动车伴随行为模式同时具备的时、空两个特性。这个指数是一个无量纲的量,便于操作。
[0033] (3)浮动车非嫌疑支持度函数 NoEASI (No Explicit Accompany Support Index)
[0035] 该函数中的两个变量:k代表当前时间片,m代表k之前的m个时间片。如果NoEASI 在过去的连续m个时间片内都是非零的,即使在连续的m个时间片内,有几次不满足邻近状 态AS条件,那么我们仍然累加 A、B两车的伴随支持度指数EASI,除非A、B辆车在过去连续 m个时间片内都不满足,那么NoEASI将为零。此时将不再累加 A、B两车的伴随支持度指数 EASI0
[0036] (4)浮动车非嫌疑支持度函数阈值NoEASI_Lim
[0037] 在本实施例中认为m = 7, NoEASI_Lim = 0,即连续7个时间片不满足邻近状态AS 条件,则可以认为两车可以解除伴随嫌疑。
[0038] (5)浮动车伴随支持度阈值EASI_Lim
[0039] 当浮动车伴随支持度指数EASI累积到一定程度的时候认为A、B两辆车的伴随嫌 疑较大,将输出报警信息。
[0040] 在本实施例中,EASI同时考虑了时间和空间上的伴随行为,防止了堵车、数据偏移 等极端情况,所以本实施例仅考虑正常行驶情况下的阈值设置。
[0041] 在本实施例中,正常行驶车辆平均每个时间片内行驶距离处于[50m,300m];邻近 状态持续时间超过20分钟的车辆发生伴随。两车行驶距离均最慢平均50m时,20分钟邻近 状态,此时EASI = 39*100*39/Lmin = 1521 ;两车速度较大每个时间片内路程300m,邻近状 态达到 8 分钟,EASI = 16*600*16/Lmin = 1536。
[0042] 所以,本实施例采用均值EASI_Lim = 1529。
[0043] 定义 4、浮动车伴随行为模式 ACP_Pattern (Accompany Pattern)
[0044] 在[t。,tn+ Δ t] (tn= t Q+n* Δ t/2)内,对于A、B两辆车满足如下条件的:
[0045] (I)EASIn^ EASI_lim
[0046] (2)在 m 个连续的时间片内 NoEASI (i, m) >NoEASI_Lim
[0047] 贝IJ认为A,B两车在该区间内有伴随行为模式。
[0048] 基于上述给出的基本定义,如图1所示,本实施例的具体步骤是:
[0049] 1、预处理:
[0050] ⑴设定可疑程度阈值为EASI_lim = 1529和NoEASI_Lim = 7,时间片大小Δ t =1分钟;
[0051] (ii)建立一个空的二维HashMap作为可疑集合MP,如表1所示。任意有嫌疑两辆 车A和B可以从中得到如下记录:
[0052] CarA,CarB :主键,两车车牌ID映射编号,见下文(iii)
[0053] EASI :伴随支持度指数
[0054] NoEASI :非嫌疑支持度函数
[0055] Sum_t:邻近时间
[0056] Sum_dis:累计的有效距离
[0057] Sum_0:统计倒数有多少个 0,NoEASI = (NoEASI_lim-Sum_0) *EASI ;如果少于 NoEASI_lim,则 NoEASKX) (NoEASI 不等于 0)
[0058] GPS_A, GPS_B:A, B两车上一个时间片GPS坐标,用于计算Sum_dis
[0059] Start :伴随行为开始时间片编号
[0060] 通过以上参数,可以更容易在程序中计算出EASI,NoEASI
[0061] EASI = Sum_dis*Sum_t* Δ t/minL* Δ t
[0062] NoEASI = (NoEASI_lim_Sum_0)*EASI
[0063] 以上参数要与的算法中的参数对应,或进行说明对应。
[0064] 表1. MP表的表结构
[0066] (*代表主键)
[0067] (iii)建立车牌ID映射,使不同车牌号的车辆拥有唯一编号i (i小于等于最大车 辆数);
[0068] (iv)建立时间片ID,[t。,t。+ Δ t]对应为0 ;
对应2 ;
对应3,;...
对应η。
[0070] (V)建立一个线性表GPS用来存储[t,t+Δ t]时间段的浮动车数据,GPS [i]表示 编号为i的车辆的记录,它有3个属性Ion (经度),Iat (维度),rnd(时间片ID);如果i在 t+Δ t时间片内有两条记录,取最新的记录存入GPS中。
[0071] (vi)正在处理的时间片编号rk = 0 ;设定初始时间和终止时间,可疑距离阈值 minL= 100m。minL在邻近状态中有
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1