一种基于车辆轨迹时空特征分析的黑车智能发现方法

文档序号:6629051阅读:1220来源:国知局
一种基于车辆轨迹时空特征分析的黑车智能发现方法
【专利摘要】本发明提供一种基于车辆轨迹时空特征分析的黑车智能发现方法。本发明首先提取城市小型车车辆列表,并剔除合法运营出租车,其次对于特定排查期,提取车辆列表中所有车辆在排查期的卡口过车记录数据,进而从过车记录数据中初步筛选得出嫌疑黑车列表;然后选择数据挖掘分析样本,提取车辆时空特征数据,接着采用支持向量机算法训练黑车分类器模型,最后将嫌疑黑车列表中的所有嫌疑黑车特征数据作为测试集输入训练的分类器模型进行分类判定。本发明改变了传统黑车人工排查方法,分析更加智能高效,对车辆行为特征进行多维度提取,通过对训练样本数据进行样本交叉训练消除过拟合问题。
【专利说明】一种基于车辆轨迹时空特征分析的黑车智能发现方法

【技术领域】
[0001] 本发明涉及基于车辆轨迹时空特征分析的黑车智能发现方法,特别涉及一种基于 对车辆轨迹时空特征数据进行挖掘分析进而从大量车辆轨迹时空特征数据中发现黑车的 方法。

【背景技术】
[0002] 当前,许多城市黑车营运的现象日益严重、屡禁不止,成为困扰各地交通运输管理 部门的难题。黑车营运不仅扰乱城市客运市场秩序,侵害合法经营者的利益,影响城市的文 明形象,而且严重地影响着人民群众的生命财产安全和和谐社会的构建。
[0003] 目前执法机关抓获黑车主要通过蹲点排查、钓鱼执法、群众举报等方法,这些抓获 方法难度大、收获少。虽然许多城市道路都安装了电子摄像头、智能卡口和电子警察设备, 但是目前尚没有利用这些设备采集的数据进行科学智能分析从而自动发现黑车的方法。


【发明内容】

[0004] 本发明针对目前人工排查黑车收效甚微的问题,提供了一种基于车辆轨迹时空特 征分析的黑车发现方法,该方法有较高的黑车发现精度,同时随着发现的黑车数量增加,可 进一步将确认的黑车加入模型正向样本对模型训练反馈,不断提升算法判定精度。通过该 发明描述的黑车发现方法,可极大减少人工排查的周期和投入人力,提高经济效益。本发明 技术解决方案:基于车辆轨迹时空特征分析的黑车智能发现方法,包括如下步骤:
[0005] 步骤1、提取城市小型车车辆列表,并剔除合法运营出租车;
[0006] 步骤2、对于特定排查期,提取步骤1车辆列表中所有车辆在排查期的卡口过车记 录数据;
[0007] 步骤3、从步骤2的过车记录数据中初步筛选得出嫌疑黑车列表,所述的嫌疑黑车 的判断条件为:
[0008] 在该排查期内,超过R天的行为数据满足以下条件:
[0009] (1)当日产生的卡口过车记录数大于设定第一阈值m;
[0010] ⑵当日经过的卡口个数大于设定第二阈值η ;
[0011] 如果某辆车辆,有超过R天满足以上条件,则将其作为嫌疑黑车供后续模型进一 步判断,依此筛选出所有嫌疑黑车列表,作为步骤4中黑车判断模型输入;
[0012] 步骤4、数据挖掘分析样本选择;所述的数据挖掘分析样本包括正向样本和负向 样本:正向样本为所有在册合法运营出租车行为数据,负向样本为典型私家车、警用车行为 数据;因为黑车与合法运营出租车有相似的轨迹行为特征,而典型私家车和警用车与黑车 在行为轨迹上特征相差较大,因此将合法运营出租车的行为数据作为正向样本、典型私家 车和警用车的行为数据作为负向样本训练分类器模型;
[0013] 步骤5、提取步骤4中选择的样本车辆的时空特征数据,该时空特征数据包括车辆 分别在工作日和节假日在一天当中不同时间段平均过车记录数,在一级卡口、二级卡口、三 级卡口一天当中不同时间段的平均过车记录数,经过的一级卡口、二级卡口、三级卡口数数 据;
[0014] 步骤6、利用步骤5得到的样本车辆时空特征数据,采用支持向量机算法训练黑车 分类器模型,利用该模型能够对所需判断车辆进行判别并返回车辆是否属于黑车;
[0015] 步骤7、将步骤3中产生的嫌疑黑车列表中的所有嫌疑黑车特征数据作为测试集 输入步骤六中训练的分类器模型进行分类判定,获取最终模型得到的黑车列表。
[0016] 所述步骤5中提取车辆时空特征数据的具体步骤如下:
[0017] 步骤5. 1、对所有电子卡口设备按照过车记录频次进行分级,设分为L个等级;
[0018] 步骤5. 2、提取车辆初始的s个时空特征数据,将该s个时空特征数据形式化描述 为 F = {f\,f2, · · ·,fs};
[0019] 步骤5· 3、特征细化,对所述步骤5· 2中的s个特征F = {f^,f2, · · ·,fj,根据特征 取值的分布情况,按照特征值相近的聚类原则;所述根据特征取值的分布情况是指特征取 值大小的分布,进行聚类,能将尽可能将相近的值归为相同类,进一步离散化,转化为特征 相似性越容易判断的更细粒度的特征集合FN = {f\,f2, . . .,f,}。
[0020] 所述步骤6中采用分类算法训练黑车分类器模型M(F)过程如下:
[0021] 步骤6. 1、对于特征集合FN = {f\,f2, . . .,fq}进行归一化处理,去除特征值为0的 特征,同时标记特征顺序,得到归一化后的特征集合FNAUlA = 1,;^ e FN};
[0022] 步骤6. 2、选择分类算法,将正向样本和负向样本特征数据代入分类算法进行模型 训练;
[0023] 步骤6. 3、交叉训练最优模型参数,使得模型M(F)针对样本分类具有最高精度。
[0024] 所述步骤5. 3转化为特征相似性越容易判断的更细粒度的特征以下步骤:
[0025] 步骤5. 3. 1、对于5. 2中获取的初始特征L得到样本的初始特征&取值集合

【权利要求】
1. 一种基于车辆轨迹时空特征分析的黑车智能发现方法,其特征在于实现步骤如下: 步骤1、提取城市小型车车辆列表,并剔除合法运营出租车; 步骤2、对于特定排查期,提取步骤1车辆列表中所有车辆在排查期的卡口过车记录数 据; 步骤3、从步骤2的过车记录数据中初步筛选得出嫌疑黑车列表,所述的嫌疑黑车的判 断条件为: 在该排查期内,超过R天的行为数据满足以下条件: (1) 当日产生的卡口过车记录数大于设定第一阈值m; (2) 当日经过的卡口个数大于设定第二阈值n; 如果某辆车辆,有超过R天满足以上条件,则将其作为嫌疑黑车供后续模型进一步判 断,依此筛选出所有嫌疑黑车列表,作为步骤4中黑车判断模型输入; 步骤4、数据挖掘分析样本选择;所述的数据挖掘分析样本包括正向样本和负向样本: 正向样本为所有在册合法运营出租车行为数据,负向样本为典型私家车、警用车行为数据; 因为黑车与合法运营出租车有相似的轨迹行为特征,而典型私家车和警用车与黑车在行为 轨迹上特征相差较大,因此将合法运营出租车的行为数据作为正向样本、典型私家车和警 用车的行为数据作为负向样本训练分类器模型; 步骤5、提取步骤4中选择的样本车辆的时空特征数据,该时空特征数据包括车辆分别 在工作日和节假日在一天当中不同时间段平均过车记录数,在各级卡口一天当中不同时间 段的平均过车记录数,经过的各级卡口数等数据; 步骤6、利用步骤5得到的样本车辆时空特征数据,采用分类算法训练黑车分类器模 型,利用该分类器模型能够对所需判断车辆进行判别并返回车辆是否属于黑车; 步骤7、将步骤3中产生的嫌疑黑车列表中的所有嫌疑黑车特征数据作为测试集输入 步骤六中训练的分类器模型进行分类判定,获取最终模型得到的黑车列表。
2. 根据权利要求1所述的基于车辆轨迹时空特征分析的黑车智能发现方法,其特征在 于:所述步骤5中提取车辆时空特征数据的具体步骤如下: 步骤5. 1、提取车辆初始的时空特征数据,将该时空特征数据形式化描述为F={fpf2,. . .,fs},其中s表示特征个数; 步骤5. 2、特征细化,对所述步骤5. 1中的s个特征F= {f\,f2,. . .,fj,根据特征取值 的分布情况,按照特征值相近的聚类原则;所述根据特征取值的分布情况是指特征取值大 小的分布,进行聚类,能将尽可能将相近的值归为相同类,进一步离散化,转化为特征相似 性越容易判断的更细粒度的特征集合FN= {f\,f2,. . .,fq}。
3. 根据权利要求1所述的基于车辆轨迹时空特征分析的黑车智能发现方法,其特征在 于:所述步骤6中采用分类算法训练黑车分类器模型M(F)过程如下: 步骤6. 1、对于特征集合FN= {f\,f2,. . .,fq}进行归一化处理,去除特征值为O的特 征,同时标记特征顺序,得到归一化后的特征集合FNA{iIfi =IfiGFN}; 步骤6. 2、选择分类算法,将正向样本和负向样本特征数据代入分类算法进行模型训 练; 步骤6. 3、交叉训练最优模型参数,使得模型M(F)针对样本分类具有最高精度。
4. 根据权利要求2所述的基于车辆轨迹时空特征分析的黑车智能发现方法,其特征在 于:所述步骤5. 2转化为特征相似性越容易判断的更细粒度的特征以下步骤: 步骤5.3. 1、对于5. 1中获取的初始特征L得到样本的初始特征&取值集合Vfi =Ivalue1,Value2,--?,ValuesmJ,其中sum为样本总数; 步骤5. 3. 2、对Vfi中的数值进行一维聚类,得到质心集合C=IC1,C2,...,CP}; 步骤5. 3. 3、将步骤5. 3. 2中质心集合C作为分界点对初始特征&细化为 {f'pf' 2,...,f'p+1}的P+1个特征,P为需要聚类的类数,对于特征f'i其取值V(f'J 为:
Valuei表示初始特征&的第i个样本取值,Ci为质心集合第i个质心; 步骤5. 3. 4、对集合F中所有特征f\,f2,. . .,f128,重复步骤5. 3. 1、5. 3. 2、5. 3. 3,得到细 化后特征集合FN=If1,f2, ? ? ?,;
q为对于所有初始特征进行相似性特征聚类后获取得到的最终特 征个数的总数值; Centroidi表示初始特征Ti的值聚类后得到的质心集合; C(Centroidi)表示初始特征对应的Centroidi的大小。
5. 根据权利要求1所述的基于车辆轨迹时空特征分析的黑车智能发现方法,其特征在 于:所述步骤3中的R取值为不小于排查期的1/3的天数,S卩如果排查期为一个月30天,则 R取值不小于10,且不大于30。
6. 根据权利要求1所述的基于车辆轨迹时空特征分析的黑车智能发现方法,其特征在 于:所述步骤3中第一阈值m取值范围通常为1-100,第二阈值n取值范围为1-80。
7. 根据权利要求4所述的基于车辆轨迹时空特征分析的黑车智能发现方法,其特征在 于:所述步骤3中p取值为1-20的整数。
【文档编号】G06K9/66GK104268599SQ201410514768
【公开日】2015年1月7日 申请日期:2014年9月29日 优先权日:2014年9月29日
【发明者】袁伟, 闫碧莹, 邓攀, 陈 峰, 李玉成 申请人:中国科学院软件研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1