一种基于卡口数据辨别非法营运车辆的方法与流程

文档序号:15147206发布日期:2018-08-10 20:35阅读:522来源:国知局
本发明涉及智能交通
技术领域
,具体为一种基于卡口数据辨别非法营运车辆的方法。
背景技术
:非法营运车辆是指未取得行业管理部门许可的出租车、小客车或微型面包车等机动运输车辆。非法营运车辆通常在车站、医院或学校等人流集中区域聚集并随意拉客、载客,严重扰乱正常的道路交通运输市场以及城市的交通运行秩序,同时也侵害了乘客的合法权益。目前卡口等智能化交通管理系统能够对过车进行记录,实现全路网的车辆检测。因此,如何利用已知的车辆过车数据中找出非法营运的车辆是技术人员亟待解决的问题。技术实现要素:本发明提供了一种基于卡口数据辨别非法营运车辆的方法,该方法具有检测非法营运车辆的精确度高以及覆盖面广的优点。为实现上述目的,本发明提供如下技术方案:一种基于卡口数据辨别非法营运车辆的方法,该方法包括如下步骤:s01、采集城市全路网所有卡口的过车数据,所述过车数据包括车牌号码、过车时间以及卡口编号;s02、分别计算每个运行车辆的运行特征;所述运行特征包括日平均行驶时长、日平均行驶距离、出行空间覆盖率、出行时间覆盖率、途经重点区域的次数以及日均停车次数;s03、获取m辆营运车辆的过车数据以及m辆非营运车辆的过车数据,其中,m大于1000;m辆营运车辆的运行特征作为正样本,m辆非营运车辆的运行特征作为负样本,将所述正样本中的运行特征元素与负样本中的运动特征元素组成训练集其中,xi包括日平均行驶时长、日平均行驶距离、出行空间覆盖率、出行时间覆盖率、途经重点区域的次数以及日均停车次数,yi为对应输出的类别属性,yi=1表示营运车辆,yi=0表示非营运车辆,i表示所抽取车辆样本的车辆编号;s04、经营运车辆监管部门登记的合法营运车辆车牌号所组成的集合为p,当yi=0,则车辆i是非营运车辆;当yi=1且车辆i的车牌号∈p,则车辆i是合法营运车辆;当yi=1且车辆i的车牌号则车辆i是非正常营运车辆。作为优选,在步骤s01与步骤s02之间还包括步骤s01a,所述步骤s01a为:删除所采集的不能识别的车牌号码记录;删除设备时钟异常的过车时间记录以及删除重复经过同一卡口编号的过车记录。作为优选,在步骤s02中,根据编号为i的车辆的车牌号抽取在指定时间范围内的所有过车数据,并将所述的过车数据按过车时间排序得到集合c={p1,p2...pi...pn},其中,pi=[platei,datetimei,devicei],platei为车辆i的车牌号码,datetimei为车辆i的过车时间,devicei为车辆i所经过的卡口编号;用road(devicea,deviceb)表示卡口编号为devicea的安装地点到卡口编号为deviceb的安装地点的最短路径,用roadlength(devicea,deviceb)表示所述的最短路径的长度;当则表示车辆i从卡口编号为devicei行驶至卡口编号为devicei+1的路程中出现了停车驻留,记为一次行程;则集合c={p1,p2...pi...pn}可分割成多个所述的一次行程,多个一次行程重新组合成的新集合为d={s1,s2...si...sm},其中,一次行程si={pj,pj+1...pj+q};记录途经的交叉口得到对应轨迹ti={begintimei,endtimei,crossesi},其中,轨迹开始时间begintimei为集合si中pj的过车时间,轨迹结束时间endtimei为集合si中pj+q的过车时间,crossesi为本次出行途经的所有交叉口所组合成的集合为{crossi1,crossi2...crossik};定义车辆i在指定时间范围内所有的出行轨迹组成的集合为t={t1,t2...tm};通过所述的集合t,统计车辆i的出行天数ndays,则:(1)日平均行驶时长(2)日平均行驶距离(3)通过所述的出行轨迹t,统计经过路网所有交叉口的次数,统计经过次数超过2次的交叉口个数,记为cnum,路网交叉口总数为:crossnum,则:出行空间覆盖率(4)将一天划分成x个时间间隔为w分钟的时间片,通过出行轨迹t,统计每个不同时间片内车辆行驶的天数,并统计行驶次数超过1次的时间片个数,记为snum,则:出行时间覆盖率(5)定义车站、机场、医院、学校以及景点附近的交叉口为重点区域,通过出行轨迹t,统计在指定时间范围内经过重点区域的次数,记为focustimes;(6)通过出行轨迹t,统计车辆i在指定时间范围的停车次数m,则:日均停车次数本发明的有益效果为:本发明通过卡口数据取得的全路网车辆的过车记录,并通过每个车辆的过车数据计算并得到相应车辆的运行特征。并将该运行特征输入至非法营运车辆识别模型中,从而根据相应的输出值来判断该车辆是否是非法营运车辆。采用上述方法识别非法营运车辆准确度高且覆盖面广,可检测全路网中任一车辆,从而帮助车辆监管部门依法扣留非常营运车辆以保障乘客切身利益的目的。附图说明图1为本实施例一种基于卡口数据辨别非法营运车辆的方的流程原理示意图;图2为本实施例一种基于卡口数据辨别非法营运车辆的方的流程原理示意图。具体实施方式本实施例提供一种技术方案:如图1~2所示,一种基于卡口数据辨别非法营运车辆的方法,该方法包括如下步骤:s01、采集城市全路网所有卡口至少连续5个工作日的过车数据,在本实施例中,需要全路网所有卡口连续采集5个工作日的过车数据,每条过车数据至少包括车牌号码、过车时间、卡口编号(或卡口安装位置)的信息。所以在获取原始数据后,需要对数据进行清洗,去除车牌未识别的过车记录、去除设备时钟异常的过车记录、去除重复过车记录。s02、以提取车牌为platea车辆的运行特征为例,介绍提取车辆运行特征的步骤。根据车牌检索过车记录,得到车牌为platea的车辆在指定时间范围内的所有过车记录,并按过车时间排序得到{p1,p2...pn},其中pi:[platei,datetimei,devicei],platei为第i条过车记录的车牌号码,datetimei为第i条过车记录的过车时间,devicei为第i条过车记录的卡口设备编号;(2)日平均行驶距离(3)通过所述的出行轨迹t,统计经过路网所有交叉口的次数,统计经过次数超过2次的交叉口个数,记为cnum,路网交叉口总数为:crossnum,则:出行空间覆盖率(4)将一天划分成288个时间间隔为5分钟的时间片,通过出行轨迹t,统计不同时间片内车辆行驶的天数,因本实施例全路网卡口采集了连续5个工作日的过车数据,故在不同时间片段内,车辆正在行驶的次数最多为5次,统计行驶次数超过1次的时间片个数,记为snum,则:出行时间覆盖率(5)定义车站、机场、医院、学校以及景点附近的交叉口为重点区域,通过出行轨迹t,统计在指定时间范围内经过重点区域的次数,记为focustimes;(6)通过出行轨迹t,统计车辆i在指定时间范围的停车次数m,则:日均停车次数s03、基于梯度提升决策树(gbdt)监督型学习方法,训练非法营运车辆识别模型。获取m辆营运车辆的过车数据以及m辆非营运车辆的过车数据,其中,m大于1000;m辆营运车辆的运行特征作为正样本,m辆非营运车辆的运行特征作为负样本,将所述正样本中的运行特征元素与负样本中的运动特征元素组成训练集其中,xi包括日平均行驶时长、日平均行驶距离、出行空间覆盖率、出行时间覆盖率、途经重点区域的次数以及日均停车次数,yi为对应输出的类别属性,yi=1表示合法营运车辆,yi=0表示非正常营运车辆,i表示所抽取车辆样本的车辆编号;s04、经营运车辆监管部门登记的合法营运车辆车牌号所组成的集合为p,当yi=0,则车辆i是非营运车辆;当yi=1且车辆i的车牌号∈p,则车辆i是合法营运车辆;当yi=1且车辆i的车牌号则车辆i是非正常营运车辆。如图3所示,下面以卡口检测到的具体过车数据为实例:本算例以计算车牌号为a1车辆的运行特征为例:(1)从过车数据中获取连续5天过车数据,具体时间范围是2018-02-05至2018-02-10。表1原始过车数据(2)去除车牌未识别数据、重复数据、时间异常数据:可见流水号为3的数据,车牌未识别;流水号为1的数据与流水号为4重复;流水号为5的数据,时间异常。去除车牌未识别数据、重复数据、时间异常数据后,有效数据如下:表2有效过车数据(3)提取车辆运行特征:以车辆“a1”为例,介绍提取车辆运行特征的步骤:从“表2有效过车数据”挑选出车牌号码为“a1”的所有数据,并按照过车时间排序,结果如下:表3“a1”的过车记录(4)根据卡口编号以及卡口安装地点,得到车辆“a1”经过的相邻卡口之间的距离,途径的交叉口,以及经过相邻卡口的平均行驶速度。结果如下:表4“a1”在相邻卡口之间的行驶距离、速度、途经的交叉口其中第一条记录是车辆首次出现,无法计算相邻卡口之间的距离、途径的交叉口、平均行驶速度。第二条记录,卡口p0000000001与p0000000003最短路径相距218m,途经交叉口c017和c102,结合第一条记录的过车时间与第二条记录的过车时间,算出时间差为65s,进而算出平均行驶速度为12.1km/h。按此方法依次算出下面所有过车记录的相邻卡口之间的距离、途径的交叉口、平均行驶速度。(5)根据“表4‘a1’在相邻卡口之间的行驶距离、速度、途经的交叉口”,按照的判断标准,判断“a1”的行程是否处于终止状态,本例中取q=3。得到“a1”的出行表,结果如下:表5“a1”出行表根据“表5‘a1’出行表”获取日平均行驶时长、日平均行驶距离、出行空间覆盖率、出行时间覆盖率、途经重点区域的次数以及日均停车次数。计算方法如下:①获取车辆“a1”的出行天数(ndays):根据“表5‘a1’出行表”可以看出车辆“a1”在2018-02-05、2018-02-06、2018-02-08有出行记录,所以出行天数为3,即:ndays=3。②日平均行驶时长,先算出每次出行的时长,把所有出行的时长求和,除以ndays得到结果。所以日平均行驶时长为9586/3=3195秒③日平均行驶距离,把所有出行的距离求和,除以ndays得到结果所以日平均行驶距离为39202/3=13067m④出行空间覆盖率,统计经过次数超过2次的交叉口,有c102,c072,c064,c044,c042,c034,c021,c018,c017,c003,共10个交叉口,路网区域共有1803交叉口,所以空间覆盖率为10/1803=0.0055;⑤出行时间覆盖率,本例x取288,w取5,通过车辆的出行覆盖的时间间隔,统计可知车出行时间分布是:08:55:00-09:25:006个时间间隔09:30:00-10:10:008个时间间隔10:25:00-10:45:004个时间间隔18:20:00-18:45:005个时间间隔19:00:00-19:30:006个时间间隔19:45:00-20:25:004个时间间隔-总和33个时间间隔所以时间覆盖率为33/288=0.114;⑥经过终点区域的次数,需要结合《重点区域内交叉口登记表》统计,如下表所示表6重点区域内交叉口登记表统计车辆经过重点区域交叉口的次数,统计结果为1次。⑦统计日停车次数,车辆有7次出行,即:7次停车,所以日停车次数为7/3=2.33。(6)训练营运车辆识别模型从营运车辆管理部门获取m辆营运车辆的车牌,作为正样本。并且从非营运车辆中随机挑选m辆车辆的车牌,作为负样本。提取2*m辆车的运行特征,得到训练集:表7训练集其中“日平均行驶时长”、“日平均行驶距离”、“出行空间覆盖率”、“出行时间覆盖率”、“经过重点区域的次数”和“日均停车次数”为特征,“是否有营运特征”为类别。采用gbdt方法进行模型训练,得到模型。(7)判断车辆是否为非法营运车辆:以“判断‘浙a00002’是否为营运车辆”为例,介绍方法步骤,如下:①查询“浙a00002”一段时间内的过车,并做数据清洗,去掉无效数据、重复数据;②按照步骤(1)~(6)所述的方法获取“浙a00002”的运行特征,即:日平均行驶时长、日平均行驶距离、出行空间覆盖率、出行时间覆盖率、经过重点区域的次数、日均停车次数;③将提取的运行特征输入已经准备好的营运车辆识别模型,如果模型输出是,没有营运特征,则:输出“非营运车辆”,程序结束。如果模型输出是,有营运特征,则进行步骤④;④在营运车辆管理部门的《营运车辆登记表》中查找“浙a00002”,如果没有在《营运车辆登记表》中找到“浙a00002”,则“浙a00002”为非法营运车辆,如果在《营运车辆登记表》中找到“浙a00002”,则“浙a00002”为正常营运车辆。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1