本发明属于智能交通信息处理技术领域,具体地涉及一种基于gps的城市配送车辆出行链及其特征识别方法与设备。
背景技术:
随着社会发展,城市配送在城市生产生活中的作用越来越大,与此同时,其引发的交通拥堵、空气污染等城市问题也愈发严重。城市车辆出行行为特征识别方法改进是城市配送方案优化的基础,对政府的配送政策制定和配送企业的配送效率提升有重要意义。
早期的城市配送车辆出行行为特征研究主要采用人工调查的方式,通过对配送中心管理人员、配送车辆司机等进行问卷调查,以及对配送中心统计数据的分析来确定配送车辆出行的主要特征。这种方法虽然节省时间、经费和人力,但是很难获得配送车辆出行的细部特征,而且研究结论的有效性也往往得不到保证。随着车载gps设备在城市配送中的普及,配送车辆每天产生大量的轨迹数据,但是由于企业缺乏相关分析技术,导致车辆gps数据往往得不到有效利用。
技术实现要素:
发明目的:为了解决上述现有技术的不足,本发明目的在于提供一种基于gps的城市配送车辆出行链及其特征识别方法与设备,能够较为准确地识别出配送车辆出行链,并进一步较为精细、准确和全面地识别车辆出行特征,对政府的配送政策制定和配送企业的配送效率提升有重要意义。
技术方案:在介绍本发明技术方案之前,首先对本发明使用的概念做如下说明:
(1)经停点与临时停车点
经停点即车辆为完成一定目的而停留的地点,包括配送中心经停点和客户经停点。其中配送中心为车辆提供货物装车和停车服务,是每条出行链的起点和终点;客户是货物需求点,是配送的中间节点;临时停车点是配送过程中的因临时需求产生的停车点,主要包括加油点、等红灯停车点等。经停点与临时停车点的主要区别在于经停点是主动的带有目的性的停车点,临时停车点是由于外部原因导致的临时性停车。
(2)配送中心
配送中心是车辆的主要汇集点,车辆在配送中心装卸或停车,必然产生大量的经停点信息,因此直观上车辆经停点最密集的一些区域即为配送中心。
(3)客户区域
客户即送货点,车辆到达客户后需要按客户要求在指定的卸货地点停车,而对于同一客户来说卸货地点通常是固定的,故在较长时间内相关位置的经停点信息会多次出现,将该相关位置定义为客户区域。
(4)出行端点
出行端点即车辆一次出行的出发点或者到达点,根据其与配送中心和客户的关系又可以分为两类,即配送中心端点和客户端点。其中,配送中心端点是指发生在配送中心区域范围内的出行端点,而客户端点是指发生在客户区域范围内的出行端点。
(5)出行链轨迹
出行链轨迹是指车辆完成一条出行链所形成的车辆轨迹。在现实生活中,可以近似将相对应的车辆gps轨迹看作是出行链轨迹。
本发明所述的一种基于gps的城市配送车辆出行链识别方法,其包括如下步骤:
s1、经停点识别:获取车辆gps点数据并对车辆gps点数据进行预处理,区分车辆gps点数据中的临时停车点和经停点;
s2、配送中心及客户区域识别:将经停点数量大于配送停车点阈值数量的区域识别为配送中心;将经停点数量大于停车点阈值数量的区域识别为客户区域;
s3、出行端点识别:出行端点由配送中心端点和客户端点组成;将经停点按时间顺序排列,将位于配送中心范围内且相邻时间段中上一个或下一个经停点位于客户区域范围内的经停点识别为配送中心端点;将位于客户区域范围内且相邻下一个经停点在配送中心范围内或不同客户区域范围内的经停点识别为客户端点;
s4、出行链识别:将出行端点按时间顺序排列,依次识别配送中心端点、客户端点和相邻下一个配送中心端点,将配送中心端点作为出行链起点、客户端点作为出行链中间节点、相邻下一个配送中心端点作为出行链终点,依次链接即为车辆的一条出行链,按照该方法依次识别出所有出行链;
s5、出行链轨迹识别:查找一条出行链范围内的所有gps点,其组合即构成一条出行链轨迹,依次识别所有出行链轨迹。
优选的,所述gps点数据包括车牌、车辆位置和速度信息。
优选的,所述对车辆gps点数据进行预处理包括数据缺失的处理方法和数据漂移的处理方法。
所述数据缺失的处理方法包括:若某车辆某天数据缺失较多,则直接删除该车辆当天gps点数据,若数据缺失较少,则采用移动平滑法方法对数据进行补充;
所述数据漂移的处理方法包括:若数据漂移较多,则直接剔除漂移数据;若数据漂移较少,则忽略不做处理。
进一步,本发明所述的一种基于gps的城市配送车辆出行链特征识别方法,在上述基于gps的城市配送车辆出行链识别的基础上还包括时间特征指标识别、空间特征指标识别和运行特征指标识别中的至少一种。
优选的,所述时间特征指标识别包括单个车辆单次出行时间识别、单次停留时间识别和单条出行链总时间识别中的至少一种,单次出行时间为车辆完成一次出行所花费的时间,单次停留时间为车辆从到达某客户开始到离开截止所花费的时间,单条出行链总时间为车辆完成一条出行链所花费的总时间。
优选的,所述空间特征指标识别包括单次出行距离识别、出行链长度识别以及出行链链长识别中的至少一种,单次出行距离是指车辆完成一次出行所行驶的路径长度,出行链长度是指车辆完成一条出行链所行驶的总长度,出行链链长是指车辆在一条出行链中出行的总次数。
优选的,所述运行特征指标识别包括单次出行的平均速度、出行链的平均速度以及出行链数量中的至少一种,单次出行平均速度是指车辆完成一次出行的平均速度,出行链平均速度是指车辆完成一条出行链的平均速度,出行链数量是指车辆一天内完成的出行链总量。
另一方面,本发明公开了一种计算机设备,该计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序被加载至处理器时实现所述的基于gps的城市配送车辆出行链识别方法,或者实现所述的基于gps的城市配送车辆出行链特征识别方法。
有益效果:与现有技术相比,本发明的有益效果为:
(1)能够对城市配送车辆海量gps数据进行数据缺失和数据漂移等处理,获得车辆出行gps点数据;
(2)基于gps数据识别城市配送车辆出行链,相较于传统数据类型,能够较为准确地识别出配送车辆出行链;
(3)基于gps数据,在准确识别配送车辆出行链的基础上,能够较为精细、准确和全面地识别车辆出行特征;
(4)能够较为准确地识别城市配送车辆出行时间特征、空间特征和运行特征,为进一步优化城市配送方案夯实基础。
(5)根据识别的出行链和出行链特征,通过有效规划可以改善城市交通拥堵,空气污染,为企业城市配送提供合理有效的出行链规划,具有良好的社会效益和经济效益。
附图说明
图1是本发明一种城市配送车辆出行链及其特征识别方法的流程示意图。
具体实施方式
以下结合附图1对本发明作进一步的说明。
首先、采集车辆gps数据。城市配送车辆gps数据主要包括车牌号、位置(经度、纬度)、时间、速度和方向等信息,数据格式如表1所示,城市配送车辆gps数据实例如表2所示。不同车辆gps数据上传频率不尽相同,若按30秒上传一次数据计算,则每辆车每天可产生2880条记录。
表1城市配送车辆gps数据
表2城市配送车辆gps数据实例
其次、对gps数据进行预处理并储存在gps点数据表中。数据预处理是为了提高数据挖掘质量和数据挖掘效率而对数据进行的重新组织、清理、转换等工作,数据预处理主要包括数据清理、数据集成、数据变换和数据归约四部分。其中数据清理主要是对缺失数据和噪声数据的处理;数据集成即将多个数据源进行统一;数据变换就是将数据转换为适合挖掘的形式;数据归约即在不影响挖掘的前提下通过聚类、删除冗余特征等方式来对数据进行约简的操作。
城市配送车辆gps数据预处理使用比较多的方法包括:
1)数据缺失处理。如果某辆车某天gps数据存在大范围缺失情况(如当缺失gps的时间大于总记录时间(一天的开始记录时间到结束记录时间)的设定的比例(一般设置为30%)),则直接删除该车辆当天gps数据;如果数据缺失较少,可以采用移动平滑法等方法对数据进行补充。
2)数据漂移处理。对于数据漂移较大(如两个连续的gps点直线距离(根据经纬度计算)大于最大行驶速度(一般取120km/h)*记录周期(根据设备确定)*误差系数(一般设置为2))的情况,直接剔除漂移数据并采用移动平滑法等方法对数据进行补充;对于较小的数据漂移,因为其属于正常的系统误差,故不作特殊处理。
如图1所示,本发明实施例提供一种城市配送车辆出行链识别方法,包括以下步骤:
s1、识别经停点。对上述已获取车辆gps点数据及对车辆gps点数据进行预处理后,进行区分车辆gps点数据中的临时停车点和经停点,并对经停点进行记录;区分经停点与临时停车点的方法之一是比较停车时间的长短。在临时停车点,例如等红灯时停车,车辆处于怠速状态,停车时间较短;而经停点,如在客户位置,此时一般需要较长时间来卸货,车辆一般处于熄火状态,停车时间较长。若将区分经停点与临时停车点临界时间记作tthresh,其值一般由在客户位置的最短停留时间决定。
对于按时间顺序排列好的单个车辆gps点数据,其经停点识别方法描述如下,通过该方法对gps点数据表进行操作,并将数据结果记录在经停点数据表中。
基于临界时间tthresh的经停点识别方法:
s2、识别配送中心和客户区域。
将经停点数量大于配送停车点阈值数量的区域识别为配送中心,并对配送中心进行记录;
将经停点数量大于停车点阈值数量的区域识别为客户区域,并对客户区域进行记录;
一辆配送车的经停点离散而无规律,很难识别出不同经停点的性质,但是多天多辆车的经停点在空间分布上具有一定的规律,即从整体来看经停点的分布是比较分散的,但是从局部来看在小的区域内多个经停点会集中在一起。配送中心是车辆的主要汇集点,车辆在配送中心装卸或停车,必然产生大量的经停点信息,因此车辆经停点最密集的区域即为配送中心。客户即送货点,车辆到达客户后需要按客户要求在指定的卸货地点停车,而对于同一客户来说卸货地点通常是固定的,故在较长时间内相关位置的经停点信息会多次出现。
本实施例提供一种只有一个配送中心的出行链识别算法。为了方便,假设配送中心和客户区域是圆形区域,其圆心分别是配送中心点和客户点,所述配送中心和客户点是已有的经停点。先新建一个临时数据表,用于记录可能的配送中心点以及客户点信息,包括编号、经度、纬度、周边范围内经停点数量num四个字段;此外,方法中出现的符号说明如表3所示。
表1符号说明
对经停点数据表进行操作并将结果输出到配送点数据表,具体识别方法描述如下:
通过以上方法可以得到配送中心点以及客户点的位置,则配送中心为以配送中心点为圆心,l1为半径的圆形区域,客户区域为以客户点为圆心,l2为半径的圆形区域。
s3、识别出行端点。
将经停点按时间顺序排列,将位于配送中心范围内且相邻时间段中上一个或下一个经停点位于客户区域范围内的经停点识别为配送中心端点,并对配送中心端点进行记录;
将位于客户区域范围内且相邻下一个经停点在配送中心范围内或不同客户区域范围内的经停点识别为客户端点,并对客户端点进行记录;
根据定义,出行端点具有如下性质:每个出行端点必然是经停点,且每个出行端点必然在配送中心或者客户区域范围内。但由于并不是在配送中心或者客户区域范围的点都是出行端点,例如对客户的一次服务过程中,车辆可能会由于卸货需要而多次变换停车位置,从而产生多个经停点,其中只有第一个经停点为出行端点。对于出行端点的识别过程需要分为两步:第一步是从经停点中识别出待选出行端点,第二步则是从待选出行端点中进一步识别出行端点。其中待选出行端点的识别方法如下:
通过待选出行端点方法识别,同一配送中心或客户区域可能会出现多个待选出行端点。因此还需要对同一配送中心或客户区域的多个待选出行端点进行甄别,确定具体的出行端点。具体方法法如下:
s4、识别出行链。识别配送车辆出行链的具体方法如下:
将出行端点按时间顺序排列,依次识别配送中心端点、客户端点和相邻下一个配送中心端点,将配送中心端点作为出行链起点、客户端点作为出行链中间节点、相邻下一个配送中心端点作为出行链终点,依次链接即为车辆的一条出行链,按照该方法依次识别出所有出行链并对出行链进行记录;
s5、识别出行链轨迹,查找一条出行链范围内的所有gps点,其组合即构成一条出行链轨迹,依次识别所有出行链轨迹并进行记录。
出行链轨迹包括了出行链、出行端点以及单次出行的轨迹点等相关信息,因此出行链轨迹的识别算法需要同时对多个表进行操作。车辆的出行链轨迹识别方法如下:
进一步,本发明实施例还公开了一种基于上述gps的城市配送车辆出行链的特征识别方法,该方法在识别出城市配送车辆出行链后还包括时间特征指标识别、空间特征指标识别和运行特征指标识别中的一种。
其中:
(1)时间特征识别
城市配送车辆出行链时间特征指标主要包括单个车辆单次出行时间、单次停留时间和单条出行链总时间。
a1.单次出行时间
单次出行时间为车辆完成一次出行所花费的时间,可以由出行链数据表或者出行链轨迹数据表获得。单次出行时间公式表示如下:
其中,
b1.单次停留时间
单次停留时间为车辆从到达某客户开始到离开前往下一客户截止所花费的时间,同样可以由出行链数据表或者出行链轨迹数据表获得。单次停留时间公式表示如下:
其中,
c1.单条出行链总时间
单条出行链总时间为车辆完成一条出行链所花费的总时间,可以通过出行链数据表或者出行链轨迹数据表获得,或者通过单次出行时间以及单次停留时间获得。单条出行链总时间公式表示如下:
其中,tik为车辆在出行链i所花费的总出行时间。
出行链的其他时间特征均可以通过以上三个基本特征分析获得,如所有车辆的单次出行时间分布、所有车辆的出行链总时间分布等。
(2)空间特征识别
城市配送车辆出行链空间特征指标主要包括单次出行距离、出行链长度以及出行链链长。
a2.单次出行距离
单次出行距离是指车辆完成一次出行所行驶的路径长度。单次出行距离可以通过出行链轨迹数据表得到,其表达式如下:
其中,lijk为第k辆车第i条出行链第j次出行的单次出行距离;vijkn为出行链轨迹数据表中第k辆车第i条出行链第j次出行的第n个gps点的速度;tijkn+1,tijkn分别为出行链轨迹数据表中第k辆车第i条出行链第j次出行的第n+1个和第n个gps点的时间。
b2.出行链长度
出行链长度是指车辆完成一条出行链所行驶的总长度。出行链长度可以由单次出行距离累加得到,具体表达式如下:
其中,lik为出行链长度。
c2.出行链链长
出行链链长是指车辆在一条出行链中出行的总次数,反应了车辆一次配送任务所服务的客户的多少。出行链链长可以由出行链数据表或者出行链轨迹数据表得到,其表达式如下:
pik=pik-1
其中,pik为车辆k的第i条出行链的出行链链长;pik为出行链数据表中第k辆车的第i条出行链所包含的出行链节点数。
由以上三个出行链空间特征可以进一步得到所有车辆的单次出行距离分布、所有车辆的出行链长度分布以及所有车辆的出行链链长分布等出行链空间特征。
(3)运行特征识别
城市配送车辆出行链运行特征主要包括单次出行的平均速度、出行链的平均速度以及出行链数量。
a3.单次出行平均速度
单次出行平均速度是指车辆完成一次出行所行驶的长度与花费的时间之比,可以由单次出行距离与单次出行时间获得,具体公式如下:
其中,vijk为单次出行平均速度。
b3.出行链平均速度
出行链平均速度等于出行链长度与单条出行链出行总时间之比,具体公式如下:
其中,vik为出行链平均速度。
c3.出行链数量
出行链数量是指车辆一天内完成的出行链总量,可以由出行链数据表或者出行链轨迹数据表获得,具体公式如下:
mk=mk
其中,mk为第k辆车一天内完成的出行链数量;mk为出行链数据表中第k辆车的出行链数量。
同样,由以上三个基本的运行特征可以得到诸如所有车辆的出行平均速度分布、所有车辆的出行链平均速度分布以及所有车辆的出行链数量分布等出行链运行特征。
基于相同的技术构思,本发明实施例还提供了一种计算机设备,该计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序被加载至处理器时实现所述的基于gps的城市配送车辆出行链识别方法,或者实现所述的基于gps的城市配送车辆出行链特征识别方法。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明,对于本发明所属技术领域的技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。