基于车辆语义轨迹数据的停留点分析方法及其系统与流程

文档序号:14686977发布日期:2018-06-15 04:06阅读:182来源:国知局

本发明涉及车辆轨迹数据分析处理领域,具体说的是一种基于车辆语义轨迹数据的停留点分析方法及其系统。



背景技术:

随着移动互联技术的不断发展,在交通运输等领域,收集受到路网约束的轨迹数据变为可能。对移动对象的知识获取和信息分析处理也逐渐成为人们日益关注研究的焦点。在面向移动位置服务和智能交通领域内,通过分析车辆轨迹的特征,利用聚类方法进行数据挖掘分析,从而发现车辆的运动规律和行为模式,进行热点分析,从而为车辆管理、城市规划和交通管理等领域提供辅助决策信息。

语义轨迹数据是指轨迹点数据不仅包含当前移动物体本身的经纬度和时间还包含了当前点所在的地标名称(地址编码)、移动对象自身属性等信息。轨迹点包括起点、移动、停点和终点,这些语义轨迹点组成了语义轨迹。

本发明提供一种基于语义轨迹数据的停留点分析方法及其系统,从车辆的轨迹数据中准确的找到车辆停留点,为实际应用提供决策信息。



技术实现要素:

本发明所要解决的技术问题是:提供一种基于语义轨迹数据的停留点分析方法及其系统,能够实现准确获取车辆的停留点,进而获取车辆的运动规律和行为模式。

为了解决上述技术问题,本发明采用的技术方案为:

一种基于语义轨迹数据的停留点分析方法,包括:

获取车辆在预设时长内的轨迹数据;

依据所述轨迹数据获取可疑停留点集合;

对所述可疑停留点集合做聚类分析,得到至少一个的聚类点集合;

基于语义分析每个聚类点集合,获取对应一预设关键词的聚类中心。

本发明提供的另一个技术方案为:

一种基于语义轨迹数据的停留点分析系统,包括一个或多个处理器及存储器,所述存储器存储有计算机程序,所述程序在被配置成由所述一个或多个处理器执行时,能实现上述基于语义轨迹数据的停留点分析方法所包含的步骤。

本发明的有益效果在于:本发明基于车辆预设历史时间内的轨迹数据进行分析处理,先获取可疑停留点集合,再据此做聚类分析,在聚类结果中根据实际业务需求做基于语义的聚类中心锁定,获取所有聚类中心作为最终停留点结果,进而获取车辆的运动规律和行为模式,能够为后续实际应用提供决策信息。本发明能很好的满足现实业务需求,如准确、高效的寻找如车辆疑似非法加油站点、旅游客运车辆疑似非法载客下客点等车辆停留点;或者提供服务的精准投放,如广告的推送、集中设置休闲区或商铺等。

附图说明

图1为本发明一种基于语义轨迹数据的停留点分析方法的流程示意图;

图2为本发明实施例一的流程示意图;

图3为本发明实施例一中过滤漂移跳变点条件示意图。

具体实施方式

为详细说明本发明的技术内容、所实现目的及效果,以下结合实施方式并配合附图予以说明。

本发明最关键的构思在于:基于车辆预设历史时间内的轨迹数据进行分析处理,先获取可疑停留点集合,再据此做聚类分析,在聚类结果中根据实际业务需求做基于语义的聚类中心锁定,获取所有聚类中心作为最终停留点结果。

请参照图1,本发明提供一种基于语义轨迹数据的停留点分析方法,包括:

获取车辆在预设时长内的轨迹数据;

依据所述轨迹数据获取可疑停留点集合;

对所述可疑停留点集合做聚类分析,得到至少一个的聚类点集合;

基于语义分析每个聚类点集合,获取对应一预设关键词的聚类中心。

从上述描述可知,本发明的有益效果在于:在移动互联高度发展的今天,面向移动位置服务日趋完善。本发明能够通过分析车辆轨迹特征,发现车辆运动规律和行为模式,进行停留点分析,不仅能够提供服务的精准投放,在一些特殊的业务场景,例如广告的推送、寻找非法加油站点、集中设置休闲区等方面;同时也能满足现实业务需求,如为准确、高效的寻找如车辆疑似非法加油站点、旅游客运车辆疑似非法载客下客点等车辆停留点提供决策信息。

进一步的,所述基于语义分析每个聚类点集合,获取对应一预设关键词的聚类中心,具体为:

依据轨迹数据的一属性信息对每个聚类点集合内的成员点进行分组,所述一属性信息与预设关键词相关;

依据组内成员点的数量或者组内成员点与所述预设关键词的距离,获取分组权重;

获取权重最高的分组。

由上述描述可知,通过在聚类结果中根据实际业务需求做与其对应的语义的聚类中心锁定,实现准确获取最终停留点结果。

进一步的,还包括:

过滤掉所述轨迹数据中包括漂移跳变点、时间戳异常点和与建筑物重合的点的无效轨迹点。

由上述描述可知,通过将无效轨迹点过滤掉,保证数据的真实可靠,进而提高数据分析结果的准确度。

进一步的,所述依据所述轨迹数据获取可疑停留点集合,具体为:

遍历轨迹数据,依据轨迹点之间的时间间隔确定可疑停留点,获取可疑停留点集合。

由上述描述可知,基于轨迹数据的获取方式(车辆将正常行驶状态和熄火状态按照不同的周期性间隔上报一次经纬度位置信息),通过轨迹时间间隔高效准确的找出车辆所有可能的停留点。

进一步的,所述获取车辆在预设时长内的轨迹数据,具体为:

获取车辆在预设时长内包括经纬度、时间、车辆信息以及点所在位置的相关信息的轨迹数据。

由上述描述可知,轨迹数据中包含各个轨迹点的相关信息,为后续基于语义的分析提供支持。

进一步的,所述对所述可疑停留点集合做聚类分析,得到至少一个的聚类点集合,具体为:

对可疑停留点集合Sstop做聚类分析,得到x个用数组保存的聚类点集合Sgroup={S0,S1,…,Sx-1};其中,x为大于等于1的整数。

进一步的,所述基于语义分析每个聚类点集合,获取对应一预设关键词的聚类中心,具体为:

依据与预设关键词对应的一轨迹数据属性,对第p个聚类点集合Sp={Pm,Pm+1,…,Pn}内的成员点进行分组,获取分组后的聚类点集合其中,所述p依次取1至X的整数,所述groupk是第k个分组成员个数,所述k为一聚类点集合内分组的个数;

依据组内成员点的数量或者组内成员点与所述预设关键词的距离,获取分组权重wk,然后获取聚类中心点经纬度坐标:

其中,权重wk满足:

L为常量,取

由上述描述可知,能够直接通过预设的算法高效且精准的基于语义做聚类分析。

本发明提供的另一个技术方案为:

一种基于语义轨迹数据的停留点分析系统,包括一个或多个处理器及存储器,所述存储器存储有计算机程序,所述程序在被配置成由所述一个或多个处理器执行时,能实现上述基于语义轨迹数据的停留点分析方法所包含的步骤。

从上述描述可知,本发明的有益效果在于:能够通过处理器调用并执行存储介质中的计算机程序,实现基于车辆预设历史时间内的轨迹数据进行分析处理,先获取可疑停留点集合,再据此做聚类分析,在聚类结果中根据实际业务需求做基于设定的语义的聚类中心锁定,获取所有聚类中心作为最终停留点结果。

实施例一

请参照图2,本实施例提供一种基于语义轨迹数据的停留点分析方法,能够针对某个车辆历史时间内一定周期的轨迹数据进行分析处理,获取该车辆对应这段时间的最终停留点结果,以进一步的获取该车辆的运动规律和行为模式,能够为后续实际应用提供决策信息。所述实际运用如寻找车辆疑似非法加油站点、旅游客运车辆疑似非法载客点等基于停留点的应用,再或者是提供服务的精准投放,如广告的推送、集中设置休闲区或商铺等。

本实施例的方法包括:

S1:获取某一车辆V0历史时间内一定周期的轨迹数据。

其中,所述一定周期的长短取决于数据分析处理的处理器的能力,以及对应分析结果的精度需求。可选的,所述一定周期可以依据用户实际需求而灵活配置。

其中,所述轨迹数据包括经纬度、时间、车辆信息(种类编号等)以及轨迹点所在位置的相关信息。优选的,所述相关信息包括POI信息(包含有位置附近的建筑物名称、商户设施名称、景点名称、环境硬件设施名称等信息),以及经过该轨迹点的次数。因此,所述轨迹数据包括地点、时间等的属性信息。

S2:对所述轨迹数据进行过滤,去除无效数据。

具体的,过滤掉采集得到的轨迹数据中包括漂移跳变点、时间戳异常点和与建筑物重合的点等无效轨迹点。

例如:针对漂移跳变点,即轨迹跳变点的过滤过程如下:

如图3所示,为过滤漂移跳变点条件示意图,其中,圆圈点为轨迹点。车辆在行驶过程中产生的轨迹集合S={Pm,…,P1,D,P2,…,Pn},点D为时间介于点P1和P2的轨迹点。车辆在行驶中几乎不可能在tε时间内从P1行驶超过当前时速所能达到的距离到达点D后再行驶到达点P2。因此,可通过图1判断距离角度的方法判断点D是否为漂移跳变点:若θ≤θε且P2.t-P1.t<tε,则可判定点D为跳变漂移点,予以删除处理。其中θε为判断漂移跳变点的角度阈值,θ为P1D和DP2的夹角。经过过滤处理,由轨迹集合S得到过滤后的轨迹集合Sfilter。

S3:依据过滤后的轨迹数据获取可疑停留点集合。

由于车辆在正常行驶状态和熄火状态都会周期性间隔若干时间上报一次经纬度位置信息。在正常行驶状态下上报时间一般间隔30~40s,在熄火状态下上报时间间隔相对更久。因此,根据时间间隔前后的两个采样点可判断车辆当前状态信息。通过此先验知识,在过滤车辆轨迹后可找到所有可能的停留点集合。

例如:遍历过滤异常点后的轨迹集合Sfilter,找到时间间隔大于其他点间隔的数据,所得的轨迹点即可疑停留点集合Sstop。

S4:对可疑停留点集合做DBSCAN聚类分析,得到聚类点集合。

所谓聚类分析,指的是指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。在本实施例中,指的是将过滤出来的可疑停留点按照地理位置相近程度聚类成多个类簇的过程。

例如:对可疑停留点集合Sstop做DBSCAN聚类分析,得到x个聚类结果用数组保存为Sgroup={S0,S1,…,Sx-1};其中∈邻域设为由总体轨迹得到的单位时间内车辆移动的平均距离,∈邻域是DBSCAN里设置聚类半径的一个参数,可设置为移动物体单位时间内移动的距离;其中,x为大于等于1的整数。

S5:基于语义分析每个聚类点集合,获取对应一预设关键词的聚类中心,作为结果输出。

具体的,预先设定的关键词是与所述轨迹数据的属性信息相关的,如对应地点属性的“加油站”。依据所设定的关键词,然后基于语义的方法所确定的聚类中心,将是与设定的关键词关系最为接近的结果。

例如:首先对每个聚类点集合进行分组:对第p个聚类点集合Sp={Pm,Pm+1,…,Pn}内的成员点按某个属性进行分组,该属性信息的选定由预设的关键词决定,二者具有对应关系,如从属关系、相近关系等。如设定关键词为“加油站”,由于“加油站”对应的是一地点,且成员轨迹点中均含有所在的地点名称。因此,便可确定作为分组依据的属性信息为“地点”;通过分组,将相同的成员点分为一组。

计算各个分组的权重:分组的权值可以与组内成员数量成正比,或者根据要进行分析的热点,即预设的关键词“加油站点”,查询出每个聚类成员点与加油站点的距离,该点权值与距离成反比,进而获取分组的权值。经过分组后的聚类点集合可表示为:

其中groupk是第k个分组成员个数;

则聚类中心点的经纬度坐标可表示为:

其中权重wk满足:

L为常量,取

需要说明的是,本实施例的权重求取方式不同于传统的求平均和,传统的求平均和是设置wk=1。

实施例二

本实施例对应实施例一,提供一种基于语义轨迹数据的停留点分析系统,包括一个或多个处理器及存储器,所述存储器存储有计算机程序,所述程序在被配置成由系统内的一个或多个处理器执行时,能实现上述实施例所述的基于语义轨迹数据的停留点分析方法所包含的所有步骤。具体步骤在此不再复述,详细描述请参见实施例一。

实施例三

本实施例对应实施例一,提供一具体运用场景:

在现实业务需求中,我们获取了各类车辆例如出租车、校车、旅游客运车和渣土车等包括行驶经纬度信息、时间、车辆信息以及点所在位置的POI的轨迹数据。寻找其中的非法加油站点是我们的关注点,因此,设定关键词为“加油站点”。

在依据实施例一获取的聚类结果中,依据关键词对应的数据属性“地点”为依据进行分组,然后指定地点中包含关键词“加油站”的分组权重较大;而如果某一类簇所有成员均不包含此字符串,则可以将类簇中地点最为相近的分为一组,且权重与该组成员数量成正比,最终聚类出停留点。

例如某非法加油站位于“A区B路C号”,停留点地址零散分布于“A区B路D号”、“A区B路E号”等,但均不包含“加油站”关键字,此时可将“A区B路”作为分组依据,这样聚出“A区B路C号”的可能性和准确性将大于传统中只将类簇所有成员经纬度作平均后输出更为准确。

综上所述,本发明提供的一种基于语义轨迹数据的停留点分析方法,能够实现从车辆的轨迹数据中准确且高效的分析获取车辆停留点。不仅能够为实际应用提供决策信息;而且还能据此发现车辆运动规律和行为模式,实现服务的精准投放。

以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等同变换,或直接或间接运用在相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1