个体出行目的地预测的方法与流程

文档序号:16251226发布日期:2018-12-12 00:03阅读:811来源:国知局
个体出行目的地预测的方法与流程

本发明涉及交通领域,具体说的是个体出行目的地预测的方法。

背景技术

旅行目的地和下一个路段是驾驶行为的关键,事关着人们出行的安全与便捷性。因此,如何从海量的交通轨迹数据中挖掘出驾驶员的出行意向、下一个路段等有价值的信息存在需求。



技术实现要素:

本发明所要解决的技术问题是:提供一种个体出行目的地预测的方法,能够对个体出行意向进行预测。

为了解决上述技术问题,本发明采用的技术方案为:

一种个体出行目的地预测的方法,包括:

依据一浮动车的行车数据获取对应的行车轨迹;

对所述行车轨迹所对应的地理范围进行网格划分,并设置网格id;

依据预设时间差对所述行车轨迹进行分段,获取多条子轨迹;

匹配所述子轨迹的各个轨迹点与网格,获取与各所述子轨迹对应的网格id集;

预设第一主题的个数,依据lda主题模型对各所述子轨迹及其对应的网格id集进行建模分析,获取对应所述第一主题的第一预测模型;

依据所述第一预测模型对所述一浮动车的当前行车数据进行计算,获取对应各个所述第一主题的概率值。

本发明的有益效果在于:提供一种以驾驶员的行车数据为基础,依据lda主题模式进行分析处理而对车主的出行目的地进行预测的方法、以及实现该方法的计算机程序。本发明能够从大量行车轨迹数据中发现旅行事件行为主题模式,进而对驾驶员的出行意向进行定量分析,并预测下一个路段或者出行目的地,不仅能够很好的被应用于出行路线的规划,也能进行短时交通流的预测等。

附图说明

图1为本发明一种个体出行目的地预测的方法的流程示意图;

图2为本发明实施例的流程示意图。

具体实施方式

为详细说明本发明的技术内容、所实现目的及效果,以下结合实施方式并配合附图予以说明。

本发明最关键的构思在于:能够从大量行车轨迹数据中发现旅行事件行为主题模式,进而对驾驶员的出行意向进行定量分析,并预测下一个路段或者出行目的地。

实施例

请参照图1和图2,本实施例提供一种个体出行目的地预测的方法,能够实现基于驾驶员当前的行车数据对其出行意向进行预测。

具体参阅图2,本实施例的方法包括以下步骤:

s1:依据一浮动车的行车数据获取对应的行车轨迹;

具体的,利用驾驶员所驾驶的浮动车上的车载信息终端在浮动车行驶过程中以一预设的固定时间周期t采集浮动车的行车数据后发送通过无线通信方式发送至后台数据平台。其中,所述行车数据包括车辆编号u,位置l,速度v,时间t;依据时间顺序采集得到行车数据序列,并将采集的行车数据序列通过移动蜂窝通信技术发送到后台数据中心。

后台数据中心接收到一浮动车的行车数据后,对应该浮动车的基础信息(如车辆编号等与该浮动车唯一对应的标识信息)存储至数据库中。通过将不断采集得到的浮动车的行车数据存储至位于远端的后台数据中心,实现车载信息终端存储空间的优化,减轻其存储负担。

当接收到对应该浮动车的下一行驶路段或出行目的地进行预测的请求时,可以由后台服务中心直接调用其数据库中对应该浮动车的数据进行分析处理,获取结果;当然,也可以由任意一终端发起该请求,并从后台服务中心获取浮动车的相关数据后,在终端本地进行分析处理后获取结果。预测过程的执行端的选择可依据不同使用场景进行灵活配置(如具备良好的网络状态支持时可选择后台执行、终端具备较高性能配置支持时可选择终端执行),更好的满足实际需求。优选的,为了减轻终端本地的负担,同时充分利用后台资源,默认选择由后台服务中心作为预测过程的执行端。

下面,将以后台数据中心对该浮动车的行车数据进行处理为例展开进行详细说明;若选择由终端在本地进行处理,则在终端从后台获取到行车数据后,将终端作为执行主体,通过同样的处理方式也能实现。

后台数据中心获取请求发起者对应的浮动车的行车数据后,获取与其对应的行车轨迹,即将零散的行车数据依据时间先后顺序进行排序后,即可获取对应地理位置的行车轨迹。

s2:对所述行车轨迹所对应的地理范围进行网格划分,并设置网格id;

后台数据中心依据行车轨迹确认该浮动车的活动地理范围,具体依据该行车轨迹记载的地理位置信息进行框定;

然后对所确定的地理范围进行网格划分,并对每个网格设置对应的id。其中,所划分的网格大小依据组成行车轨迹的每个具体轨迹点进行确定。由于每个轨迹点都记载有对应的地理位置信息,为了确保后续基于网格信息对行车轨迹的分析处理的精确度,优选使每个轨迹点能够对应一个网格的方式进行网格划分。因此,可以直接依据每个具体经纬度信息的地理坐标进行网格划分,优选所述网格大小为100m*100m,即每个网格对应一个确定经纬度信息的地理位置。优选的,直接依据每个网格对应的地理位置信息设置其id。

例如:获取到一车辆编号u为5205278的历史行车数据;依据该行车数据获取与其对应的行车轨迹;然后依据该行车轨迹确定其活动范围,即地理范围,优选选取大于该行车轨迹一定范围的地理范围;再然后对所确定的地理范围进行网格划分,并设置网格id,建立与该行车轨迹对应的网格模型。具体的,网格间距为100米,提取行车轨迹的每个轨迹点的地理位置信息,即经纬度信息,组合确定该轨迹点对应的网格id。如:福州市中心位置(119.300023754,26.080006881),先设置经纬度精度为0.001,得到(119.300,26.080),通过计算119.300*1000*100000+26.080*1000=11930026080,得该位置的id为:11930026080。

在该步骤中,依据行车轨迹框定对应的地理范围后,只对该范围进行网格划分和设置网格id,而不是将整个地图都进行网格划分,能够大大降低所要处理的数据量,仅针对有效数据进行分析处理,实现系统处理方式的优化,进而提升本实施例的方法的实现速度。

s3:依据预设时间差对所述行车轨迹进行分段,获取多条子轨迹;

具体的,可以根据相邻两个行车数据的时间差(如δt>30min)作为分段依据,对整条轨迹数据进行分段,形成多条的子轨迹m。例如,行车数据1的时间信息为2015-07-1418:26:27,行车数据2的时间信息为2015-07-1418:26:37,两数据时间相减即可得到时间差10秒;然后根据相邻两数据的时间差大于30分钟(δt>30min)作为分段依据,对整条轨迹数据进行分段,形成100个子轨迹。

对行车轨迹进行分段的目的是为后续依据lda主题模型对各条的子轨迹进行建模分析提供数据基础,即本实施例的计算,是针对驾驶员一定时间间隔内的多条子轨迹进行定量分析处理的结果,因此,所获取的计算结果能更好、更准确的体现驾驶员对应上述时间间隔内的出行意向,即能够实现更准确的预测。

s4:匹配所述子轨迹的各个轨迹点与网格,获取各个子行车轨迹各自对应的网格id集;

通过将各条子轨迹的各个轨迹点依据其记载的地理位置信息匹配到已划分网格的地理范围中,从而获取各子轨迹各自对应的网格集,及网格id集合。

简单而言,即首先获取各条子轨迹各自对应的各个轨迹点;然后匹配所述各个轨迹点与网格;获取各条子轨迹各自对应的网格id集;

例如,依据其中一条子轨迹中的一个轨迹点对应其在行车数据记载的位置l(经纬度信息)为(119.300,26.080),将该轨迹点匹配到划分网格了的地图范围中对应的位置上,然后获取该地图中该位置对应的网格id。

通过该步骤,实现各条的子轨迹的各个轨迹点与网格地图的匹配,以及各自对应的网格id集的获取。

在一具体实施方式中,该步骤之后,下一步骤s5之前,还包括数据预处理过程,即优化子轨迹与网格地图的对应关系;

具体的,包括数据插值以及数据去重步骤,分别对应图2中的s41和s42:

(一)数据插值

由于行车数据采集是周期性进行的,因此未经加工处理的轨迹数据具有稀疏性。为了使驾驶员行驶的轨迹更好进行连接,采用线性插值技术对子轨迹数据进行逐一插值补充,即确保每条子轨迹的轨迹点对应的网格是连续的。

具体的,可以通过依次遍历各条子轨迹,使用线性插值技术对当前遍历到的这条子轨迹的各个轨迹点进行逐一插值补充,然后使得每条子轨迹能够与连续的网格对应,插值处理后的各条子轨迹为优化子轨迹;最后获取各优化子轨迹对应的网格id集。

例如,一条子轨迹中相邻两个轨迹点1、2分别属于网格id11930026081和11930026083,即中间网格id11930026082没有数据,那么就给该网格id插入数据,即插入一个轨迹点,使其形成一条连续的轨迹,该连续的轨迹即优化后的子轨迹。

(二)数据去重

即对相邻重复网格进行去重,按时间排序,若相邻的数据点(轨迹点)同属一个网格,即相邻重复网格,则只保留一个网格id;

具体的,通过遍历各条子轨迹,对当前遍历到的这条子轨迹对应的各个轨迹点对应的网格id进行判断,对相邻重复网格进行去重,如:连续三个数据,其网格id为11930026080,11930026080,11930026081,则去重后剩下两个数据11930026080,11930026081。

通过数据插值以及数据去重步骤,能够提升后续用于建模的基础数据的精确度和完整性,进而有利于最终计算结果,即所预测的目的地的准确度。

s5:预设第一主题的个数,依据lda主题模型对各所述子轨迹及其对应的网格id集进行建模分析,获取对应所述第一主题的第一预测模型。

所述lda主题模型在交通出行领域的应用方法为trajectory(轨迹)->topic(主题)->od(交通起止段)。

具体的,该步骤可以包括以下子步骤:

s51:参数配置;

根据驾驶行为设置第一主题k的个数,即模型计算所要获取的第一主题的数量,如k=100;设置模型的参数α、β设置为0.0001,即计算精度的设置。

s52:随机初始化;

即对行车轨迹的每条子轨迹的每个轨迹点对应的网格id,随机赋予一个topic(第一主题编号)。

具体的,将遍历每条子轨迹,对当前遍历到的这条子轨迹的各轨迹点所对应的网格id随机赋予一个第一主题topic编号,直至所有子轨迹对应的网格id集的各个网格id都随机赋值完成,且各个网格id随机赋的值不同。

所述编号的范围与所述第一主题的个数对应,即依据k确定,若k为100,则范围可以是0-99;

例如,对网格id为11930026080随机赋予topic编号99,依次遍历各条子轨迹,对各条子轨迹的各个轨迹点对应的网格id都随机赋予一个0-99的编号,且各编号不同。

s53:gibbssampling采样;

即重新扫描各条子轨迹,按照gibbssampling公式对其各个轨迹点的网格id重新进行采样,更新topic编号;所述gibbssampling公式为其中,所述v为语料库,其存储着所有的网格id;t表示语料库中的第t个网格id;m为子轨迹点的总条数;k表示第k个第一主题;w表示第m条子轨迹对应的网格id集;zi是隐含变量,表示第i个网格id对应的第一主题topic编号;α、β分别表示第一预测模型的参数,设置为0.0001;表示第一主题k中各网格id出现的次数;表示子轨迹m中第一主题k出现的次数;表示去除下标为i的网格id。

具体的,将重新遍历各条子轨迹,利用gibbssampling采样进行更新每个网格id对应的topic编号,如:网格id11930026080随机初始化的topic编号为99,利用gibbssampling采样得到一个topic编号1,则把网格id11930026080的topic编号更新为1。

s54:重复执行步骤s53,直至收敛;一般迭代的次数为20000次。

s55:统计各词频,计算获取轨迹中topic-id频率矩阵,即对应第一主题的lda主题模型,简称第一预测模型;

具体的,就是统计各子轨迹中第一主题topic编号出现的频率以及所述第一主题topic编号中各网格id出现的频率;然后将统计结果代入lda主题模型的topic-id频率矩阵进行计算,得到对应所述第一主题的第一预测模型。

例如,统计总的网格数1000,主题1中网格id11930026080出现的次数100,主题1中所有网格id出现的总次数10000,子轨迹1中主题1出现的次数10000,子轨迹1中所有网格id出现的总次数10000,利用公式计算得到:主题1网格id11930026080的参数(100+0.0001)/(10000+0.0001*1000)=0.010;上述公式可参考《lda数学八卦》第六章lda文本建模的相关内容,其中,子轨迹对应文中的文档;网格id对应文中的word。

以此类推,遍历所有主题的所有网格id,计算出其参数,得topic-id参数矩阵。

该步骤计算得到的是对应第一主题的第一预测模型,主题的数量较大,相近主题较多,因此基于当前行车数据在第一预测模型中的计算量可能较大,计算较为耗时,计算结果的精度可能有待提升,但是并不影响方法的实现,即该第一预测模型仍然可以运用于该驾驶员的目的地预测。同时通过下述步骤提供进一步优化处理后的第二预测模型,能够进一步提升预测处理效率以及精确度。

s6:通过自适应聚类处理,将相近的第一主题聚为一类,得到与确定的x个主题数对应的预测模型。

具体的,对所述第一预测模型依据第一主题进行聚类分析,获取对应第二主题的第二预测模型;

例如,对上述得到的100个第一主题进行聚类,把相同或相近轨迹聚为一类,最后得到确定的10个主题数,即第二主题;并与地图进行匹配,得到10个地点:工程学院、鼓山、万达、森林公园、宝龙、东街口、农大、长乐机场、平潭、永泰;所举例的地点位于福建省福州市。

s7:依据预测模型对所述一浮动车的当前行车数据进行计算,获取对应各个主题的概率值,并据此进行目的地的推荐。

具体的,若基于成本等考虑,仅提供第一预测模型,则直接基于第一预测模型进行计算,将概率值最大的第一主题对应的地理位置推荐给驾驶员;但优选的,通过所述第二预测模型对所述一浮动车的当前行车数据进行计算,获取对应各个所述第二主题的概率值;然后将概率值最大的第二主题对应的地理位置作为该浮动车的驾驶员的下一目的地进行推荐。

例如,利用已建好的出行目的地预测模型,即参数不变,计算得到这10个主题的概率,选取概率最大的主题作为预测的出行目的地:该行车目前处于浦上大道(119.264928131,26.037414520),把当前的行车数据发送给已建好的出行目的地预测模型的后台数据中心或者终端,计算得到该行车下一目的地及其对应的概率值:工程学院50%、鼓山8%、万达15%、森林公园0.2%、宝龙10%、东街口10%、农大5%、长乐机场1%、平潭0.5%、永泰0.3%;选取概率为50%的工院作为预测的出行目的地。

由于本实施例针对的是各个子轨迹进行定量分析处理的预测结果,因此所预测的目的地对应的是下一较短路程目的地,从而保证预测结果的准确性,同时预测结果也更符合驾驶员的实际需求,能够实现智能、精准、快速地对驾驶员的下一路段的目的地进行预测,有利于行驶路线的规划(如直接依据预测的目的地快速完成导航目的地的设置),特别是旅行中的规划,帮助驾驶员明确当前行驶路线;进一步的,也能很好的运用于交通管控,通过对交通道路中所有行驶车辆的下一行驶路径的预测结果,实现短时交通流的预测,以便及时的掌握城市交通道路的车流情况,在出现交通拥堵前及时进行调控和疏导,有助于缓解城市交通压力。

综上所述,本发明提供的一种个体出行目的地预测的方法,能够对个体出行意向进行预测;不仅准确度高;而且效率高;本发明能够很好的运用于对驾驶员个人的出行意向进行预测,有利于出行规划;还能很好的运用于交通管控,通过对交通道路中所有行驶车辆的下一行驶路径的预测结果,实现短时交通流的预测。

以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等同变换,或直接或间接运用在相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1