出行信息的预测方法、服务器及存储介质与流程

文档序号:16202944发布日期:2018-12-08 06:47阅读:141来源:国知局
出行信息的预测方法、服务器及存储介质与流程

本发明涉及数据处理领域,尤其涉及一种出行信息的预测方法、服务器以及计算机可读存储介质。

背景技术

随着时代的发展,利用出行预测模型来预测人们的出行需求信息对于提高城市道路的通行效率有很强的指导意义。现阶段的出行预测方法主要集中在建立单一交通方式的出行率分析的定量模型上,对多种交通方式的全出行链解释不足,使得人们出行预测的准确性无法保证。



技术实现要素:

本发明的主要目的在于提供一种出行信息的预测方法、服务器以及计算机可读存储介质,基于利用用户的历史出行轨迹构建的预测模型,通过建立出发信息和出行信息之间的因果关系,实现提高了对人们出行预测的准确率。

为实现上述目的,本发明提供一种出行信息的预测方法,所述出行信息的预测方法包括以下步骤:

在接收到出发信息时,获取预测模型,其中,所述出发信息包括出发时间、出发地点和条件参数,所述预测模型包括随机森林模型和贝叶斯模型中的至少一个;

根据所述出发信息和所述预测模型,预测得到出行信息,所述出行信息包括目的地点和交通工具中的至少一个。

优选地,所述出行信息的预测方法还包括:

判断出发当天是否为工作日,根据判断结果得到所述条件参数。

优选地,所述随机森林模型根据历史出发信息和历史出行信息建立,由至少一棵决策树组成,其中,每一棵所述决策树能根据所述出发信息,得到一个预目的地点作为输出结果。

优选地,所述根据所述出发信息和所述预测模型,预测得到出行信息的步骤包括:

在预测所述目的地点时,获取所述预目的地点;

根据所述预目的地点得到所述目的地点。

优选地,所述根据所述预目的地点得到所述目的地点的步骤包括:

根据所述预目的地点中出现次数最多的地点,生成第一目的地点;

根据所述预目的地点中,除所述第一目的地点之外的出现次数最多的地点,生成第二目的地点;

根据所述预目的地点中,除所述第一目的地点和所述第二目的地点之外的出现次数最多的地点,生成第三目的地点;

按顺序输出所述第一目的地点、所述第二目的地点和所述第三目的地点,得到所述目的地点。

优选地,所述贝叶斯模型根据所述历史出发信息和所述历史出行信息训练得到,其中,在所述贝叶斯模型中,对于所述出发时间的密度估计采用核密度估计;对于所述出发地点和所述条件参数的所述密度估计,采用拉普拉斯平滑的方式估计。

优选地,所述根据所述出发信息和所述预测模型,预测得到出行信息的步骤包括:

根据所述出发信息和所述贝叶斯模型,预测得到所述交通工具。

优选地,所述根据所述出发信息和所述贝叶斯模型,预测得到所述交通工具的步骤包括:

根据所述出发信息和所述贝叶斯模型,计算所述出发信息对应的各种所述交通工具的预测概率,所述交通工具包括小轿车、地铁和公交中的至少一个;

输出所述预测概率最高的所述交通工具。

优选地,所述根据所述出发信息和所述预测模型,预测得到出行信息的步骤之前,还包括:

获取所述出发信息对应的所述历史出发信息和所述历史出行信息;

根据所述历史出发信息和所述历史出行信息,判断所述出发信息是否为可预测信息;

在判定所述出发信息为可预测信息时,对所述出发信息进行预测。

优选地,所述根据所述历史出发信息和所述历史出行信息,判断所述出发信息是否为可预测信息的步骤包括:

计算所述历史出发信息和所述历史出行信息的互信息;

在所述互信息大于或者等于预设数值时,判定所述出发信息为可预测信息;

在所述互信息小于所述预设数值时,判定所述出发信息为不可预测信息。

为实现上述目的,本发明还提供一种服务器,所述服务器包括:

所述服务器包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的出行信息的预测程序,所述出行信息的预测程序被所述处理器执行时实现如上述出行信息的预测方法的步骤。

为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有出行信息的预测程序,所述出行信息的预测程序被处理器执行时实现如上述出行信息的预测方法的步骤。

本发明提供的出行信息的预测方法、服务器以及计算机可读存储介质,在接收到出发信息时,获取预测模型,其中,所述出发信息包括出发时间、出发地点和条件参数,所述预测模型包括随机森林模型和贝叶斯模型中的至少一个;根据所述出发信息和所述预测模型,预测得到出行信息,所述出行信息包括目的地点和交通工具中的至少一个。这样,实现提高了对人们出行预测的准确率。

附图说明

图1为本发明实施例方案涉及的实施例终端的硬件运行环境示意图;

图2为本发明出行信息的预测方法第一实施例的流程示意图;

图3为本发明出行信息的预测方法第二实施例的流程示意图;

图4为本发明出行信息的预测方法第三实施例的流程示意图;

图5为本发明出行信息的预测方法第四实施例的流程示意图;

图6为本发明出行信息的预测方法第五实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明提供一种出行信息的预测方法,实现提高了对人们出行预测的准确率。

如图1所示,图1是本发明实施例方案涉及的实施例终端的硬件运行环境示意图;

本发明实施例终端可以是服务器。

如图1所示,该服务器可以包括:处理器1001,例如cpu,存储器1002,通信总线1003。其中,通信总线1003用于实现该服务器中各组成部件之间的连接通信。存储器1002可以是高速ram存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1002可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解,图1中示出的终端的结构并不构成对本发明实施例终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种计算机存储介质的存储器1002中可以包括出行信息的预测程序。

在图1所示的服务器中,处理器1001可以用于调用存储器1002中存储的出行信息的预测程序,并执行以下操作:

在接收到出发信息时,获取预测模型,其中,所述出发信息包括出发时间、出发地点和条件参数,所述预测模型包括随机森林模型和贝叶斯模型中的至少一个;

根据所述出发信息和所述预测模型,预测得到出行信息,所述出行信息包括目的地点和交通工具中的至少一个。

进一步地,处理器1001可以调用存储器1002中存储的出行信息的预测程序,还执行以下操作:

判断出发当天是否为工作日,根据判断结果得到所述条件参数。

进一步地,处理器1001可以调用存储器1002中存储的出行信息的预测程序,还执行以下操作:

所述随机森林模型根据历史出发信息和历史出行信息建立,由至少一棵决策树组成,其中,每一棵所述决策树能根据所述出发信息,得到一个预目的地点作为输出结果。

进一步地,处理器1001可以调用存储器1002中存储的出行信息的预测程序,还执行以下操作:

在预测所述目的地点时,获取所述预目的地点;

根据所述预目的地点得到所述目的地点。

进一步地,处理器1001可以调用存储器1002中存储的出行信息的预测程序,还执行以下操作:

根据所述预目的地点中出现次数最多的地点,生成第一目的地点;

根据所述预目的地点中,除所述第一目的地点之外的出现次数最多的地点,生成第二目的地点;

根据所述预目的地点中,除所述第一目的地点和所述第二目的地点之外的出现次数最多的地点,生成第三目的地点;

按顺序输出所述第一目的地点、所述第二目的地点和所述第三目的地点,得到所述目的地点。

进一步地,处理器1001可以调用存储器1002中存储的出行信息的预测程序,还执行以下操作:

所述贝叶斯模型根据所述历史出发信息和所述历史出行信息训练得到,其中,在所述贝叶斯模型中,对于所述出发时间的密度估计采用核密度估计;对于所述出发地点和所述条件参数的所述密度估计,采用拉普拉斯平滑的方式估计。

进一步地,处理器1001可以调用存储器1002中存储的出行信息的预测程序,还执行以下操作:

根据所述出发信息和所述贝叶斯模型,预测得到所述交通工具。

进一步地,处理器1001可以调用存储器1002中存储的出行信息的预测程序,还执行以下操作:

根据所述出发信息和所述贝叶斯模型,计算所述出发信息对应的各种所述交通工具的预测概率,所述交通工具包括小轿车、地铁和公交中的至少一个;

输出所述预测概率最高的所述交通工具。

进一步地,处理器1001可以调用存储器1002中存储的出行信息的预测程序,还执行以下操作:

获取所述出发信息对应的所述历史出发信息和所述历史出行信息;

根据所述历史出发信息和所述历史出行信息,判断所述出发信息是否为可预测信息;

在判定所述出发信息为可预测信息时,对所述出发信息进行预测。

进一步地,处理器1001可以调用存储器1002中存储的出行信息的预测程序,还执行以下操作:

计算所述历史出发信息和所述历史出行信息的互信息;

在所述互信息大于或者等于预设数值时,判定所述出发信息为可预测信息;

在所述互信息小于所述预设数值时,判定所述出发信息为不可预测信息。

参照图2,在一实施例中,所述出行信息的预测方法包括:

步骤s10、在接收到出发信息时,获取预测模型,其中,所述出发信息包括出发时间、出发地点和条件参数,所述预测模型包括随机森林模型和贝叶斯模型中的至少一个;

步骤s20、根据所述出发信息和所述预测模型,预测得到出行信息,所述出行信息包括目的地点和交通工具中的至少一个。

本实施例中,所述出发时间为用户行程的具体出发时间;所述出发地点以交通小区为单位;所述条件参数可以是通过判断出发当天是否为工作日,根据判断结果得到所述条件参数,比如,判定出发当天为工作日时,输出条件参数为1,判定出发当天不是工作日时,即判定出发当天为周末或者节假日时,输出条件参数为2。需要说明的是,该条件参数不限于上述所述,可根据实际应用进行设置,比如,条件参数也可以是根据出行人数设置,如出行人数为2人时,输出条件参数为2。

所述目的地点以交通小区为单位;所述交通工具包括小轿车、地铁和公交中的至少一个。

所述随机森林模型根据历史出发信息和历史出行信息建立,由至少一棵决策树组成,其中,每一棵所述决策树能根据所述出发信息,得到一个预目的地点作为输出结果。在预测所述目的地点时,获取所述预目的地点;根据所述预目的地点得到所述目的地点。需要说明的是,可以按照不同的出行信息属性设置不同的决策树的对应参数。

具体地,出行的交通工具为公交和地铁的对应历史出发信息和历史出行信息的获取,可以是通过获取交通卡对应的出行数据得到。出行的交通工具为公小轿车的对应历史出发信息和历史出行信息的获取,可以是通过获取行车记录仪的出行数据得到。需要说明的是,当出行的交通工具为小轿车时,由于出发地点和目的地点的物理位置的获得是通过gps获取的,而gps上传的位置数据为经纬度位置数据,所以需要先将该经纬度位置数据转换为交通小区位置数据。

由于车载行车记录仪会将gps的原始数据每隔几秒钟上传一次,而行车记录仪在车辆没有开启的状态下是不会发送gps数据的,所以可以通过时间间隔分布设置两个记录数据之间的时间间隔大于30分钟时,那么将第一个记录数据标识为上一次出行行程的目的地点,将第二个记录默认为下一次出行行程的出发地点。

根据所述出发信息和所述随机森林模型,预测得到出行信息中的目的地点。具体地,随机森林模型中的每棵决策树根据出发信息得到一个预目的地点,随机森林模型根据所述预目的地点中出现次数最多的地点,生成第一目的地点;根据所述预目的地点中,除所述第一目的地点之外的出现次数最多的地点,生成第二目的地点;根据所述预目的地点中,除所述第一目的地点和所述第二目的地点之外的出现次数最多的地点,生成第三目的地点;按顺序输出所述第一目的地点、所述第二目的地点和所述第三目的地点,得到所述目的地点。

比如,在有100棵决策树的随机森林模型中,根据出发信息得到的预目的地点的出现次数为甲地点50次,乙地点20次,丙地点25次,丁地点5次,因此按顺序输出的目的地点的结果,概率排第一的目的地点为甲地点,排第二的目的地点为丙地点,排第三的目的地点为乙地点。

所述贝叶斯模型根据所述历史出发信息和所述历史出行信息训练得到,其中,在所述贝叶斯模型中,对于所述出发时间的密度估计采用核密度估计;对于所述出发地点和所述条件参数的所述密度估计,采用拉普拉斯平滑的方式估计。根据所述出发信息和所述贝叶斯模型,预测得到所述交通工具。

需要说明的是,对出发信息的密度估计,即是计算该出发信息对应交通工具的概率,比如,对出发地点为甲地点的密度估计,即是计算在出发地点为甲地点时,预测的交通工具为小轿车的对应概率;在出发地点为甲地点时,预测的交通工具为公交的对应概率;在出发地点为甲地点时,预测的交通工具为地铁的对应概率。

根据所述出发信息和所述贝叶斯模型,计算所述出发信息对应的各种所述交通工具的预测概率,所述交通工具包括小轿车、地铁和公交中的至少一个;输出所述预测概率最高的所述交通工具。

具体地,将出发地点的密度估计数值、出发时间的密度估计数值、条件参数的密度估计数值和交通工具的出现概率相乘,即可计算得到交通工具的预测概率。需要说明的是,将出发地点的密度估计数值、出发时间的密度估计数值、条件参数的密度估计数值和交通工具的出现概率相乘,即是计算四个概率同时出现的概率。

比如,当公交对应的出发地点的密度估计数值为0.08,公交对应的出发时间的密度估计数值为0.98,公交对应的条件参数的密度估计数值为0.67,而由于一个有三种交通工具,所以公交的出现概率为0.33,因此公交的预测概率为0.02。

在第一实施例中,在接收到出发信息时,获取预测模型,其中,所述出发信息包括出发时间、出发地点和条件参数,所述预测模型包括随机森林模型和贝叶斯模型中的至少一个;根据所述出发信息和所述预测模型,预测得到出行信息,所述出行信息包括目的地点和交通工具中的至少一个。这样,基于利用用户的历史出行轨迹构建的预测模型,通过建立出发信息和出行信息之间的因果关系,实现提高了对人们出行预测的准确率。

在第二实施例中,如图3所示,在上述图2所示的实施例基础上,所述根据所述预目的地点得到所述目的地点的步骤包括:

步骤s30、根据所述预目的地点中出现次数最多的地点,生成第一目的地点;

步骤s31、根据所述预目的地点中,除所述第一目的地点之外的出现次数最多的地点,生成第二目的地点;

步骤s32、根据所述预目的地点中,除所述第一目的地点和所述第二目的地点之外的出现次数最多的地点,生成第三目的地点;

步骤s33、按顺序输出所述第一目的地点、所述第二目的地点和所述第三目的地点,得到所述目的地点。

本实施例中,在预测的出行信息为目的地点时,根据所述出发信息和所述随机森林模型,得到预目的地点,根据所述预目的地点得到所述目的地点。

具体地,根据在随机森林模型中,预目的地点中出现次数最多的地点,生成第一目的地点;根据所述预目的地点中,除所述第一目的地点之外的出现次数最多的地点,生成第二目的地点;根据所述预目的地点中,除所述第一目的地点和所述第二目的地点之外的出现次数最多的地点,生成第三目的地点;按顺序输出所述第一目的地点、所述第二目的地点和所述第三目的地点,得到所述目的地点。

比如,在有100棵决策树的随机森林模型中,根据出发信息得到的预目的地点的出现次数为甲地点50次,乙地点20次,丙地点25次,丁地点5次,因此按顺序输出的目的地点的结果,概率排第一的目的地点为甲地点,排第二的目的地点为丙地点,排第三的目的地点为乙地点。

在第二实施例中,根据所述预目的地点中出现次数最多的地点,生成第一目的地点;根据所述预目的地点中,除所述第一目的地点之外的出现次数最多的地点,生成第二目的地点;根据所述预目的地点中,除所述第一目的地点和所述第二目的地点之外的出现次数最多的地点,生成第三目的地点;按顺序输出所述第一目的地点、所述第二目的地点和所述第三目的地点,得到所述目的地点。这样,实现了对目的地点的预测输出。

在第三实施例中,如图4所示,在上述图2至图3的实施例基础上,所述根据所述出发信息和所述预测模型,预测得到出行信息的步骤包括:

步骤s40、根据所述出发信息和所述贝叶斯模型,预测得到所述交通工具。

本实施例中,在接收到出发信息时,获取贝叶斯模型,其中,所述出发信息包括出发时间、出发地点和条件参数;根据所述出发信息和所述贝叶斯模型,预测得到所述交通工具。需要说明的是,所述贝叶斯模型根据所述历史出发信息和所述历史出行信息训练得到,其中,在所述贝叶斯模型中,对于所述出发时间的密度估计采用核密度估计;对于所述出发地点和所述条件参数的所述密度估计,采用拉普拉斯平滑的方式估计。

在第三实施例中,根据所述出发信息和所述贝叶斯模型,预测得到所述交通工具。这样,实现对出行时交通工具的预测。

在第四实施例中,如图5所示,在上述图2至图4的实施例基础上,所述根据所述出发信息和所述贝叶斯模型,预测得到所述交通工具的步骤包括:

步骤s41、根据所述出发信息和所述贝叶斯模型,计算所述出发信息对应的各种所述交通工具的预测概率,所述交通工具包括小轿车、地铁和公交中的至少一个;

步骤s42、输出所述预测概率最高的所述交通工具。

本实施例中,预测得到所述交通工具的步骤包括根据所述出发信息和所述贝叶斯模型,计算所述出发信息对应的各种所述交通工具的预测概率,所述交通工具包括小轿车、地铁和公交中的至少一个;输出所述预测概率最高的所述交通工具。

比如,预测到得小轿车的预测概率为0.09,公交的概率为0.02,地铁的概率为0.33,则输出预测到的交通工具为地铁。

在第四实施例中,根据所述出发信息和所述贝叶斯模型,计算所述出发信息对应的各种所述交通工具的预测概率,所述交通工具包括小轿车、地铁和公交中的至少一个;输出所述预测概率最高的所述交通工具。这样,实现对出行时交通工具的预测。

在第五实施例中,如图6所示,在上述图2至图5的实施例基础上,所述根据所述出发信息和所述预测模型,预测得到出行信息的步骤之前,还包括:

步骤s50、获取所述出发信息对应的所述历史出发信息和所述历史出行信息;

步骤s51、根据所述历史出发信息和所述历史出行信息,判断所述出发信息是否为可预测信息;

步骤s52、在判定所述出发信息为可预测信息时,对所述出发信息进行预测。

本实施例中,在预测出行信息之前,获取所述出发信息对应的所述历史出发信息和所述历史出行信息;根据所述历史出发信息和所述历史出行信息,判断所述出发信息是否为可预测信息;在判定所述出发信息为可预测信息时,对所述出发信息进行预测。

需要说明的是,基于用户的异常行为在本质上是不可预测的,所以在根据用户的出发信息预测出行信息时,先判断所述出发信息是否为可预测信息,根据判定为可预测信息的出发信息对出行信息进行预测。

具体地,所述根据所述历史出发信息和所述历史出行信息,判断所述出发信息是否为可预测信息的步骤包括计算所述历史出发信息和所述历史出行信息的互信息;在所述互信息大于或者等于预设数值时,判定所述出发信息为可预测信息;在所述互信息小于所述预设数值时,判定所述出发信息为不可预测信息。

比如,计算得到用户的历史出发信息和历史出行信息之间的互信息为5比特,而预设数值为3比特,因此该用户对应的出发信息为可预测信息。

需要说明的是,根据互信息判断出发信息是否为可预测信息的方法,也可以是,基于一定用户覆盖率计算,即可以是设置在一定基数的用户中,判定互信息数值最大的70%的用户对应的出发信息为可预测信息。

在第五实施例中,获取所述出发信息对应的所述历史出发信息和所述历史出行信息;根据所述历史出发信息和所述历史出行信息,判断所述出发信息是否为可预测信息;在判定所述出发信息为可预测信息时,对所述出发信息进行预测。这样,实现对出发信息是否为可预测信息的判断。

此外,本发明还提出一种服务器,所述服务器包括存储器、处理器及存储在存储器上并可在处理器上运行的出行信息的预测程序,所述处理器执行所述出行信息的预测程序时实现如以上实施例所述的出行信息的预测方法的步骤。

此外,本发明还提出一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括出行信息的预测程序,所述出行信息的预测程序被处理器执行时实现如以上实施例所述的出行信息的预测方法的步骤。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是电视机,手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1