一种基于回声状态网络的历史轨迹目的地预测方法与流程

文档序号:18397026发布日期:2019-08-09 23:31阅读:283来源:国知局
一种基于回声状态网络的历史轨迹目的地预测方法与流程

本发明属于目的地预测领域,具体涉及一种基于回声状态网络的历史轨迹目的地预测方法。



背景技术:

这些年来,移动互联网应用得到迅猛发展,移动终端产品例如智能手机、平板电脑、智能手表、运动手环等设备越来越得到广泛的使用。这些设备产生海量的数据,如何发掘这些数据中的有用信息是数据挖掘领域研究的一个热点。

同时随着gps、移动信号网络和无线网络等的定位技术大力发展,基于位置信息服务的数据挖掘也应运而生。通过使用各种基于位置的服务(locationbasedservice,lbs),如附近陌生人社交,附近娱乐场所推荐,交通线路的推荐,物流配送等等的服务,给人们的生产、生活和工作带来了极大的便利。

其次,在过去的很长一段时间内,由于缺乏大量数据的积累,人类的移动行为是被认为杂乱的、随机的、没有规律可言。但是随着移动互联网技术、定位技术和云服务技术的发展,大量的移动行为特征数据被积累起来,这些数据从多个角度反映了人类移动行为的特征,这就为移动轨迹和目的地的预测提供了比较可靠的科学依据。在基于大量的位置信息的前提下,利用合适且高效率的数据分析方法从中提取出有效的数据,构建起时空数据库,在此基础上对人类行为的特征进行建模,寻找出人类移动的规律,然后来进行轨迹的分析同时进行目的地的预测,利用大数据和建模的方法对人类行为进行诠释,从而更好地利用大量的位置信息,方便人们的生活。

而如果可以提前预测用户的下一个即将到达目的地的话,就可以发展更多便利的、个性化的服务,提高用户个人的使用体验。例如智能的交通导航,如果检测到预测的目的地路线上出现了交通堵塞现象时,可以智能地提醒使用者,并提供多条可以选择的路线。或者检测到下个可能访问到的位置处是娱乐场所时,系统可以自动提供该场所的信息或者沿线上其他相似的场所的信息,如果用户对这些信息感兴趣就可以顺道去消费。或者用户在某个时间段都会做同一件事,产生相似的轨迹路线,那么在下次这个时间段系统就会事先预测好这个目的地,然后推荐给用户多条可以选择的路线。这些功能都可以通过lbs结合用户的历史轨迹路线再加上合适的算法来实现,由此可见位置预测技术是比较有价值的研究方向。

因此考虑到移动交通数据的大爆发,如何根据历史轨迹数据对用户的轨迹进行一个实时地分析、预测已经成为一个热点的问题,同时通过这种方法充分利用海量的交通数据,从而解决人类生活过程中遇到的一些困难问题,例如交通阻塞问题,交通线路推荐等等。所以需要运用新的方法和模型来解决这一类的轨迹预测问题,提高预测的精度。



技术实现要素:

本发明解决的技术问题是在收集到足够的历史轨迹数据条件下,对用户的出行轨迹进行一个预测,同时尽可能提高预测的精准度。

为了达到此目的,本发明采用以下的技术方案。

一种基于回声状态网络的历史轨迹目的地预测方法,包括以下步骤:

s1、预测服务提供者对某一区域中的移动物体的行驶轨迹数据进行预处理,再将预处理后的数据分为训练数据集和测试数据集;

s2、根据目的地预测的基本特点构建基础回声状态网络模型;

s3、预测服务提供者通过设定模型评估标准,利用训练数据集对步骤s2中的基础回声状态网络模型进行训练,得到回声状态网络模型;

s4、通过测试数据集对回声状态网络模型的不同参数进行测试与优化,选出测试结果最优的参数表;

s5、将s4中的最优的参数表输入到回声状态网络模型中,得到基于回声状态网络的目的地预测模型;

s6、预测服务提供者利用预测模型对轨迹数据提供者的实时轨迹数据进行预测,将预测结果返回轨迹数据提供者。

进一步的,所述的预处理是将行驶轨迹数据行进筛选、gps修正和清洗操作;

所述筛选包括淘汰gps只有一个数值的无效轨迹;所述清洗包括删除gps修正不能修改的轨迹;

所述训练数据集包括公开的或者是用户个人的行驶轨迹数据;所述测试数据集包括轨迹提供者提供的行驶轨迹数据;

再分别将训练数据集和测试数据集中的数据分成车辆轨迹数据和行人轨迹数据,目的在于对于不同的类型轨迹,训练出来的目的地预测模型的参数是不同的。

进一步的,训练数据集的数据获取具体为:确定需要进行预测任务的区域,确定该区域可能产生轨迹的移动物体集合s,获取s中的个体作为历史行驶轨迹训练数据的候选者,再通过配置的gps定位仪器收集这些个体的固定时间间隔内的gps数据,该数据作为训练数据集的数据。

进一步的,步骤s2所述的基础回声状态网络模型是基于回声状态网络(echostatenetwork,esn)机制的神经网络模型,包括有k个输入节点的输入层、有m个节点的隐藏层和有l个节点的输出层,其中,输入层的的状态为u(t),隐藏层的状态为x(t),输出层的状态为y(t),各层之间的关系如下:

输入层与隐藏层之间存在连接权值矩阵为win,隐藏层到隐藏层的连接权值矩阵为w,隐藏层到输入层的连接权值矩阵为wout,同时存在从前一个输出层到当前隐藏层的连接,其连接权值矩阵为wback;

各层的状态公式如下:

u(t)=[u1(t),u2(t),u3(t),...,uk(t)]t

x(t)=[x1(t),x2(t),x3(t),...,xm(t)]t

y(t)=[y1(t),y2(t),y3(t),...,yl(t)]t

其中,uk(t)表示第k个输入节节点的第t个输入状态,t表示第t个状态,k表示输入节点个数;xm(t)表示第m个隐藏层节点的第t个隐藏层状态,m表示隐藏层节点个数;yl(t)表示第l个输出层节点的第t个状态,l表示输出层节点个数。

进一步的,隐藏层的状态x(t)在接收到输入层的输入后都会进行更新,其状态更新方程为:

x(t+1)=f(win*u(t+1)+w*x(t))

其中,win和w都是随机初始化的参数,并且在整个过程中保持不变,u(t+1)和x(t+1)分别为当前的输入层和隐藏层的状态,而x(t)表示当前隐藏层上一个状态,当t=0时,x(t)用0进行初始化,f是神经元激活函数,在esn中采用双曲正切函数tanh;

输出层的状态为y(t)的输出方程为:

y(t)=wout[1;u(t);x(t)]

回声状态网络只需要训练得到wout即可,因此就变成一个线性回归的问题,需要配合岭回归进行推导。

进一步的,步骤s3所述的训练包括如下步骤:

s31、使用训练数据集中的任一组数据作为初始输入运行基础回声状态网络模型,同时将该模型的隐藏层初始化状态设为x(0)=0,然后输入训练数据集中的其他数据更新该模型;

s32、将隐藏层的状态x(t)添加到状态集合x,状态集合x用于存储隐藏层状态,同时将输出层获取到的值ytarget添加到该模型训练得到的输出数据集合ytarget;

s33、设置数据预热值,用于过滤输出数据集合ytarget中不准确的轨迹,具体来说就是得到的预测目的地与真实目的地不一致的轨迹,这部分不准确的轨迹用于预热基础回声状态网络模型,使之产生回声性质,提高预测精度提高;

s34:利用上述得到的数据ytarget,用如下的公式进行计算得到隐藏层到输入层的连接权值矩阵wout:

wout=ytargetxt(xxt+λ/)-1

其中ytarget是指回声状态网络模型得到的输出数据,x=[1;u;x]为u(t)和x(t)标准化的表达式,λi表示单位矩阵。

进一步的,对步骤s3所述的模型评估标准如下:

采用平均haversine(meanhaversinedistance,mhd)距离,通过两个点的经纬度来计算两个点的距离,其计算公式如下:

其中,a表示中间参数,d表示预测点和实际轨迹目的地点的距离,α1和α2分别表示不同地点的纬度,β1和β2分别表示不同地点的经度,r表示计算的地点所在的曲面的半径,这里的曲面可以指地球,所以r可以用地球的半径6371km来代替;d与预测点和实际轨迹目的地点的实际距离越接近,则说明训练后得到的模型越准确。

进一步的,步骤s4具体包括回声状态网络模型每生成一组参数,则输入测试数据集的数据,运行回声状态网络模型,得到预测结果,根据预测结果与真实结果的差距优化参数,选出测试结果最优的参数作为参数表;所述参数包括权值矩阵为w_in和权值矩阵为w。

上文中所述神经网络模型是基于回声状态网络(echostatenetwork,esn)机制的,这种一种新型的递归型神经网络,由输入层,隐藏层(亦称储备池)和输出层组成,并且隐藏层到隐藏层之间还存在一个连接,可以用来保存序列之间存在的关系,即保留前面时刻状态的信息。而与一般的循环神经网络rnn相比,回声状态网络一个比较突出的特点在于esn的输入层到隐藏层,隐藏层到隐藏层之间的连接权值是随机初始化而且是固定不变的,所以只需要通过数据训练得到隐藏层到输出层的连接权值即可,这样整个问题就可以转化为线性回归的问题,不需要rnn训练中的后向传播算法,所以比起其他神经网络,训练效率更快,模型训练时间更短。

本发明相对于现有技术具有如下的优点及效果:

本发明解决了如何利用历史轨迹数据进行预测模型的训练,同时可以让预测模型基于历史轨迹数据实现一个参数的自动优化,保证使预测模型在训练数据上的评价最优,同时使模型的预测精确度有了提高。

与一般的循环神经网络rnn相比,回声状态网络一个比较突出的特点在于esn的输入层到隐藏层,隐藏层到隐藏层之间的连接权值是随机初始化而且是固定不变的,所以只需要通过数据训练得到隐藏层到输出层的连接权值即可,这样整个问题就可以转化为线性回归的问题,不需要rnn训练中的后向传播算法,所以比起其他神经网络,训练效率更快,模型训练时间更短。同时可以将其运用到商业运营上,提高运营的效率,同时缓解大量由于信息不充分带来的交通问题。

附图说明

图1为实施例一种基于回声状态网络的历史轨迹目的地预测方法的流程图;

图2为实施例利用基础回声状态网络模型训练的结果图;

图3为实施例回声状态网络模型测试的结果图。

具体实施方式

下面结合附图及实施例,对本发明作进一步的说明。

如图1所示的一种基于回声状态网络的历史轨迹目的地预测方法,包括以下步骤:

s1、对某一区域中的移动物体的行驶轨迹数据进行预处理,再将预处理后的数据分为训练数据集和测试数据集;

具体的,对需要进行预测任务的区域,确定该区域可能产生轨迹的移动物体集合s,对s中的每个个体进行分析研究,考虑哪个个体能够产生比较有价值而且有规律的轨迹历史信息数据,然后通过配置的gps定位仪器收集该物体的固定时间间隔内(每5秒一次)的gps数据,然后将该数据作为训练数据集的数据以供模型训练使用。

所述的预处理是将行驶轨迹数据行进筛选(淘汰无效的轨迹,如gps只有一个数值)、gps修正和清洗(对于一些gps修正不能修改的轨迹,如轨迹中某些点偏差太远,无法修复出正确轨迹,则删除这些轨迹)操作;

s2、根据目的地预测的基本特点(如时间,经纬度坐标等)构建基础回声状态网络模型;

所述的基础回声状态网络模型是基于回声状态网络(echostatenetwork,esn)机制的神经网络模型,包括有k个输入节点的输入层、有m个节点的隐藏层和有l个节点的输出层,其中,输入层的的状态为u(t),隐藏层的状态为x(t),输出层的状态为y(t),各层之间的关系如下:

输入层与隐藏层之间存在连接权值矩阵为win,隐藏层到隐藏层的连接权值矩阵为w,隐藏层到输入层的连接权值矩阵为wout,同时存在从前一个输出层到当前隐藏层的连接,其连接权值矩阵为wback;

各层的状态公式如下:

u(t)=[u1(t),u2(t),u3(t),...,uk(t)]t

x(t)=[x1(t),x2(t),x3(t),...,xm(t)]t

y(t)=[y1(t),y2(t),y3(t),...,yl(t)]t

其中,uk(t)表示第k个输入节节点的第t个输入状态,t表示第t个状态,k表示输入节点个数;xm(t)表示第m个隐藏层节点的第t个隐藏层状态,m表示隐藏层节点个数;yl(t)表示第l个输出层节点的第t个状态,l表示输出层节点个数。

隐藏层的状态x(t)在接收到输入层的输入后都会进行更新,其状态更新方程为:

x(t+1)=f(win*u(t+1)+w*x(t))

其中,win和w都是随机初始化的参数,并且在整个过程中保持不变,u(t+1)和x(t+1)分别为当前的输入层和隐藏层的状态,而x(t)表示当前隐藏层上一个状态,当t=0时,x(t)用0进行初始化,f是神经元激活函数,在esn中采用双曲正切函数tanh。

输出层的状态为y(t)的输出方程为:

y(t)=wout[1;u(t);x(t)]

其中,u(t)和x(t)标准化的表达式为[1;u;x]。

s3、预测服务提供者通过设定模型评估标准,利用训练数据集对步骤s2中的基础回声状态网络模型进行训练,得到训练后的回声状态网络模型;

所述的模型评估标准如下:

采用平均haversine(meanhaversinedistance,mhd)距离,通过两个点的经纬度来计算两个点的距离,其计算公式如下:

其中,a表示中间参数,d表示预测点和实际轨迹目的地点的距离,α1和α2分别表示不同地点的纬度,β1和β2分别表示不同地点的经度,r表示计算的地点所在的曲面的半径;d与预测点和实际轨迹目的地点的实际距离越接近,则说明训练后得到的模型越准确。

所述的训练包括如下步骤:

s31、使用训练数据集中的任一组数据作为初始输入运行基础回声状态网络模型,同时将该模型的隐藏层初始化状态设为x(0)=0,然后输入训练数据集中的其他数据更新该模型;

s32、将隐藏层的状态x(t)添加到状态集合x,状态集合x用于存储隐藏层状态,同时将输出层获取到的值ytarget添加到该模型训练得到的输出数据集合ytarget;

s33、设置数据预热值,用于过滤输出数据集合ytarget中不准确的轨迹,具体来说就是得到的预测目的地与真实目的地不一致的轨迹,这部分不准确的轨迹用于预热基础回声状态网络模型,使之产生回声性质,提高预测精度提高;

s34:利用上述得到的数据ytarget,用如下的公式进行计算得到隐藏层到输入层的连接权值矩阵wout。

wout=ytargetxt(xxt+λ/)-1

其中ytarget是指回声状态网络模型得到的输出数据,x=[1;u;x]为u(t)和x(t)标准化的表达式,λi表示单位矩阵。

s4、通过测试数据集对回声状态网络模型的不同参数(如权值矩阵)进行测试与优化,具体来说,每生成一组参数,输入测试数据,运行回声状态网络模型,得到预测结果,根据预测结果与真实结果的差距优化参数。参数选出测试结果最优的参数表;

s5、将s4中的最优的参数表输入到回声状态网络模型中,得到基于回声状态网络的目的地预测模型;

s6、利用预测模型对轨迹数据提供者的实时轨迹数据进行预测,将预测的可能的目的地结果返回轨迹数据提供者。

图2和图3是采用得到的预测模型来对波尔图市的442辆出租车的轨迹进行建模和预测的结果。行驶轨迹数据是波尔图市2013年7月1日到2015年6月30日为期一年的442辆出租车正常运营数据,采用的是基于回声状态网络模型的预测模型,利用442辆出租车正常运营数据进行模型的训练。

图2表示出了回声状态网络训练的结果,从该图的覆盖率上可以看出,(三角形表示预测结果,圆形表示实际结果)训练的效果符合预期,预测的目的地基本上都能覆盖到实际的目的地,模型训练的结果符合预期。

图3表示出了回声状态网络模型进行测试的实际结果,从该图的覆盖率上可以看出,(三角形表示预测结果,圆形表示实际结果)测试的效果基本符合预期,测试的目的地基本上都能覆盖到实际的目的地,模型测试的结果符合预期,可以将该模型用于实际的预测使用。

以上所述,仅为本发明较佳的实施例,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明所公开的范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都属于本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1