一种基于深度学习的城市公交线路查询方法与流程

文档序号:12366023阅读:388来源:国知局
一种基于深度学习的城市公交线路查询方法与流程
本发明涉及公交路线查询
技术领域
,尤其是涉及一种能够提供乘客准确、及时、优化的公交信息服务,生成出行辅助计划,主动而合理的引导乘客出行的基于深度学习的城市公交线路查询方法。
背景技术
:随着我国汽车产业的逐步发展,城市道路拥堵问题日益严重。通过有效分析目前城市公交线路和站点的相关数据,并在此基础上建立合理的数学分析模型对大规模公交线路数据进行充分挖掘,找出不同线路之间彼此存在的内在关系,从而为乘客提供合理的公交出行路线。传统的公交线路查询算法有迪杰斯特拉(DijKstra)算法及其相应的改进算法、Floyd算法、Moore算法、深度优先搜索算法以及遗传算法等。基于目前的研究现状,诸如此类算法对于大规模的公交线路数据进行有效成分分析及彼此内联关系的分析及时间优化上还存在一定的不足,难以得到一个较为合理的公交出行路线。技术实现要素:本发明的发明目的是为了克服现有技术中的针对现有城市公交的相关数据,根据目前传统的算法进行线路查询,由于换成次数、出行时间、起始距离以及行程费用等因素的相互制约,因此传统方法难以得到一个较为合理的公交出行路线的不足,提供了一种能够提供乘客准确、及时、优化的公交信息服务,生成出行辅助计划,主动而合理的引导乘客出行的基于深度学习的城市公交线路查询方法。为了实现上述目的,本发明采用以下技术方案:一种基于深度学习的城市公交线路查询方法,包括如下步骤:(1-1)采集公交线路相关数据;(1-2)对公交线路数据进行预处理;(1-3)采用深度自动编码器(DAE)和主成分分析(PCA)相结合进行公交线路数据训练,获得改进的深度自动编码器(PCA-DAE)神经网络模型;(1-4)训练大规模公交线路数据,得到改进的深度神经网络自动编码器PCA-DAE预测模型;(1-5)利用训练好的PCA-DAE预测模型进行公交线路查询。作为优选,所述步骤(1-1)包括如下步骤:(2-1)采集各城市公交线路数据;(2-2)采集公交各线路的站点数据;(2-3)采集各线路的起止出发时间,停运时间,各相邻站点之间行驶需要的时间等数据,形成线路时间数据链条;(2-4)采集各线路相邻站点间的距离数据,形成线路距离数据链条;(2-5)采集各线路的行程费用数据。作为优选,所述步骤(1-3)包括如下步骤:(3-1)DAE的预训练:采用PCA将经过预处理的公交线路数据生成DAE神经网络的输入层;用无监督的方法将DAE的隐含层全部初始化,然后再用逐层wake-sleep算法将每个隐含层训练为自动关联器,实现输入数据的重构,其基本步骤可总结如下:(3-1-1)逐层构建单层神经元,每次构造一个单层网络;(3-1-2)当所有层构造完后,每层采用wake-sleep算法进行调优;每次仅调整一层,逐层调整;(3-2)在神经网络模型的输出层之后加入支持向量机(SVM)分类器,将整个神经网络训练成能完成分层特征提取和数据分类任务的多重感知器;(3-3)DAE的微调:通过监督学习,利用梯度下降法调整网络参数:采用BP算法将深度自动编码器的输入层、输出层和所有隐含层视为一个整体,用有监督学习算法进一步调整经过预训练的神经网络,经过多次迭代后,所有权值及偏置均被优化。其中,PCA是一种目标统计特性的最佳正交变换,将原本高维空间投影到一个新的低维度且相互正交的空间上,找出样本的主要成分来重新表达图像的某些细节特征。假设有m个训练样本,特征维度均为n维,此时所有训练样本的特征向量就可以用矩阵(3.1)表示为:P=p11p12p13...p1np21p22p23...p2np31p31p33...p3n............pm1pm2pm3...pmn---(3.1)]]>其中行数为训练样本的数量,列数为每个样本的特征维度。矩阵P的样本均值为P‾={Σi=1mpi1m,Σi=1mpi2m,...,Σi=1mRinm}---(3.2)]]>降维之前需要计算矩阵P的协方差矩阵。记P={q1,q2,q3,…,qn},其中q1=[p11,p21,p31,…,pm1]T,q2=[p12,p22,p32,…,pm2]T其它的依次类推。协方差矩阵计算如下:CP=cov(q1,q1)cov(q1,q2)cov(q1,q3)...cov(q1,qn)cov(q2,q1)cov(q2,q2)cov(q2,q3)...cov(q2,qn)cov(q3,q1)cov(q3,q2)cov(q3,q3)...cov(q3,qn)............cov(qn,q1)cov(qn,q2)cov(qn,q3)...cov(qn,qn)---(3.3)]]>最后计算协方差矩阵CP的特征值和特征向量。假设取所有特征值中的前m个值。此时特征向量矩阵K={k1,k2,k3,…,km}T,最后的降维矩阵可以表示为:Result=[P-P‾]×KT---(3.4)]]>通过上式可以有出最后降维的维度为m,因此特征值的选取个数即是降维的维数。其中,DAE由编码器、解码器和隐含层组成。编码器是输入x到隐含表示h的映射,表示为:h=f(x)=Sf(w+bn),其中,w为权重,b为偏置,Sf是非线性激活函数,一般为逻辑函数,其表达式为:sigmoid(z)=1/(1+z-1)解码器函数g(h)将隐含层数据映射回重构y,表示为:y=g(h)=Sg(w′h+by)其中,Sg是解码器的激活函数,一般为线性函数或者sigmoid函数。训练DAE的过程是在训练样本集D上寻找参数θ={W,by,bh}的最小化重构误差,重构误差的表达式为:JAE=Σx∈DL(x,g(f(x)))]]>其中,L为重构误差函数,一般可以用平方误差函数或交叉熵损失函数,二者分别表示为:L(x,y)=||x-y||2L(x,y)=-Σi=1dxilogyi+(1-xi)log(1-yi)]]>其中,平方误差用于线性Sg,交叉熵损失函数用于sigmoid。其中,wake-sleep算法:A、wake阶段:认知过程,通过下层的输入特征(Input)和向上的认知(Encoder)权重产生每一层的抽象表示(Code),在通过当前的生成(Decoder)权重产生一个重建信息(Reconstruction),计算输入特征和重建信息残差,使用梯度下降修改层间的下行生成(Decoder)权重。B、sleep阶段:生成过程,通过上层概念(Code)和向下的生成(Decoder)权重,生成下层的状态,再利用认知(Encoder)权重产生一个抽象景象。利用初始上层概念和新建抽象景象的残差,利用梯度下降修改层间向上的认知(Encoder)权重。以上步骤的主要目的是进行网络参数的初始化。作为优选,所述步骤(1-4)包括如下步骤:(4-1)PCA-DAE在分布式系统上训练大规模公交线路数据:在CPU+GPU协同计算集群上实现。作为优选,所述步骤(1-5)包括如下步骤:(5-1)输入数据为乘客出行始发站和终点站的公交站点数据;(5-2)输出结果为公交出行路线方案:(5-2-1)有直达路线的优先采用直达路线;(5-2-2)在没有直达的情况下优先考虑一次换乘方案,并将所有的一次换乘方案依次按照出行时间长短、距离远近、费用多少等因素进行排序,供乘客进行选择;(5-2-3)当没有一次换乘方案的条件下优先考虑二次换乘方案,并将所有的二次换乘方案依次按照(5-2-2)中给定的相关因素进行排序,供乘客进行选择;(5-2-4)同理,当没有二次换乘方案的条件下优先考虑三次换乘方案,并将所有的三次换乘方案也依次按照(5-2-2)中给定的相关因素进行排序,供乘客进行选择;(5-2-5)当需要超过3次以上换乘才能达到目的地的情况下,能告知乘客合理选择其它的出行方式。因此,本发明具有如下有益效果:深度学习算法提供乘客准确、及时、优化的公交信息服务,生成出行辅助计划,主动而合理的引导乘客出行,不仅方便了乘客,还让缺少秩序的交通出行变得有秩序,使客流分布更加合理。附图说明图1是本发明的一种方法流程图;图2是本发明的一种全国公交线路数据集合示意图;图3是本发明的一种自动编码模型;图4是本发明的一种改进的深度自动编码器PCA-DAE预测模型。具体实施方式下面结合附图和具体实施方式对本发明做进一步的描述。如图1所述的实施例是一种基于深度学习的城市公交线路查询方法,包括如下步骤:步骤100:采集公交线路相关数据:步骤110:采集各城市公交线路数据;步骤120:采集公交各线路的站点数据;步骤130:采集各线路的起止出发时间,停运时间,各相邻站点之间行驶需要的时间等数据,形成线路时间数据链条;步骤140:采集各线路相邻站点间的距离数据,形成线路距离数据链条;步骤150:采集各线路的行程费用数据。对于公交数据按照一定规律对其进行分组,形成相应的数据集;以城市为单位进行汇总,最后将形成全国的公交线路数据;将城市数据当成父节点,对每个城市的所有公交路线进行统计,将上述五种数据分别放在不同路线的子数据集中,最后将得到一个较大规模的全国公交路网数据集合,如图2所示。步骤200:对公交线路数据进行预处理:根据上述的五类公交数据,对其进行统一归一化处理,获得各个城市的公交线路数据记为(X1,X2,X3…,Xn),其中X1表示第一条线路的相关数据,X2表示第二条线路的相关数据,其它的依次类推;每条公交线路数据具体包含文中上述的五种数据,如路线数据R1,R1中包含的站点数据(S1,S2,S3…,Sn),相邻站点行程时间及起止出发时间数据(T1,T2,T3…,Tn-1),相邻站点行程距离数据(D1,D2,D3…,Dn-1)和票价数据M1。步骤300:采用深度自动编码器(DAE)和主成分分析(PCA)相结合进行公交线路数据训练,获得改进的深度自动编码器(PCA-DAE)神经网络模型;步骤310:DAE的预训练:采用PCA将经过预处理的公交线路数据生成DAE神经网络的输入层;用无监督的方法将DAE的隐含层全部初始化,然后再用逐层wake-sleep算法将每个隐含层训练为自动关联器,实现输入数据的重构,其基本步骤可总结如下:步骤311:逐层构建单层神经元,每次构造一个单层网络;步骤312:当所有层构造完后,每层采用wake-sleep算法进行调优;每次仅调整一层,逐层调整。通过PCA得到第一层公交数据流记为code(h1(1),h2(1),h3(1),…,ht(1),…,hn(1))。本发明采用的自动编码模型如图3所示,我们将第一层输出的code当成第二层的输入input数据流,将input公交线路数据流输入一个encoder编码器,就会得到一个code,这个code也就是输入的一个表示,为了确定输出code就是input的一个表示,加一个decoder解码器,这时候decoder就会输出一个信息reconstruction,输出的这个信息和一开始的输入数据input是比较接近的,在理想情况下几乎是一样的,我们就有理由相信这个code是输入input的最好诠释。所以,每一层就是通过调整encoder编码器和decoder解码器的参数,使得重构误差最小,此时就得到了输入input数据流的第一个表示了,即编码code。因为是无标签数据,所以误差的来源就是直接重构后与原输入input相比得到。从而得到第二层的参数,并且得到第二层输入公交数据流的code(h1(2),h2(2),h3(2),…,ht(2),…,hn(2)),也就是原输入信息(x1,x2,x3,…,xt,…,xn)的第二个表达了。其他层利用同样的方法进行训练,训练当前层,前面层的参数都是固定的,这时候他们的decoder已经不需要了。步骤320:在神经网络模型的输出层之后加入支持向量机(SVM)分类器,将整个神经网络训练成能完成分层特征提取和数据分类任务的多重感知器;步骤330:DAE的微调:通过监督学习,利用梯度下降法调整网络参数:采用BP算法将深度自动编码器的输入层、输出层和所有隐含层视为一个整体,用有监督学习算法进一步调整经过预训练的神经网络,经过多次迭代后,所有权值及偏置均被优化。步骤331:随机选取类标数据样本用BP算法对神经网络进行训练,计算各层的输出;步骤332:求出各层的重构误差,并根据误差修正权值和偏置;步骤333:根据性能指数判定误差是否满足要求,如果未能满足要求则重复步骤331和步骤332,直到整个网络输出满足期望要求;步骤334:得出最后改进的深度自动编码器PCA-DAE预测模型如图4所示。步骤400:训练大规模公交线路数据,得到改进的深度神经网络自动编码器PCA-DAE预测模型;PCA-DAE在分布式系统上训练大规模公交线路数据:在CPU+GPU协同计算集群上实现。步骤500:利用训练好的PCA-DAE预测模型进行公交线路查询。步骤510:输入数据为乘客出行始发站和终点站的公交站点数据;步骤520:输出结果为公交出行路线方案:步骤521:有直达路线的优先采用直达路线;步骤522:在没有直达的情况下优先考虑一次换乘方案,并将所有的一次换乘方案依次按照出行时间长短、距离远近、费用多少等因素进行排序,供乘客进行选择;步骤523:当没有一次换乘方案的条件下优先考虑二次换乘方案,并将所有的二次换乘方案依次按照步骤522中给定的相关因素进行排序,供乘客进行选择;步骤524:同理,当没有二次换乘方案的条件下优先考虑三次换乘方案,并将所有的三次换乘方案也依次按照步骤522中给定的相关因素进行排序,供乘客进行选择;步骤525:当需要超过3次以上换乘才能达到目的地的情况下,能告知乘客合理选择其它的出行方式。本发明使用深度学习自动编码器DAE模型对大规模公交线路数据进行分析,从而完成起止站点间线路的查询任务。完成预训练和微调的DAE具有生物神经系统的基本特征,在一定程度上反映了人脑的若干功能,是对生物系统的成功模拟,实现了无监督学习和监督学习的有机结合,且不同隐含层能学到不同的特征,低阶隐含层为高阶隐含层提供特征模式,便于高阶隐含层进行模式组合。同时,DAE的拓扑结构完整,具有强大的非线性拟合能力,能发现数据的分布式特征表示,提取数据的潜在分层特征,获取原始输入的“层次型分组”或“部分-整体分解”结构,因而可以更好地表示输入数据,具有大规模并行、分布式处理、自组织和自学习等优点。因此,本发明具有如下有益效果:深度学习算法提供乘客准确、及时、优化的公交信息服务,生成出行辅助计划,主动而合理的引导乘客出行,不仅方便了乘客,还让缺少秩序的交通出行变得有秩序,使客流分布更加合理。应理解,本实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1