本发明涉及公共交通的技术领域,更具体地说,涉及一种基于bp神经网络和聚类分析法的公交车“两率”检查方法。
背景技术:
目前公交总体服务质量和精细化管理水平与建设国家中心城市的发展定位及广大市民群众对公交出行的舒适性要求仍有一定的差距。通过开展“两率”专项检查,结合日常线路考评,可以进一步提升公交行业服务水平及服务形象。人工检查是进行“两率”专项检查的最基本的数据获取方法,检查数据是广州市公交行业营运及服务质量监管的主要依据。这就要求检查结果必须真实可靠,能够体现反映公交车真实的运营状况。
“两率”检查即对公交行业“营运服务违章率”、“服务设施违章率”进行检查记录的一项专项工作。该项检查工作不同于交通量检查,无法全部通过视频监控完成。由于检查项目的特殊性,导致目前的检查行为仍然需要大量的人力去完成,其中包括检查前的线路分配以及检查中的路线规划。基于bp神经网络的检查前线路的分配可以替代人工对众多线路的查询与分类;聚类分析法对检查站点的选择中采用欧式距离法计算最短距离,完成对城市中所有公交站点检查点的选择,基于以上两种方法的检查方法,可更加精确的完成“两率”检查,克服以往检查人员分配过程繁琐以及检查过程效率低的缺点,提高检查的精度和效率。
技术实现要素:
本发明的目的在于弥补现有公交“两率”检查的不足,综合考虑人力物力的节约,提供一种精确的检查方法。本发明提出一种基于bp神经网络和聚类分析法的公交车“两率”检查方法,克服了以往检查人员分配过程繁琐以及检查过程效率较低的缺点,提高了检查方法的精度和效率。
为了达到上述目的,本发明采用以下技术方案:
本发明一种基于bp神经网络和聚类分析法的公交车“两率”检查方法,包括下述步骤:
(1)获取检查所涉及路线及路线条数n,检查城市内的所有路线途经站点集合a,检查城市行政区划分;
(2)基于bp神经网络的检查基本起始站点选择,具体步骤如下:
(2-1)bp神经网络参数设定,并设定检查基本起始点的选择模型中第1层为输入层,网络第3层为输出层,隐含层是介于输入层和输出层之间的中间层;
(2-2)检测起始点判定,经过大量样本数据训练的bp网络,通过得到net参数达到对检查起始点初步选择的目的;
(2-3)bp神经网络的学习;利用bp神经网络的学习,对可以作为调查起始点的相关信息进行数据训练,以是否选取该点作为调查起始点为bp网络的输出,经过大量样本数据训练的bp网络,通过得到net参数达到对调查起始点的选择目的;
(3)步骤(2)中所选站点的所有路线有可能经过城市内两个以上的行政区,对不同行政区内重复线路进行处理;
(4)基于聚类分析法对选择的站点进行整合及区域划分;
(5)根据步骤(4)站点整合的结果划分检查所涉及的主要片区及检查人员。
作为优选的技术方案,步骤(2-1)中,所述输入层由影响站点选择的因素组成,包括:经过该站点的公交线路数量大于等于m,站点类型、站点是否邻近地铁站、站点所属城市行政区,站点类型包括起始站、途经站、终点站和枢纽站;
所述输出层以是否选择该站点作为检查起始点作为输出矩阵,该矩阵组成元素为0和1,其中0表示不选择该站点作为检查起始点,1表示该站点作为检查起始点;
所述中间层与输入层和输出层完全连接,连接强度用连接权表示。
作为优选的技术方案,步骤(2-2)具体为:根据选择目的的差异化对bp网络参数进行相应的测试,当输入待预测的影响因素后,bp网络的输出即为对站点选择的判定结果。
作为优选的技术方案,步骤(2-3)中,bp神经网络学习的具体方法如下:
(2-3-1)给各连接权值分别赋予(-1,1)内的随机数,并设置误差函数e,给定计算精度值和最大训练次数m;
(2-3-2)则第k个输入样本向量x(k)及对应期望输出向量d0(k)分别表示为:
x(k)=(x1(k),x2(k),…,xn(k))和d0(k)=(d1(k),d2(k),…,dq(k));
式中:k-样本数据个数;n-输入层神经元个数;q-输出层神经元个数;
(2-3-3)计算隐含层每个神经元的输入hih(k),随机利用输入以及激活函数得到隐含层各神经元的输出hoh(k):
式中:yio(k)-输入层输入向量;yoo(k)-输入层输出向量;who-隐含层与输出层的连接权值;bo-输出层各神经元的阈值;bh-隐含层各神经元的阈值;p-隐含层神经元个数。
(2-3-4)通过网络期望及实际输出,得到误差函数对输出层神经元的偏导数δo(k)
δo(k)=(do(k)-yoo(k))yoo(k)(1-yoo(k))
(2-3-5)利用隐含层到输出层的连接权值who(k)、输出层的δo(k)和隐含层的输出hoh(k)得到误差函数对隐含层神经元的偏导数δh(k)
(2-3-6)运用输出层神经元的δo(k)和隐含层神经元的输出hoo(k)修正连接权值who(k)和阈值bo(k):
n为调整前,n+1为调整后,η为学习率,在(0,1)之间取值;
(2-3-7)利用隐含层各神经元的δh(k)和输入层各神经元的输入xi(k)修正连接权值和阈值bh(k)
(2-3-8)全局误差e:
(2-3-9)判断网络误差能否达到设定的结束要求,当e<e或训练次数大于设置的m值,则算法结束,否则,随机选取下一个学习样本及对应的期望输出,返回到步骤(2-3-3),进入下一轮训练。
作为优选的技术方案,步骤(3)中,对筛选出的公交线路进行分析处理,统计每个行政区选择站点的所有线路,将不同区域中的重复路线删除。
作为优选的技术方案,步骤(4)中,整合过程中的聚类分析主要是对上述所选站点进行的,对站点聚类分析后的结果进行整理后,选出距离某一片区较近站点的类,最终得出检查城市每个行政区的检查起始点分布,站点聚类分析的具体过程为:
(4-1)数据变换处理
在聚类分析过程中,首先应对原始数据进行标准化处理,如果原始数据为:
式中xij表示第j个行政区中第i个站点,i为行政区内站点编号,j为城市行政区编号;
对原始数据进行标准化处理,公式如下:
式中:x′ij表示标准化数据,
(4-2)计算聚类统计量
采用欧氏距离来计算最短距离,根据欧氏距离的计算公式,设类gp与gq合并为新类记为gr,则任一类gk与gr的距离是:
计算各行之间的欧氏距离,得到一个m×m的距离矩阵,其中dik表示第i行与k行的距离:
本发明与现有技术相比,具有如下优点和有益效果:
1、本发明采取了运用bp神经网络的技术手段,解决了检查起始点的选取以及前期检查人员如何分配的技术问题,从而达到了缩短“两率”检查前期人员分配工作的时间,提高分配工作的灵活性的技术效果。
2、本发明采取了运用聚类分析技术手段,解决了整合所选调查起始点的技术问题,从而达到了减少检查人员不必要的路途时间,提高检查效率的技术效果,整合后的调查起始站点有利于调查人员在该站点范围内实现调查公交线路的衔接,增加调查人员的有效调查时间,节省调查时间。
附图说明
图1为本发明bp三层神经元网络结构图;
图2为本发明bp神经网络学习算法流程图;
图3(a)、图3(b)分别为本发明样本的实际输出和网络仿真输出图;
图4(a)、图4(b)为实施例运用本发明的检查方法得到的两处检查起始点分布详情图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例
本实施例基于bp神经网络和聚类分析法的公交车“两率”检查方法,步骤如下:
(1)获取检查所涉及路线及路线条数383条,检查城市内的所有路线途经站点集合a,广州市行政区划分;
(2)基于bp神经网络的检查基本起始站点选择;
1)bp神经网络参数设定
检查基本起始点的选择模型中第1层为输入层,由影响站点选择的因素组成,包括:经过该站点的公交线路数量大于等于15,站点类型(起始站、途经站、终点站、枢纽站)、站点是否邻近地铁站、站点所属城市行政区等。对站点类型依次编号为1、2、3、4;站点邻近地铁站记为1,远离地铁站记为0;所要检查的越秀区、荔湾区、海珠区、白云区、天河区、黄埔区依次编号为1、2、3、4、5、6。
网络第3层为输出层,输出层以是否选择该站点作为检查起始点作为输出矩阵,该矩阵组成元素为0和1,其中0表示不选择该站点作为检查起始点,1表示该站点作为检查起始点。
隐含层是介于输入层和输出层之间的中间层,并与输入层和输出层完全连接,连接强度用连接权表示。如图1为bp三层神经元网络结构图。
2)检查起始点判定
本发明的测试数据中,依据选择目的的差异化对bp网络参数进行相应测试,当输入影响因素后,bp网络的输出即为对站点选择的判定结果。
3)bp网络的学习算法
图2为bp神经网络学习算法流程图,从图中可以看出,其学习算法的流程如下:
①给各连接权值赋予(-1,1)内的随机数,设置误差函数e、计算精度值和最大训练次数m。
②第k个输入样本及对应期望输出:
x(k)=(x1(k),x2(k),…,xn(k))和d0(k)=(d1(k),d2(k),…,dq(k))
③计算隐含层每个神经元的输入hih(k),随后借助输入以及激活函数计算隐含层各神经元的输出hoh(k):
④运用网络期望及实际输出,得到误差函数对输出层的各神经元的偏导数δo(k)
δo(k)=(do(k)-yoo(k))yoo(k)(1-yoo(k))
⑤利用隐含层到输出曾的连接权值who(k)、输出层的δo(k)和隐含层的输出hoh(k)计算误差函数对隐含层各神经元的偏导数δh(k)
⑥利用输出层各神经元的δo(k)和隐含层各神经元的输出hoo(k)来修正连接权值who(k)和阈值bo(k):
n为调整前,n+1为调整后,η为学习率,在(0,1)之间取值。
⑦使用隐含层各神经元的δh(k)和输入层各神经元的输入xi(k)修正连接权和阈值bh(k)
⑧全局误差e:
⑨判断其网络误差是否设定条件,当e<e或训练次数大于设定的最大次数m,则算法结束。否则,随机选取下一个学习样本及对应年的期望输出,返回到第三步,进入下一轮训练。
图3(a)、图3(b)为运用以上方法得到样本的实际输出和网络仿真输出的样本训练结果。从图中可以看出同样的样本值做的两次训练的结果实际输出和仿真结果非常接近。
(3)处理不同行政区内重复线路;
用以上所述方法得到的409条公交线路进行分析处理,统计每个行政区内的选择站点的所有线路,将不同行政区中的重复路线删除,得到所需检查的383条线路。
(4)基于聚类分析法的检查起始站点整合。整合过程中的聚类分析主要是对上述所选站点进行的。对站点聚类分析后的结果进行整理后,选出距离某一片区较近站点的类(即站点集合),最终得出检查城市每个行政区的检查起始点分布。站点聚类分析的具体过程为:
1)数据变换处理
在聚类分析过程中,首先应对原数据进行数据标准化处理。假设原始数据为每个区域内各个站点之间的距离:
式中:xij表示第j个行政区中第i个站点,i为行政区内站点编号,j为广州市行政区越秀区、荔湾区、海珠区、白云区、天河区、黄埔区,编号分别为1、2、3、4、5、6。
用公式
2)计算聚类统计量
采用欧氏距离法来计算最短距离。计算步骤如下:
①定义1)中原始数据之间的距离,计算其两两之间的距离,得到距离矩阵d(0),起初阶段每个数据自成一类,所以开始时dij=dij。
②确定d(0)中的非对角线最小元素,记为dpq,此时将gp和gq合并记为新类,得到gr,此时gr=﹛gp,gq﹜。
③运用以下公式计算新类和其它类的距离公式:dkr=min﹛dkp,dkq﹜
把d(0)中第p、q行及p、q列用上述方法合为一个新的行和列,分别对应gr,得到新的矩阵d(1)。
④对得到的新矩阵重复上述步骤②和③,依次循环直到所有数据合并分类为一类为止。
注:如果上述某一步骤中的非对角线最小元素不止一个,那么这些最小元素对应的类同时可以合并为一类。
计算各行之间的欧氏距离,得到一个m×m的距离矩阵,其中dij表示第i行与j行的距离:
(5)按照图4(a)、图4(b)对运用以上方法得到的划分结果进行检验,验证其检查中是否达到节省人力提高效率的目的,如果达到以上目的则整理划分结果并进行检查人员的分布;如果没有达到以上目的则重新进行步骤(2)重新进行划分。
(6)表1为根据以上站点整合的结果划分检查所涉及的主要片区及检查人员分配,图4(a)、图4(b)为以华工为出发点进行的检查区域分布。
表1
通过上述实施例,克服了以往检查人员分配过程繁琐以及检查过程效率较低的缺点,提高了检查方法的精度和效率。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。