一种基于类别相似的二叉树支持向量机的公交行驶状态分类方法

文档序号:10570424阅读:246来源:国知局
一种基于类别相似的二叉树支持向量机的公交行驶状态分类方法
【专利摘要】本发明公开了一种基于类别相似的二叉树支持向量机的公交行驶状态分类方法,该方法包括以下步骤:步骤1:通过位置数据采集器采集公交实时位置信息,并通过二叉树支持向量机的树结构来转化复杂的公交实时位置信息;步骤2:建立一种类别相关度的二分类器,进而将公交实时位置信息分成两类;步骤3:通过抽离根节点处的高相关度数据建立最优二叉树结构,得到正类相关度矩阵和负类相关度矩阵;步骤4:将正类相关度矩阵输入SVM多分类器进行分类判别;步骤5:将负类相关度矩阵采用相似度策略进行分类判别。本发明所提出的基于类别相似的BT?SVM多分类算法,在处理堵车串车的分类问题上,对比于传统方法有着较高的精度且分类速度较快。
【专利说明】
一种基于类别相似的二叉树支持向量机的公交行驶状态分类 方法
技术领域
[0001] 本发明属于城市公交管理技术领域,尤其是涉及一种基于类别相似的二叉树支持 向量机的公交行驶状态分类方法。
【背景技术】
[0002] 高精度的公交车辆状态判别算法可提升公交车辆的管理效率。目前,针对公交状 态分类判别的研究相对较少,但对于交通状态判别,已经取得一定的成果。如基于模糊综合 推理的道路交通事件识别算法,算法信息丢失少,且计算量小;以神经网络为基础建立交通 检测算法,检测度高,且误判率较低;通过分析流量与占有率的统计特性,提出一种相对增 量准则判别,实现对拥挤事件的自动检测与判别。但上述交通状态判别方法都将多种车辆 状态类型进行归一化处理,因此不适用于多类别的车辆状态的识别。
[0003] 支持向量机(Support Vector Machine,SVM)是一种基于统计学习理论的分类方 法,通过几何映射将低维空间的线性不可分转化为高维空间的线性可分,其多分类算法包 括一对一方法和一对多方法,在这两种方法基础上的改进算法有:有向无环图法、二叉树法 (BT)等。但是,由于噪声以及数据关联的原因,当测试数据映射到高维空间后,将出现不可 分或错分的问题。

【发明内容】

[0004] 鉴于以上所述现有技术的缺点,本发明的目的在于提供一种基于类别相似的二叉 树支持向量机的公交行驶状态分类方法,以二叉树多分类支持向量机(BT-SVM)为基础,增 加纠错机制,通过比较判断相邻车辆状态相关度划分类别,以减少因相关度高的数据映射 到高维空间出现不可分现象,提高分类算法的准确率。
[0005] 为了达到上述发明目的,解决其技术问题所采用的技术方案如下:
[0006] -种基于类别相似的二叉树支持向量机的公交行驶状态分类方法,该方法包括以 下步骤:
[0007]步骤1:通过位置数据采集器采集公交实时位置信息,并通过二叉树支持向量机的 树结构来转化复杂的公交实时位置信息;
[0008] 步骤2:建立一种类别相关度的二分类器,进而将公交实时位置信息分成两类;
[0009] 步骤3:通过抽离根节点处的高相关度数据建立最优二叉树结构,得到正类相关度 矩阵和负类相关度矩阵;
[0010] 步骤4:将正类相关度矩阵输入SVM多分类器进行分类判别;
[0011] 步骤5:将负类相关度矩阵采用相似度策略进行分类判别。
[0012] 进一步的,步骤1中,所述位置数据采集器是全球定位系统、地磁传感器或视频检 测器。
[0013] 进一步的,步骤3中,通过纠错机制实现在根节点处将高相关度的数据进行抽离, 以及实现根节点分类后子节点的再分类,所述纠错机制的实现步骤如下:
[0014] Step21:计算行驶在道路上的公交的车头时距
[0015] dij = di_dj
[0016] 其中,cU表示第i辆公交车所处的位置车,山表示第j辆公交车所处的位置车,可得 到车头时距矩阵Du;
[0017] Step22:设矩阵Dij的每行最小值平均值做分类阈值H,即有:
[0019]根据阈值做二分类运算,可得矩阵D' :
[0020] D' ^ i
[0021] Step23:取负类相关度矩阵为:
[0022] D; ij = (0???, 0,D,ij-2,D,ij-i,D,ij,D,ij +i,D,ij+2,0,???〇)
[0023] 其中:
[0024] d' ij-2 = dij-2,d' ij-l = dij-l,d ' ij+i = dij+i,d' ij+2 = dij+2 [0025]因此,正类相关度矩阵为:
[0026] DMij = Dij-DMij〇
[0027]进一步的,步骤4具体包括以下步骤:
[0028] Step41:根据类别相关度的二分类器分类,并将正类相关度矩阵采用SVM多分类器 进行分类判断;
[0029] Step42:根据Step41所得D"ij,可得负类相关度矩阵中最小的min(D"ij),其中i辛 j,并将变量Si与变量Sj归为一个新类S,其中,变量Si与变量Sj的距离即为D"ij;根据dkj=min (D'^DkU辛i,j,重新计算D"^,即有K-1阶的距离矩阵;再从新的距离矩阵中选出最小者 min(D"ij),把S'i与S'j归并成新类S' ;再计算各类与新类S'的距离,依次类推,直至余下一 类为止;
[0030] Step43:把Step42余下的类标记为他,再对余下的K-1类进行类似Step42的运算, 可得类别feLNk;
[0031] Step44:根据生成的二叉树,利用多级支持向量机分类器训练算法构造各内节点 的最优超平面,以第见类样本为正样本集,其他N2LNk为负样本集,采用多级结构训练算法构 造节点处的二分类支持向量机分类器,把属于第见类的样本从样本集中删除,继续以第N2类 样本为正样本集,第 N3LNk类样本为负样本集,构造第二个内节点的二分类支持向量机分类 器,依次下去,直到所有的二分类支持向量机分类器训练完,可得到基于类别相似的公交状 态多类别支持向量机分类器模型;
[0032] Step45:算法结束。
[0033]进一步的,步骤4中,所述SVM多分类器将公交的运行状态分为四种类型,分别为正 常、故障、堵车和串车,其中:
[0034]当公交的运行状态为正常时,其车头时距相等且呈水平状态;
[0035]当公交的运行状态为故障时,其车头时距将会出现负值且呈递减状态;
[0036] 当公交的运行状态为堵车时,其车头时距将呈先减后增的状态;
[0037] 当公交的运行状态为串车时,其车头时距将呈水平波动状态且其均值小于总体均 值。
[0038] 进一步的,步骤5中,所述相似度策略具体包括:
[0039] 策略一:当负类相关度矩阵< > ^时,判断为正常状态;当< S <时,则转入策略 -* * n
[0040]策略二:当士2>() *()时,判断为故障状态,否则转入策略三; 户:2
[0041 ] 策略三:当0 < < <&时,且(T ij呈近似正态分布,判断为堵车状态,否则判断为串 车状态。
[0042] 本发明由于采用以上技术方案,使之与现有技术相比,具有以下的优点和积极效 果:
[0043] 本发明针对公交车辆状态分类的问题,以二叉树支持向量机分类模型基础,设计 多级分类器,并通过主成份分析等方法将GPS数据进行处理,选择径向基核函数,将测试集 进行分类测试。本发明所提出的基于类别相似的BT-SVM多分类算法,在处理堵车串车的分 类问题上对比于传统方法上有着较高的精度且分类速度较快。
【附图说明】
[0044] 为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用 的附图作简单的介绍。显而易见,下面描述中的附图仅仅是本发明的一些实施例,对于本领 域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。附 图中:
[0045] 图1为本发明一种基于类别相似的二叉树支持向量机的公交行驶状态分类方法的 流程图;
[0046] 图2为本发明一种基于类别相似的二叉树支持向量机的公交行驶状态分类方法中 基于类别相关度的二分类器示意图;
[0047] 图3为本发明一种基于类别相似的二叉树支持向量机的公交行驶状态分类方法中 的BT-SVM多级分类器模型示意图;
[0048] 图4为本发明一种基于类别相似的二叉树支持向量机的公交行驶状态分类方法中 的各类状态特征向量经过主成分分析后得到的样本数据在二维空间中的分布图;
[0049] 图5为本发明一种基于类别相似的二叉树支持向量机的公交行驶状态分类方法中 第一级分类器SVMlvs234的超平面图;
[0050] 图6为本发明一种基于类别相似的二叉树支持向量机的公交行驶状态分类方法中 第二级分类器SVM2vs34的超平面图;
[0051 ]图7为本发明一种基于类别相似的二叉树支持向量机的公交行驶状态分类方法中 第三级分类器SVM3vs4的超平面图。
【具体实施方式】
[0052] 以下将结合本发明的附图,对本发明实施例中的技术方案进行清楚、完整的描述 和讨论,显然,这里所描述的仅仅是本发明的一部分实例,并不是全部的实例,基于本发明 中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施 例,都属于本发明的保护范围。
[0053] 本发明涉及一种基于类别相似支持向量机的公交行驶状态分类策略,针对公交车 辆运行状态区分问题,提出公交车辆运行状态分类纠错机制,设计公交车辆运行类别相关 度的判别策略。然后以二叉树支持向量机为基础,设计一种基于相似度策略的二叉树支持 向量机的公交车运行状态分类算法。即增加纠错机制,通过比较判断相邻车辆状态相关度 划分类别,以减少因相关度高的数据映射到高维空间出现不可分现象,提高分类算法的准 确率。所谓纠错机制,即以车头时距作为相关度参数,计算车辆状态类别相关度矩阵,设计 分类阈值将相关度矩阵划分成两类。与传统的分类方法对比,基于类别逻辑相似的支持向 量机公交车辆多分类算法效果更佳。
[0054] 如图1和2所示,一种基于类别相似的二叉树支持向量机的公交行驶状态分类方 法,该方法包括以下步骤:
[0055] 步骤1:通过位置数据采集器采集公交实时位置信息,并通过二叉树支持向量机的 树结构来转化复杂的公交实时位置信息;本步骤中所使用的二叉树支持向量机(BT-SVM)是 通过树结构来转化复杂的多类无顺序分类。每个树节点处采用SVM二分类器作为分类处理。 现有的BT-SVM多类分类方法通过随机或计算信息熵的方式决定二叉树节点,对于相关度高 的类别表现出较差的分类能力,即泛化能力。若在根节点层将相关度高的类别剔除并另作 处理,然后再进行二叉树分类,从难到易。这样,可降低因高相关度数据映射到高维空间所 引发的不可分问题的事件发生频率。
[0056] 步骤2:建立一种类别相关度的二分类器,进而将公交实时位置信息分成两类; [0057]步骤3:通过抽离根节点处的高相关度数据建立最优二叉树结构,得到正类相关度 矩阵和负类相关度矩阵;
[0058]步骤4:将正类相关度矩阵输入SVM多分类器进行分类判别;
[0059] 步骤5:将负类相关度矩阵采用相似度策略进行分类判别。
[0060] 进一步的,步骤1中,所述位置数据采集器是全球定位系统、地磁传感器或视频检 测器。
[0061] 进一步的,步骤3中,通过纠错机制实现在根节点处将高相关度的数据进行抽离, 以及实现根节点分类后子节点的再分类,所述纠错机制的实现步骤如下:
[0062] Step21:计算行驶在道路上的公交的车头时距
[0063] dij = di_dj
[0064] 其中,cU表示第i辆公交车所处的位置车,山表示第j辆公交车所处的位置车,可得 到车头时距矩阵Du;
[0065] Step22:设矩阵Dij的每行最小值平均值做分类阈值H,即有:
[0067]根据阈值做二分类运算,可得矩阵D' :
[0069] Step23:取负类相关度矩阵为:
[0070] D; ij = (0???, 0,D,ij-2,D,ij-i,D,ij,D,ij +i,D,ij+2,0,???〇)
[0071] 其中:
[0072] d' ij-2 = dij-2,d' ij-i = dij-i,d ' ij+i = dij+i,d' ij+2 = dij+2 [0073]因此,正类相关度矩阵为:
[0074] DMij = Dij-D,ij〇
[0075] 进一步的,步骤4具体包括以下步骤:
[0076] Step41:根据类别相关度的二分类器分类,并将正类相关度矩阵采用SVM多分类器 进行分类判断;
[0077] Step42:根据Step41所得D"ij,可得负类相关度矩阵中最小的min(D"ij),其中i辛 j,并将变量Si与变量Sj归为一个新类S,其中,变量Si与变量Sj的距离即为D"ij;根据dkj=min (D^DkU^J,重新计算D"^,即有K-1阶的距离矩阵;再从新的距离矩阵中选出最小者 min(D"ij),把S'i与S'j归并成新类S';再计算各类与新类S'的距离,依次类推,直至余下一 类为止;
[0078] Step43:把Step42余下的类标记为他,再对余下的K-1类进行类似Step42的运算, 可得类别feLNk;
[0079] Step44:根据生成的二叉树,利用多级支持向量机分类器训练算法构造各内节点 的最优超平面,以第Ni类样本为正样本集,其他N2LNk为负样本集,采用多级结构训练算法构 造节点处的二分类支持向量机分类器,把属于第见类的样本从样本集中删除,继续以第N 2类 样本为正样本集,第N3LNk类样本为负样本集,构造第二个内节点的二分类支持向量机分类 器,依次下去,直到所有的二分类支持向量机分类器训练完,可得到基于类别相似的公交状 态多类别支持向量机分类器模型;
[0080] Step45:算法结束。
[0081] 进一步的,步骤4中,根据城市公交车辆运行状态,所述SVM多分类器将公交的运行 状态分为四种类型,分别为正常、故障、堵车和串车,其中:
[0082]当公交的运行状态为正常时,其车头时距相等且呈水平状态;
[0083]当公交的运行状态为故障时,其车头时距将会出现负值且呈递减状态;
[0084]当公交的运行状态为堵车时,其车头时距将呈先减后增的状态;
[0085]当公交的运行状态为串车时,其车头时距将呈水平波动状态且其均值小于总体均 值。
[0086] 基于上述分析,本实施例提出以下分类策略划分纠错机制所得的负类相关度矩阵 的公交车辆运行状态。具体的,在步骤5中,所述相似度策略具体包括:
[0087] 策略一:当负类相关度矩阵时,判断为正常状态;当 < << 时,则转入策略 -* *
[0088] 策略二:当+ 时,判断为故障状态,否则转入策略三; j~2
[0089] 策略三:当〇 <<,.< <时,且cU、呈近似正态分布,判断为堵车状态,否则判断为串 车状态。
[0090] 参见图3,公交车辆运行状态的五种类型:正常、故障、堵车、串车,分别用1-4代表。 可以构造这样的二叉树型多级分类器用于状态分类,根节点为第一级分类器SVMlvs234代 表用于对1类和2、3、4类进行区分。第二层为二级分类器SVM2vs34,第三层为叶子结点2类和 三级分类器SVM3v4,最后分为叶子节点3类和4类。
[0091] 本实施例从广州的智能公交GPS系统数据库提取的四类运行状态特征向量分别取 K+N个样本,其中K个样本用于SVM分类器训练,其他N个样本为测试集数据。图4为各类状态 特征向量经过主成分分析后得到的样本数据在二维空间中的分布图。
[0092] 从数据分析及二维分布图可得出,第一级分类器SVMlvs234为线性可分类器,如图 5所示;第二级分类器为近似线性分类器,如图6所示;第三级分类器为线性不可分分类器, 如图7所示。
[0093]本实施例中,所有实验均在酷睿i52.4GHZ,4GB内存的微机上进行。实验中,支持向 量机的核函数采用径向基核函数,采用上述分类方法进行训练。每种分类选择的数据集与 结果如表1所示,并将基于相关度的BT-SVM多分类方法与传统多分类法的分类性能进行对 比,如表2所示。
[0099] 通过上述实例测试可以得出:正常状态待测样本判别精度较高,故障状态待测样 本出现少量误判,堵车状态待测样本与串车状态待测样本的误判数量较多,但误判率浮动 较小。
[0100] 误判情况具体表现为:故障状态误判为堵车状态,堵车状态误判为串车状态,串车 状态误判为堵车状态。这是因为本实施例采用简单的均值方法做分类判断,因此将会出现 少量误判,但由于采用均值计算分类阈值可使误判率趋于稳定。试验验证待测样本总体判 断率为90.7%,从总体来看基于类别相关度的BT-SVM公交车辆状态分类算法取得良好的效 果。
[0101] 与传统多分类算法对比,本实施例中的相关度多分类算法的分类精度最高,因为 筛选出易错数据使得采用了正常状态的分类精度高于其他两种分类方法,但且分类速度将 会慢于传统多分类方法。对于"故障"、堵车"、"串车"三种类别都具有较大相关度区域,因此 本实施例中的相关度策略分类方法将会明显的高于其他类别,同样由于使用均值做阈值, 使得其出现少量误判。综上,基于类别相关度的BT-SVM公交车辆状态多分类方法优于传统 SVM分类方法以及基于二分类SVM衍生的一对多多分类方法。
[0102] 以上所述,仅为本发明较佳的【具体实施方式】,但本发明的保护范围并不局限于此, 任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换, 都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围 为准。
【主权项】
1. 一种基于类别相似的二叉树支持向量机的公交行驶状态分类方法,其特征在于,该 方法包括以下步骤: 步骤1:通过位置数据采集器采集公交实时位置信息,并通过二叉树支持向量机的树结 构来转化复杂的公交实时位置信息; 步骤2:建立一种类别相关度的二分类器,进而将公交实时位置信息分成两类; 步骤3:通过抽离根节点处的高相关度数据建立最优二叉树结构,得到正类相关度矩阵 和负类相关度矩阵; 步骤4:将正类相关度矩阵输入SVM多分类器进行分类判别; 步骤5:将负类相关度矩阵采用相似度策略进行分类判别。2. 如权利要求1所述的一种基于类别相似的二叉树支持向量机的公交行驶状态分类方 法,其特征在于,步骤1中,所述位置数据采集器是全球定位系统、地磁传感器或视频检测 器。3. 如权利要求1所述的一种基于类别相似的二叉树支持向量机的公交行驶状态分类方 法,其特征在于,步骤3中,通过纠错机制实现在根节点处将高相关度的数据进行抽离,以及 实现根节点分类后子节点的再分类,所述纠错机制的实现步骤如下: Step21:计算行驶在道路上的公交的车头时距 dij = di-dj 其中,Cl1表示第i辆公交车所处的位置车,山表示第j辆公交车所处的位置车,可得到车 头时距矩阵Dlj; Step22:设矩阵Dij的每行最小值平均值做分类阈值H,即有:根据阈值做二分类运算,可得矩阵D ' :Step23:取负类相关度矩阵为: D7 Ij= (0··· ,O1D7 ij-2,07 Ij-I1D7 Ij1D7 ij+i.D7 ij+2,0, ···〇) 其中: d ij-2 - dij-2,d ij-1 - dij-1,d ij+1 - dij+1 , d ij+2 - dij+2 因此,正类相关度矩阵为: D ij = Dij_D ij〇4. 如权利要求3所述的一种基于类别相似的二叉树支持向量机的公交行驶状态分类方 法,其特征在于,步骤4具体包括以下步骤: Step41:根据类别相关度的二分类器分类,并将正类相关度矩阵采用SVM多分类器进行 分类判断; Step42:根据Step41所得D〃ij,可得负类相关度矩阵中最小的min(D〃 ij),其中i辛j,并将 变量Si与变量Sj归为一个新类S,其中,变量Si与变量Sj的距离即为D〃ij;根据dkj =min(D〃ij, 〇//1」)氺^^,」,重新计算0〃1」,即有1(-1阶的距离矩阵;再从新的距离矩阵中选出最小者 1^11 (D〃^),把3/1与3'」归并成新类S';再计算各类与新类S'的距离,依次类推,直至余下一类为 止; Step43:把Step42余下的类标记为见,再对余下的K-I类进行类似Step42的运算,可得类 别 N2LNk; Step44:根据生成的二叉树,利用多级支持向量机分类器训练算法构造各内节点的最 优超平面,以第N1类样本为正样本集,其他N2LNk为负样本集,采用多级结构训练算法构造节 点处的二分类支持向量机分类器,把属于第N 1类的样本从样本集中删除,继续以第N2类样本 为正样本集,第N3LN k类样本为负样本集,构造第二个内节点的二分类支持向量机分类器,依 次下去,直到所有的二分类支持向量机分类器训练完,可得到基于类别相似的公交状态多 类别支持向量机分类器模型; Step45:算法结束。5. 如权利要求4所述的一种基于类别相似的二叉树支持向量机的公交行驶状态分类方 法,其特征在于,步骤4中,所述SVM多分类器将公交的运行状态分为四种类型,分别为正常、 故障、堵车和串车,其中: 当公交的运行状态为正常时,其车头时距相等且呈水平状态; 当公交的运行状态为故障时,其车头时距将会出现负值且呈递减状态; 当公交的运行状态为堵车时,其车头时距将呈先减后增的状态; 当公交的运行状态为串车时,其车头时距将呈水平波动状态且其均值小于总体均值。6. 如权利要求3所述的一种基于类别相似的二叉树支持向量机的公交行驶状态分类方 法,其特征在于,步骤5中,所述相似度策略具体包括: 策略一:当负类相关度矩阵时,判断为正常状态;当& < <时,则转入策略二;,判断为故障状态,否则转入策略三; 策略三:当O Z时,且cT ij呈近似正态分布,判断为堵车状态,否则判断为串车状 iJ 1J 〇
【文档编号】G06K9/62GK105930872SQ201610272472
【公开日】2016年9月7日
【申请日】2016年4月28日
【发明人】刘云翔, 郑力, 李晓丹, 杜杰, 杜駉骏, 刘天伟, 周俊杰
【申请人】上海应用技术学院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1