一种基于半监督学习的道路交通状态判别方法

文档序号:6712981阅读:542来源:国知局
一种基于半监督学习的道路交通状态判别方法
【专利摘要】本发明的基于半监督学习的道路交通状态判别方法,包括:a)采集道路及上、下游路口的交通流数据;b)对交通状态进行标记;c)生成标记训练集;d)生成标记训练集、;e)利用、、对3种基分类器进行训练;f)选取个未标记样本;g)协同训练基分类器;h)重复执行步骤g),直至协同训练完毕。本发明的道路交通状态判别方法,首先利用已标记的交通流数据对分类器进行训练,然后利用未标记的交通流数据进行协同训练,充分利用了节省成本的未标记数据,有利于形成更加准确的基分类器,提高交通状态判别的正确率,提升交通管理、决策、规划和运营的正确性和智能交通信息服务的质量。
【专利说明】一种基于半监督学习的道路交通状态判别方法【技术领域】
[0001]本发明涉及一种基于半监督学习的道路交通状态判别方法,更具体的说,尤其涉及一种首先利用有标记的交通流数据对基分类器进行训练然后再利用无标记的交通流数据进行协同训练的基于半监督学习的道路交通状态判别方法。
【背景技术】
[0002]随着城市的迅速发展,交通拥堵、交通污染日益严重,交通尾气排放是目前雾霾的主要污染源之一。这些都是各大城市亟待解决的问题,智能交通成为改善城市交通的关键所在。近年来,各大、中城市的智能交通系统不断完善,智能化程度不断提高,交通数据采集的范围、广度和深度急剧增加,正在形成以线圈、微波、GPS、车牌等交通流检测数据,交通监控视频数据,以及系统数据和服务数据等为主体的海量交通数据,这为道路交通状态判别提供了更加丰富的信息。道路交通状态需要通过对采集交通流数据分析得到判别结果,道路交通状态无法通过采集设备直接获取。因此,采集的大量交通流数据都是无标记样本,道路交通状态的样本需要通过人为判别进行标注,耗费大量的人力物力,要获取大量有标记的道路交通状态样本非常困难。
[0003]交通状态判 别是智能交通系统的重要研究内容,已有大量的研究成果,很多数据挖掘方法被用于交通状态的自动判别,如支持向量机、BP神经网络、决策树、K-最近邻分类方法、贝叶斯神经网络等。虽然如此,仍有很多交通状态判别方法很难在实际中应用,主要原因是这些有监督的交通状态判别方法需要大量的训练样本,而实际中很难采集大量的交通状态样本,因此限制了很多数据挖掘方法在实际交通状态判别中的应用。
[0004]如果只使用少量的有标记样本,那么利用它们所训练出的学习系统往往很难具有强泛化能力;另一方面,如果仅使用少量“昂贵的”有标记样本而不利用大量“廉价的”未标记样本,则是对数据资源的极大的浪费。如果大规模交通流数据被充分利用,必将提高交通状态判别的正确率,但常规的交通状态判别方法的计算量随着样本量的增长呈指数级增长。半监督学习是模式识别和机器学习领域研究的重点问题,是监督学习与无监督学习相结合的一种学习方法,利用少量有标签数据训练初始分类器,同时用大量无标签数据来进一步改进初始分类器的性能以最终达到精确学习的一种综合学习方法,它可有效解决少量标注样本和大量未标注样本的分类问题。

【发明内容】

[0005]本发明为了克服上述技术问题,提供了一种基于半监督学习的道路交通状态判别方法。
[0006]本发明的基于半监督学习的道路交通状态判别方法,其特别之处在于,包括以下步骤:a).采集交通流数据,采集道路及其上游路口、下游路口的交通流数据,所采集的交通流数据包括交通流量β、时间占有率O和车辆速度V ;设:时刻待预测道路上的交通流数据分别上游路口、下游路口的交通流数据分别为W、O-、V丨和ql、Os1、vf,其中:i = l,2,..、!:,i为所采集的交通流数据的数目;b).人工标记样本,通过人工观察视频监测数据或现场观察的方式,对步骤a)中采集的部分道路交通流数据对rz的文通状态进行标注,生成 > 个交通状态F=(乃|i = 1,2,...,均,由此生成训练测试样本集P,样本集F表示为:
【权利要求】
1.一种基于半监督学习的道路交通状态判别方法,其特征在于,包括以下步骤: a).采集交通流数据,采集道路及其上游路口、下游路口的交通流数据,所采集的交通流数据包括交通流量β、时间占有率O和车辆速度设时刻待预测道路上的交通流数据分别为&、%、%,上游路口、下游路口的交通流数据分别为和<、of、V;,其中j = 12,为所采集的交通流数据的数目; b).人工标记样本,通过人工观察视频监测数据或现场观察的方式,对步骤a)中采集的部分道路交通流数据对应的交通状态进行标注,生成N个交通状态y = {χ |? = l,2,--%iV),由此生成训练测试样本集f,样本集i?表示为:


2.一种根据权利要求1所述的基于半监督学习的道路交通状态判别方法,其特征在于,还包括以下的交通状态判别过程: I).采集待预测交通流数据,采集待预测道路及其上、下游路口的交通流数据,交通流数据包括交通流量、时间占有率和车辆速度,获得待预测道路的交通流数据样本; 2).获取交通状态,将步骤1)中获取的待预测道路的交通流数据作为步骤h)中获取的3个基分类器的输入,分别获取3个交通状态; 3).确定交通状态,对于步骤2)中获取的交通状态,利用少数服从多数的投票法确定当前道路的交通状态。
3.根据权利要求1或2所述的基于半监督学习的道路交通状态判别方法,其特征在于,步骤g)中所述的协同训练基分类器通过以下步骤来实现: g-1).将未经人工标记的交通流数据样本作为三个基分类器的输入,并求出输出的交通管理状态,设第一、第二、第三个基分类器的输出状态分别为YT、Y*、Ym ; g-2).判断YT与Ym是否相同,如果yt = ym,则执行步骤g_3);如果yt≠ym,则执行步骤 g_4); g-3).yt= yn时,判断与输出状态Z是否相同,如果yt= yn =ym ,则对该样本标记后,基分类器不变;如果.Vyt=yn≠ym则将该样本标记后加入第三个基分类器的有标记训练集,形成新的训练集对第三个基分类器重新进行训练; g-4).yt≠yn时,判断输出状态yt与ym是否相同,如果yt=ym,,则将该样本标记后加入第二个基分类器的有标记训练集,形成新的训练集对第二个基分类器重新进行训练;如果,则执行步骤g-5);g-5).yt≠ym且时yt≠ym,判断输出状态ym与yn是否相同,如果,则将该样本标记后加入第一个基分类器的有标记训练集,形成新的训练集对第一个基分类器重新进行训练;如果yn≠ym,则对该训练集不做标记,基分类器均不变。
4.根据权利要求1或2所述的基于半监督学习的道路交通状态判别方法,其特征在于:步骤e)中所述的3种基分类器分别为贝叶斯网络、决策树和支持向量机。
【文档编号】G08G1/01GK103903441SQ201410135031
【公开日】2014年7月2日 申请日期:2014年4月4日 优先权日:2014年4月4日
【发明者】孙占全, 赵彦玲, 顾卫东, 张新常 申请人:山东省计算中心
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1