一种基于Fisher算法的交通时段自动划分的方法

文档序号:9844450阅读:1541来源:国知局
一种基于Fisher算法的交通时段自动划分的方法
【技术领域】
[0001]本发明属于智能交通控制系统领域,涉及一种交通时段自动划分的方法,特别是 一种基于Fi sher算法的交通时段自动划分的方法。
【背景技术】
[0002]智能交通系统(Intel ligentTransportationSy stem,简称ITS)集成 了信息技术、 数据通讯传输技术、电子传感技术、控制技术及计算机技术等多种先进的技术,可实时、准 确、高效地运用于整个地面交通管理系统。ITS可以有效地利用现有交通设施、减少交通负 荷和环境污染、保证交通安全、提高运输效率,因而,日益受到各国的重视。自1994年巴黎首 届智能交通系统世界大会至今,ITS概念的正式提出和规模性开发已有20余年,建设较成熟 的国家有美国、日本以及欧盟等,智能交通行业正从技术研发阶段迈进实施部署阶段,逐步 实现质的飞跃。国内的智能交通系统研究虽然起步较晚,但经过多年的努力,已经取得了一 定的成果,参考国外先进技术的同时,也在不断推进各项具备自主知识产权的新技术。
[0003] 近年来,随着经济飞速发展以及城市化快速推进,交通流量急剧增长,交通拥挤、 堵塞频现。由于道路交叉口与路段之间的通行能力的差异性,交叉口已经成为道路交通的 "瓶颈",因此改善道路交通的关键在于合理地调度交叉口的交通流,完善优化信号控制方 案。信号控制是道路交通管理中的一项重要的措施,以三大主要参数为特征,分别是相位、 周期和信号配时。传统的单点定周期信号控制是最基本的控制形式,但其无法适应交通流 变化较大的路况,单一的配时方案极易导致局部拥堵或空放现象。目前广泛应用的交叉口 信号控制算法是多时段定时控制,简称T0D(Time of Day)算法。多时段定时控制是根据交 叉口流量的变化把24小时划分为若干个时间段,针对不同的交通时段采用不同的控制方 案。因此时段划分是T0D算法的关键,直接决定着控制方案的实施效果。但关于时段自动划 分的研究却经常被忽视,更没有软件具备这种功能。
[0004] 据调研,传统的交通时段划分主要是由有经验的工程师依据经验,基于路口交通 流量的实际变化,对时段结构进行人为调整,做出时段划分、拆分、合并等控制决策。但是这 种方法极大地依赖于工程师的业务素质,主观局限性太强,无法保证得到最优的划分结果, 难以满足道路交通快速变化的需求。
[0005] 目前,时段自动划分方法已经取得一些研究成果。有学者提出了一种人工免疫数 据聚类分析算法,可减少交通数据的冗余信息,但因需要设置的可调参数较多难以选择而 降低了划分方法的鲁棒性。也有学者利用PAM聚类算法进行划分,但没有将交通流的序列特 征纳入研究范围,较难在实际路况中得到应用。

【发明内容】

[0006] 本发明要解决的技术问题是针对现有技术的不足,提出一种设计更合理、可操作 性更强、准确性更高的基于Fisher算法的交通时段自动划分的方法。
[0007] 本发明要解决的技术问题是通过以下技术方案实现的。本发明是一种基于Fisher 算法的交通时段自动划分的方法,其特点在于,包括如下步骤:
[0008] 步骤一,采集任意给定采样间隔的交通流基本参数,得到原始数据;
[0009] 步骤二,对原始数据依次进行筛选、处理和修复预处理,得到预处理数据;
[0010] 步骤三、通过Fisher算法对预处理数据进行分类,得到最优解和分割点;
[0011]步骤四、输出分割点,结合最优分类数目,对交通时段区间进行划分。
[0012]本发明一种基于Fisher算法的交通时段自动划分的方法技术方案中,进一步优选 的技术方案特征是:所述的步骤二通过如下步骤实现:
[0013] 步骤1:对原始数据进行筛选和判别,提取出正常数据;
[0014] 步骤2:建立问题数据修复模型,对原始数据中的缺失类数据、异常类数据、错误类 数据和冗余类数据进行修复归约,得到修复数据;
[0015] 步骤3:将修复数据与正常数据进行合并,得到所述的预处理数据。
[0016]本发明一种基于Fisher算法的交通时段自动划分的方法技术方案中,进一步优选 的技术方案特征是:所述的步骤三包括如下步骤:
[0017]步骤1,定义类直径:设某一类样本G的原序列为Gi = {Xu,Xi2…Xij},定义其直径Di 为样本离差平方和:
[0018]
[0019] 式中
· I为均值,Xij为样本特征值;
[0020] 步骤2、假设样本(样品个数为η)分成k类:
[0021] Gi={Xii,Xi2,. . . ,Xij}
[0022] G2={X21,X22,· . ·,X2j}
[0023] ···
[0024] Gk={Xki,Xk2,· · ·,Xkj}
[0025] 其中,m,n2, · · ·,nk为k个分割点,且下标满足1 < m<n2< · · ·,nk《n;
[0026] 步骤3、定义目标函数为
[0027]
[0028]
[0029]
[0030]
[0031]计算最小目标函数;
[0032]步骤5、求取最优解:
[0033]若分类数k(1 <k<η)已知,求分类法L[B (η,k)],使它在目标函数意义下达到最 小,求法如下:
[0034]首先根据目标函数相邻值计算非负斜率,取非负斜率最大的分类数k为最优分类 数;找最优分类数目k对应的分割点jk,使步骤G的公式数值达最小,即
[0035] L[B(n,k) ] = L[B( jk_l,k_l) ]+D( jk,n)
[0036] 由上式求得分割成k类的最优情况Gk;然后依次类推,求取第jk-^分割点下的最 小目标函数,得到第k-Ι类Gw,依次求得所有类G^G^,. . .,&而,此即为最优解。最优解的 体现形式是样本数据分类情况,即哪些数据归为一类,哪些数据归为其他类。对应到交通流 量数据中,最优分类数对应的是时段划分的区间数目,最优解对应的是时段区间划分点的 设置情况。交通流量数据的时间序列特征,决定了流量数据对应的时间值,因此根据最优解 可得出分割点处的流量值,由此可得出时段划分点,最终实现时段区间的划分。
[0037] 与现有技术相比,本发明具有如下的技术效果:对传统的时段划分方法进行了改 进,避免了局部主观性,解决了以往依靠人工调查数据、筛选数据而耗费大量人力物力的缺 陷;数据预处理过程大大提高了数据质量,消除或减少了数据噪声和误差,增加了划分的可 靠性;基于Fisher算法的有序样本划分,快速便捷且准确性高,也为最终的多时段控制方案 的设置提供了保障。本发明具备鲁棒性高、可操作性强、准确度性好等优势,能投入到实际 的道路交通控制系统中使用,时段区间的划分更人性化、更合理、更便捷。
【附图说明】
[0038]图1本发明的设计流程图;
[0039]图2数据预处理流程图;
[0040]图3 Fisher算法的流程图;
[0041] 图4本发明采用的算法计算得出的目标函数随分类数变化的趋势图;
[0042] 图5本发明计算得出的交通时段划分结果图。
【具体实施方式】
[0043] 以下参照附图,进一步描述本发明的具体技术方案,以便于本领域的技术人员进 一步地理解本发明,而不构成其权力的限制。
[0044] 实施例1,参照图1-5,首先采集任意给定采样周期的交通数据,并对原始数据进行 预处理,改进数据质量;其次在原序列上定义类直径,规定目标函数;接着确定最佳分段数 并计算最优解,由此得出时段划分结果并可进行优化调整。其具体步骤如下:
[0045]步骤一、采集交通流数据:
[0046]交通数据的采集是进行交通时段划分的前提,凭借多种检测手段可以采集到任意 给定采样间隔的交通流基本参数:流量、速度、密度。流量是单位时间内通过道路某个地点 的车辆数,即车流量,速度是车辆行驶速度,密度是单位长度的道路上,在某一瞬间的车辆 总数。本发明采用的分析数据为流量数据。但由于诸多外界环境的干扰,原始数据存在异常 值、缺失值等情况,不能够直接用于交通模型的输入,特别是在交通控制、诱导、信息发布等 实时的系统中,更需要对数据进行预处理,避免错误结果的出现。
[0047]步骤二、对原始数据进行预处理:
[0048]动态交通数据的预处理包含三个方面,数据筛选、数据处理和数据修复。首先建立 数据筛选模型,对原始数据进行筛选和判别,提取正常数据;再者建立问题数据修复模型, 对缺失类数据、异常类数据、错误类数据和冗余类数据进行修复归约;最后将修复后的数据 与正常数据进行合并,并保存至数据库中。
[0049] 2.1缺失类数据处理方法:不同数据源大小,应对的策略也不同。短时数据有限采 用空间序列数据加以重构,或者直接放弃不用。长时数据有限采用时间序列数据进行补位, 可建立预测模型进行完善。
[0050] 2.2错误类数据处理:该类数据格式错误,一般常见于三种情况:其一是短期数据 格式错误,可自动清除;其二是检测器安装有误或者通讯故障,可调配工程人员进行现场修 复;其三是严重的交通拥堵导致样本数据比例溢出,可调配技术人员进行现场调研,改善数 据判别模型。
[0051 ] 2.3异常类数据处理:采用阈值法对检测器的回馈数据进行上下限值认定,超出者 可重复2.2所述方法。
[0052] 2.4冗余类数据处理:常见两种情况,其一是数据完全重复,可删除多余记录,仅保 存一条记录;其二是数据相似,可对交通流数据取均值。
[0053]步骤三、将修复后的数据加入Fisher算法,确定不同的类直径,根据目标函数求取 最优解,确定分割点。具体包含以下步骤:
[0054]步骤三(1)、定义类直径:设某一类样本G的原序列为6?={Χη,Χη. . .Xij},定义其 直径Di为为样本离差平方和:
[0055]
[0056] 式4
为均值,Xij为样本特征值。
[0057]步骤三(2)、样本(样品个数为η)分成k类:
[0058] Gi={Xii,Xi2,. . . ,Xij}
[0059] G2= {X21,X22,· · ·,X2j}
[0060] ···
[0061] Gk={Xki,Xk2,· · ·,Xkj}
[0062] 其中,ni,n2, · · ·,nk为k个分割点,且下标满足1《m<n2< · · ·,nk仝n。
[0063] 步骤三(3)、定义目标函数为
[0064] Z[执Μ)卜; ?Χ'?
[0065]当样本序列总数η确定,分类数k确定时,L[B(n,k)]越小表示各类的离差平方和越 小;Fisher算法的最优分割实质上就是寻求一组分割点,是所有分类直径综合最小,即保证 各段内部样品间的差异最小,而各段间样本的差异最大。
[0066] 步骤三(4)、Fisher算法的核心递推公式:
[0067]

[00 (!)
[0069]式(1)
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1