一种基于Fisher算法的交通时段自动划分的方法_2

文档序号:9844450阅读:来源:国知局
是将样本分为两类的最小目标函数,式2是将样本分为k类的最小目标函数, 若要将η个样品分为k类的最优分割,应建立在将j-1个样品分为k-1类的最优分割基础上 (此处」=1,2,3,...,1〇,即由式1到式2的逐渐类推过程。算法设计过程中不仅考虑类间散 度,还考虑类内散度,增加对时段划分的可靠保障。
[0070] 步骤三(5)、求取最优解:
[0071] 若分类数k(l<k<n)已知,求分类法L[B(n,k)],使它在目标函数意义下达到最小 的分类情况即为最优解。首先确定最优分类数,求解L[B(n,k)]相邻目标函数值之间的非负 斜率:
[0072]
[0073] 斜率较大时,表示第k类优于第(k-Ι)类,斜率值接近0时表示没有继续分类的必 要,一般取斜率最大处为最优分类数。
[0074] 由上述方法得出的最优分类数k,求得步骤三(4)步骤的公式最小值的分类情况, 获得第k类的分割点jk,即可得第k类G k分类情况;然后依次类推,求取第jk个分割点下的最 小目标函数,得到第k-Ι类Gh,依次求得所有类G^Gh,...,&,&,此即为最优解。
[0075] 步骤四、输出分割点,根据步骤三(5)中的最优解,可得出哪些数据可归为一类,基 于交通流的序列特征,流量数据的划分点可转换为相应时间值,对交通时段进行划分。
[0076] 结合实际路况,一个孤立的交叉口,时段划分越多,信号控制方案越能适应多变的 交通流;但实际路口与路口之间,路段与路段之间,路面区域与区域之间有紧密的联系,不 是孤立的单点,若因时段划分过多而导致配时方案的不断变化,会对相邻路口甚至整个区 域产生不良影响。交通流本身也存在一定的关系,频繁变换配时方案,难以满足较强的适应 性。一般当交通流的变化曲线波动很频繁时,应尽量增加时段的划分数目,反之则减少。曲 线波动的时间长短决定了划分时段区间的长短。
[0077] 交通流是离散随机的系统,为了描述交通流的各种复杂特性,需要在一定的连续 时间段内观测交通流的特征参数,因此,数据采样的间隔选择也起着至关重要的影响。考虑 到检测器精度因素,过短的采样间隔会大大增加检测误差,而过长的间隔无法表现完整的 变化特性。为了对交通时段进行合理正确的划分,本发明提出基于Fisher算法的交通信号 时段划分方法,如图1所示流程图,Fisher算法可实现对对多维样本数据的分割,而本发明 中交通流数据指的是流量数据,因此基于的是Fisher算法针对单维数据的聚类分析,具体 包括如下步骤:
[0078] 步骤一、以常规四岔路况为研究对象,以15min为采样间隔,提取24小时的流量数 据(流量数据数值单位为辆/15min),如表1所示:
[0079] 表 1
[0080]
[0081]
[0082]
[0083]步骤二、建立数据筛选模型,对原始数据进行预处理,问题类数据清洗修复后与正 常数据合并再保存至数据库。通过对全天候交通流数据的调查,可掌握交叉口全天变化规 律,可以科学地进行时段划分,流程图如图2所示:
[0084]步骤三、将修复后的数据加入Fisher算法中,设计流程图如图3所示,具体实施步 骤如下:
[0085]步骤三(1)、定义类直径:设某一类样本G的原序列为6?={Χη,Χη. . .Xij},定义其 直径Di为样本离差平方和:
[0086]
[0087]式_
I为均值,知为样本数据的流量特征值。根据表1数据计算 得出如表2所示的类直径数据,即分类的变差矩阵。
[0088] 表 2
[0089]
[0090] 因数据较多,只显示部分数据,类直径越小,表明该分类更集中,区间类的数据划 分为同一类的科学性更高。
[0091] 步骤三(2)、将24小时的数据样本分成k类,样品个数为η:
[0092] Gi={Xii,Xi2,. . . ,Xij}
[0093] G2={X21,X22,· . ·,X2j}
[0094] ···
[0095] Gk={Xki,Xk2,· · ·,Xkj}
[0096] 其中,m,n2,…,nk为k个分割点,且下标满足1 < m<n2<…,nk《n。
[0097] 步骤三(3)、分别计算各自分类情况下的目标函数值:
[0098]
[0099] 当η和k都确定时,L[B(n,k)]越小表示各类的离差平方和越小,即所谓的类内散步 最小,差异最小。
[0100] 步骤三(4)、Fisher算法的核心递推公式:
[0101]
(3)
[0102]
(4;)
[0103] 式1是将数据分为两类的最小目标函数公式,式2是将样本分为k类的最小目标函 数公式。若要将η个样品分为k类的最优分割,应建立在将j-Ι个样品分为k-ι类的最优分割 基础上(此处」=1,2,3,...,1〇,即由式1到式2的逐渐类推过程。
[0104] 步骤三(5)、由步骤三(4)的(3)式中先计算分成两类的目标函数,得出目标函数值 显示到表3中
[0105] 步骤三(6)、由步骤三(4)的(4)式中再计算分成三类、四类,…,(n-1)类的目标函 数,结果显示在表3中。
[0106] 表3
[0107]
[0108] 本发明的步骤三分别计算了将96个数据分成2类、3类、4类、…、95类的最优分割的 目标函数,计算结果列于表3中,因数据较多,实际路况中的交通时段划分的数目不可能太 多,因此只显示分割成2类到15类的目标函数值。目标函数值后面的括弧中的数字,例如表3 的第一个数值180.5(3),此时j = 3,k = 2,该数据描述的是j个数据分为k类的最优分法,括 弧中的数字3即可作为分割点,3之前的作为一类,即表示对一切形如 样本数据,如欲分成两类,以61={&1,&2},6 2={&3}的分法为最优情况。
[0109] 步骤三(7)求取最优解,如果能直接从数据结构角度得出最优分类数目,当然最 好,这样由表3即可知道如何划分数据,但绝大数情况下不能确定最优分类数目,此时可作 出L[B(n,k)]随分类数k的变化趋势图,如图4所示:
[0110] 本实施例采用更科学的方法获取最优分类数值,通过计算相邻目标函数的非负斜 率值求取:
[0111]
[0112]步骤三(8),比较斜率值,确定最优分类数,斜率较大时,表示第k类优于第(k_l) 类,斜率值接近〇时表示没有继续分类的必要,一般取斜率最大处为最优分类数。
[0113]步骤四、根据步骤三(7)和步骤三(8)根据最优分类数输出的分类点,进行时段区 间划分。
[0114] 步骤四(1)、根据最优分类数k以及表3中相应目标函数值括弧中的数据m,确定Gk ,为同一类,即属于同一时段区间;剩余的(m-1)个数据再根据表3中数 据进行划分,依次类推,可以得到最优分类数为k时,96个样品数据的具体分类情况。
[0115] 步骤四(2),基于最优分割结果对时段进行划分时,对于所划分时段的多少其实没 有严格或者说合理的约定,而上述步骤求解的最优分类数是理想数值;因此,时段划分数又 不宜过多,交通时段划分数一般为4-10个。本实施例中通过计算,将所得分割点转化为时 亥IJ,得到最终的时段划分结果如图5所示。与通常将24h划分为早高峰、平峰、晚高峰三个时 段的传统划分方法相比,本文的划分方法更为细致,高峰段着重体现出过渡、顶峰和下降的 趋势,更能体现出交通流的变化趋势。
[0116] 本实施例的最终效果为:技术人员借助软件将上述方法加载到信号控制系统中, 人性化的操作界面更易于操作人员理解,操作人员还可以凭借丰富经验和实际路况对划分 结果进行优化完善微调,可调整时段区间、增减时段。结果显示,根据本发明的方法得出的 划分结果,是科学且合理的,分段拟合精度高,且方法简单,理论性强,易于接受,可以极大 地缓解拥堵、减少延误。
【主权项】
1. 一种基于Fisher算法的交通时段自动划分的方法,其特征在于,包括如下步骤: 步骤一,采集任意给定采样间隔的交通流基本参数,得到原始数据; 步骤二,对原始数据依次进行筛选、处理和修复预处理,得到预处理数据; 步骤三、通过Fisher算法对预处理数据进行分类,得到最优解和分割点; 步骤四、输出分割点,结合最优分类数目,对交通时段区间进行划分。2. 根据权利要求1所述的基于Fisher算法的交通时段自动划分的方法,其特征在于,所 述的步骤二通过如下步骤实现: 步骤1:对原始数据进行筛选和判别,提取出正常数据; 步骤2:建立问题数据修复模型,对原始数据中的缺失类数据、异常类数据、错误类数据 和冗余类数据进行修复归约,得到修复数据; 步骤3:将修复数据与正常数据进行合并,得到所述的预处理数据。3. 根据权利要求1或2所述的基于Fisher算法的交通时段自动划分的方法,其特征在 于,所述的步骤三包括如下步骤: 步骤1,定义类直径:设某一类样本G的原序列为Gi= {Xu,Xi2-_Xij},定义其直径Di为样 本离差平方和:式中,,1;为均值,Xij为样本特征值; 步骤2、假设样本(样品个数为η)分成k类: Gi= {Χιι,Χ?2,…,Xij} G2 = {X21,X22,…,X2j} Gk - { Xkl,Xk2,· · ·,Xk j } 其中,m,n2,…,nk为k个分割点,且下标满足1 < m<n2<…,nk《n; 步骤3、定义目标函数为步骤4、根据Fi sher算法的核心递推公式:计算最小目标函数; 步骤5、求取最优解: 若分类数k(l<k<n)已知,求分类法L[B(n,k)],使它在目标函数意义下达到最小,求 法如下: 首先根据目标函数相邻值计算非负斜率,取非负斜率最大的分类数k为最优分类数;找 最优分类数目k对应的分割点jk,使步骤G的公式数值达最小,即 L[B(n,k)]=L[B( jk_l,k_l)]+D( jk,n) 由上式求得分割成k类的最优情况Gk;然后依次类推,求取第九^个分割点下的最小目标 函数,得到第k-Ι类Gw,依次求得所有类Gk,Gh,…,G2,&,此即为最优解。
【专利摘要】本发明是一种基于Fisher算法的交通时段自动划分方法,该方法包括数据提取与预处理、分割算法设计和时段划分优化设计三个方面,首先,对交通流数据进行提取、清洗筛选和修复归约,改进数据的质量;其次,定义类的直径和这种方法的损失函数,利用Fisher算法的核心递推公式求取最优解,最后根据最优解对交通时段进行划分,可满足不同的路况应用需求。与现有技术相比,本发明的显著优点:方法易实现,精确度高,鲁棒性强,可应用于实际道路交通控制系统中。
【IPC分类】G06Q50/26, G06Q10/04
【公开号】CN105608510
【申请号】CN201511023923
【发明人】高桃桃, 刘建华, 杜云霞, 张新军, 项俊平, 母万国, 程添亮
【申请人】连云港杰瑞电子有限公司
【公开日】2016年5月25日
【申请日】2015年12月31日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1