基因搜索短时交通流预测方法

文档序号:6548817阅读:212来源:国知局
基因搜索短时交通流预测方法
【专利摘要】本发明公开了一种基因搜索短时交通流预测方法,包括如下步骤:(1)对交通流数据进行采集时,保证采集到的数据中包含一定量的工作日数据、非工作日数据和重大节假日数据,即数据库的多样性;(2)对采集到的连续时间段交通流数据进行二进制编码,建立短时交通流预测基因库;(3)对当前连续时间段的交通流数据进行二进制编码;(4)通过当前交通流数据染色体基因与短时交通流预测基因库中的历史交通流数据染色体基因进行比对,搜索到最相似的染色体种群;(5)计算出相似种群中所有染色体基因的偏差值;(6)将偏差值最小的三条染色体的预测基因片段进行解码,取三个预测基因片段解码值的平均数作为最终的预测结果,因此预测精度高于利用当天或者几天历史数据进行预测的模型,是短时交通流预测的有效方法。
【专利说明】基因搜索短时交通流预测方法
【技术领域】
[0001]本发明涉及一种可以实现智能交通管理的基因搜索短时交通流预测方法。
【背景技术】
[0002]进入新世纪以来,我国经济持续高速增长,大量的汽车进入人们的日常生活,同时也带来了交通拥堵、交通污染、交通事故等问题。在当前的道路条件下,智能交通系统是一种有效解决交通领域里相关问题的方法。在智能交通管理系统中,交通流预测控制方法作为基础理论研究,是实现智能交通管理系统的关键,具有重要意义。
[0003]目前单一的短时交通流预测方法都要求独特的信息特征和特定的适用条件,致使单一的预测模型对复杂的交通流量预测精度不高,并且在预测之前往往需要进行大量的分析判断来选择最佳方法。一些短时交通流预测组合方法往往不能同时兼顾预测的准确性与实时性,虽然这其中的一些组合方法在一定程度上提高预测精度,但是其操作复杂、劳动量较大,不利于进行实时交通流预测。例如专利申请号为200910100395.1的专利公开文本,采用智能组合的方法,将历史平均法以及神经网络模型的预测输出,进行模糊组合得到组合模型的预测输出。该方法存在的不足之处是对于两种子模型的组合过程较复杂,工作量大,且需要对交通流数据进行工作日、周末、重大节假日分类预测,才能保证较高的预测精确度。专利申请号为201210186056.1的专利,采用加权组合的方法,将K近邻方法的预测结果和模糊神经网络的预测结果进行加权求和,作为最终的组合模型预测结果。该方法存在的不足之处是K近邻预测法通过历史数据库中样本与当前交通流状况之间的距离来对下一时间段的交通流状况作出预测,但是距离只反映当前点和K近邻的“靠近性”,不能直接反映它们之间的“形状相似性”,而形状相似性则直接反映交通流的发展变化规律。并且当交通流数据库较大时,K近邻法预测速度较慢。

【发明内容】

[0004]本发明的目的在于克服现有技术中存在的不足而提供一种以提高短时交通流预测的准确性与实时性的基因搜索短时交通流预测方法。
[0005]本发明的目的是这样实现的:一种基因搜索短时交通流预测方法,其特征在于,包括以下步骤:
[0006]步骤I)、数据采集:
[0007]对交通流数据进行采集时,保证采集到的数据中包含一定量的非工作日数据和重大节假日数据,保证数据库的多样性;
[0008]步骤2)、历史交通流数据编码:
[0009] 利用当前t-3、t-2、t-1时间段的交通流数据来对t时间段的交通流量进行预测,选取连续4个时间段的交通流数据q(t-3)、q(t_2)、q(t_l)、q(t)的基因组合作为一个染色体C,具体是针对不同的交通流数据库大小以及要求的预测精确度,选择不同长度的连续时间段交通流数据对当前交通流状况进行预测,利用t-m、t-m+1、…t-2、t-1时间段的交通流数据q(t-m)、q (t-m+1)、…q(t_2)、q(t_l)对t时间段的交通流量进行预测,其中m为正的自然数,染色体C中包含了比对基因片段D1和预测基因片段D2, D1由q (t-3)、q (t_2)、
q(t-l)对应的基因D;' Dt;1组合而成,D2由q(t)对应的基因謂组成;
[0010]步骤3)、当前交通流数据编码:
[0011]对当前t时间段交通流量进行预测时,将t时间段之前的t-3、t-2、t-1三个时间段的交通流数据的基因组合作为一个染色体Y1,该染色体基因为36位二进制编码值,其中前12位为交通流数字百位对应的二进制编码值组合而成,中间12位为交通流数字十位对应的二进制编码值组合而成,后12位为交通流数字个位对应的二进制编码值组合而成;
[0012]短时交通流预测基因库中的染色体C因带有预测基因片段D2,所以它是48位二进制编码值;为了便于与染色体C进行比对,对染色体Y1进行修补,增加12位编码为O的无效基因片段000000000000,修补后的染色体为48位二进制编码值,记为匹配标准染色体Y ;
[0013]步骤4)、搜索相似染色体种群:
[0014]在短时交通流预测基因库中,搜索与匹配标准染色体Y前18位基因相同的染色体C作为初始种群,当短时 交通流预测基因库较大时,选择更多位的相同基因,以提高搜索效率,初始种群数量定义为P,当P > 10时,则以匹配标准染色体Y的第19位基因值为标准,在初始种群中继续搜索与匹配标准染色体Y第19位基因值相同的染色体C,然后重新统计符合条件的相似染色体总数,如果P仍然大于10,则以匹配标准染色体Y的第20位基因值为标准,直到P < 10时,停止,此为初始种群数量;
[0015]步骤5)、相似染色体偏差值计算:
[0016]初始种群中的每个染色体均含有48位基因,根据搜索条件,前18位基因完全一样,将染色体C的48位基因分为16个基因片段,每三位基因为一个基因片段,每个基因片段的偏差值记为4(/ = L2…16),因为前18位基因完全一样,前6个基因片段是一样的,计算偏差值时从第7个基因片段开始计算;
[0017]每三位基因为一个基因片段,是因为在t-3、t-2、t-Ι时间段所对应的交通流数据二进制码中,这三位基因对应的二进制值的位置是一样的,在计算偏差值时,它们具有同等性;对于初始种群中每一个染色体Cn,η为正的自然数,且η < 10,染色体Cn的任一基因片段在计算与匹配标准染色体Y的偏离值时计算原则都不一样;具体公式如下:
[0018]初始种群P中染色体Cn,η为正的自然数,且η < 10,第i个基因片段与匹配标准染色体Y第i个基因片段有a个基因不一样(a = O, I, 2,3),则初始种群P中染色体Cn的第i个基因片段其偏差值为:
[0019]Mlt = ax2b xW ,
[0020]式中2b为该基因片段对应的十进制转化关系,IOc代表该基因位是交通流数字十位或者个位对应的二进制编码值组合而成;
[0021 ] 初始种群P中染色体Cn的总偏差值:
[0022]Δ = Δ + ^ + Δ: + Δ: + Δ*! + Δ::
- Jn n n η n n H
[0023]步骤6)、预测基因片段解码及预测:
[0024]选取偏差值An最小的三条染色体Cn,η = 1,2, 3,将每一条染色体中的预测基因片段D2解码为十进制数分别为Sp S2, S3,它们为历史数据库中与当前t时间段交通流量相似的时间段的交通流量,利用它们对当前t时间段的交通流量进行预测的值S为:
【权利要求】
1.一种基因搜索短时交通流预测方法,其特征在于,包括以下步骤: 步骤I)、数据采集: 对交通流数据进行采集时,保证采集到的数据中包含一定量的非工作日数据和重大节假日数据,保证数据库的多样性; 步骤2)、历史交通流数据编码: 利用当前t-3、t-2、t-1时间段的交通流数据来对t时间段的交通流量进行预测,选取连续4个时间段的交通流数据q(t_3)、q(t_2)、q(t-l)、q(t)的基因组合作为一个染色体C,具体是针对不同的交通流数据库大小以及要求的预测精确度,选择不同长度的连续时间段交通流数据对当前交通流状况进行预测,利用t-m、t-m+l、一t-2、t_l时间段的交通流数据q(t-m)、q(t_m+l)、…q(t_2)、q(t_l)对t时间段的交通流量进行预测,其中m为正的自然数,染色体C中包含了比对基因片段D1和预测基因片段D2, D1由q (t-3)、q (t_2)、q (t-1)对应的基因D\-\ Ο1;4组合而成,D2由q(t)对应的基因D丨组成; 步骤3)、当前交通流数据编码: 对当前t时间段交通流量进行预测时,将t时间段之前的t-3、t-2、t-1三个时间段的交通流数据的基因 组合作为一个染色体Y1,该染色体基因为36位二进制编码值,其中前12位为交通流数字百位对应的二进制编码值组合而成,中间12位为交通流数字十位对应的二进制编码值组合而成,后12位为交通流数字个位对应的二进制编码值组合而成; 短时交通流预测基因库中的染色体C因带有预测基因片段D2,所以它是48位二进制编码值;为了便于与染色体C进行比对,对染色体Y1进行修补,增加12位编码为O的无效基因片段000000000000,修补后的染色体为48位二进制编码值,记为匹配标准染色体Y ;步骤4)、搜索相似染色体种群: 在短时交通流预测基因库中,搜索与匹配标准染色体Y前18位基因相同的染色体C作为初始种群,当短时交通流预测基因库较大时,选择更多位的相同基因,以提高搜索效率,初始种群数量定义为P,当P > 10时,则以匹配标准染色体Y的第19位基因值为标准,在初始种群中继续搜索与匹配标准染色体Y第19位基因值相同的染色体C,然后重新统计符合条件的相似染色体总数,如果P仍然大于10,则以匹配标准染色体Y的第20位基因值为标准,直到P < 10时,停止,此为初始种群数量; 步骤5)、相似染色体偏差值计算: 初始种群中的每个染色体均含有48位基因,根据搜索条件,前18位基因完全一样,将染色体C的48位基因分为16个基因片段,每三位基因为一个基因片段,每个基因片段的偏差值记为<(/ = 1,2…〗6),因为前18位基因完全一样,前6个基因片段是一样的,计算偏差值时从第7个基因片段开始计算; 每三位基因为一个基因片段,是因为在t-3、t-2、t-1时间段所对应的交通流数据二进制码中,这三位基因对应的二进制值的位置是一样的,在计算偏差值时,它们具有同等性;对于初始种群中每一个染色体Cn,η为正的自然数,且η < 10,染色体Cn的任一基因片段在计算与匹配标准染色体Y的偏离值时计算原则都不一样;具体公式如下: 初始种群P中染色体Cn,η为正的自然数,且η < 10,第i个基因片段与匹配标准染色体Y第i个基因片段有a个基因不一样(a = O, I, 2,3),则初始种群P中染色体Cn的第i个基因片段其偏差值为:

【文档编号】G06F17/30GK104021665SQ201410249337
【公开日】2014年9月3日 申请日期:2014年6月6日 优先权日:2014年6月6日
【发明者】钱伟, 杨矿利, 杨蒙蒙, 陈琳, 赵运基 申请人:河南理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1