一种数据驱动的城市交通流速模式识别与实时预测预警方法

文档序号:26009634发布日期:2021-07-23 21:29阅读:来源:国知局

技术特征:

1.一种数据驱动的城市交通流速模式识别与实时预测预警方法,其特征在于,包括以下步骤:

第一步,数据预处理:将城市路段的交通流速历史数据作为初始数据集,所述初始数据集包括若干不同路段id、不同时间的样本数据;对所述初始数据集进行预处理,得到已预处理数据集,所述预处理包括缺失值处理、异常值处理与标准化处理;

第二步,流速模式分析:按照改进版的k-mans聚类算法,对第一步中所述已预处理数据集进行聚类分析,得到不同路段id和不同日期特征下的交通流速模式数据集和交通流速模式图。所述日期特征是指该日所属一周内的星期几,所述交通流速模式数据集包括不同类别的一天24小时下的路段交通流速数据,所述交通流速模式图是所述交通流速模式数据集的折线图表示;

第三步,历史模式匹配:使用第二步中所述交通流速模式数据集和交通流速模式图,结合不同路段id与当前日期特征,匹配符合当日的交通流速模式数据集和交通流速模式图,即形成其交通流速历史模式;

第四步,实时流速预测:使用第一步中已预处理数据集作为预测模型的训练集,得到预测模型中的最优模型参数,导入城市路段的交通流速实时数据,基于训练好的预测模型实现对交通流速的实时预测,得到实时预测结果;

第五步,实时流速预警:对于同一路段id,使用第四步中实时预测结果与第三步中的交通流速历史模式进行比较,如果二者的下半偏差——前者数据减去后者数据为负值时的偏差,大于设定阈值时进行路段的交通流速预警,即结合交通流速历史模式与实时预测结果进行实时预警,以便及时采取路段交通缓堵措施。

2.根据权利要求1所述的一种数据驱动的城市交通流速模式识别与实时预测预警方法,其特征在:所述第一步中,

预处理中的缺失值处理的实现为,针对连续缺失数据为两个及以下的缺失数据,取值为前一个最近的值;针对连续缺失数据为两个以上的缺失数据,若为周六日,则填补为周六日的该路段id该时间下的均值,若为工作日,则填补为工作日该路段id该时间下的均值;

预处理中的异常值处理的实现为,采用二倍标准差分解法,首先筛选缺失值处理后的数据集中每个路段id的每个时间点下的样本数据中与该样本数据的均值之差大于两倍该样本数据的标准差的异常值,调整为该样本数据的均值与两倍该样本数据的标准差之和;然后筛选缺失值处理后的数据集中每个路段id的每个时间点下的样本数据中与该样本数据的均值之差小于两倍该样本数据的标准差的异常值,调整为该样本数据的均值与两倍该样本数据的标准差之差,其中所述缺失值处理后的数据集中第j个路段id的第i个时间点下的样本数据经过异常值处理后的数值y(i,j)表示为:

式中,yij表示所述缺失值处理后的数据集中第j个路段id的第i个时间点下的原始数据;μi表示所述缺失值处理后的数据集中第i个时间点下的样本数据的均值;表示所述缺失值处理后的数据集中第i个时间点下的样本数据的标准差;

预处理中的标准化处理的实现为,令vt表示为t时刻的交通流速,其中l表示数据字段中的路段长度;t表示数据字段中的路段通行时间;t表示数据字段中的数据记录时间。

3.根据权利要求1所述的一种数据驱动的城市交通流速模式识别与实时预测预警方法,其特征在:所述第二步中,通过改进版的k-means聚类算法进行交通流速模式的识别,具体如下:

(1)聚类指标的确定:根据路段流速数据的特征,选取一天内不同t时刻的路段流速时间序列数据作为聚类指标;

(2)指标权重的选取:对于不同日期之间差别大小不同的指标,应赋予不同的权重,使区分更加充分,所以使用反映数据间离散程度大小的变异系数作为权重赋值给每个日期下的聚类指标,某个指标对应的变异系数计算如下:

式中,cv表示该指标对应的变异系数;σ(v)表示所有日期的该指标值的总体标准差;e(v)表示所有日期的该指标值的均值;vi表示第i个日期该指标的值;m表示待聚类的日期数;

(3)最佳聚类数目的确定:轮廓系数sli(a)是衡量样本点聚类结果类内紧密性和类间分离性的测度量,用来确定最佳聚类数目;sli(a)∈[-1,1],取值越大说明聚类效果质量越好,计算方法如下:

式中,sli(a)表示样本aa的轮廓系数;aa表示样本aa到其它类内样本平均距离的最小值;ba表示样本aa与其所属类内其它样本的平均距离;aa表示所取样本;ab表示与aa所属同一类的样本;ac表示与aa所属不同类的样本;k(a)表示样本aa所属的类;k′表示与k(a)不同的类;

以上计算过程得到一个样本点的轮廓系数,将所有点的轮廓系数测度值取平均值,得到轮廓系数测度的平均值计算公式如下:

式中,m表示样本点的数量;n表示聚类数目,对于来说,其值最大时,对应的聚类数n即为最佳聚类数目;

(4)k-means聚类识别交通流速模式:用确定最佳聚类数目后,对所述聚类指标使用k-means聚类算法实现路段的交通流速模式识别,k-means聚类算法的基本思路是选出若干个初始点作为初始聚类中心,将除初始点以外的点按照最近距离的原则归入各中心,得到第一次迭代结果,然后将每一类的中心点作为下一次迭代的中心,进行重复迭代,最终结果逐渐收敛、逼近最优解,具体操作步骤如下:

①随机选取k个点,作为聚类中心;

②计算每个点分别到k个聚类中心的距离,将该点分到最近的聚类中心,这样可形成k个簇;

③重新计算每个簇的质心,即均值;

④重复以上②-④步,直到每个簇的质心的位置不再发生变化或达到设定的迭代次数。

其中,第(2)步指标权重的选取为改进版k-means聚类算法的体现,此指标权重的选取能体现不同指标对于聚类的影响能力不同,优化聚类的效果。

4.根据权利要求1所述的一种数据驱动的城市交通流速模式识别与实时预测预警方法,其特征在:所述第四步中,预测模型采用holt指数平滑预测模型对城市路段的交通流速进行实时预测,具体如下:

(1)使用路段交通流速历史数据集作为预测模型的训练集来训练预测模型,以确定预测效果最好的模型参数,holt指数平滑预测是将历史数据进行加权平均作为未来时刻的预测结果,其预测方程和平滑方程为:

式中,表示第t+k期的预测值;k表示预测期数;lt表示水平平滑方程,是第t期一次指数平滑值;bt表示趋势平滑方程,是第t期二次指数平滑值;表示阻尼系数,用来防止预测在未来无限增加或减少,α表示水平平滑参数,α∈[0,1];β表示趋势平滑参数,β∈[0,1];

(2)交通流速的实时预测:通过训练好的预测模型,结合路段交通流速实时数据,可对路段的交通流速进行短期实时预测,预测结果作为路段交通流速预警的重要参考信息。

5.根据权利要求1所述的一种数据驱动的城市交通流速模式识别与实时预测预警方法,其特征在:所述第五步中,结合交通流速历史模式与实时预测结果进行实时预警,具体如下:

对于同一路段id,通过已得到的交通流速实时预测结果,匹配所述当天日期特征下的交通流速历史模式,采用前述二倍标准差分解法实现对交通流速异常的实时预警,若实时时刻交通流速实时预测值小于实时时刻当天日期特征下交通流速历史模式值与该时刻该日期特征下历史数据的两倍标准差之差,则视为流速异常并进行流速预警;若实时时刻交通流速实时预测值大于实时时刻当天日期特征下交通流速历史模式值与该时刻该日期特征下历史数据的两倍标准差之和,或者实时时刻交通流速实时预测值介于实时时刻当天日期特征下交通流速历史模式值与该时刻该日期特征下历史数据的两倍标准差之差和实时时刻当天日期特征下交通流速历史模式值与该时刻该日期特征下历史数据的两倍标准差之和之间,则视为流速正常。


技术总结
本发明涉及一种数据驱动的城市交通流速模式识别与实时预测预警方法,包括:对路段交通流速历史数据进行处理,填补缺失值,筛选并修正异常值;基于处理后的路段交通流速历史数据,采用轮廓系数确定最佳聚类数目,使用改进的K‑means聚类算法,得到不同日期特征下的路段交通流速历史模式;利用路段交通流速实时数据,采用Holt指数平滑预测模型预测该路段未来一段时间的交通流速;基于当前日期特征与路段交通流速历史模式进行匹配,计算路段交通流速预测结果与历史模式之间的下半偏差,当下半偏差大于一定阈值时进行预警。本发明在城市交通日益拥堵的背景下,综合利用历史交通流速数据和实时交通流速数据,驱动路段交通流速的模式分析和实时预测,实现对路段交通流速的实时预警,为预防和缓解交通拥堵提供决策依据。

技术研发人员:李想;桂佼;马红光;刘佳明;于海涛
受保护的技术使用者:北京化工大学;北京市交通信息中心
技术研发日:2021.03.05
技术公布日:2021.07.23
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1