一种基于数据关联性的桥梁应变数据异常值识别方法与流程

文档序号:18798249发布日期:2019-09-29 20:07阅读:233来源:国知局
一种基于数据关联性的桥梁应变数据异常值识别方法与流程

本发明属于桥梁健康监测数据分析研究领域,具体涉及一种基于数据关联性的桥梁应变数据异常值识别方法。



背景技术:

国内外桥梁健康监测技术的应用逐渐成熟,大型桥梁结构健康监测系统功能亦逐渐提高,但由于其组成环节和影响因素的日益增加,发生故障的潜在可能也逐渐增大,桥梁健康监测任务的长期性与监测系统设备的有限寿命间的矛盾更加突出,如个别部件的故障常会引起链式反应,导致整个系统不能运行甚至瘫痪。尤其是,监测系统自身故障引起的监测数据失真如果不能被及时发现,将影响安全评估结果的准确性,使得桥梁结构健康监测任务不能顺利完成。根据houser和aktan等人的研究,现有桥梁健康监测系统中超过80%的虚假报警都是由于数据失真导致的[1]。因此,需要对监测数据进行清洗,以实现传感器数据的价值,提高桥梁健康监测系统的可用性和效能。

应变数据异常值主要由于电源故障、仪表或其他使信号产生瞬时波动,形成脉动干扰而造成,主要表现为信号波动幅度过大。但应变数据本身波动较大,车辆经过时会造成较大的信号波动,这样的信号波动与数据异常值从单一信号源难以分辨。因此,针对上述数据异常值的缺点,迫切需要发展一种对桥梁监测动应变数据异常值进行实时清洗的方法。

参考文献:

[1]贺冬冬,张理,张会礼,李现科.“3σ准则”在桥梁健康监测数据奇异值检验中的应用[j].中外公路,2013,33(6):107-110.



技术实现要素:

本发明所要解决的技术问题是针对上述现有技术的不足提供一种基于数据关联性的桥梁应变数据异常值识别方法,本基于数据关联性的桥梁应变数据异常值识别方法能精准高效地处理桥梁健康监测中应变数据异常值问题。

为实现上述技术目的,本发明采取的技术方案为:

一种基于数据关联性的桥梁应变数据异常值识别方法,包括以下步骤:

步骤1、获取安装于相同位置的传感器原始数据;

步骤2、通过小波分解对原始应变数据提取长周期趋势数据,得到原始应变数据与长周期趋势数据的差值;

步骤3、根据步骤2得到的应变差值数据的均值和标准差,得到原始应变数据中潜在异常值的变化范围;

步骤4、通过小波分解对原始加速度数据提取长周期趋势数据,得到原始加速度数据与长周期趋势数据的差值;

步骤5、根据步骤4得到的加速度差值数据的均值和标准差,得到原始加速度数据中潜在异常值的变化范围;

步骤6、对比原始应变数据中潜在异常值的出现位置与原始加速度数据中潜在异常值的出现位置,判断识别原始应变数据真正的异常值。

作为本发明进一步改进的技术方案,所述步骤1的具体步骤为:

获取健康监测系统相同位置处的应变传感器采集的原始应变数据{xi},i=1,2,…,n及加速度传感器采集的原始加速度数据{yi},i=1,2,…,n,其中n表示数据个数。

作为本发明进一步改进的技术方案,所述步骤2的具体步骤为:

步骤2.1、采用小波分解提取原始应变数据的长周期趋势数据{si},i=1,2,…,n;

步骤2.2、计算xi与si的差值进行分析,记为di=xi-si。

作为本发明进一步改进的技术方案,所述步骤3的具体步骤为:

步骤3.1、计算应变差值数据{di},i=1,2,…,n的均值μ和标准差σ;

其中:

步骤3.2、根据区间估计方法,计算应变差值的正常值的波动范围(μ-aσ,μ+aσ),其中a为设定的阈值范围系数;

步骤3.3、根据应变差值的正常值的置信区间,查找应变差值数据{di},i=1,2,…,n在置信区间(μ-aσ,μ+aσ)以外的数据位置信息,记:{di},i=1,2,…,n<μ-aσ的数据位置序列为其中m1为应变差值小于下分位值的数据个数;{di},i=1,2,…,n>μ+aσ的数据位置序列为其中m2为应变差值大于上分位值的数据个数;则为原始应变数据序列中的潜在异常点位置集合。

作为本发明进一步改进的技术方案,所述步骤4的具体步骤为:

步骤4.1、采用小波分解提取原始加速度数据的长周期趋势数据{si'},i=1,2,…,n;

步骤4.2、计算yi与si'的差值进行分析,记为di'=yi-si'。

作为本发明进一步改进的技术方案,所述步骤5的具体步骤为:

步骤5.1、计算加速度差值数据{di'},i=1,2,…,n的均值μ'和标准差σ';

其中:

步骤5.2、根据区间估计方法,计算加速度差值的正常值的波动范围(μ'-bσ',μ'+bσ'),其中b为设定的阈值范围系数;

步骤5.3、根据加速度差值的正常值的置信区间,查找加速度差值数据{di'},i=1,2,…,n在置信区间(μ'-bσ',μ'+bσ')以外的数据位置信息,记:{di'},i=1,2,…,n<μ'-bσ'的数据位置序列为其中n1为加速度差值小于下分位值的数据个数;{di'},i=1,2,…,n>μ'+bσ'的数据位置序列为其中m2为加速度差值大于上分位值的数据个数;则为原始加速度数据序列中的潜在异常点位置集合。

作为本发明进一步改进的技术方案,所述步骤6的具体步骤为:

遍历原始应变数据序列中的潜在异常点位置集合中的元素,若该元素也在原始加速度数据序列中的潜在异常点位置集合中,则该元素对应的原始应变数据为正常值,否则,该元素对应的原始应变数据为异常值。

本发明的有益效果为:本发明针对动应变数据异常值在单一数据源中难以与由车辆荷载引起的信号波动分离,本发明综合多数据源进行信息融合,提出基于数据关联性的应变数据异常值识别方法,具有以下有益效果:

(1)本发明能够准确识别出动应变数据中的异常值,误判少;

(2)本发明能够对动应变数据进行实时化、自动化清洗,具有广泛的工程应用价值。

附图说明

图1是烈士河大桥2017年4月9日应变传感器第二通道数据的一维时程图。

图2是烈士河大桥2017年4月9日加速度传感器第二通道数据的一维时程图。

图3是应变差值示意图。

图4是应变数据中正常数据及潜在异常值图。

图5是加速度差值示意图。

图6是加速度数据中正常数据及潜在异常值图。

图7是应变数据中异常值识别图。

具体实施方式

下面根据图1至图7对本发明的具体实施方式作出进一步说明:

一种基于数据关联性的桥梁应变数据异常值识别方法,包括以下步骤:

1)、获取安装于相同位置的传感器原始数据。

具体步骤为:

获取健康监测系统相同位置处的应变传感器采集的原始应变数据{xi},i=1,2,…,n及加速度传感器采集的原始加速度数据{yi},i=1,2,…,n,其中n表示数据个数。

2)、通过小波分解对原始应变数据提取长周期趋势数据,得到原始应变数据与长周期趋势数据的差值。

具体步骤为:

a)采用小波分解提取原始应变数据的长周期趋势数据{si},i=1,2,…,n;

b)计算xi与si的差值进行分析,记为di=xi-si。

3)、根据应变差值数据的均值和标准差,得到原始应变数据中潜在异常值的变化范围。

具体步骤为:

a)计算应变差值数据{di},i=1,2,…,n的均值μ和标准差σ;其中:

b)根据区间估计方法,计算应变差值的正常值的波动范围(μ-aσ,μ+aσ),其中a为设定的阈值范围系数;其中应变差值的正常值的波动范围也可称作应变差值的正常波动范围;

c)根据应变差值的正常值的置信区间,查找应变差值数据{di},i=1,2,…,n在置信区间(μ-aσ,μ+aσ)以外的数据位置信息,记:{di},i=1,2,…,n<μ-aσ的数据位置序列为其中m1为应变差值小于下分位值的数据个数;{di},i=1,2,…,n>μ+aσ的数据位置序列为其中m2为应变差值大于上分位值的数据个数;则为原始应变数据序列中的潜在异常点位置集合。本实施例中传感器采集的数据都是按照时间序列记录,存在格式化的数据位置,本实施例中的位置即指异常点出现时的数据位置,即异常点出现时对应记录的时刻。

4)、通过小波分解对原始加速度数据提取长周期趋势数据,得到原始加速度数据与长周期趋势数据的差值。

具体步骤为:

a)采用小波分解提取原始加速度数据的长周期趋势数据{si'},i=1,2,…,n;

b)计算yi与si'的差值进行分析,记为di'=yi-si'。

5)、根据加速度差值数据的均值和标准差,得到原始加速度数据中潜在异常值的变化范围。

具体步骤为:

a)计算加速度差值数据{di'},i=1,2,…,n的均值μ'和标准差σ';其中:

b)根据区间估计方法,计算加速度差值的正常值的波动范围(μ'-bσ',μ'+bσ'),其中b为设定的阈值范围系数;其中加速度差值的正常值的波动范围也可称作加速度差值的正常波动范围;

c)根据加速度差值的正常值的置信区间,查找加速度差值数据{di'},i=1,2,…,n在置信区间(μ'-bσ',μ'+bσ')以外的数据位置信息,记:{di'},i=1,2,…,n<μ'-bσ'的数据位置序列为其中n1为加速度差值小于下分位值的数据个数;{di'},i=1,2,…,n>μ'+bσ'的数据位置序列为其中m2为加速度差值大于上分位值的数据个数;则为原始加速度数据序列中的潜在异常点位置集合。

步骤6、对比原始应变数据中潜在异常值的出现位置与原始加速度数据中潜在异常值的出现位置,判断识别原始应变数据真正的异常值。

具体步骤为:判断原始应变数据中潜在异常值位置是否在原始加速度数据中潜在异常值位置也存在相同的异常点位置,即:

遍历原始应变数据序列中的潜在异常点位置集合p中的元素,记:元素p∈p,若p∈q,则该元素对应的原始应变数据为正常值,否则,该元素对应的原始应变数据为异常值。

下面以烈士河大桥为例,说明本发明的具体实施过程:

本实施例所述的原始应变数据选取烈士河桥2017年4月9日应变传感器第二通道的数据,原始加速度数据选取同一位置处的加速度传感器第二通道数据,采样频率均为200hz,共17280000个数据,图1展示了该原始应变数据的一维时程曲线,图2展示了该原始加速度数据一维时程曲线。其次,采用小波分解将原始应变数据分成长周期信号及高频信号,其中高频信号即应变差值,其示意图如图3所示。长周期信号主要由温度效应引起,与温度成正相关关系;高频信号主要是由车辆荷载产生,但同时也包含一定的传感器本身问题或外界干扰引起的数据异常值。

计算得到应变差值的均值为0.0021,标准差为1.4049,设置阈值范围参数为8,得到应变差值的正常波动区间为(-11.2372,11.2415),进而得到原始应变数据的潜在异常值为60个。原始应变数据潜在异常值的分布情况如图4所示。

然后,对原始加速度数据进行小波分解,提取其长周期趋势,得到原始加速度数据与长周期趋势数据的差值,如图5所示。其中,加速度差值的均值为0,标准差为6.8925,设置阈值范围参数为8,得到加速度差值的正常波动区间为(-55.1397,55.1397),进而得到原始加速度数据的潜在异常值为115个。原始加速度数据潜在异常值的分布情况如图6所示。

对比应变潜在异常值的出现位置与加速度潜在异常值的出现位置,判断识别原始应变数据真正的异常值。在寻找原始应变数据和原始加速度数据潜在跳点值的相同位置时,考虑到桥梁结构本身存在一定的响应误差及传感器的影响,记应变数据潜在跳点位置为pi,本节认为在加速度数据潜在跳点[pi-2,pi+2]位置处即为相同位置。如果二者潜在跳点位置相同则该点对应的应变数据正常,不作处理;反之,则该点对应的应变数据为异常值。经过对比识别之后,共存在4个相同位置,即4个正常数据,最终的原始应变数据异常值识别如图7所示。

以上算例表明本发明所提出的方法能够有效识别应变数据中的异常值且对于异常值的误判少,能够实时化、自动化清洗动应变数据中的异常值,可以应用于实际工程健康监测数据预处理中。

本发明的保护范围包括但不限于以上实施方式,本发明的保护范围以权利要求书为准,任何对本技术做出的本领域的技术人员容易想到的替换、变形、改进均落入本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1