空间交叉识别多传感器奇异失真数据的方法

文档序号:6030007阅读:108来源:国知局
专利名称:空间交叉识别多传感器奇异失真数据的方法
技术领域
本发明涉及一种识别传感器失真数据的技术,尤其涉及一种空间交叉识别多传感器奇异失真数据的方法。

背景技术
奇异失真数据是桥梁结构健康监测系统中数据失真现象主要的表现形式之一,发生频率较高;这些发生奇异失真的数据往往与一些正常数据混淆在一起,并且与结构失常数据和外界干扰引起的异常数据很相似,因此,如果不把这些发生失真与变异的原始数据与桥梁结构的损伤信息分离识别开来,轻者会影响桥梁结构故障诊断的准确性、重者会被误判为桥梁结构陡然突变的事故先兆,给桥梁故障诊断结果造成混乱,产生严重后果。
目前,对桥梁结构监测与故障诊断技术的研究主要包括两大倾向,一是主要从力学的角度出发,开展桥梁结构的损伤识别与故障诊断方法的研究,因此,对系统原始数据的失真问题普遍缺乏足够的认识;一是单纯从传感器与测量技术的角度出发研究其可靠性问题,基本没有从状态监测与故障诊断系统的整体出发去探讨数据的失真与变异问题。显然,上述两种倾向都存在不足。
在传统信号处理和数据分析中,已经提出了许多识别单点数据失真的方法,如3σ方法、格拉布斯方法、Q检验法等,然而,此类方法大多是从数据的统计特性出发来识别单点失真数据,并不能直接适用在桥梁结构监测数据上。


发明内容
本发明公开了一种空间交叉识别多传感器奇异失真数据的方法,它包括1)采用基于数据变化率的识别算法,找出发生失真的数据点位置的集合M1,2)采用基于关联稳态模型方法对数据进行处理,找出发生失真的数据点位置的集合M2,3)或者直接将M1或M2提供给后续的结构评估程序,或者对M1、M2取交集M失真=M1∩M2后再提供给后续的结构评估程序。
前述步骤1)采用基于数据变化率的识别算法,判断可能发生失真的数据点位置的依据为 当某一采集到的数据为xi时,它的数据变化率为yi,则根据下式判断数据是否失真 |yi-M|>Δ时,wi=-1,此时数据失真, |yi-M|<Δ时,wi=1,此时数据正常; 发生失真的数据点位置的集合即构成M1。
其中 yi为数据变化率; M为聚类中心值;Δ为设定的阈值;wi为数据状态值。
进一步的,(1)计算数据变化率yi的方法为 设某一传感器采集到的测量数据集为X={x1,x2,…,xi,…,xn-1,xn}和S={s1,s2,…,si,…,sn-1,sn},xi为si时刻采集到的数据,则si时刻xi的数据变化率为 i=2,3,…,n (2)计算聚类中心值M的方法为 以计算得到的数据变化率序列Y={y2,y3,…,yi,…,yn}(i=2,3,…,n)作为样本集,根据下式计算聚类中心值M i=2,3,…,n (3)确定阈值Δ的方法为 由下式计算数据变化率与聚类中心值的距离Ki(yi,M), 得到数据组K={k2,k3,…,ki,…,kn}i=2,3,…,n; 根据下式确定阈值, Δ=g·max(K) 其中,g为参数的安全系数。
步骤2)采用基于关联稳态模型方法对数据进行处理,找出发生失真的数据点位置的集合M2,包括(1)选取适当的主元个数,建立主元模型,(2)计算样本的主元值、估计值和残差,(3)根据步骤(2)的计算结果进行统计假设检验,判断过程有无故障,也即判断数据是否失真。
(1)选取适当的主元个数,建立主元模型 [1]若有测量数据集X,即样本X∈Rn×m,利用主元计算方法得到主元矩阵和负荷向量矩阵PH=[p1…pm]∈Rm×m, 其中,R为相关矩阵的统一表示形式; n为样本数,m为测量变量数; t1为第一主元,p1为t1的载荷; t1T为t1的矩阵转置; [2]把TH和PH分别分解为TH=[T,Tr]和PH=[P,Pr], 其中,T∈Rn×l为前l个主元构成的矩阵,P∈Rm×l为T的负荷矩阵; Tr∈Rn×(m-l)为后(m-l)个主元构成的矩阵,Pr∈Rm×(m-l)为Tr的负荷矩阵; [3]根据下式计算主元的个数ηl 其中,λi为第i个主元的方差,也即第i个特征值; [4]根据主元个数,建立主元模型如下, T=XP (2)计算样本的主元值、估计值和残差 根据下式计算样本X的主元值t, t=PTX 根据下式计算样本X的估计值
根据下式计算样本X的残差
其中,X为测量数据集,X∈Rn×m,n为样本数,m为测量变量数;R为X的相关矩阵; P∈Rm×l为T的负荷矩阵 PT为P的矩阵转置; I为单位矩阵; (3)根据步骤(2)的计算结果进行统计假设检验,判断过程有无故障,也即判断数据是否失真 或者采用HotellingT2统计对t、

进行统计假设检验;或者采用Q统计对t、

进行统计假设检验;或者同时采用HotellingT2统计和Q统计对t、

进行统计假设检验;发生失真的数据点位置的集合即构成M2,同时采用上述两种统计方法进行统计假设检验时,M2为两种方法判断出的失真点位置的并集。
采用HotellingT2统计对t、

进行统计假设检验时,根据下式判断过程有无故障 T2<UCL 式中, t满足条件时,过程正常无故障,数据无失真;否则过程有故障,数据失真; 其中,UCL为置信度为α的HotellingT2统计量的上限; Λ为主元的方差阵,Λ=diag{λ1…λi…λl},λi为X的协方差阵∑阵的第i大特征根; l为主元数;n为样本数; F(l,n-l)为置信度未知,自由度为l和n-l的F分布; Fα(l,n-l)为置信度为α,自由度为l和n-l的F分布; 采用Q统计对t、

进行统计假设检验时,根据下式判断过程有无故障 SPE<Qα SPE满足条件时,过程正常无故障,即数据无失真;否则过程有故障,即数据失真;式中, 其中,SPE为平方预报误差,即Squared Prediction Error;

为样本X的残差; Qα为统计量; θ1、θ2、θ3、h0均为中间变量; λi为特征值; Cα是一个高斯分布的(1-α)%的置信极限; i为特征值的个数; 本发明的有益技术效果是提高了传感器奇异失真数据的识别率和准确率,降低了桥梁结构健康监测系统的误报警。



图1、2,典型基元序列示意图; 图3,累积方差百分比图; 图4,SPE变化情况示意图; 图5,T2变化情况示意图; 图6,主元得分图; 图7,2006年5月15-18日高家花园大桥的挠度数据图; 图8,图7所示数据的数据变化率曲线; 图9,图7所示数据的欧式距离曲线图; 图10,2006年5月19-21日高家花园大桥的挠度数据的数据变化率曲线图; 图11,图10所示的数据变化率曲线所对应的欧式距离曲线图; 图12,图10所示的数据变化率曲线所对应的数据状态曲线图;
具体实施例方式 本发明的创新点在于1、针对奇异失真数据在时间上的纵向和横向的特点,分别从时间二维上来识别奇异失真数据,并对于数据进行融合判断,将奇异失真数据从正常数据,包括结构失常数据和外界干扰引起的异常数据中识别出来; 2、在时间上轴的横向,采用基于关联稳态模型方法来识别奇异失真数据。该方法的前提条件主要是依据奇异数据失真不会破坏桥梁监测数据之间关联性,而桥梁结构损伤一般会引起多数监测数据的关联反应,但是不会损坏其关联性。在时间上轴的纵向,采用基于数据变化率来识别奇异失真数据。该方法的前提条件就是充分考虑了大型桥梁结构变化缓慢、传感器数据变化率变化范围小的特点. 3、该技术充分考虑了大桥结构特点和信号处理方法,将结构工程领域知识和信息科学领域知识结合起来,有效地提高了传感器奇异失真数据的识别率和准确率,降低了桥梁结构健康监测系统的虚假报警。
(一)基于关联稳态模型方法来识别奇异失真数据(时间上的横向) 由于桥梁结构健康监测系统的传感器数量众多,传感器采集的数据构成了一个高维空间,数据中的冗余信息过多,所以,利用主成分分析将分散在一组变量上的信息集中到某几个综合指标(也可称为主成分或主元)上。在系统稳定时候,主成分(主元)可以很好地描述系统状态,剩余成分就可以忽略,而系统不稳定时候,主成分就不能很好地描述系统状态。所以,可以基于主成分分析理论建立关联稳态方程来描述桥梁结构数据之间的关联性。
1)主成分分析内涵 设有随机变量X1,X2…,XP,其样本均数记为X1,X2,…XP,样本标准差记为S1,S2…,SP,首先作标准化变换, 有如下的定义 若 C1=a11x1+a12x2+…+a1PxP 且使Var(C1)最大,则称C1为第一主成分; 若 C2=a21x1+a22x2+…+a2PxP (a21,a22…,a2p)垂直于(a11,a12…,a1p),且使Var(C2)最大,则称C2为第二主成分; 类似地,可有第三、四、五...个主成分,至多有p个。
所以,主成分C1,C2,...,Cp具有如下几个性质 [1]主成分间互不相关,即对任意i和j,Ci和Cj的相关系数 Corr(Ci,Cj)=0(i≠j) [2]组合系数(ai1,ai2,...,aip)构成的向量为单位向量, [3]各主成分的方差是依次递减的,即 Var(C1)≥Var(C2)≥...≥Var(Cp) [4]总方差不增不减,即 Var(C1)+Var(C2)+...+Var(Cp) =Var(x1)+Var(x2)+...+Var(xp)=p 这一性质说明,主成分是原变量的线性组合,是对原变量信息的一种改组,主成分不增加总信息量,也不减少总信息量。
[5]主成分和原变量的相关系数满足如下条件, [6]令X1,X2,…XP的相关矩阵为R,(ai1,ai2,…aip)则是相关矩阵R的第i个特征向量。而且,特征值λi就是第i主成分的方差,即 Var(Ci)=λi 其中,λi为相关矩阵R的第i个特征值 λ1≥λ2…≥λp≥0 假定有n个样本,每个样本共有p个变量,构成一个n×p阶的数据矩阵 当p较大时,在p维空间中考察问题比较麻烦。为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多变量指标所反映的信息,同时它们之间又是彼此独立的。
记X1,X2,…XP为原变量指标,Z1,Z2…,Zm(m≤p)为新变量指标。
系数lij的确定原则 [1]zi与zj(i≠j;i,j=1,2,...,m)相互无关; [2]z1是X1,X2,…XP的一切线性组合中方差最大者,z2是与z1不相关的X1,X2,…XP的所有线性组合中方差最大者; ...... zm是与Z1,Z2,…,Zm-1都不相关的X1,X2,…XP的所有线性组合中方差最大者。
从以上的分析可以看出,主成分分析的实质就是确定原来变量xj(j=1,2,...,p)在诸主成分zi(i=1,2,...,m)上的荷载lij(i=1,2,...,m;j=1,2,...,p)。
从数学上可以证明,它们分别是的相关矩阵的m个较大的特征值所对应的特征向量,则新变量指标Z1,Z2,…,Zm分别称为原变量指标X1,X2,…XP的第一,第二,...,第m主成分(这里又引入了一个主成分的符号Zm,它与CP所表示的主成分的区别也仅仅是在不同地方的两种称谓)。
所以,计算相关矩阵的特征值与特征向量如下 [1]解特征方程 |λI-R|=0 常用雅可比法求出特征值,并使其按大小顺序排列 λ1≥λ2,…,≥λP [2]分别求出对应于特征值λi的特征向量ei(i=1,2,…,P),要求 ||ei||=1 即 其中,eij表示向量ei的第j个分量。
[3]计算主成分贡献率及累计贡献率 贡献率 (i=1,2,…,p) 累计贡献率 (i=1,2,…,p) 一般取累计贡献率达85-95%的特征值所对应的第一,第二,...,第m(m≤p)个主成分。
[4]计算主成分载荷 (i,j=1,2,…,p) 各主成分的得分 前已指出,设有p个随机变量,便有p个主成分。由于总方差不增不减,C1,C2等前几个综合变量的方差较大,而Cp,Cp-1等后几个综合变量的方差较小,严格说来,只有前几个综合变量才称得上主(要)成份,后几个综合变量实为“次”(要)成份。实践中总是保留前几个,忽略后几个。
保留多少个主成分取决于保留部分的累积方差在方差总和中所占百分比(即累计贡献率),它标志着前几个主成分概括信息之多寡。实践中,粗略规定一个百分比便可决定保留几个主成分;如果多留一个主成分,累积方差增加无几,便不再多留。
前面的分析主要介绍了主成分(或主元)的概念,具体应用到本发明中的方法,可以概括为如下 (1)选取适当的主元个数,建立主元模型 [1]若有测量数据集X,即样本X∈Rn×m,利用主元计算方法得到主元矩阵 和负荷向量矩阵PH=[p1…pm]∈Rm×m, 其中,R为相关矩阵的统一表示形式; n为样本数,m为测量变量数; t1为第一主元,p1为t1的载荷; t1T为t1的矩阵转置; [2]把TH和PH分别分解为TH=[T,Tr和PH=[P,Pr], 其中,T∈Rn×l为前l个主元构成的矩阵,P∈Rm×l为T的负荷矩阵(将其构成的子空间称为主元子空间,也称为特征子空间); Tr∈Rn×(m-l)为后(m-l)个主元构成的矩阵,Pr∈Rm×(m-l)为Tr的负荷矩阵(将其构成的子空间称为残差子空间); [3]根据下式计算主元的个数ηl 该公式的意义为l个主元方差的贡献率; 其中,λi为第i个主元的方差,也即第i个特征值; [4]根据主元个数,建立主元模型如下, T=XP (2)计算样本的主元值、估计值和残差 原测量矩阵X表示为 令

称为X的估计值,

称为X的残差,则X可表示为 可以看出测量数据矩阵可分解为两部分,一部分由前l个主元线性表出,后一部分由后(m-l)个主元线性表出,即X的一部分信息投影到主元子空间中,另一部分则投影到残差子空间;如果系统中存在着大量的冗余,那么前l个方向向量确定的子空间即PCA空间就能抽取X的绝大部分信息,即PCA子空间代表X的特征空间,而p为特征空间的方向向量,

是X很好的估计。
故可以根据下面几个式计算其主元值、估计值和残差 根据下式计算样本X的主元值t, t=PTX 根据下式计算样本X的估计值
根据下式计算样本X的残差
其中,X为测量数据集,X∈Rn×m,n为样本数,m为测量变量数;R为X的相关矩阵; P∈Rm×l为T的负荷矩阵; PT为P的矩阵转置; I为单位矩阵; 在实际问题中,不同的变量具有不同的量纲,为了消除由于量纲的不同可能带来的一些不合理的影响,通常应将测量数据进行标准化处理,即 i=1,2,…,n① 其中,Xi为X矩阵中的某一变量,xi为Xi进行标准化处理后对应的变量。
这样原数据集就变换为均值为0,方差为1的标准数据集。
①式与前文提及的都是对数据进行标准化处理,只是处理的方式不一样。
(3)根据步骤(2)的计算结果进行统计假设检验,判断过程有无故障,也即判断数据是否失真 常用的统计有HotellingT2统计和Q统计两种 [1]采用HotellingT2统计对t、

进行统计假设检验时,根据下式判断过程有无故障 T2<UCL 式中, ② t满足条件时,过程正常无故障,数据无失真;否则过程有故障,数据失真; 其中,UCL为置信度为α的HotellingT2统计量的上限; Λ为主元的方差阵,Λ=diag{λ1…λi…λl},λi为X的协方差阵∑阵的第i大特征根; l为主元数;n为样本数; F(l,n-l)为置信度未知,自由度为l和n-l的F分布; Fα(l,n-l)为置信度为α,自由度为l和n-l的F分布; [2]采用Q统计对t、

进行统计假设检验时,根据下式判断过程有无故障 SPE<Qα SPE满足条件时,过程正常无故障,数据无失真;否则过程有故障,数据失真; 式中, ③ 其中,SPE为平方预报误差,即Squared Prediction Error;

为样本X的残差; Qα为统计量; θ1、θ2、θ3、h0均为中间变量; λi为特征值; Cα是一个高斯分布的(1-α)%的置信极限; i为特征值的个数; 上述的两种统计方法,或者采用HotellingT2统计对t、

进行统计假设检验;或者采用Q统计对t、

进行统计假设检验;或者同时采用HotellingT2统计和Q统计对t、


进行统计假设检验;发生失真的数据点位置的集合即构成M2,同时采用上述两种统计方法进行统计假设检验时,M2为两种方法判断出的失真点位置的并集。
通过(一)中方法找到的失真数据点的位置集合即为M2。
(二)基于数据变化率来识别奇异失真数据(时间上的纵向) 要准确的识别单点失真数据,不仅要考虑是桥梁结构数据之间的关联性,还要考虑数据自身的变化特性,所以,完整、合理的识别数据失真方法是将二者结合起来。而基于关联稳态模型方法来识别奇异失真数据只是考虑测量点之间的关联性,而没有考虑数据自身的变化。因此,本发明还提出基于数据变化率的方法与之结合,综合起来识别单点失真数据。
基于关联稳态模型方法只是考虑数据的关联性,然而,桥梁结构数据通常情况下自身的变化也保持一定。对于大型结构而言,结构的自重是影响参数变化的主要原因,很多参数测点曲线的变化趋势缓慢,即数据变化率(在单位时间内数据值变化的大小)比较小。如图1、2所示(图中各个符号的意义见下表),将一系列采集数据描述成一系列基元组成的序列,只有在跳变数据处,变化率才会出现一个畸变值。因此,通过寻找参数缓变数据的变化率阈值,智能在线检测采集数据是否超过阈值,就可判断单点采集数据是否失真。
附图1、2所示基元序列图符号对照表 注Δ是设定的最小变化率值(即阀值)。
其中,阈值的选取好坏是单点数据失真智能判断的关键。根据数据变化率值集中在某一区域内的特点,采用聚类分析法寻找阈值选取一段典型的数据段(既很好地反映参数变化规律,又不包含异常数据),将其变化率的均值作为聚类中心,根据各个数据与聚类中心的欧式距离的最大值和参数自身的安全系数确定阈值。
上述分析体现在本发明中的具体步骤如下 (1)计算数据变化率yi 设某一传感器采集到的测量数据集为X={x1,x2,…,xi,…,xn-1,xn}和S={s1,s2,…,si,…,sn-1,sn},xi为si时刻采集到的数据,则si时刻xi的数据变化率为 i=2,3,…,n (2)计算聚类中心值M 以计算得到的数据变化率序列Y={y2,y3,…,yi,…,yn}(i=2,3,…,n)作为样本集,根据下式计算聚类中心值M i=2,3,…,n (3)确定阈值Δ 由下式计算数据变化率与聚类中心值的距离Ki(yi,M), 得到数据组K={k2,k3,…,ki,…,kn}i=2,3,…,n; 根据下式确定阈值, Δ=g·max(K) 其中,g为参数的安全系数。
当某一采集到的数据为xi时,它的数据变化率为yi,则根据下式判断数据是否失真 |yi-M|>Δ时,wi=-1,此时数据失真, |yi-M|<Δ时,wi=1,此时数据正常; 其中,M为聚类中心值; Δ为设定的阈值; wi为数据状态值。
通过(二)中方法找到的失真数据点的位置集合即为M1。
实施例1 基于关联稳态模型方法来识别奇异失真数据,就是考虑的是结构数据之间的关联特性,其算法思想为首先,选取待识别数据段前面的一大段数据(以月为单位,数据量最好不低于500)作为分析样本,依据公式①对原始数据进行标准化处理;然后,利用标准化后的数据建立主元模型,进行主成分分析,计算主成分系数,方差贡献率,协方差矩阵的特征值和HotellingT2统计量;接着,再根据协方差矩阵特征值确定主元个数(累计特征值不低于90%),依据公式②和③计算T2控制限制和SPE统计量控制限;最后,对待识别的数据进行主成分分析,依据公式确定失真数据点位置M2(M2为失真数据点位置的集合)。
依据前面的分析,选取挠度数据段2006年4月1日到2006年5月18日的选取1144个正常运行样本,先进行标准化,然后建立主元模型,主元个数的保留采用累积方差百分比法来确定,结果参见图3;从图中可知,保留4个主元建立主元模型就可以解释约90.96%的数据变化。因此选取主元个数l为4。利用公式②和③计算SPE统计量控制去限和T2控制限制,当检验水平为0.95时的报警控制限为SPEα=0.2257;T2=18.0037。
接着,利用上面建立的主元模型对时间段2006年5月19-21日的挠度数据进行主成分分析。SPE和T2的变化情况如图4、5所示。从图4和5中可以看出,失真数据点位置为33,49,59,66。
从图6可以看出明显有一部分点偏离了大部分点聚集的地方,这也形象地说明有异常出现。
上面是基于关联稳态模型方法的实施例,根据前面理论分析,单点数据失真的识别不仅仅是考虑数据的统计特性,还应将统计特性与桥梁数据特性结合起来,即将基于数据变化率的方法和基于关联稳态模型方法结合起来,才能提高单点数据失真的识别率。
实施例2 在有些时候,传感器采集数据产生突变是正常现象,可能是由于外界环境(如温度突变、外加载荷等)等引起,此时应该依据安装在结构类似位置的传感器采集数据变化规律相似原理,综合进行判断。
根据上述原理分析,单点数据失真初步识别的思想如下(以一天的数据为单位) 1)选取一段正确的采集数据序列,计算其数据变化率、聚类中心和欧式距离,得到聚类中心M,确定阈值Δ; 2)取紧跟后面的数据(不能超过前面正确数据5天以上)作为识别数据段,计算其数据变化率、聚类中心和欧式距离; 3)计算待识别数据状态,确定失真数据位置M1(M1为失真数据点位置的集合); 最终确定的失真点位置为M失真=M1∩M2(M失真为取交集后失真数据点位置的集合)。
实施例1已经分析了可能失真的微突变数据,这里依然还是以高家花园大桥的挠度数据作为实例来阐释算法过程。
1)由于静态采集数据的时间间隔一般最少为60分钟,因此选取2006年5月15-18日96个典型数据(最少包含一天的数据变化规律,而且是经过验证数据都完全正确)用于阈值确定。原始采集数据如图7所示,该数据段是经过人工检验的正确数据,采集间隔为1个小时,计算其数据变化率和欧式距离曲线如图8、9所示,根据前文所述的方法计算得到聚类中心M=20.2225;从图9中可以看出欧式距离曲线的最大值为32,而参数的安全系数为1.5,因此阈值Δ=1.5×30=45。
2)针对实施例1中述及的微小突变数据,选择时间段2006年5月19-21日的挠度数据,采集时间间隔为60分钟,计算实测数据变化率曲线如图10所示,欧式距离曲线如图11所示,实测数据状态曲线如图12所示。
3)依据前文所述的方法确定可疑失真数据点的位置为33,51,59。
最后,结合实施例1的分析结果,可确定失真的数据点位置为33,59。
权利要求
1、一种空间交叉识别多传感器奇异失真数据的方法,其特征在于1)采用基于数据变化率的识别算法,找出发生失真的数据点位置的集合M1,2)采用基于关联稳态模型方法对数据进行处理,找出发生失真的数据点位置的集合M2,3)或者直接将M1或M2提供给后续的结构评估程序,或者对M、M2取交集M失真=M1∩M2后再提供给后续的结构评估程序。
2、根据权利要求1所述的空间交叉识别多传感器奇异失真数据的方法,其特征在于采用基于数据变化率的识别算法,判断可能发生失真的数据点位置的方法为
当某一采集到的数据为xi时,它的数据变化率为yi,则根据下式判断该数据是否失真
|yi-M|>Δ时,wi=-1,此时数据失真,
|yi-M|<Δ时,wi=1,此时数据正常;
其中,M为聚类中心值;
Δ为设定的阈值;
wi为数据状态值;
发生失真的数据点位置的集合即构成M1。
3、根据权利要求2所述的空间交叉识别多传感器奇异失真数据的方法,其特征在于
(1)计算数据变化率yi的方法为
设某一传感器采集到的测量数据集为X={x1,x2,…,xi,…,xn-1,xn}和S={s1,s2,…,si…,sn-1,sn},xi为si时刻采集到的数据,则si时刻xi的数据变化率为
i=2,3,…,n
(2)计算聚类中心值M的方法为
以计算得到的数据变化率序列Y={y2,y3,…,yi,…,yn}(i=2,3,…,n)作为样本集,根据下式计算聚类中心值M
i=2,3,…,n
(3)确定阈值Δ的方法为
由下式计算数据变化率与聚类中心值的距离Ki(yi,M),
得到数据组K={k2,k3,…,ki,…,kn} i=2,3,…,n;
根据下式确定阈值,
Δ=g·max(K)
其中,g为参数的安全系数。
4、根据权利要求1所述的空间交叉识别多传感器奇异失真数据的方法,其特征在于基于关联稳态模型方法,包括(1)选取适当的主元个数,建立主元模型,(2)计算样本的主元值、估计值和残差,(3)根据步骤(2)的计算结果进行统计假设检验,判断过程有无故障,也即判断数据是否失真。
5、根据权利要求4所述的空间交叉识别多传感器奇异失真数据的方法,其特征在于步骤(1)选取适当的主元个数,建立主元模型,包括
[1]若有测量数据集X,即样本X∈Rn×m,利用主元计算方法得到主元矩阵和负荷向量矩阵PH=[p1…pm]∈Rm×m,
其中,R为相关矩阵的统一表示形式;
n为样本数,m为测量变量数;
t1为第一主元,p1为t1的载荷;
t1T为t1的矩阵转置;
[2]把TH和PH分别分解为TH=[T,Tr]和PH=[P,Pr],
其中,T∈Rn×l为前l个主元构成的矩阵,P∈Rm×l为T的负荷矩阵;
Tr∈Rn×(m-l)为后(m-l)个主元构成的矩阵,Pr∈Rm×(m-l)为Tr的负荷矩阵;
[3]根据下式计算主元的个数ηl
其中,λi为第i个主元的方差,也即第i个特征值;
[4]根据主元个数,建立主元模型如下,
T=XP。
6、根据权利要求4所述的空间交叉识别多传感器奇异失真数据的方法,其特征在于步骤(2)计算样本的主元值、估计值和残差,包括
根据下式计算样本X的主元值t,
t=PTX
根据下式计算样本X的估计值
根据下式计算样本X的残差
其中,X为测量数据集,X∈Rn×m,n为样本数,m为测量变量数;R为X的相关矩阵;
P∈Rm×l为T的负荷矩阵;
PT为P的矩阵转置;
I为单位矩阵。
7、根据权利要求4所述的空间交叉识别多传感器奇异失真数据的方法,其特征在于步骤(3),根据步骤(2)的计算结果进行统计假设检验,判断过程有无故障,也即判断数据是否失真,包括或者采用HotellingT2统计对t、
进行统计假设检验;或者采用Q统计对t、
进行统计假设检验;或者同时采用HotellingT2统计和Q统计对t、
进行统计假设检验;发生失真的数据点位置的集合即构成M2,同时采用上述两种统计方法进行统计假设检验时,M2为两种方法判断出的失真点位置的并集。
8、根据权利要求7所述的空间交叉识别多传感器奇异失真数据的方法,其特征在于采用HotellingT2统计对t、
进行统计假设检验时,根据下式判断过程有无故障
T2<UCL
式中,
t满足条件时,过程正常无故障,数据无失真;否则过程有故障,数据失真;
其中,UCL为置信度为α的HotellingT2统计量的上限;
Λ为主元的方差阵,Λ=diag{λ1…λi…λl},λi为X的协方差阵∑阵的第i大特征根;
l为主元数;n为样本数;
F(l,n-l)为置信度未知,自由度为l和n-l的F分布;
Fα(l,n-l)为置信度为α,自由度为l和n-l的F分布。
9、根据权利要求7所述的空间交叉识别多传感器奇异失真数据的方法,其特征在于采用Q统计对t、
进行统计假设检验时,根据下式判断过程有无故障
SPE<Qα
SPE满足条件时,过程正常无故障,即数据无失真;否则过程有故障,即数据失真;
式中,
其中,SPE为平方预报误差,即Squared Prediction Error;
为样本X的残差;
Qα为统计量;
θ1、θ2、θ3、h0均为中间变量;
λi为特征值;
Cα是一个高斯分布的(1-α)%的置信极限;
i为特征值的个数。
全文摘要
本发明公开了一种空间交叉识别多传感器奇异失真数据的方法。它包括1)采用基于数据变化率的识别算法,找出发生失真的数据点位置的集合M1,2)采用基于关联稳态模型方法对数据进行处理,找出发生失真的数据点位置的集合M2,3)或者直接将M1或M2提供给后续的结构评估程序,或者对M1、M2取交集M失真=M1∩M2后再提供给后续的结构评估程序。本发明的有益技术效果是提高了传感器奇异失真数据的识别率和准确率,降低了桥梁结构健康监测系统的误报警。
文档编号G01M5/00GK101408940SQ20081023311
公开日2009年4月15日 申请日期2008年11月25日 优先权日2008年11月25日
发明者胡顺仁, 陈伟民 申请人:重庆大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1