一种基于主元相似性分析的多模态过程模态辨识方法与流程

文档序号:15345273发布日期:2018-09-04 22:41阅读:164来源:国知局

本发明属于模态辨识技术领域,更具体地,涉及一种基于主元相似性分析的多模态过程模态辨识方法。



背景技术:

由于外界环境等条件的变化、生产方案变动,或是过程本身的固有特性等因素,导致现代工业生产过程往往具有多个稳定工况,各稳定模态之间的过渡过程具有明显的动态特性,过程呈现多模态特性。针对复杂工业生产过程的多模态特性,如何区分识别不同的生产模态,是多模态工业过程监控的基础。传统的多变量统计过程监控方法主成分分析(pca)和偏最小二乘法(pls)常用于过程建模、控制和监控等,但是它们都假设过程有单个操作模态。

针对复杂工业过程的多模态特性,许多学者基于传统的pca/pls方法提出了改进的适用于多模态过程的方法。常见的有基于整体建模的思想对多模态过程建立统一模型,一个全局模型虽然简单,但是缺乏每个操作模态的信息,所建立的模型无法准确地刻画所有的运行模态。

模态辨识常用的方法还有聚类算法。传统的聚类算法主要是k-means聚类算法以及k-means的衍生算法。基于k-means的聚类方法是一种有监督的聚类算法,需要预设聚类数目并初始化聚类中心,而初始化的聚类中心是根据数据的均值计算的,所以k-means聚类对异常数据比较敏感,聚类结果往往不够精确。

由此可见,现有技术存在模态辨识结果不准确的技术问题。



技术实现要素:

针对现有技术的以上缺陷或改进需求,本发明提供了一种基于主元相似性分析的多模态过程模态辨识方法,由此解决现有技术存在模态辨识结果不准确的技术问题。

为实现上述目的,本发明提供了一种基于主元相似性分析的多模态过程模态辨识方法,包括:

(1)获取不同模态的数据,组成待识别模态的数据集;

(2)根据待识别模态的数据集,选取窗口大小h、窗口移动的长度l和pca相似性因子的控制限值;

(3)窗口在待识别模态的数据集中移动时,将第一个窗口的数据作为初始模态的数据,基于初始模态的数据计算初始模态的相似性指标统计量的控制限值;

(4)根据当前窗口的数据,得到当前窗口与当前模态之间的pca相似性因子和当前窗口的相似性指标统计量,分别与pca相似性因子的控制限值和当前模态的相似性指标统计量的控制限值比较,判断当前窗口的模态,所述当前模态为已经辨识出来的最近一个非过渡模态;

(5)若当前窗口属于当前模态,将当前窗口的数据并入当前模态的数据后,得到当前模态的相似性指标统计量的新的控制限值,利用新的控制限值更新当前模态的相似性指标统计量的控制限值;若当前窗口的数据不属于当前模态,根据前一个窗口的模态判断当前窗口是否为新的模态;

(6)若当前窗口为新的模态,根据当前窗口的数据计算新的模态的相似性指标的控制限值,并将当前窗口的数据作为新的模态的数据;

(7)重复步骤(4)~(6),直至待识别模态的数据集中所有数据模态辨识完成。

进一步地,窗口大小h大于等于窗口移动的长度l。

进一步地,pca相似性因子的控制限值的取值范围是0.7-0.8。

进一步地,步骤(3)包括:

(3.1)窗口在待识别模态的数据集中移动时,将第一个窗口的数据作为初始模态的数据,根据初始模态的数据计算初始模态的均值向量和标准差向量;

(3.2)利用初始模态的均值向量和标准差向量对初始模态的数据进行标准化处理;

(3.3)对标准化处理后的初始模态的数据的协方差矩阵进行特征值分解,将初始模态的数据分为主元空间和残差空间;

(3.4)对标准化处理后的初始模态的数据,根据下式计算初始模态的相似性指标统计量的控制限值τ2

其中,fl,s-l,1-α是具有自由度l和s-l,置信度为1-α的f分布值,s为初始模态的数据个数,l是主元个数。

进一步地,步骤(4)包括:

(4.1)根据当前窗口i的数据,得到当前窗口i的相似性指标统计量ti2

其中,p为当前窗口i的数据的主元空间的载荷矩阵,λ为对角矩阵,x为待识别模态的数据集中的每一行,相似性指标统计量用于衡量两个不同数据集之间的一阶矩差异,且相似性指标统计量超过当前模态的相似性指标统计量的控制限值时,二者一阶矩差异明显;

(4.2)对于当前窗口的数据d1和当前模态的数据d2,分别对其进行pca分解,相应的主元个数分别为k1和k2,令k=max(k1,k2),则当前窗口与当前模态之间的pca相似性因子由下式得出:

其中,θij是d1中第i个载荷向量pi,1和d2中第j个载荷向量pj,2之间的夹角,λi,1和λj,2分别是d1和d2中主元相对应的特征值;

(4.3)将当前窗口与当前模态之间的pca相似性因子和当前窗口的相似性指标统计量,分别与pca相似性因子的控制限值和当前模态的相似性指标统计量的控制限值比较,判断当前窗口的模态,所述当前模态为已经辨识出来的最近一个非过渡模态。

进一步地,步骤(4.3)包括:

(4.3.1)比较当前窗口i的相似性指标统计量和当前模态j的相似性指标统计量的控制限值的大小,如果转到步骤(4.3.3);

(4.3.2)比较当前窗口i与当前模态j之间的pca相似性因子和当前模态j的pca相似性因子的控制限值slim的大小,如果当前窗口i属于当前模态j;

(4.3.3)当前窗口i不属于当前模态j。

进一步地,步骤(5)包括:

(5.1)若当前窗口属于当前模态,将当前窗口的数据并入当前模态的数据后,得到当前模态的相似性指标统计量的新的控制限值,利用新的控制限值更新当前模态的相似性指标统计量的控制限值;

(5.2)当前窗口不属于当前模态时,根据前一个窗口的模态判断当前窗口是否为新的模态,如果前一个窗口i-1的模态不是过渡模态,则当前窗口i为过渡窗口,当前窗口i之前的窗口的数据属于模态j,当前窗口i之后的窗口的数据属于另外的模态;

(5.3)如果前一个窗口i-1是过渡窗口,分别将当前窗口i的数据和模态1~j的数据进行相似性分析,如果存在某一模态m,1≤m≤j,与当前窗口i相似,则当前窗口i属于模态m,当前窗口i的数据并入模态m的数据中,并更新模态m的主元空间的载荷矩阵pm和相似性指标统计量的控制限值如果模态1~j中不存在任何模态与当前窗口i相似,则当前窗口i属于新的模态j+1。

进一步地,pca相似性因子用于度量两个不同数据集之间的二阶矩差异,且两个不同数据集之间的pca相似性因子越大,二者相似性越大,当两个不同数据集之间的pca相似性因子超过pca相似性因子的控制限值时,说明两个不同数据集的二阶矩没有差异。

总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:

(1)本发明提出的多模态过程模态辨识方法,利用当前窗口与当前模态之间的pca相似性因子和当前窗口的相似性指标统计量,分别与pca相似性因子的控制限值和当前模态的相似性指标统计量的控制限值比较,判断当前窗口的模态;使得本发明的模态辨识方法计算量小,模态辨识的结果准确率高,同时,可以有效地完成离线模态划分和在线模态划分。

(2)本发明提出相似性指标统计量用于衡量两个不同数据集之间的一阶矩差异,且相似性指标统计量ti2超过当前模态的相似性指标统计量的控制限值时,二者一阶矩差异明显;针对一阶矩的差异,利用相似性指标统计量进行模态辨识,pca相似性因子用于度量两个不同数据集之间的二阶矩差异,且两个不同数据集之间的pca相似性因子越大,二者相似性越大,当两个不同数据集之间的pca相似性因子超过pca相似性因子的控制限值时,说明两个不同数据集的二阶矩没有差异,针对二阶矩的差异,利用pca相似性因子进行模态辨识。由此,本发明揭示了不同模态之间的差异主要存在于一阶矩和二阶矩,针对不同的方面采取不同的指标进行相似性分析,通过比较数据集之间的相似性进行模态辨识。

附图说明

图1是本发明实施例提供的多模态过程模态辨识方法的流程图;

图2是本发明实施例提供的数值仿真实例三个不同模态的数据集;

图3(a)是本发明实施例提供的第2~48窗口和模态1之间的pca相似性因子的值;

图3(b)是本发明实施例提供的第49~94窗口和模态2之间的pca相似性因子值;

图4(a)~4(d)分别是本发明实施例提供的数值仿真实例中第16、第31、第47和第48个窗口的hotellingt2值和模态1的值比较;

图5(a)~5(d)分别是本发明实施例提供的数值仿真实例中第62、第77、第93和第94个窗口的hotellingt2值和模态2的值比较;

图6(a)~6(b)分别是本发明实施例提供的第93和94个窗口的hotellingt2值和模态1的值比较;

图7是本发明实施例提供的数值仿真实例的模态划分结果;

图8是本发明实施例提供的tennesseeeastman过程的示意图;

图9(a)是本发明实施例提供的tennesseeeastman过程实例中第2~44个窗口和模态1之间的的值;

图9(b)是本发明实施例提供的第46~87个窗口和模态2之间的的值;

图9(c)是本发明实施例提供的第89~129个窗口和模态1之间的的值;

图10是本发明实施例提供的tennesseeeastman过程实例中第44个窗口的t2值和模态1的值比较;

图11是本发明实施例提供的tennesseeeastman过程实例中第87个窗口的t2值和模态2的值比较;

图12是本发明实施例提供的tennesseeeastman过程实例中第88个窗口的t2值和模态1的值比较;

图13是本发明实施例提供的tennesseeeastman过程实例的模态划分结果。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

如图1所示,一种基于主元相似性分析的多模态过程模态辨识方法,包括:

(1)获取不同模态的数据,组成待识别模态的数据集;

(2)根据待识别模态的数据集,选取窗口大小h、窗口移动的长度l和pca相似性因子的控制限值;

(3)窗口在待识别模态的数据集中移动时,将第一个窗口的数据作为初始模态的数据,基于初始模态的数据计算初始模态的相似性指标统计量的控制限值;

(4)根据当前窗口的数据,得到当前窗口与当前模态之间的pca相似性因子和当前窗口的相似性指标统计量,分别与pca相似性因子的控制限值和当前模态的相似性指标统计量的控制限值比较,判断当前窗口的模态,所述当前模态为已经辨识出来的最近一个非过渡模态;

(5)若当前窗口属于当前模态,将当前窗口的数据并入当前模态的数据后,得到当前模态的相似性指标统计量的新的控制限值,利用新的控制限值更新当前模态的相似性指标统计量的控制限值;若当前窗口的数据不属于当前模态,根据前一个窗口的模态判断当前窗口是否为新的模态;

(6)若当前窗口为新的模态,根据当前窗口的数据计算新的模态的相似性指标的控制限值,并将当前窗口的数据作为新的模态的数据;

(7)重复步骤(4)~(6),直至待识别模态的数据集中所有数据模态辨识完成。

本发明实施例优选地,窗口大小h大于等于窗口移动的长度l,第1个窗口的数据为第1~h个数据样本,第i个窗口的数据为第1+l(i-1)~h+l(i-1)个数据样本。每个窗口相比前一个窗口移动l个数据点,相邻的两个窗口共有h-l个相同数据点。pca相似性因子用于度量两个不同数据集之间的二阶矩差异,且两个不同数据集之间的pca相似性因子越大,二者相似性越大,当两个不同数据集之间的pca相似性因子超过pca相似性因子的控制限值时,说明两个不同数据集的二阶矩没有差异。pca相似性因子的控制限值的取值范围是0.7-0.8。

本发明实施例优选地,步骤(3)包括:

(3.1)窗口在待识别模态的数据集中移动时,将第一个窗口的数据作为初始模态的数据,根据初始模态的数据计算初始模态的均值向量和标准差向量;基于初始模态的数据计算以下指标:均值向量a,标准差向量std。对于一般形如的数据,计算公式如下:

(3.2)利用初始模态的均值向量和标准差向量对初始模态的数据进行标准化处理;使其均值为0,标准差为1,计算过程为对数据的每一列减去该列的均值a,再除以该列的标准差std。

(3.3)对标准化处理后的初始模态的数据的协方差矩阵进行特征值分解,将初始模态的数据分为主元空间和残差空间;对于一般形如的数据样本,协方差矩阵s可分解为:

其中,主元空间的载荷矩阵残差空间的载荷矩阵λ=diag{λ1,λ2,...,λl}是对角矩阵,λ1,λ2,...,λl是与主元对应的特征值,l是选取的主元个数;

(3.4)对标准化处理后的初始模态的数据,根据下式计算初始模态的相似性指标统计量的控制限值τ2

其中,fl,s-l,1-α是具有自由度l和s-l,置信度为1-α的f分布值,s为初始模态的数据个数,l是主元个数。

本发明实施例优选地,步骤(4)包括:

(4.1)根据当前窗口i的数据,得到当前窗口i的相似性指标统计量

其中,p为当前窗口i的数据的主元空间的载荷矩阵,λ为对角矩阵,x为待识别模态的数据集中的每一行,相似性指标统计量用于衡量两个不同数据集之间的一阶矩差异,且相似性指标统计量超过当前模态的相似性指标统计量的控制限值时,二者一阶矩差异明显;

(4.2)对于当前窗口的数据d1和当前模态的数据d2,分别对其进行pca分解,相应的主元个数分别为k1和k2,令k=max(k1,k2),则当前窗口与当前模态之间的pca相似性因子由下式得出:

其中,θij是d1中第i个载荷向量pi,1和d2中第j个载荷向量pj,2之间的夹角,λi,1和λj,2分别是d1和d2中主元相对应的特征值;

(4.3)将当前窗口与当前模态之间的pca相似性因子和当前窗口的相似性指标统计量,分别与pca相似性因子的控制限值和当前模态的相似性指标统计量的控制限值比较,判断当前窗口的模态,所述当前模态为已经辨识出来的最近一个非过渡模态。

本发明实施例优选地,步骤(4.3)包括:

(4.3.1)比较当前窗口i的相似性指标统计量和当前模态j的相似性指标统计量的控制限值的大小,如果转到步骤(4.3.3);

(4.3.2)比较当前窗口i与当前模态j之间的pca相似性因子和当前模态j的pca相似性因子的控制限值slim的大小,如果当前窗口i属于当前模态j;

(4.3.3)当前窗口i不属于当前模态j。

本发明实施例优选地,步骤(5)包括:

(5.1)若当前窗口属于当前模态,将当前窗口的数据并入当前模态的数据后,得到当前模态的相似性指标统计量的新的控制限值,利用新的控制限值更新当前模态的相似性指标统计量的控制限值;

(5.2)当前窗口不属于当前模态时,根据前一个窗口的模态判断当前窗口是否为新的模态,如果前一个窗口i-1的模态不是过渡模态,则当前窗口i为过渡窗口,当前窗口i之前的窗口的数据属于模态j,当前窗口i之后的窗口的数据属于另外的模态;

(5.3)如果前一个窗口i-1是过渡窗口,分别将当前窗口i的数据和模态1~j的数据进行相似性分析,如果存在某一模态m,1≤m≤j,与当前窗口i相似,则当前窗口i属于模态m,当前窗口i的数据并入模态m的数据中,并更新模态m的主元空间的载荷矩阵pm和相似性指标统计量的控制限值如果模态1~j中不存在任何模态与当前窗口i相似,则当前窗口i属于新的模态j+1。

本发明实施例采用本发明提供的多模态工业过程模态辨识方法,对数值仿真实例以及如tennesseeeastman过程的连续化工过程进行模态辨识;

实施例1中,数值仿真实例具体描述为:

其中,x(k)=[x1x2x3x4x5]是五个过程变量,s(k)=[s1s2s3]是相互无关的随机信号源,且s1,2,3~u(0,1)。w(k)是噪声向量,且w(k)~n(0,1)。对s1赋予0~10之间的某一随机值,产生共3000个三个不同模态的数据,每个模态包括1000个样本。

采用本实施例提供的模态辨识方法,对上述数值仿真实例进行模态辨识的具体过程如下:

(1)三个不同模态的数据构成样本集

(2)选取窗口大小h=100和每次窗口移动的长度l=20;

(3)选取第一个窗口的数据(第1~100个样本)作为初始模态1的数据;

(4)选取相似性因子的控制限值slim=0.8;

(5)对第一个窗口数据建立pca模型,计算初始模态的相似性指标t2统计量的控制限值;

(6)对于当前窗口,分别计算两个相似性指标t2的值,分别与相应的控制限值比较,判断当前窗口的模态;

(7)若当前窗口属于当前模态,将当前窗口数据并入当前模态数据内,并更新相似性指标t2的控制限值;

(8)若当前窗口数据不属于当前模态,根据前一个窗口状态判断当前窗口状态;

(9)对于新的模态,重新计算相似性指标t2的控制限值,并更新新模态数据集;

(10)重复步骤(6)~(9),直至所有数据模态划分完成。

图2是数值仿真实例中个不同模态的数据集,从图中可以看出前1000个样本是模态一数据,1001~2000个样本是模态二数据,2001~3000个样本是模态三数据。图3(a)是第2~48窗口和模态1之间的pca相似性因子的值;图3(b)是第49~94窗口和模态2之间的pca相似性因子值;

图4(a)~4(d)分别是窗口16、窗口31、窗口47和窗口48的hotellingt2值。虚线是模态1的hotellingt2控制限值从图中可以看出,窗口16和窗口31的hotellingt2值均小于结合图3(a)可知,窗口16和窗口31均属于模态1。窗口47和窗口48部分数据的hotellingt2值超过说明窗口47和窗口48的一部分数据不再属于模态1,选择窗口48作为过渡窗口。窗口49属于新的模态2,基于窗口49的数据建立新的pca模型。

图5(a)~5(d)分别是窗口62、窗口77、窗口93和窗口94的hotellingt2值。虚线是模态2的hotellingt2控制限值从图中可以看出,窗口62和窗口77的hotellingt2值均小于结合图3(b)可知,窗口62和窗口77均属于模态2。窗口93和窗口94部分数据的hotellingt2值超过说明窗口93和窗口94一部分数据不再属于模态2,选择窗口94作为过渡窗口。窗口95属于新的模态,从图6(a)~6(b)可以看出,窗口93和窗口94的hotellingt2值大于说明窗口93和窗口94也不属于模态1,则窗口95属于新的模态3,并基于窗口95的数据建立新的pca模型。

图7为模态辨识结果。纵坐标1、2、3表示模态类型,1.5和2.5表示两个不同模态之间的过渡模态。本发明提供的模态辨识方法可以将三个不同的模态数据准确辨识出来。

实施例2为tennesseeeastman过程,te过程是一个基于真实工业过程的仿真平台,在基于数据驱动的故障检测研究领域被广泛应用于各种监控方法的性能评价中,包含5个部分:反应器、冷凝器、循环压缩机、气液分离器、汽提塔,其示意图如图8所示。该过程包含41个测量变量和12个控制变量。根据产品g/h质量比的不同,te过程有六个操作模式,工业过程中根据不同的需求使系统工作在相应的模式下。本次实施案例中,用于模态辨识的数据共1500个,其中前500个样本为模态1数据,第501~1000个样本为模态3样本,第1001~1500个样本为模态1样本。选取窗口大小为50,窗口每次移动大小为10。选取slim=0.7。

图9(a)是tennesseeeastman过程实例中第2~44个窗口和模态1之间的的值;图9(b)是第46~87个窗口和模态2之间的的值;图9(c)是第89~129个窗口和模态1之间的的值。

图10是第44个窗口的hotellingt2值和模态1的值比较。从图中可以看出,窗口44部分数据的hotellingt2值超过说明窗口44一部分数据不再属于模态1,选择窗口44作为过渡窗口。窗口45属于新的模态2,基于窗口45的数据建立新的pca模型。图11是第87个窗口的hotellingt2值和模态2的直比较。从图中可以看出,窗口87部分数据的hotellingt2值超过说明窗口87一部分数据不再属于模态2,选择窗口87作为过渡窗口。从图12可以看出,窗口88的hotellingt2值小于结合图9(c),说明窗口88属于模态1,将窗口88数据并入模态1数据集中。图13为模态辨识结果。本发明提供的模态辨识方法可以将三个不同的模态数据准确辨识出来。

本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1