基于复杂机电系统耦合关系模型评估数据准确性的方法及装置与流程

文档序号:22737264发布日期:2020-10-31 09:16阅读:132来源:国知局
基于复杂机电系统耦合关系模型评估数据准确性的方法及装置与流程

本发明属于复杂机电系统数据监测分析领域,涉及一种基于复杂机电系统耦合关系模型评估数据准确性的方法及装置。



背景技术:

以化工生产、核能发电为代表的复杂机电系统,各监测变量之间具有高度耦合、高度关联的特征,同时随着生产环境变化、工艺调整等,变量之间呈现一种动态的耦合关系。因此,探究系统中各变量之间的耦合约束关系和耦合特征,分析耦合特征演化规律,构建系统中各监测变量间的耦合关系模型,是系统监测数据异常检测和准确性评估的基础。

而以流程工业为代表的复杂机电系统,其本质上是一种非线性连续动力系统,从特质上不满足线性系统的叠加原理,其非线性函数表现形式也是多种多样,造成系统拥有无穷多的性质和形态,系统的非线性特点造成了系统的无限多样性、差异性及非平稳性等,同时也是造成系统中监测数据混沌的核心因素,因此,在考虑系统多态、非线性、非平稳性的基础上,如何正确、高效的构建复杂系统的耦合关系模型,成为复杂机电系统监测数据准确性评估的重点和难点问题。

目前,关于复杂机电系统的模型主要分为两类:一类物理模型;一类是数据模型。物理模型通过分析系统连锁控制、工艺过程及设备的连接,代表性的物理建模方法有复杂网络、符号有向图、多色集合等。其中多色集合理论的核心思想是使用相同的数学模型来仿真不同的对象及其元素间的层次结构和复杂关系。而复杂网络和符号有向图等建模方法对系统的背景知识要求很高,模型主要是线性,复杂难懂且时延大;利用多色集合直接为实际系统建模时,对设计人员的领域和知识要求较高,理解起来有一定困难。数据建模主要是通过对系统建立数学模型或从数据分析角度建立系统的耦合关系网络,比较有代表性的方法有支持向量机、回归、copula函数分析、贝叶斯网络、神经网络等。支持向量机能较好的处理小样本的非线性数据建模,在模式识别、分类等得到了广泛的研究与应用;copula对于处理非线性结构问题的优势明显,并能处理数据的尾部相关问题,但处理混沌的时间序列效果一般;贝叶斯网络分析往往要求数据满足正态分布或近正态分布,实际系统状态信息不服从于正态分布,神经网络由于强的自学习能力和处理非线性数据能力,得到了较大的应用,但是由于传统在使用神经网络时没有考虑实际过程中变量之间因果影响关系,只是简单的对输入输出的非线性映射,并不能完全表达实际系统中的非线性关系。

基于耦合关系模型的监测数据准确性评估作为数据准确性评估的重要方法之一,主要存在两大缺点:1)耦合模型构建困难、模型复杂等,从而导致数据准确性评估实时性差;2)传统从机器学习方面进行建模实现数据准确性评估的过程中缺乏因果影响分析,对系统耦合关系反映并不全面,导致评估结果准确度不高。基于此,需要提出一种对复杂机电系统监测数据准确性进行评估的方法。



技术实现要素:

本发明的目的在于克服上述现有技术的缺点,提供一种基于复杂机电系统耦合关系模型评估数据准确性的方法,以生产过程监测数据为基础,以因果分析和机器学习为理论依据,从变量间因果影响关系分析角度出发,结合因果分析和rbf神经网络进行非线性耦合关系建模,为复杂机电系统监测信息异常检测/仪表故障及计量有效性评估提供理论支撑。

为达到上述目的,本发明的技术方案是:基于复杂机电系统耦合关系模型评估数据准确性的方法,包括以下步骤:

s1,数据预处理

获取dcs系统在复杂机电系统生产过程中采集的监测数据,并对监测数据进行非线性/非平稳性检验和降噪处理;

s2,多变量因果分析及各变量真实原因变量集确定

首先,利用基于径向基函数的双变量非线性granger因果对s1处理之后的监测数据中双变量之间的因果关系进行检验,得到双变量因果分析结果;

其次,利用条件granger因果对双变量因果分析结果进行筛选,剔除由于同源和传递关系导致的虚假因果,确定各变量的真实原因变量集;

s3,基于机器学习方法的非线性关系模拟

以复杂机电系统中任意变量为输出,以变量自身及s2所得原因变量集为输入,构建基于径向基的神经网络模型,通过对神经网络模型参数优化,确定模型输入与输出之间的非线性映射关系,获得复杂机电系统中各变量之间耦合关系模型;

s4,评估数据准确性

基于s3所得复杂机电系统中各变量之间耦合关系模型对复杂机电系统中实时的监测数据进行准确性评估。

s2中利用基于径向基函数的双变量非线性granger因果对s1处理之后的监测数据中双变量之间的因果关系进行检验,获取双变量因果分析结果如下:

s21,根据s1中对监测数据的处理结果,构建双变量非线性granger因果模型如下所示:

其中,αj,βj和γj表示各滞后系数,ηy(t)和ηy|x(t)表示模型的误差项,m和n表示变量y和x的滞后阶数,φx()和φy(·)表示径向基核函数,它的函数形式为:

s22,计算s21中变量x对y的granger因果值,其计算公式为:

s23,计算因果检验的临界值gc,对s21中的因果模型的变量x进行随机重排后获得新序列,标记为应用所述新序列拟合s21中的第二个方程,并按照s22中的公式计算因果值,重复s21-s22500次,根据置信度为0.05的显著水平,取因果检验的临界值gc;

s24,对比s22所得因果值gcx→y和s23所得因果检验的临界值gc,如果gcx→y≥gc,则认为,x是y的原因变量,否则x不是y的原因变量。

利用条件granger因果对双变量因果分析结果进行筛选,剔除由于同源和传递关系导致的虚假因果,确定各变量的真实原因变量集,具体如下:

s25,根据双变量因果分析结果,遍历所有监测变量到y变量的因果值,确定y变量的初始原因变量集;

s26,根据s25中的因果检验结果,遍历各变量原因变量集中的三元组结构,三元组结构为原因变量集中的任意三个变量组成,并对各个三元组结构中的变量构建基于径向基函数的多变量因果分析模型,如下所示:

其中公式(1)表示在z变量存在条件下,x变量过去值对自身的影响程度,ui表示误差项,wij表示拟合系数,φj表示x和z的核函数,表示x和z的均值,表示x和z的方差,则预测误差的协方差矩阵可以表示为:

则有在z存在条件下,x变量过去值对自身影响程度为

其中公式(2)表示在z存在条件下,加入变量y后对变量x影响的回归模型,则预测误差的协方差矩阵可以表示为:

在z存在条件下,加入y后对x的影响程度可以表示为

s26,根据步骤s25计算多变量因果模型的因果值gcxy|z:

s27,根据蒙特卡罗模拟法确定因果值gcxy|z的临界值,并将因果值gcxy|z与统计检验量比较,若统计检验量大于因果值gcxy|z临界值,则保留该因果关系,否则,认为该因果关系为冗余/间接因果,直接去除,并根据保留的因果分析结果确定y变量的原因变量集。

s3中基于机器学习方法的非线性关系模拟的具体过程是:

s31,根据s2中因果分析结果,以目标变量及其原因变量集作为神经网络输出与输入;

s32,确定神经网络隐层激活函数;

s33,根据k-means聚类算法确定所述隐层激活函数的中心;

s34,根据高斯激活函数最优方差,计算激活函数方差;

s35,根据最小二乘法确定输出层链接权重;

s36,构建基于rbf神经网络模型,用s1预处理之后的监测数据对所述神经网络模型进行训练,得到最终的复杂机电系统中各变量之间耦合关系模型。

s32中,高斯函数作为神经网络隐层激活函数。

s35输出层链接权重为:

wj=(hj(·)*hj(·)t)-1*hj(·)*y,j=1,2,...,m

其中,hj(·)为神经网络隐层激活函数。

一种评估复杂机电系统耦合关系数据准确性的系统,包括:数据预处理模块,用于对监测数据进行非线性/非平稳性检验和降噪处理;原因变量集确定模块,采用基于径向基函数的双变量非线性granger因果对预处理之后的监测数据中双变量之间的因果关系进行检验,得到双变量因果分析结果;再用条件granger因果对双变量因果分析结果进行筛选,剔除由于同源和传递关系导致的虚假因果,确定各变量的真实原因变量集;

耦合关系模型建立模块,用于以复杂机电系统中任意变量为输出,以变量自身及原因变量集为输入,构建基于径向基的神经网络模型,优化神经网络模型参数,确定模型输入与输出之间的非线性映射关系,获得复杂机电系统中各变量之间耦合关系模型;数据评估模块,用于基于所述复杂机电系统中各变量之间耦合关系模型对复杂机电系统中实时的监测数据进行准确性评估。

一种评估复杂机电系统耦合关系数据准确性的装置,包括一个或多个处理器以及存储器,存储器与处理器通过i/o接口连接,存储器用于存储计算机可执行程序,处理器从存储器中读取部分或全部所述计算机可执行程序并执行,处理器执行部分或全部计算可执行程序时能实现本发明所述基于复杂机电系统耦合关系模型评估数据准确性的方法。

一种计算机可读介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现本发明所述基于复杂机电系统耦合关系模型评估数据准确性的方法。

与现有技术相比,本发明具有以下有益效果:

本发明在考虑变量之间因果影响机制的基础上,结合因果分析和机器学习的优势,运用于复杂机电系统中监测变量耦合因果建模和数据异常检测,利用因果分析确定输入输出变量集,利用机器学习进行多变量非线性关系模拟,确定因果变量集之间的映射关系,从而实现多变量耦合因果建模;考察不同变量历史状态对于现时状态的可预测性的影响,从而检定出监测时间序列之间耦合方向,本发明所述方法不需要了解生产工艺流程和任何先验知识的情况下,完全依赖于复杂机电系统实时监测数据,通过考虑变量之间因果影响机制,结合因果分析和机器学习的优势来构建复杂机电系统中各变量之间的耦合关系模型,解决了物理建模复杂性问题,为复杂机电系统中实时监测数据的异常检测及数据准确性评估提供理论支撑。

附图说明

图1为本发明一种可选的实施方法流程图。

具体实施方式

下面结合附图对本发明进行详细阐述。

参考图1,本发明提供了一种基于复杂机电系统耦合关系模型评估数据准确性的方法,包括以下步骤:

步骤s1,数据预处理

以流程工业复杂机电系统为代表,获取dcs系统在生产过程中采集的监测数据,并对监测数据进行非线性/非平稳性检验和降噪处理;

步骤s2,多变量因果分析及各变量原因变量集确定

结合双变量granger和多变量granger因果分析方法,基于步骤s1处理后的监测数据对复杂机电系统监测变量进行因果分析,具体过程如下:

步骤s21,根据步骤s1中数据处理结果,构建双变量非线性granger因果模型为:

其中,αj,βj和γj表示滞后系数,ηy(t)和ηy|x(t)表示模型的误差项,m和n表示变量y和x的滞后阶数,φx()和φy(·)表示径向基核函数,它的函数形式为:

步骤s22,计算步骤s21中变量x对y的granger因果值,其计算公式为:

步骤s23,计算因果检验的临界值gc,对步骤s21中的因果模型的变量x进行随机重排后获得新序列,标记为应用所述新序列拟合步骤s21中的第二个方程,并按照步骤s22中的公式计算因果值,重复s21-s22500次,根据置信度为0.05的显著水平,取因果检验的临界值gc;

步骤s24,检验因果存在性,对比s22所得因果值gcx→y和s23所得因果检验的临界值gc,如果gcx→y≥gc,则认为,x是y的原因变量,否则不是;

步骤s25,根据步骤s24中的检验结果,遍历所有监测变量到y变量的因果值,确定y变量的初始原因变量集;

步骤s26,根据步骤s25中的因果检验结果,遍历各变量原因变量集中的三元组结构,三元组结构为原因变量集中的任意三个变量组成,并对各个三元组结构中的变量构建基于径向基函数的多变量因果分析模型,如下所示:

其中公式(1)表示在z变量存在条件下,x变量过去值对自身的影响程度,ui表示误差项,wij表示拟合系数,φj表示x变量和z变量的核函数,表示x变量和z变量的均值,表示x变量和z变量的方差,则预测误差的协方差矩阵可以表示为:

则有在z变量存在条件下,x变量过去值对自身影响程度为

其中公式(2)表示在z变量存在条件下,加入y变量后对x变量影响的回归模型,则预测误差的协方差矩阵可以表示为:

在z变量存在条件下,加入y变量后对x变量的影响程度可以表示为

步骤s26,根据步骤s25计算多变量因果模型的因果值gcxy|z:

步骤s27,根据蒙特卡罗模拟法确定因果值gcxy|z的临界值,并将因果值gcxy|z与统计检验量比较,若统计检验量大于因果值gcxy|z临界值,则保留该因果关系,否则,认为该因果关系为冗余/间接因果,直接去除,并根据保留的因果关系分析确定y变量的原因变量集;

步骤s3,构建复杂机电系统中各变量之间耦合关系模型

基于机器学习方法的非线性关系模拟,结合s2因果分析所得原因变量集,构建神经网络模型,通过对网络模型参数优化,确定模型输入与输出之间的非线性映射关系,获得复杂机电系统中各变量之间耦合关系模型,具体过程如下:

步骤s31,根据步骤s2中因果分析结果,以目标变量及其原因变量集作为神经网络输出与输入;

步骤s32,选择神经网络隐层激活函数,其公式表示为:

步骤s33,根据k-means聚类算法确定所述隐层激活函数的中心,即以上步骤s32中的c值;

步骤s34,根据高斯函数最优方差公式计算隐层激活函数方差δ,其中m表示隐层神经元个数,cmax表示激活函数中心间最大距离;

步骤s35,根据最小二乘法确定输出层链接权重wj,其计算公式为:wj=(hj(·)*hj(·)t)-1*hj(·)*y,j=1,2,...,m;hj(·)为神经网络隐层激活函数;

步骤s36,构建基于rbf神经网络模型,用s1预处理之后的监测数据对所述神经网络模型进行训练,得到最终的复杂机电系统中各变量之间耦合关系模型;

步骤s4,基于步骤s3所得复杂机电系统中各变量之间耦合关系模型评估数据准确性。

本发明还提供一种评估复杂机电系统耦合关系数据准确性的系统,包括:数据预处理模块,用于对监测数据进行非线性/非平稳性检验和降噪处理;原因变量集确定模块,采用基于径向基函数的双变量非线性granger因果对预处理之后的监测数据中双变量之间的因果关系进行检验,得到双变量因果分析结果;再用条件granger因果对双变量因果分析结果进行筛选,剔除由于同源和传递关系导致的虚假因果,确定各变量的真实原因变量集;

耦合关系模型建立模块,用于以复杂机电系统中任意变量为输出,以变量自身及原因变量集为输入,构建基于径向基的神经网络模型,优化神经网络模型参数,确定模型输入与输出之间的非线性映射关系,获得复杂机电系统中各变量之间耦合关系模型;数据评估模块,用于基于所述复杂机电系统中各变量之间耦合关系模型对复杂机电系统中实时的监测数据进行准确性评估。

作为一个实施例,一种评估复杂机电系统耦合关系数据准确性的装置,包括一个或多个处理器以及存储器,存储器与处理器通过i/o接口连接,存储器用于存储计算机可执行程序,处理器从存储器中读取部分或全部所述计算机可执行程序并执行,处理器执行部分或全部计算可执行程序时能实现本发明所述基于复杂机电系统耦合关系模型评估数据准确性的方法。

本发明所述评估复杂机电系统耦合关系数据准确性的装置可以采用笔记本电脑、平板电脑、桌面型计算机或工作站。

作为可选的,本发明所述处理器可以是中央处理器(cpu)、数字信号处理器(dsp)、专用集成电路(asic)、现成可编程门阵列(fpga)或可编程逻辑器件(pld)。

对于本发明所述存储器,可以是笔记本电脑、平板电脑、桌面型计算机或工作站的内部存储单元,如内存、硬盘;也可以采用外部存储单元,如移动硬盘或闪存卡。

可选的,本发明提供一种计算机可读介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现本发明所述基于复杂机电系统耦合关系模型评估数据准确性的方法。

计算机可读存储介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机可读存储介质可以包括:只读存储器(rom,readonlymemory)、随机存取记忆体(ram,randomaccessmemory)、固态硬盘(ssd,solidstatedrives)或光盘等。其中,随机存取记忆体可以包括电阻式随机存取记忆体(reram,resistancerandomaccessmemory)和动态随机存取存储器(dram,dynamicrandomaccessmemory)。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1