一种基于LLE-SVDD的非线性轮廓数据监控方法与流程

文档序号:23307204发布日期:2020-12-15 11:37阅读:214来源:国知局
一种基于LLE-SVDD的非线性轮廓数据监控方法与流程

本发明涉及数据监控的技术领域,特别是涉及一种基于lle-svdd的非线性轮廓数据监控方法。



背景技术:

由于复杂产品监控过程中收集的数据量较大、关系较复杂,采用某种函数关系描述自变量与质量特性之间的关系,比一元或多元变量更加准确。因此将这种表征单个响应变量和多个解释变量之间的复杂函数关系称为轮廓(profile)。目前对非线性轮廓进行监控的方法主要有三种,基于回归拟合的监控方法、基于差异度量的监控方法及基于机器学习的监控方法。

基于回归拟合的控制方法是为对非线性轮廓进行回归拟合,通过对回归模型中参数的监控实现对非线性轮廓的监控。william等人用带有四个参数的逻辑回归模型对药物的剂量-反应轮廓进行拟合,并提出了三种t2统计量对这四个参数进行监控。jensen和birch提出了一种非线性混合模型来监测非线性剖面,并考虑了轮廓内的相关结构。kazemzadeh等提出多项式回归控制图,对正交转化后的回归系数和误差项建立ewma控制图。amiri等人采用二阶多项式拟合汽车发动机数据进行轮廓监测。chang用b样条回归检测轮廓中的均值偏移和形状改变。chen和nembhard提出了一种基于离散傅里叶变换系数的自适应neyman检验统计量的高维控制图轮廓监测方法。hadidoust等将样条平滑技术引入到复杂轮廓监控中,采用最大似然估计的方法估计异常点。izadbakhsh等提出了基于皮尔逊残差的监控方法,当非线性轮廓模型的参数形式难以确定时,可以采用该方法。qiu等提出基于局部线性平滑的ewma控制图,计算简捷,易于实施,并且能够有效检测轮廓的偏移程度。zou等人将mewma法与基于非参数回归的广义似然比检验相结合,用于监控非线性轮廓。colosimo将非参数混合效应模型用于vdp数据集中。fan用几个正弦函数之和对回流过程的非线性轮廓进行了拟合,并用hotellingt2统计量对模型参数进行监控。ding提出基于随机效应的有序轮廓检测。he将ewma控制图用于熔融沉积过程的剖面检测问题。liu将非线性混合模型用于监测工业晶圆切片过程中的晶圆厚度剖面。

由于基于回归拟合的方法过于复杂,有些学者提出基于差异度量的方法对非线性轮廓进行监控。其基本思想为:建立基础轮廓,构建样本轮廓与基础轮廓之间的差异统计量,对差异统计量进行监控,从而实现对轮廓的监控和异常轮廓的识别。jin将独立的解释变量分成p段。每一个分段内的偏移将与特定类型的过程故障相关,并建立hotellingt2控制图对每个分段内的偏移进行监控。willam提出用样本轮廓与基础轮廓之间的最大偏差m1、绝对偏差之和m2等作为差异统计量,构建轮廓控制图。波音公司提出将样本轮廓与基准轮廓间的绝对偏差的平均值作为统计量,构建控制图。vaghefi将样本轮廓与基础轮廓之间的面积作为差异统计量对非线性轮廓进行监控。zhang将轮廓视为高维空间的向量,构建χ2控制图用于第ⅰ阶段和第ⅱ阶段的分析中。wei等人基于非参数l-1位置尺度模型提出使用三种差异度量同时监控轮廓的垂直位置偏移、局部形状变化和整体形状偏离。qiu等人提出了一种用于第ⅱ阶段分析的新的控制图,当轮廓内部相关时,将局部线性核平滑算法引入到ewma控制图中。

以上所有的研究都是基于控制图的方法,对实时轮廓进行监控的。但建立控制图所需监控的统计量大多需要服从一定的分布假设,从而限制了控制图的适用性。因此也有一些学者探索将机器学习的方法用于轮廓控制中,取得了不错的效果。moguerza使用支持向量机对拟合曲线本身进行监控,而不是对拟合曲线的模型参数进行监测。并将他们所提方法应用于vdp数据中,与william所提方法做出对比。hosseinifard用三种ann模型检测并分类线性轮廓中的偏移。pacella和semeraro运用自适应共振理论来监测圆形轮廓,zobel和cook通过选择ann变量组合,提出了一种新的过程控制方法。huang用支持向量回归机来描述响应变量与解释变量的关系。贺辰然用支持向量机监控线性轮廓中斜率、截距及方差的波动。崔庆安等将支持向量回归机及hopfield神经网络用于非线性轮廓的监控中。

综上所述,尽管国内外学者对非线性轮廓的监控问题进行了充分的研究。但由于生产过程的复杂性和传感器的多样性,这些非线性轮廓数据呈现出高维性的特点,形成了反映生产过程运行状态的高维非线性轮廓数据。在这些高维非线性轮廓数据中,存在大量的冗余信息和无关信息,若直接对这种高维轮廓数据进行监控,势必会影响监控的准确性和监控效果。因此如何有效地对高维数据降维已成为非线性轮廓实时监控的关键问题。



技术实现要素:

为解决上述技术问题,本发明提供一种基于lle-svdd的非线性轮廓数据监控方法,通过与传统的轮廓监控方法的监控效果进行比较,显示了基于lle-svdd的非线性轮廓监控模型具有良好的监控效果,对于进一步探索非线性轮廓质量实时监控问题提供了新的视角和方法。

本发明的一种基于lle-svdd的非线性轮廓数据监控方法,包括以下步骤:

s1、局部线性嵌入降维:利用lle算法对高维非线性轮廓数据进行降维的步骤如下:

(a)对于高维空间中的任意两个轮廓数据xi和xj(i,j=1,2,...,n,其中n为轮廓个数)计算其欧式距离:

dij=|xi-xj|(1)

(b)设定近邻轮廓个数k,对于第i个轮廓xi,找到距离其最近的k个轮廓的集合qi,然后基于qi中的轮廓数据对xi进行线性重构:

(c)根据高维空间中轮廓xi和他的近邻点xj之间的权值wij来计算其在低维嵌入空间的坐标yi

s2、lle-svdd非线性质量监控模型构建:

为了对降维后的非线性轮廓数据进行监控,引入了支持向量数据描述算法,可将降维后的受控数据作为目标数据集yi∈rd,i=1,...,n,在高维空间中找到一个具有中心af和半径r的最小体积超球面,使得大部分的受控数据落在超球体内:

其中c是惩罚系数,它给出了超球体体积和错分样本数之间的平衡,ξi是松弛变量,φ是一种将输入样本映射到高维特征空间f的非线性映射;

式(5)(6)的对偶问题如下式:

其中,α是拉格朗日乘数,k(yi,yj)为核函数,根据kuhn-tucker条件,样本点可分为三类:(1)αi=0,表明第i个样本点在超球体内部;(2)0<αi<c,表明第i个样本点在超平面上;(3)αi=c,表明第i个样本点在超球体外部,且ξi≠0;位于超平面上的样本点被称为支持向量,求解可得原问题的最优解,其中,超球体球心af及半径r分别由式(9)和式(10)计算:

对于新的非线性轮廓z,由式(11)计算其到球心af的距离d(z):

通过比较d(z)与半径r的大小,可判断测试轮廓样本z与超球体的相对位置;

s3、模型监控过程:

lle-svdd质量监控模型对非线性轮廓进行监控的过程可划分为两个阶段。

本发明的一种基于lle-svdd的非线性轮廓数据监控方法,所述步骤s3中,第一个阶段为lle-svdd模型的离线训练阶段,第二个阶段为在线监控阶段;第一个阶段的目的是利用局部线性嵌入算法对轮廓数据进行降维,然后利用svdd算法对降维后的数据进行分类,训练出适用于非线性轮廓数据监控的lle-svdd模型;而第二个阶段则是利用训练后的lle-svdd模型进行非线性轮廓数据的实时质量监控。

与现有技术相比本发明的有益效果为:本发明利用局部线性嵌入(locallylinearembedding,lle)降维方法对高维非线性轮廓数据进行降维,并将降维后的正常轮廓数据作为受控样本,利用支持向量数据描述(supportvectordatadescription,svdd)算法对受控轮廓样本与失控轮廓样本进行分类,以实现对高维非线性轮廓数据的在线监控,lle算法通过找到高维数据的低维嵌入实现对原始数据的非线性降维,将其引入到高维非线性轮廓数据的降维中,不仅能保持原始数据的拓扑结构不变,而且能解决数据处理中的“维数灾难”问题,支持向量数据描述作为机器学习方法的一种,将其用于过程监控中可以摆脱对统计量分布的限制,且在训练时不需要负样本和过多的样本量,因而,本发明利用局部线性嵌入算法对非线性轮廓数据进行降维的优越性,利用svdd算法作为非线性轮廓的监控方法,构建了基于lle-svdd的高维非线性轮廓质量监控模型,重点研究该lle-svdd模型对非线性轮廓数据进行监控的效果,基于仿真模型生成的数据,对lle-svdd质量监控模型进行了充分地实证研究,论证了本发明所构建的lle-svdd模型的监控有效性,同时,通过与传统的轮廓监控方法的监控效果进行比较,显示了基于lle-svdd的非线性轮廓监控模型具有良好的监控效果,对于进一步探索非线性轮廓质量实时监控问题提供了新的视角和方法,

附图说明

图1是本发明的结构示意图;

图2是利用局部线性嵌入方法对非线性轮廓数据进行降维的原理图;

图3是svdd算法的原理图。

具体实施方式

下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。

如图1至图3所示,本发明的一种基于lle-svdd的非线性轮廓数据监控方法,包括以下步骤:

s1、局部线性嵌入降维:为了对高维非线性轮廓数据进行降维,引入局部线性嵌入(lle)算法,该算法的优势在于可通过保持邻域内非线性轮廓数据之间结构关系不变,使得在高维空间中最近邻的轮廓数据在低维嵌入中,也是近邻的;利用lle算法对高维非线性轮廓数据进行降维的步骤如下:

(a)对于高维空间中的任意两个轮廓数据xi和xj(i,j=1,2,...,n,其中n为轮廓个数)计算其欧式距离:

dij=|xi-xj|(1)

(b)设定近邻轮廓个数k,对于第i个轮廓xi,找到距离其最近的k个轮廓的集合qi,然后基于qi中的轮廓数据对xi进行线性重构:

(c)根据高维空间中轮廓xi和他的近邻点xj之间的权值wij来计算其在低维嵌入空间的坐标yi

利用局部线性嵌入方法对非线性轮廓数据进行降维的原理如图2所示;

s2、lle-svdd非线性质量监控模型构建:

为了对降维后的非线性轮廓数据进行监控,引入了支持向量数据描述算法,可将降维后的受控数据作为目标数据集yi∈rd,i=1,...,n,在高维空间中找到一个具有中心af和半径r的最小体积超球面,使得大部分的受控数据落在超球体内:

其中c是惩罚系数,它给出了超球体体积和错分样本数之间的平衡,ξi是松弛变量,φ是一种将输入样本映射到高维特征空间f的非线性映射;

式(5)(6)的对偶问题如下式:

其中,α是拉格朗日乘数,k(yi,yj)为核函数,根据kuhn-tucker条件,样本点可分为三类:(1)αi=0,表明第i个样本点在超球体内部;(2)0<αi<c,表明第i个样本点在超平面上;(3)αi=c,表明第i个样本点在超球体外部,且ξi≠0;位于超平面上的样本点被称为支持向量,求解可得原问题的最优解,其中,超球体球心af及半径r分别由式(9)和式(10)计算:

对于新的非线性轮廓z,由式(11)计算其到球心af的距离d(z):

通过比较d(z)与半径r的大小,可判断测试轮廓样本z与超球体的相对位置;如图3所示,以二维数据集说明svdd算法的原理:

(1)当d(z)<r时,测试样本z位于超球体内,被分为受控样本;

(2)当d(z)>r时,测试样本z位于超球体外,被分为失控类样本;

s3、模型监控过程:

lle-svdd质量监控模型(简称lle-svdd模型)对非线性轮廓进行监控的过程可划分为两个阶段:第一个阶段为lle-svdd模型的离线训练阶段,第二个阶段为在线监控阶段;第一个阶段的目的是利用局部线性嵌入算法对轮廓数据进行降维,然后利用svdd算法对降维后的数据进行分类,训练出适用于非线性轮廓数据监控的lle-svdd模型;而第二个阶段则是利用训练后的lle-svdd模型进行非线性轮廓数据的实时质量监控。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变型,这些改进和变型也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1