统计过程控制方法和装置的制作方法

文档序号:6292652阅读:229来源:国知局
专利名称:统计过程控制方法和装置的制作方法
技术领域
本发明涉及一种统计过程控制方法和装置。
背景技术
在企业的生产部门里,每天都要生产或加工大量产品,产品的性能和品 质关系到企业的命脉。为保证产品质量,有必要对生产过程进行及时的监控
和检测分析。统计过程控制(SPC)是一种借助于统计学,对生产过程进行统
计并控制的工具。在生产过程中,统计过程控制工具被广泛的用于对生产过 程中的参数进行收集和分析,以统计信号的形式提供给工程师,例如对生产 过程中所收集的样本数据计算控制图的控制界,做成控制图、直方图,以供
分析;或者使用控制图中的控制界,观测生产过程中数据点的波动情况,以 此监控生产过程。
在统计过程控制中,控制图和控制界是提供给工程师的重要的统计信号, 也是用于评估该生产过程是否处于稳定状态的重要指标。通常, 一个处于稳 定状态的生产系统具有较小的离散性。产生系统的离散性的原因被分为随机 原因 (random, chance or common causes )和净争歹朱原因(special or assignable causes)。如果生产系统中存在使系统离散性增大的特殊原因,并且没有及时 被发现和去除,这些特殊原因可能会持续地以无法预测的方式影响生产系统, 从而影响生产系统的稳定性,进而影响产品质量。因此需要使用统计过程控 制工具,及早发现离散的征兆,找出原因,采取措施排除故障。然而在实际 工作当中,每个工程师需要同时负责几个机台、每个机台又有上千的系统参 数,生产过程这些大量的参数令工程师们难以承受,如何同时处理这些复杂 而数目繁多的控制图,将其自动化、简单化、易读化,成为工程师们关心的问题。
同时,如何确定控制界也是画出控制图、进而对生产过程进行监测和控 制的关键。这是由于一方面,如果将控制界设置得过于接近历史平均值,会 导致错误报警增多,而另一方面,如果将控制界设置得远离历史平均值,将 有可能出现系统不稳定却不报警的情况。
申请号为200480037968.6的中国专利申请中提到"从多维数据库提取时间 序列,并从所提取的时间序列使用统计过程控制(SPC)技术自动计算用于所指 定维中的所指定度量的一个或多个控制界限",并根据这"一个或多个控制界
限"对数据的越界情况进行监控,但是该专利申请描述的技术方案数据处理复 杂,而且计算过程按照传统的标准化计算过程,对数据的数量和性质都有要 求,即要求数据服从连续的正态分布、单峰性(uni-modality)与没有自相关 性(autocorrelation),用来计算控制界的数据数量上必须大于三十并且数据 不含异常点(outlier),在数据满足上述条件的前提下,控制界为被监测数据 的三倍标准方差。然而实际生产过程中,很多生产过程参数不满足以上条件, 因此应用传统的标准统计过程控制进行控制界的计算所得出的结果是不准确 的。与此类似,现有的软件系统大多使用传统的标准统计过程控制进行分析, 不能满足实际的生产需求。

发明内容
本发明提供了一种统计过程控制方法和装置,可处理不符合现有传统的 标准统计过程控制要求的实际生产参数的数据,提高监控精度。
本发明法提供一种统计过程控制方法,该方法包括以下步骤采集生产 过程中待分析的原始数据;将原始数据分类,分为非连续分布类型数据、具 有自相关性类型数据、非正态分布类型数据和正态分布类型数据;对于上述 各类数据,分别确定对应的控制界,并根据所确定的控制界对生产过程进行监控和/或分析。
可选的,先判断所述数据是否属于连-续分布类型,不属于的数据则为非
连续分布类型数据;属于连续分布的数据,判断其自相关性;具有自相关性 的为具有自相关性类型数据;连续分布且不具有自相关性类型的数据,经过 异常点的检验和过滤之后,根据其是否符合正态分布,分为正态分布类型数 据和非正态分布类型数据;
可选的,所述非连续分布类型是指,所述数据的不同数值种类大小小于 或等于预定值;
可选的,所述具有自相关性类型是指所述数据的 一 阶自相关性系数大于 预定值而且取得该一阶自相关性系数的概率值小于另 一预定值;
可选的,对于非连续分布类型数据,使用从工程上定义的警告上下界作 为控制界;
可选的,对于具有自相关性类型的数据,使用从工程上定义的警告上下 界作为控制界;
可选的,对于正态分布类型数据,采用被监测数据的三倍标准方差作为 控制界;
可选的,对于非正态分布类型数据,采用百位分数法计算控制界; 可选的,对于非正态分布类型数据,假定数据高低端外延部分符合正态 分布,并采用线性外推法结合百位分数分别计算其高低端控制界;
可选的,对于非正态分布类型数据,采用线性外推法结合百位分数分别 计算其高低端控制界,包括步骤对所采集的数据进行合理的假设,得到包 含百分位数的线性的控制界计算公式;由标准正态分布百分位公式求出所述 线性的控制界计算公式中的线性系数k值;根据所采集的数据,求出所述线 性的控制界计算公式中包含的百分位数所对应的数据值;将线性系数k值和 百分位数对应的数据值代入所述线性的计算公式,确定控制界。本发明还提供一种统计过程分析装置,该装置包括 数据采集单元,用于采集待分析的原始数据;
连续分布类型判断单元,用于接收所采集的数据,判断所采集的数据是 否属于连续分布类型;对于属于连续分布类型的数据,进入自相关类型判断 单元;对于属于非连续分布类型的数据,进入控制界确定单元;
自相关性类型判断单元,用于接收连续分布的数据,判断其是否具有自 相关性;对于具有自相关性类型的数据,进入控制界确定单元;对于无相关 性类型的数据,进入异常点检验和过滤单元;
异常点检验和过滤单元,用于对连续分布且无自相关性的数据进行异常 点的检验和过滤,经过检验和过滤的数据,进入正态分布类型判断单元;
正态分布类型判断单元,用于接收无自相关性且经过异常点检验和过滤 的数据,判断是否属于正态分布类型,将数据分为正态分布类型和非正态分 布类型,并进入控制界确定单元;
控制界确定单元,包括非连续分布类型数据控制界计算单元、具有自相 关性类型数据控制界计算单元、非正态分布类型数据控制界计算单元和正态 分布类型数据控制界计算单元,分别用于接收非连续分布类型数据、具有自 相关性类型数据、非正态分布类型数据和正态分布类型数据,计算各类数据 对应的用于对生产过程进行监控和/或分析的控制界。
可选的,所述连续分布类型判断单元,包括计算单元和比较单元,所述 计算单元用于计算所述数据的不同数值种类大小,所述比较单元用于比较所
述数据的不同数值种类与预定值,若所述数据的不同数值种类超过该预定值 则属于连续分布类型数据,反之则不属于。
可选的,所述自相关性类型判断单元,包括计算单元和比较单元,所述 计算单元用于计算所述数据的一阶自相关性系数和取得该一阶自相关性系数 的概率值,所述比较单元用于比较所述数据的一阶自相关性系数与预定值以及取得该一阶自相关性系数的概率值与另 一预定值,若一阶自相关性系数大 于所述预定值而且取得该一阶自相关性系数的概率值小于所述另一预定值的 数据则属于具有自相关性类型数据,反之则不属于。
可选的,所述非连续分布类型数据控制界计算单元,用于接收非连续分 布类型数据,采用从工程上定义的警告上下界作为其控制界。
可选的,所述具有自相关性类型数据控制界计算单元,用于接收具有自 相关性类型数据,采用从工程上定义的警告上下界作为其控制界。
可选的,所述正态分布类型数据控制界计算单元,用于接收无自相关性、 经过异常点检验和过滤、且为正态分布的数据,采用被监测数据的三倍标准 方差作为控制界。
可选的,所述非正态分布类型数据控制界计算单元,用于接收非正态分 布类型数据对于无自相关性且为非正态分布的数据,采用百位分数法计算控 制界。
可选的,所述非正态分布类型数据控制界计算单元,用于接收非正态分 布类型数据对于无自相关性且为非正态分布的数据,采用线性外推法结合百 分位数法计算控制界。
可选的,所述非正态分布类型数据控制界计算单元,包括百分位数计算
单元、k值计算单元和控制界计算单元。百分位数计算单元根据所采集的数据, 计算控制界计算单元所采用的线性公式中包含的百分位数所对应的数据值; k值计算单元计算控制界计算单元所采用的线性公式中的线性系数k值;控制 界计算单元根据线性系数k值和百分位数对应的数据值,采用相应的线性公 式,计算所述假警报率情况下非正态分布类型数据的控制界的值。
与现有技术相比,上述所公开的统计分析方法和装置,具有以下优点
有效的将生产系统中的各类数据进行了分类,同时也简化了控制图的分 类,提高了工作效率。对于非连续分布的数据的控制界采用从工程上定义的警告上下界;对于
无自相关性但经过异常点检验与过滤,为正态分布的数据的控制界仍采用标 准类型的计算方法,即为被检测数据的三倍标准方差。从而有效地降低了工 作量,提高了工作效率。
对于无自相关性且为非正态分布的数据,在数据量不足的情况下,对控 制界的计算方法,合理地假定了数据高低端外延部分符合正态分布,并采用 线性外推法和百位分数算法相结合,得到合理的结论值。
对于自相关性的数据,相关文献中对其控制界有提供专门的统计方法, 但过于复杂,本发明提出以从工程上定义的警告上下界作为此类数据的控制 界,只要数据点始终在警告上下界之内,就不会产生警报,节约了数据检查 的时间,减轻了工程师们的工作负荷。


图1是本发明统计过程控制方法的一种实施方式流程图2是本发明统计过程控制方法的另 一种实施方式流程图3是本发明统计过程控制方法的一种实施方式中数据点的分布图4是本发明统计过程控制方法的另 一种实施方式中数据点的分布图5是本发明统计过程控制方法的另 一种实施方式中数据点的分布图6是本发明统计过程控制装置的一种实施方式流程图7是本发明统计过程控制装置的另 一种实施方式流程图8是本发明统计过程控制装置中控制界确定单元组成;
图9是本发明统计过程控制装置中非正态分布类型数据控制界计算单元 的一种具体实施方式

具体实施例方式
参考图1,本发明统计控制方法,采集生产系统中的原始数据(步骤D1), 将这些待分析的原始数据分为非连续类型数据、具有自相关性类型数据、正 态分布类型数据和非正态分布类型数据(步骤D2),并根据不同类型的数据 特征,分别计算其不同的控制界(步骤D3)。
参考图2,本发明统计控制方法的一种实施方式包括下列步骤
步骤Sl,采集待分析的原始数据。在一种具体实现中,对于生产系统中 各工序环节的大量参数分别进行数据采集。例如,在晶圓的生产制造中,通 常采用整组数据随机抽样的方法采集数据,即每一次的随机采样,都从工序 中抽取n个样品,而不是把n个样品分几次抽出。可采用不同的采集方式对 各不同参数进行采集。
步骤S2,判断数据是否属于连续分布类型,若属于非连续分布类型,则 进入步骤S6,若属于连续分布类型,则进入步骤S3。
在一种具体实现中,可根据所述数据数值的大小,通过判断不同数值大
小的种类,确定是否属于连续分布类型。例如,若不同数值大小的种类小于 或等于二十种,即属于非连续分布类型;若不同数值大小的种类超过二十种, 即属于连续分布类型。
步骤S3,判断数据是否具有自相关性,若数据具有自相关性,进入步骤 S7;反之,即数据无自相关性,则进入步骤S4。
例如,在一种具体实现中,若所述数据的一阶自相关性系数大于0.5而且 取得该一阶自相关性系数的概率值小于0.05,即具有自相关性;反之,即数 据无自相关性。
步骤S4,对数据进行异常点的检验和过滤,完成检验和过滤的数据进入 步骤S5。
在一种具体实现中,所述异常点检验与过滤可采用按常规+A3IQR的Tukey公式来检验与过滤异常点,即上筛限=Q3 + 3 * ( Q3 - Ql ),下筛限= Ql-3 * (Q3-Q1),其中Q1和Q3是第一、第二分位数,落在该上筛限之上 或落在该下筛限之下的数据点被认作异常点而被过滤掉。
步骤S5,判断数据是否呈正态分布,呈正态分布,则进入步骤S8;反之, 即呈非正态分布,则进入步骤S9。
例如,在一种具体实现中,若Shapiro-Wilk (夏皮诺-威尔克)正态分布 检验的显著性概率值大于0.05,即呈正态分布;反之,则呈非正态分布。
步骤S6,对于非连续分布类型数据,使用从工程上定义的警告上下界作 为控制界。
步骤S7,对于具有自相关性类型数据,使用从工程上定义的警告上下界 作为控制界。
步骤S8,对于正态分布类型数据,其控制界为被监测数据的三倍标准方差。
步骤S9,对于非正态分布类型数据,采用百分位数的方法计算其控制界。
在一种实施方式中,对于非正态分布类型数据,可采用线性外推结合百 分位数法计算控制界。
标准的百分位数计算公式可采用软件或 Excel内的公式 Percentile[(array),p]。在Percentile[(array),p]公式中,p为0到1之间的百分 比数字,array为所定义相对位置的数值数组或数值区域,Percentile[(array),p] 返回在所定义相对位置的数值数组或数值区域array中百分比p所对应的数值 点。 一般地,当所需要使用的百分位p由工程上允许的假警报率决定,array 为所需分析的参数数据时,相对应的Percentile[(array),p]所返回的值即为所需 要界定的控制界。其中,所述假警报率是指原本应处于正常范围内的参数被 误认为异常而引发警报的概率。
但是Percentile[(array),p]公式要求用于计算百分位数的数据数量不得少于1/p,而这个前提在生产过程中往往得不到满足。在生产过程中,由于生产的 每个环节中都有大量的生产参数,若将监控每一个参数的假警报率定得过高, 对于每一个参数的每一次假警报进行复检需要耗费大量人力和时间,因此通 常将假警报率定为约10_5量级,相对应地,此时对于每一个生产参数,用于计 算百分位数的数据样本就不得少于105,然而在实际生产过程中,可使用的数
据点往往只有约IOOO个左右,甚至更少。也就是说,在生产中,当我们采用 10-5量级的假警报率时,无法通过常规的百分位计算公式得到结果,对此,本
发明提供了一种可能的解决方式,即采用线性外推结合百分位法。
参考图3,在本发明的一个具体实施例中,采用了线性外推法结合标准正 态分布百分位数公式NORMSINV(p) (Excel内的公式,均值为0,标准方差 为1 )的计算方法,求出非标准正态分布的1000个原始数据中对应于p为10-5 的百分位数Percentile[(array), p](可简化为P(lE-5)),即该原始数据中对应于 IO-5的数值点,也就是该原始数据的控制界。
本发明合理地对非标准正态分布的1000个原始数据点进行假设,假设其 下端为直线,则可采用线性外推法,对于P(O.OOP/。)存在线性关系
P(0.001%)=P(50%)-k*[P(50%)-P(10%)],其中线性系数k可由标准正态分 布百分位数公式NORMSINV(p)求得。
NORMSINV(p)存在以下线性关系
NO腿S雨(O.OO 1 %)=NORMSINV(50%)-k* [NORMSINV(50%)-NORMSI NV(跳)],
其中由于NORMSINV(0.001%)、NORMSINV (50%)和NORMSINV(10%) 均可由Excel函数求得,为已知量,则可得出
& — M 皿S鮮(0.5)-M9皿S鮮(1五_5) — 0-(~4.265) _3 , 一 M 層簾F(0.5)-iVO層57iW(0.1) 一 0+1.282) — . °
对于该组非标准正态分布的1000个原始数据,P (50%)和P(10。/。)可用
Excel内的公式Percentile[(array),p]求得P(50%) = 100.02 及 P(10%)=87.39, 于是P(0.001%) = 100.02-3.328*[100.02-87.39] = 57.9。
如果不采用线性外推法,直接用原来Excel内的公式Percentile[(array),p] 进行计算的话,由于数据点只有IOOO个,因此直接用公式只能求出P(0.1%): P(0.1%) = 68.8。 P(0.001。/。)可认为和P(0.01。/o)近似相等,同理P(0.01。/o)可认为 和P(O. 1%)近似相等,因此可得到P(0.001%)~P(0.01%)~P(0.1%)=68.8。相比 较采用线性外推法所得到的非标准正态分布数据的下控制界和不采用此岸性 外推法所得到的下控制界,前者小于后者,由此可见,对于前者和后者之间 的数据,采用前者可有效地识别,而采用后者则会产生假警报,也就是说, 采用线性外推法可较为合理地设置非标准正态分布数据的控制界,避免假警 报的发生。
参考图4,本发明的另一个实施例,原始数据量不足IOOO个,为596个 明显呈非正态分布的数据点,要求假警报率为10-5,在计算上控制界时,同样 可合理地假定在高端可外推为直线,因此对于p二99.999。/。时的百分位数 P(99.999%),存在线性关系
P(99.999%)= P (90%)+k*[P(99%)-P(90%)],其中线性系数k从以下公式推 算出
NORMSINV(99.999%)=NORMSINV(90%)+k*[NORMSINV(99%)-NORM SINV(90%)]。
由Excel函数中得到NORMSINV(99.999%) 、 NORMSINV(90%)和 [NORMSINV(99%),可得到
,M 層厨7(0.99999) —M 皿S鮮(0.9) 4.264891-1.281552 ,。, M 愿展7(0.99) - M 層,r(0.9) 2.326348-1.281552
由该非正态分布596个数据点的P (90%)=255.07和?(99%)=482.62,可以求出 外推的99.999。/。的百位分数:P(99.999%) = 255.07 + 2.856* (482.62-255.07) =905。复杂工艺生产系统中有少量参数的数据样本不但非正态分布而且具有多 峰性,对于这类型数据,同样可使用类似的方法外推得其上下控制界。例如,
参考图5,本发明的另一个实施例,有1000个呈非正态分布并且具有双峰性 的原始数据,需要计算上下控制界,P(0.99999)与P(O.OOOOl),要求各单边假 警报率为10-5。假定在高端外推为直线,则对于卩=99.999%和卩=0.001%的百分 位数P(99.999。/。)和P(O.OOP/。)分别存在这样的线性关系P(99.999%)= P (90%) +kl *[P(99%)-P(90%)], P(0.001%)=P(20%)- k2*[P(20%)-P(2%)]。
对于P(0.99999),可由
NORMSINV(99.999%)=NORMSINV(90%)+k*[NORMSINV(99%)-NORM SINV(90。/。)]求得
A —冊皿咖r(0.99999)-M)層柳F(0.9) — 4.264891-1.281552 — 2 ■ 该组数 1_ 7VO層咖F(0.99)-M9層咖7(0.9) —2.326348-1.281552 — . , 乂,
据的P(90%)=15.901和P(99o命17.087,因此,P(99.999%) =15.901 + 2.856*
(17.087-15.904) =19.28。
对于P(0.001。/0),可由
NORMSINV(O.OO 1 %)=NORMSINV(50%)-k* [NORMSINV(50%)-NORMSI NV(10。/。)]求得
& — M9i MSflVF(0.2) —7V(9i MS7A^(l五—5) — -0.842-(~4,26489) — 2 g25 2— M i MSflVF(0.2)-AO M厨r(0.02) _-0,842-(-2.05375) —
该组数据的P (20%)=9.750和P(2%)=8.128 ,因此,P(0.001%) =9.750—2.825* (9.750-8.128) =5.17
对于较高的假警报率和数据的不足还可以根据具体情况对不同参数分别 对待,在另外的实施方式中,例如对少数非常关键重要的数据的控制界容忍并采用较高的假警报率,例如约0.1%,而对其他大量的系统数据则采用很低 约10-5量级的假警报率。在这种情况下,对于少数假警报率被设为0.1%的参数 的数据样本,可直接采用百分位数法计算控制界,而对于其他仍采用10-5量级 假警报率的参数的数据样本,则采用线性外推结合百分位法计算控制界。
参考图6,本发明统计过程控制装置的一种实施方式,包括
数据采集单元Ml,采集待分析的原始数据。在一种具体实现中,对生产 过程中各工序环节的具体参数进行数据样本的采集;
数据分类单元M2,用于接收数据采集单元M1所采集的原始数据,将其 按照一定的规则分为非连续分布类型数据、具有自相关性类型数据、正态分 布类型数据和非正态分布类型数据;
控制界确定单元M3,用于接收由经由数据分类单元M2分类得到的非连 续分布类型数据、具有自相关性类型数据、正态分布类型数据和非正态分布 类型数据这四类数据,并对这四类数据分别确定对应的控制界。
参考图7,本发明统计过程控制装置的另一种实施方式,该装置包括
数据采集单元ll,用于采集需要分析的原始数据;
连续分布类型判断单元12,用于接收数据采集单元11所采集的数据,判 断所采集的数据是否属于连续分布类型;
自相关性类型判断单元13,用于接收经连续分布类型判断单元12判断属 于连续分布的数据,判断其是否具有自相关性;
异常点检验和过滤单元14,用于接收由自相关性类型判断单元13判断属 于无自相关性的数据,对其进行异常点的检验和过滤;
正态分布类型判断单元15,用于接收经异常点检验和过滤单元14输出 的数据,判断是否属于正态分布类型,将数据分为正态分布类型和非正态分 布类型;
参考图8,控制界确定单元16,包括非连续分布类型数据控制界计算单元20、具有自相关性类型数据控制界计算单元19、非正态分布类型数据控制
界计算单元18和正态分布类型数据控制界计算单元17,分别用于接收经连续 分布类型单元12判断属于非连续分布类型的数据、经自相关性类型判断单元 13判断具有自相关性类型的lt据、经正态分布类型判断单元15判断属于非正 态分布类型数据和经正态分布类型判断单元15判断属于正态分布类型数据, 并分别计算对应的控制界。
在一种具体的实施方式中,以上所述数据采集单元11、连续分布类型判
断单元12、自相关性类型判断单元13、异常点检验和过滤单元14、正态分布 类型判断单元15和控制界确定单元16按如下的方式相互配合进行工作
上述数据采集单元11对各具体参数的数据样本进行采集;
上述连续分布类型判断单元12,接收数据采集单元11所采集的数据,计 算不同数值大小的种类,根据不同数值大小的种类判断是否属于连续分布类 型,属于连续分布类型,进入自相关性类型判断单元13,不属于非连续分布类 型数据,进入控制界确定单元16中的非连续分布类型数据控制界计算单元20。 其中, 一种判断方法为,所述数据的不同数值种类大小超过二十种的,属于 连续分布类型;小于或等于二十种的作为非连续分布类型凄t据;
上述自相关性类型判断单元13接收经连续分布类型判断单元12判断得 到的连续分布类型数据,计算所得数据的 一阶自相关性系数和取得该一阶自 相关性系数的概率值,并判断是否属于强自相关类型数据,属于强自相关类 型的,进入控制界确定单元16中的具有自相关性类型数据控制界计算单元19, 反之,则为不具有自相关性类型数据,进入异常点检验和过滤单元14。其中, 一种判断方法为,若其一阶自相关性系数大于0.5而且取得该一阶自相关性系 数的概率值小于0.05,则为不具有自相关性,反之则为具有自相关性类型;
上述异常点检验与过滤单元14对进入的无自相关性的数据进行过滤,通 过的数据进入正态分布类型判断单元15。其中, 一种检验和过滤异常点的方法为,使用Tukey公式:上筛限=Q3 + 3 * ( Q3-Q1),下筛限=Ql - 3 * ( Q3-Ql),其中Q1和Q3是第一、第二分位数。落在该上筛限之上或落在该下筛 限之下的数据点被认作异常点而被过滤掉。
上述正态分布类型判断单元15,对进入的无自相关性且经过异常点检验 和过滤的数据判断是否呈正态分布,若属于正态分布类型数据,则进入控制 界确定单元16中的正态分布类型数据控制界计算单元17,计算所述数据的控 制界;若不属于,则进入控制界确定单元16中的非正态分布类型数据控制界 计算单元18,进行控制界的计算。其中, 一种正态分布的检验办法为,计算 Shapiro-Wilk正态分布检验的显著性概率值,若显著性概率值大于0.05,则归 类于正态分布类型数据;若显著性概率值小于或等于0.05,则该数据属于非 正态分布。
非连续分布类型数据控制界计算单元15,对于非连续分布类型数据,采 用从工程上定义的警告上下界作为其控制界;
具有自相关性类型数据控制界计算单元16,对于具有自相关性类型数据, 采用从工程上定义的警告上下界作为其控制界;
正态分布类型数据控制界计算单元17,对于正态分布类型数据,采用所 述数据的三倍标准方差作为控制界
非正态分布类型数据控制界计算单元18中,对于非正态分布类型数据, 可采用百分位数的方法计算其控制界。
在一种实施方式中,对于非正态分布类型数据,可采用线性外推结合百 分位数法计算其高低端的控制界。
参考图9,在一种具体实现中,非正态分布类型数据控制界计算单元18 可包括百分位数计算单元21、 k值计算单元22和控制界计算单元23。百分位 数计算单元21计算控制界计算单元23所采用的线性公式中包含的百分位数 的值;k值计算单元22计算控制界计算单元23所采用的线性公式中的线性系数k值;k值计算单元22和百分位数计算单元21的结果输入控制界计算单元 23后,控制界计算单元23采用所述线性公式,计算所述假警^^率情况下非正 态分布类型数据的控制界的值。
虽然本发明已通过较佳实施例说明如上,但这些较佳实施例并非用以限 定本发明。本领域的技术人员,在不脱离本发明的精神和范围内,应有能力 对该较佳实施例做出各种改正和补充,因此,本发明的保护范围以权利要求 书的范围为准。
权利要求
1. 一种统计过程控制方法,其特征在于,包括采集生产过程中待分析的原始数据;将该原始数据分类,分为非连续分布类型数据、具有自相关性类型数据、正态分布类型数据和非正态分布类型数据;对于上述各类数据,分别确定其控制界;按照所述控制界对生产过程进行监控和/或分析。
2. 如权利要求l所述的方法,其特征在于,将原始数据的分类,包括判断 所述数据是否属于连续分布类型,不属于的数据则为非连续分布类型数据; 对于属于连续分布的数据,判断其自相关性,具有自相关性的为具有自相关 性类型数据;对连续分布且不具有自相关性类型的数据,经过异常点的检验 和过滤之后,根据其是否符合正态分布,分为正态分布类型数据和非正态分 布类型数据。
3. 如权利要求l所述的方法,其特征在于,所述非连续分布类型是指,所述 数据的不同数值种类大小小于或等于预定值。
4. 如权利要求l所述的方法,其特征在于,所述具有自相关性类型是指所述 数据的一阶自相关性系数大于预定值而且取得该一阶自相关性系数的概率值 小于另一预定值。
5. 如权利要求l所述的方法,其特征在于,对于非连续分布类型的数据,使 用从工程上定义的警告上下界作为控制界。
6. 如权利要求l所述的方法,其特征在于,对于具有自相关性类型数据,使 用从工程上定义的警告上下界作为控制界。
7. 如权利要求l所述的方法,其特征在于,对于正态分布类型数据,采用被 监测数据的三倍标准方差作为控制界。
8. 如权利要求l所述的方法,其特征在于,对于非正态分布类型数据,采用 百分位数法计算控制界。
9. 如权利要求l所述的方法,其特征在于,对于非正态分布类型数据,采用 线性外推结合百分位数法计算控制界。
10. 如权利要求9所述的方法,其特征在于,所述线性外推结合百分位数法计 算其控制界,包括步骤对所采集的数据进行合理的假定,得到包含百分位 数的线性的控制界计算公式;由标准正态分布百分位公式求出线性的控制界 计算公式中的线性系数k值;根据所采集的数据,求出线性的控制界计算公 式中所包含百分位数对应的数据值;将线性系数k值和百分位数对应的数据 值代入所述线性的计算公式,确定控制界。
11. 一种统计过程控制的装置,其特征在于,包括数据采集单元,用于采集生产过程中待分析的原始数据; 数据分类单元,用于接收采集的原始数据,将其分为非连续分布类型数据、具有自相关性类型数据、正态分布类型数据和非正态分布类型数据;控制界确定单元,用于接收已分类的非连续分布类型数据、具有自相关性类型数据、正态分布类型数据和非正态分布类型数据,并分别确定各类型数据对应的用于对生产过程进行监控和/或分析的控制界。
12. 如权利要求11所述的装置,其特征在于,所述数据分类单元包括 连续分布类型判断单元,用于接收所采集的数据,判断所采集的数据是否属于连续分布类型;自相关性类型判断单元,用于接收经连续分布类型判断单元判断属于连 续分布的数据,判断其是否具有自相关性;异常点检验和过滤单元,用于接收由自相关性类型判断单元判断属于无 自相关性的数据,对其进行异常点的检验和过滤;正态分布类型判断单元,用于接收经异常点检验和过滤单元输出的数据, 判断是否属于正态分布类型,将数据分为正态分布类型和非正态分布类型。
13. 如权利要求12所述的装置,其特征在于,所述连续分布类型判断单元,包括计算单元和比较单元,所述计算单元用于计算所述数据的不同数值种类 大小,所述比较单元用于比较所述数据的不同数值种类与预定值,若所述数 据的不同数值种类超过该预定值则属于连续分布类型数据,反之则不属于。
14. 如权利要求12所述的装置,其特征在于,所述自相关性类型判断单元,包括计算单元和比较单元,所述计算单元用于计算所述数据的一阶自相关性 系数和取得该一阶自相关性系数的概率值,所述比较单元用于比较所述数据 的一阶自相关性系数与预定值以及取得该4自相关性系数的概率值与另一 预定值,若一阶自相关性系数大于所述预定值而且取得该一阶自相关性系数 的概率值小于所述另一预定值的数据则属于具有自相关性类型数据,反之则 不属于。
15. 如权利要求11所述的装置,其特征在于,所述控制界确定单元中包括非 连续分布类型数据控制界计算单元,用于接收经连续分布类型单元判断属于 非连续分布类型的数据,采用从工程上定义的警告上下界作为其控制界。
16. 如权利要求11所述的装置,其特征在于,所述控制界确定单元中还包括 具有自相关性类型数据控制界计算单元,用于接收经自相关性类型判断单元 判断具有自相关性类型的数据,对于有自相关性类型的参数,采用从工程上 定义的警告上下界作为控制界。
17. 如权利要求11所述的装置,其特征在于,所述控制界确定单元中还包括 正态分布类型数据控制界计算单元,用于接收经正态分布类型判断单元判断 属于正态分布类型数据,采用被监测数据的三倍标准方差作为控制界。
18. 如权利要求11所述的装置,其特征在于,所述控制界确定单元中还包括 非正态分布类型数据控制界计算单元,用于接收经正态分布类型判断单元判 断属于非正态分布类型数据,采用百分位法计算控制界。
19. 如权利要求11所述的装置,其特征在于,所述控制界确定单元中还包括 非正态分布类型数据控制界计算单元,用于接收经正态分布类型判断单元判断属于非正态分布类型数据,采用线性外推结合百分位法计算控制界。
20.如权利要求19所述的装置,其特征在于,所述非正态分布类型数据控制 界计算单元,包括百分位数计算单元、k值计算单元和控制界计算单元;百分 位数计算单元根据所采集的数据,计算控制界计算单元所采用的线性公式中 包含的百分位数所对应的数据值;k值计算单元计算控制界计算单元所采用的 线性公式中包含的线性系数k值;控制界计算单元根据线性系数k值和百分 位数对应的数据值,采用相应的线性公式,计算所述假警报率情况下非正态 分布类型数据的控制界的值。
全文摘要
一种统计过程控制方法和应用该方法的统计过程控制装置,所述方法包括,采集生产过程中待分析的原始数据,将该原始数据分为非连续分布类型数据、具有自相关性类型数据、非正态分布类型数据和正态分布类型数据,对于不同类型的数据,分别确定其控制界,并根据所确定的控制界对生产过程进行监控和/或分析。本发明统计过程控制方法通过对数据的分类,简化了控制图的分类,并解决了对于正态和非正态分布的有限数据点的控制界的计算问题,实现了以往无法实现的对海量参数的复杂系统的监测,节省了数据处理的时间,提高了工作效率。
文档编号G05B19/418GK101477358SQ20081003226
公开日2009年7月8日 申请日期2008年1月4日 优先权日2008年1月4日
发明者杨斯元, 简维廷 申请人:中芯国际集成电路制造(上海)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1