数据中异常点的检测方法和装置的制作方法

文档序号:7227531阅读:289来源:国知局

专利名称::数据中异常点的检测方法和装置的制作方法
技术领域
:本发明涉及工业生产
技术领域
中的一种检测数据中异常点的方法和装置。
背景技术
:在工业生产过程中,为了及时发现过程中的问题,消除问题或降低问题带来的损失,都要对每个过程进行质量管理控制,其包括对每个过程进行检测。举例来说,半导体集成电路制作工艺是一种平面制作工艺,其结合光刻、刻蚀、沉积、离子注入等多种工艺,在同一衬底上形成大量各种类型的复杂器件,并将其互相连接以具有完整的电子功能。其中,任一步工艺出现问题,都可能会导致电路的制作失败,因此,在现有技术中,常会对各步工艺的制作结果进行检测,如对薄膜的生长厚度、刻蚀的深度、光刻套刻的精度、器件的寿命等的检测,并针对检测得到的数据进行分析,判断各步工艺及制作出的各种器件的性能是否正常,以尽早发现工艺中所出现的问题。对于工艺中所出现的问题,越早发现,损失就会越小。为更好地对检测数据进行分析,2006年5月10日公开的申请号为200410089715.5的中国专利申请提出了一种缺陷检测及分类系统的数据分析方法,该方法从原始数据中选取需进行分析的数据,对其进行统计分析,再以图表的方式表现出来,以帮助管理者检测设备是否存在问题。但是该方法中并未涉及如何判断数据中是否存在异常点(outlier),以及对数据中的异常点如何进行处理的问题。所谓异常点是指在实际检测所测得的数据中,经常会包含的一些显著不同于其它数据的数据值(比其它数据要大很多或者小很多),该类数据值会直接影响到能否正确判断工艺是否超出控制(OOC,OutofControl),严重时,甚至会导致不能由检测数据的结果得出结论。因此,如何能在数据分析过程中正确地检测和去除异常点,对于正确地判断半导体工艺中是否存在问题非常关键。目前,在工业领域中常用的异常点检测方法是格鲁布斯(Grubbs)检测方法、肖维特(Chavent)检测方法等,然后再将检测到的异常点去除。例如,在半导体集成电路制作工艺中常用的一种格鲁布斯检测方法,该方法先对检测数据进行排序,再根据下述公式针对排序后的数据中的端值计算差值统计量T:RXn國Xl其中,X^X2^-SX^SXn,端值x,和xn称为可疑点,R是极差,即最大值与最小值的差值,s是标准偏差,n是数据个数,数据的平均值"fi。最后由检测人员将计算所得的值T与表l中对应于数据个数n的标准格鲁布斯检测临界值(CriticalValue)C。比较判断其是否为异常点。此时有两种情况,一种情况是可疑点Xi与平均值5的差值等于可疑点Xn与平均值^的差值,如果计算值T小于检测临界值Cn,那么可疑点Xi和Xn不是异常点,应该保留,如果计算值T大于等于检测临界值Cn,也就是端值X,和Xn的差值大,那么可疑点X,和Xn都是异常点,应该去除;另一种情况是可疑点^与平均值^的差值不等于可疑点Xn与平均值^的差值,那么就需要其它的方法来判断可疑点Xi和Xn中是否是异常点,例如,计算可疑点X,与平均值文、可疑点Xn与平均值5的差值统计量。1><table>tableseeoriginaldocumentpage8</column></row><table>其中,m、n是自然数,并且m《n。上述的格鲁布斯检测方法在可疑点&与平均值文的差值不等于可疑点Xn与平均值5的差值的情况时,对于可疑点X!和Xn哪一个是异常点,还是两个都是异常点,还是两个都不是异常点,是不能直接得出结论的。因此,有必要提供一种可以直接且方便地检测出哪一个可疑点是异常点的方法。
发明内容本发明解决的问题是,提供一种数据中异常点的检测方法,其可以直接且方便地检测出数据中的异常点。为解决上述问题,本发明提供一种所述的数据包括至少4个排序数据值,所述的方法包括下述步骤计算最大数据值与最小数据值、最大数据值与次小数据值、次大数据值与最小数据值、次大数据值与次小数据值的差值统计量;以及将计算所得的最大数据值与最小数据值、最大数据值与次小数据值、次大数据值与最小数据值、次大数据值与次小数据值的差值统计量分别与对应的检测临界值比较,以确定最大数据值、最小数据值是否是异常点。所述的与差值统计量对应的检测临界值是指与数据个数对应的检测临界值,,所述的数据个数分别是指从最小数据值到最大数据值的数据个数、从次小数据值到最大数据值的数据个数、从最小数据值到次大数据值的数据个数,从次小数据值到次大数据值的数据个数。所述的差值统计量根据下述公式计算<formula>formulaseeoriginaldocumentpage9</formula>其中,平均值mFa,Xa<Xb,R是2个数据值Xb和Xa的差值,S是2个数据值间Xb和Xa的标准偏差,m是从Xa到Xb的数据个数(包括数据值Xa到xb)。所述的确定最大数据值、最小数据值是否是异常点是通过下述控制列表所列逻辑关系来判断的<table>tableseeoriginaldocumentpage9</column></row><table><table>tableseeoriginaldocumentpage10</column></row><table>其中,X!是最小数据值,Xn是最大数据值,X2是次小数据值,Xn.,是次大数据值,T(X广Xn)是最大lt据值与最小数据值的差值统计量,T(X2~Xn)是最大数据值与次小数据值的差值统计量,T(X广X^)是次大数据值与最小数据值的差值统计量,T(X2Xn—,)是次大数据值与次小数据值的差值统计量,Cn是最大数据值与最小数据值的差值统计量T(X广Xn)所对应的检测临界值,Cn—,是最大数据值与次小数据值的差值统计量T(X2XJ、次大数据值与最小数据值的差值统计量T(X2Xn》所对应的检测临界值,C。-2是次大数据值与次'J、数据值的差值统计量T(X2X^)所对应的检测临界值。所述的检测临界值是格鲁布斯检测临界值,或是肖维特检测临界值。对应于上述的检测方法,本发明还提供一种数据中异常点的检测装置,所述的数据包括至少4个排序数据值,所述的装置包括计算模块,用于计算最大数据值与最小数据值、最大数据值与次小数据值、次大数据值与最小数据值、次大数据值与次小数据值的差值统计量;以及比较模块,用于将计算所得的最大数据值与最小数据值、最大数据值与次小数据值、次大数据值与最小数据值、次大数据值与次小数据值的差值统计量分别与对应的检测临界值比较,以确定最大数据值、最小数据值是否是异常点。所述比较模块中与差值统计量对应的检测临界值是指与数据个数对应的检测临界值,所述的数据个数分别是指从最小数据值到最大数据值的数据个数、从次小数据值到最大数据值的数据个数、从最小数据值到次大数据值的数据个数,从次小数据值到次大数据值的数据个数。所述计算模块中差值统计量根据下述公式计算<formula>formulaseeoriginaldocumentpage10</formula>其中,平均值<formula>formulaseeoriginaldocumentpage11</formula>,Xa<Xb,R是2个数据值Xb和Xa的差值,S是2个数据值间Xb和Xa的标准偏差,m是从Xa到Xb的数据个数(包括数据值Xa到xb)。所述比较模块中确定最大数据值、最小数据值是否是异常点是通过下述控制列表所列逻辑关系来判断的<table>tableseeoriginaldocumentpage11</column></row><table>其中,Xi是最小数据值,Xn是最大数据值,X2是次小数据值,X^是次大数据值,T(X广Xn)是最大数据值与最小数据值的差值统计量,T(X2~Xn)是最大数据值与次小数据值的差值统计量,T(X广Xn.,)是次大数据值与最小数据值的差值统计量,T(X2Xn—O是次大数据值与次小数据值的差值统计量,Cn是最大数据值与最小数据值的差值统计量T(X广Xn)所对应的检测临界值,Q^是最大数据值与次小数据值的差值统计量T(X2Xn)、次大数据值与最小数据值的差值统计量T(X2X^)所对应的检测临界值,Cn-2是次大数据值与次小数据值的差值统计量T(X2X^)所对应的检测临界值。所述比较模块中检测临界值是格鲁布斯检测临界值,或是肖维特检测临界值。与现有技术相比,本发明所提供的数据中异常点的^T测方法和装置通过增加计算和比较最大数据值与次小数据值的差值统计量、次大数据值与最小数据值的差值统计量、次大数据值与次小数据值的差值统计量就可以直接检测出异常点,而差值统计量的计算和比较仍是利用差值统计量的通用计算公式和现有的标准检测临界值,公式中的参数和检测临界值只需要根据计算和比较的数据值作相应的更改即可,因此实现起来非常方便。图1是本发明的数据中异常点的检测方法的基本流程步骤;图2是本发明较佳实施例的数据中异常点的检测方法的详细流程步骤;图3是本发明的数据中异常点的检测装置的基本框图。具体实施例方式本发明提供一种数据中异常点的检测方法,其实质上是通过增加3个差值统计量的计算和比较来直接检测出异常点,而差值统计量的计算和比较仍是利用通用的差值统计量计算公式和标准的检测临界值。图1是本发明的数据中异常点的检测方法的基本流程步骤,其中,所述的数据包括至少4个已经排序后的数据值,数据值可以是从小到大排序,也可以是从大到小排序。例如,有一组从小到大排序的检测数据,包括数据值Xi、X2、…、Xn—i、Xn。该方法首先进行步骤SIO,计算最大数据值与最小数据值、最大数据值与次小数据值、次大数据值与最小数据值、次大数据值与次小数据值的差值统计量。在本步骤中,根据差值统计量的通用计算公式(l)计算最大数据值xn与最小数据值X,的差值统计量T(X广Xn)、最大数据值Xn与次小数据值X2的差值统计量T(X广Xn)、次大数据值Xn-i与最小数据值Xi的差值统计量T(X广Xn-!)、次大数据值Xl>1与次小数据值X2的差值统计量T(X2X^)。<formula>formulaseeoriginaldocumentpage13</formula>其中,平均值<formula>formulaseeoriginaldocumentpage13</formula>,Xa<Xb,R是2个数据值Xb和Xa的差值,s是2个数据值间Xb和Xa的标准偏差,m是从数据值Xa到Xb的数据个数(包括数据值Xa和Xb)。在计算差值统计量T(X广Xn)时,Xa用Xi代入,Xb用X。代入;在计算差值统计量T(X广Xn)时,Xa用X2代入,Xb用Xn代入;在计算差值统计量T(X广X^)时,Xa用X!代入,Xb用X。-i代入;在计算差值统计量T(X广Xn-0时,Xa用X2代入,Xb用Xn-l代入。然后进行步骤Sll,将计算所得的最大数据值与最小数据值、最大数据值与次小数据值、次大数据值与最小数据值、次大数据值与次小数据值的差值统计量分别与对应的检测临界值比较,以确定最大数据值、最小数据值是否是异常点。其中,所述的检测临界值是格鲁布斯检测临界值,所述的与差值统计量对应的临界检测值是指从表1可查到的与数据个数对应的临界检测值,所述的数据个数分别是指从最小数据值^到最大数据值Xn的数据个数n、从次小数据值X2到最大数据值Xn的数据个数n-l、从最小数据值X,到次大数据值X^的数据个数n-l,从次小数据值X2到次大数据值Xn.2的数据个数n-2。在本步骤中,将计算所得的最大数据值Xn与最小数据值X,的差值统计量T(X广Xn)、最大数据值Xn与次小数据值X2的差值统计量T(X2Xn)、次大数据值X^与最小数据值X!的差值统计量T(X广X^)、次大数据值X^与次小数据值X2的差值统计量T(X2x^)分别与表l中数据个数n、n-l、n-l、n-2对应的格鲁布斯检测临界值Cn、C^、Qm、Q^进行比较,根据比较结果可以判断出最大数据值Xn、最小数据值Xi是否是异常点。根据本发明的较佳实施方式,可以建立一个控制列表,如表2所示,所述的控制列表列出了差值统计量与检测临界值的比较结果和异常点的判断结果之间的逻辑关系,因此,通过查询控制列表(表2)的方式,就可以得出异常,#、的判断结果。表2<table>tableseeoriginaldocumentpage14</column></row><table>以下结合图2详细说明本发明较佳实施例的数据中异常点的检测方法的详细流程步骤。在本实施例中,检测数据包括数据值X!、X2、X3、X4、X5、Xg、X7,并且Xi《X2<X3《X4《X5<X6《X7。首先进行步骤S21,计算最大数据值X7与最小数据值Xi的差值统计量T(Xl~X7)。在本步骤中,根据公式(1-1)计算最小数据值X,与最大数据值X7间所有数据值的平均值5(i);根据公式(1-2)计算最小数据值Xi与最大数据值X7间的标准偏差S(X广XJ;根据公式(l-3)计算最小数据值Xi与最大数据值X7的差值统计量T(X广X7)。<formula>formulaseeoriginaldocumentpage14</formula><formula>formulaseeoriginaldocumentpage15</formula>接着进行步骤S22,计算最大数据值X7与次小数据值X2的差值统计量T(X2~X7)。在本步骤中,根据公式(2-l)计算次小数据值X2与最大数据值X7间所有数据值的平均值文(2~7);根据公式(2-2)计算次小数据值X2与最大数据值X7间的标准偏差S(X2X7);根据公式(2-3)计算次小数据值X2与最大数据值X7的差值统计量T(X广X7)。<formula>formulaseeoriginaldocumentpage15</formula>(2-2)(2陽3)接着进行步骤S23,计算次大数据值X6与最小数据值Xi的差值统计量T(Xl~x6)。在本步骤中,根据公式(3-l)计算最小数据值Xi与次大数据值xj司所有数据值的平均值Xd-0;根据公式(3-2)计算最小数据值x,与次大数据值X6间的标准偏差s(x广X6);根据公式(3-3)计算最小数据值x!与次大数据值X6的差值统计量T(X广X6)。—in-li<formula>formulaseeoriginaldocumentpage15</formula><formula>formulaseeoriginaldocumentpage16</formula>接着进行步骤S24,计算次大数据值X6与次小数据值X2的差值统计量T(X2X6)。在本步骤中,根据公式(4-l)计算次小数据值X2与次大数据值xj司所有数据值的平均值Xp6);根据公式(4-2)计算次小数据值X2与次大数据值X6间的标准偏差S(X广X6);根据公式(4-3)计算次小数据值X2与次大数据值x6的差值统计量T(X2X6)。(<formula>formulaseeoriginaldocumentpage16</formula>上述公式(1-3)、(2-3)、(3-3)、(4-3)是根据要计算的差值统计量所对应的数据值更改公式(1)中相应的参数Xa、xb、m而得到的。上述步骤S21至S24并不是以本实施例所述的顺序为限,也就是说,计算最大数据值X7与最小数据值X!的差值统计量T(X广X7)、最大数据值X7与次小数据值X2的差值统计量T(X广X7)、计算次大数据值X6与最小数据值X,的差值统计量T(X广X6)、次大数据值X6与次小数据值X2的差值统计量T(X2X6)的步骤顺序可以任意变换。接着进行步骤S25,查表l,找出与差值统计量T(x广X7)、T(x2~x7)、T(x广X6)、T(X广X6)与对应的检测临界值C7、C6、C6、C5。具体来说,从^到X7的数据个数是7个,因此从表1中得到对应数据个数7的检测临界值是C7,因此与差值统计量T(X广X7)对应的检测临界值是C7;从X2到X7的数据个数是6个,因此从表l中得到对应数据个数6的检测临界值是C6,因此与差值统计量T(X2X7)对应的检测临界值是C6;从x!到X6的数据个数是6个,因此从表l中得到对应数据个数6的检测临界值是C6,因此与差值统计量T(x广X6)对应的检测临界值是C6;从X2到X6的数据个数是5个,因此从表l中得到对应数据个数5的检测临界值是Cs,因此与差值统计量T(X2X6)对应的检测临界值是Cs。接着进行步骤S26,建立一个控制列表,如表3所示,该控制列表列出了差值统计量T(X广X7)、T(X2~X7)、T(X广X6)、T(X广X6)与对应的检测临界值C7、C6、C6、C5的比较结果和数据值^、X7是否是异常点的判断结果之间的逻辑关系。表3<table>tableseeoriginaldocumentpage17</column></row><table>接着进行步骤S27,根据计算所得的差值统计量T(x广X7)、T(x2~x7)、T(Xl~X6)、T(X2X6)查询控制列表(表3),直接得出数据值x!、x/那一个是异常点、或是2个都是异常点、或是2个都不是异常点的结论。在结束上述检测数据值x^X7是否是异常点的步骤S21至S26后,可以继续检测数据值X2、X6是否是异常点,其先从数据X,、X2、X3、X4、X5、X6、X7中取出数据X2、X3、X4、X5、X6,然后根据上述步骤S21至S26计算和比较差值统计量,其中,计算差值统计量T(X广X6)、T(X3X6)、T(X2~X5)、T(X广X5)仍是使用差值统计量的通用计算公式(1),只需更改公式(l)中相应的参数即可,并且控制列表(表2)中的检测临界值也只需更改成相应的临界值即可。另夕卜,在结束上述检测数据值x!、X7是否是异常点的步骤S21至S26后,可以根据异常点的检测结果判断小于等于数据值Xi的数据值、大于等于数据值X7的数据值是否是异常点。举例来说,有一组数据包括数据值X。、Xl、x2、x3、X4、X5、X6、X7、X8,并且Xo<Xi《X2<X3<X4<x5<x6《x7《x8,从该组数据中取出数据值x,、x2、x3、X4、x5、x6、X7并通过上述步骤S21至S26检测数据值x,、X7,如果数据值X,是异常点,也就是数据值X!比其它数据值小很多,那么比它小的数据值xo当然也比其它数据值小很多,因此数据值xo也是异常点;同样地,如果数据值X7是异常点,也就是数据值X7比其它数据值大很多,那么比它大的数据值X8当然也比其它数据值大很多,因此数据值Xs也是异常点;如果数据值Xl、X7不是异常点,那么可以根据上述步骤S21至S26继续检测数据值x。、X8是否是异常点。上述本发明的异常点的检测方法,可以使用各种计算机语言编制成程序并存储在计算机介质上,通过执行该程序即可以自动完成对数据中异常点的检测和去除。该计算机介质可以是电、磁或半导体的存储介质。控制列表(如表2)也可以事先存储在计算机中,直接由程序自动调用。因此,检测过程不需要由检测人员完成,而是由计算机自动实现,这样检测起来既方便快捷又不容易出错。请继续参考图3,对应于上述检测方法,本发明还提供一种数据中异常点的检测装置30,所述的数据包括至少4个排序数据值,所述的装置包括计算模块31和比较模块32。计算模块31,用于计算最大数据值与最小数据值、最大数据值与次小数据值、次大数据值与最小数据值、次大数据值与次小数据值的差值统计量。其中,差值统计量根据公式(1)计算。比较模块32,用于将计算所得的最大数据值与最小数据值、最大数据值与次小数据值、次大数据值与最小数据值、次大数据值与次小数据值的差值统计量分别与对应的检测临界值比较,以确定最大数据值、最小数据值是否是异常点。其中,所述的与差值统计量对应的检测临界值是指与数据个数对应的检测临界值,所述的数据个数分别是指从最小数据值到最大数据值的数据个数、从次小数据值到最大数据值的数据个数、从最小数据值到次大数据值的数据个数,从次小数据值到次大数据值的数据个数。所述的确定最大数据值、最小数据值是否是异常点是通过查控制列表即表2的方式来判断的。需要说明的是,本发明使用的是格鲁布斯检测方法,因此所述的检测临界值是格鲁布斯检测临界值,但并非以此为限,例如,如果使用的是肖维特检测方法,则所述的检测临界值是肖维特检测临界值。另外,本发明所述的数据是指已经排序后的数据值,但是,若需要检测的数据是未排序的数据,则可以先对数据进行排序后再应用本发明所述的方法检测数据中的异常点。本发明的数据中异常点的^r测方法和装置可以广泛应用于各种工业领域中,例如可以应用于半导体制造领域中,还可以应用于机械、电子、医学等工业领域中。本发明所提供的数据中异常点的检测方法和装置除了计算最大数据值与最小数据值的差值统计量外,还计算最大数据值与次小数据值的差值统计量、次大数据值与最小数据值的差值统计量、次大数据值与次小数据值的差值统计量,再将计算所得的4个差值统计量与检测临界值比较就可以直接检测出异常点。虽然增加了要计算的差值统计量的数量,但是差值统计量的计算和比较仍是利用差值统计量的通用计算公式和现有的标准检测临界值,公式中的参数和检测临界值只需要根据计算和比较的数据值作相应的更改即可,因此实现起来非常方便。本发明虽然以较佳实施例公开如上,但其并不是用来限定本发明,任何本领域技术人员在不脱离本发明的精神和范围内,都可以做出可能的变动和修改,因此本发明的保护范围应当以本发明权利要求所界定的范围为准。权利要求1.一种数据中异常点的检测方法,所述的数据包括至少4个排序数据值,其特征在于,所述的方法包括下述步骤计算最大数据值与最小数据值、最大数据值与次小数据值、次大数据值与最小数据值、次大数据值与次小数据值的差值统计量;以及将计算所得的最大数据值与最小数据值、最大数据值与次小数据值、次大数据值与最小数据值、次大数据值与次小数据值的差值统计量分别与对应的检测临界值比较,以确定最大数据值、最小数据值是否是异常点。2.根据权利要求1所述的方法,其特征在于,所述的与差值统计量对应的检测临界值是指与数据个数对应的检测临界值,所述的数据个数分别是指从最小数据值到最大数据值的数据个数、从次小数据值到最大数据值的数据个数、从最小数据值到次大数据值的数据个数,从次小数据值到次大数据值的数据个数。3.根据权利要求1所述的方法,其特征在于,所述的差值统计量根据下述公式计算<formula>formulaseeoriginaldocumentpage2</formula>其中,平均值111Fa,Xa<Xb,R是2个数据值Xb和Xa的差值,s是2个数据值间Xb和Xa的标准偏差,m是从Xa到Xb的数据个数。4.根据权利要求1所述的方法,其特征在于,所述的确定最大数据值、最小数据值是否是异常点是通过下述控制列表所列逻辑关系来判断的<table>tableseeoriginaldocumentpage2</column></row><table><table>tableseeoriginaldocumentpage3</column></row><table>其中,Xi是最小数据值,Xn是最大数据值,X2是次小数据值,X^是次大数据值,T(X广Xn)是最大数据值与最小数据值的差值统计量,T(X2Xn)是最大数据值与次小数据值的差值统计量,T(X广X^)是次大数据值与最小数据值的差值统计量,T(X2X^)是次大数据值与次小数据值的差值统计量,Cn是最大数据值与最小数据值的差值统计量T(x广xJ所对应的检测临界值,Q^是最大数据值与次小数据值的差值统计量T(X2Xn)、次大数据值与最小数据值的差值统计量T(X广Xn.O所对应的检测临界值,Cn,2是次大数据值与次、数据值的差值统计量T(X广X^)所对应的检测临界值。5.根据权利要求1所述的方法,其特征在于,所述的检测临界值是格鲁布斯检测临界值或肖维特检测临界值。6.—种数据中异常点的检测装置,所述的数据包括至少4个排序数据值,其特征在于,所述的装置包括计算模块,用于计算最大数据值与最小数据值、最大数据值与次小数据值、次大数据值与最小数据值、次大数据值与次小数据值的差值统计量;以及比较模块,用于将计算所得的最大数据值与最小数据值、最大数据值与次小数据值、次大数据值与最小数据值、次大数据值与次小数据值的差值统计量分别与对应的检测临界值比较,以确定最大数据值、最小数据值是否是异常点。7.根据权利要求6所述的装置,其特征在于,所述比较模块中与差值统计量对应的检测临界值是指与数据个数对应的检测临界值,所述的数据个数分别是指从最小数据值到最大数据值的数据个数、从次小数据值到最大数据值的数据个数、从最小数据值到次大数据值的数据个数,从次小数据值到次大数据值的数据个数。8.根据权利要求6所述的装置,其特征在于,所述计算模块中差值统计量根据下述公式计算<formula>formulaseeoriginaldocumentpage4</formula>其中,平均值<formula>formulaseeoriginaldocumentpage4</formula>,Xa<Xb,R是2个数据值Xb和Xa的差值,s是2个数据值间Xb和Xa的标准偏差,m是从Xa到Xb的数据个数。9.根据权利要求6所述的装置,其特征在于,所述比较模块中确定最大数据值、最小数据值是否是异常点是通过下述控制列表所列逻辑关系来判断的<table>tableseeoriginaldocumentpage4</column></row><table><table>tableseeoriginaldocumentpage5</column></row><table>其中,Xt是最小数据值,Xn是最大数据值,X2是次小数据值,Xn-i是次大数据值,T(x广xJ是最大数据值与最小数据值的差值统计量,T(X2~Xn)是最大数据值与次小数据值的差值统计量,T(XlXn—i)是次大数据值与最小数据值的差值统计量,T(X2X^)是次大数据值与次小数据值的差值统计量,Cn是最大数据值与最小数据值的差值统计量T(X广Xn)所对应的检测临界值,C^是最大数据值与次小数据值的差值统计量T(X2XJ、次大数据值与最小数据值的差值统计量T(X广Xw)所对应的检测临界值,Cn—2是次大数据值与次d、数据值的差值统计量T(X2X^)所对应的检测临界值。10.根据权利要求6所述的装置,其特征在于,所述比较模块中检测临界值是格鲁布斯检测临界值或肖维特检测临界值。全文摘要一种数据中异常点的检测方法,所述的数据包括至少4个排序数据值,所述的方法包括下述步骤计算最大数据值与最小数据值、最大数据值与次小数据值、次大数据值与最小数据值、次大数据值与次小数据值的差值统计量;以及将计算所得的最大数据值与最小数据值、最大数据值与次小数据值、次大数据值与最小数据值、次大数据值与次小数据值的差值统计量分别与对应的检测临界值比较,以确定最大数据值、最小数据值是否是异常点。根据本发明所提供的数据中异常点的检测方法可以直接且方便地检测出数据中的异常点。文档编号H01L21/66GK101290611SQ20071003980公开日2008年10月22日申请日期2007年4月20日优先权日2007年4月20日发明者王邕保申请人:中芯国际集成电路制造(上海)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1