一种数据统计的方法

文档序号:6441552阅读:504来源:国知局

专利名称::一种数据统计的方法
技术领域
:本发明涉及一种排除不相干数据的统计方法。
背景技术
:在数据统计中,通常需要在测量的一组数据中排除与期望获得的数值相差甚远的不相干数据,排除不相干数据目前SEMITACH推荐采用GrubbsTests,该公式如下r(x"一x,)J二X'——其中,;d《.…《:x:"—^Xn是获取的一组数^,s是方差,R是两个数值之间的差值,该公式计算出T值,根据该T值查询对应的关键值列表,该列表列举了不同的Cn,当T值在对应的Cn范围时,X,和Xn距离很远或是很近,从而判断Xn是否是不相干数据。依照此方法,可以获取其他数据是否为不相干数据。目前这种方法,需要将X,至Xn中每个数据均代入上述公式计算对应的T值,并人工查找对应的关键值列表,这样的做法不仅会花费较大的人力,而且计算速度较慢。
发明内容本发明的目的在于提供一种新的数据统计方法,其可以提高统计工作的效率。为实现上述目的,本发明提供的一种数据统计的方法,其根据公式、7x"—x获取T值,其中,x^x^….^x^^Xn是测试的一组数据,还有一个关键值列表,该列表中对应不同的Cn值,这些Cn值界定了该数据是否相关的范围;其中,计算T(X2-X^)、T(X,-X^)、T(X2-X。)及T(X,-Xn),如果T(X2-X^)满足〈Cn-2,且T(X广Xn-i)<Cn.,、T(X2-Xn)〈Q^及T(X广Xn)<Cn,则说明在测试的一组数据中没有不相干数据。如果T(X2-X^)满足〈Cn.2,且T(X,-Xn.i)〈C^、T(X2-Xn)<Cn.,及T(X广Xn)>Cn,则说明在测试的一组数据中Xl5Xn为不相干凝:据。如果T(X2-Xn-,)满足〈Cn.2,且T(X,-Xn.,)<Cn.,、T(X2-Xn)〉Q^及T(X广Xn)<Cn,则说明在测试的一组数据中Xn为不相干数据。如果T(X2-Xn-,)满足〈Cn.2,且T(X「X^)<Cn"、T(XrXn)>Cn-,及T(X「Xn)>Cn,则说明在测试的一组数据中Xn为不相干数据。如果T(X2-X^)满足〈Cn.2,且T(X「X^)>Cn.,、T(X2-Xn)〈Cn-,及T(X,-Xn)<cn,则说明在测试的一组数据中x,为不相干数据。如果T(X2-X^)满足〈Q^,且T(X,-Xn.,)〉C^、T(X2-Xn)〈Q^及T(X!-Xn)>cn,则说明在测试的一组数据中x,为不相干数据。如果T(X2-X^)满足〈C^2,且T(X,-X^)>Cn—!、T(X2-Xn)>Cn.,及T(X-Xn)<Cn,则说明在测试的一组数据中XbXn为不相干数据。如果T(X2-Xn-,)满足〈Cn國2,且T(X广Xn.,)〉C。.,、T(X2-Xn)〉Cn國,及T(X广Xn)>Cn,则说明在测试的一组数据中XbX。为不相干数据。与现有技术相比,本发明的方法简单,而且完全可以通过计算机实现,无需人工对应查找,有效提高统计效率和准确度。具体实施方式本发明的数据统计方法基于GrubbsTests公式T/、WX"一Xlr(=—=!'-其中,x^x2^….^x^,x"是获取的一组数据,s是方差,R是两个数值之间的差值。本发明数据统计方法基于T值对应的关键值列表,该列表包括不同的常数Cn,Cn值界定了该数据是否相关的范围。本发明将人工查找关键值列表的过程编成软件加以实现,具体实现思路如下述。本发明数据统计方法通过计算T(X2-Xn-,)、T(X,-X^)、T(X2-Xn)及T(X广Xn),就可以得到不相干数据,具体判断方式请参阅表1。表1<table>tableseeoriginaldocumentpage5</column></row><table>〈C^、T(XrXn)〈C:m及T(XrXn)<Cn,则说明在测试的一组数据中没有不相干数据。如果T(X2-X^)满足〈Cn.2,且T(X广X^)〈Cn陽!、T(XrXn)<Cn_,及T(X广X。)>Cn,则说明在测试的一组数据中X,,Xn为不相千数据。如果T(X2-Xn—,)满足〈Cn.2,且T(X广Xn.,)<Cn.,、T(XrXn)〉Cn.,及T(X,-Xn)<Cn,则说明在测试的一组数据中Xn为不相千数据。如果T(X2-X^)满足〈Cn.2,且T(X,-Xn.,)〈Cn.,、T(X2-Xn)>Cn.,及T(XrXn)>Cn,则说明在测试的一组数据中Xn为不相千数据。如杲T(X2-Xn—,)满足〈Cn陽2,且T(X广X^)X^-,、T(X2-Xn)〈Qm及T(X!-Xn)<cn,则说明在测试的一组数据中x,为不相千数据。如果T(X2-Xn-,)满足〈Cn.2,且T(X广X^)>Cn.,、T(XrXn)<Cn.,及T(X广Xn)>cn,则说明在测试的一组数据中x,为不相千数据。如果T(X2-Xn-,)满足〈Cn-2,且T(X广X。-,)、T(X2-Xn)〉Cn-,及T(XrXn)<Cn,则说明在测试的一组数据中X,,Xn为不相千数据。如果T(X2-X^)满足〈Cn.2,且T(X广Xn—i)〉C^、T(X2-Xn)〉C"及T(XrXn)>Cn,则说明在测试的一组数据中Xi,Xn为不相干数据。依次类推,通过判断T(X2-X^)、T(X广Xn-,)、T(X2-Xn)及T(X广Xn)四个数值就可以得到不相干数据。本发明这种方法可以通过计算机来实现关键值列表的查找,所以本发明不仅可以有效节约查找的工作量,而且可以通过计算才几查找,乂人而提高统计效率和准确度。权利要求1.一种数据统计的方法,其根据公式<math-cwu><![CDATA[<math><mrow><mi>T</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>n</mi></msub><mo>-</mo><msub><mi>x</mi><mn>1</mn></msub><mo>)</mo></mrow><mo>=</mo><mfrac><mi>R</mi><mi>s</mi></mfrac><mo>=</mo><mfrac><mrow><msub><mi>x</mi><mi>n</mi></msub><mo>-</mo><msub><mi>x</mi><mn>1</mn></msub></mrow><msqrt><mfrac><mn>1</mn><mrow><mi>n</mi><mo>-</mo><mn>1</mn></mrow></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msup><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>-</mo><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mn>2</mn></msup></msqrt></mfrac></mrow></math>]]></math-cwu><!--imgid="icf0001"file="A2007100371590002C1.gif"wi="71"he="18"top="29"left="106"img-content="drawing"img-format="tif"orientation="portrait"inline="no"/-->获取T值,其中,x1≤x2≤…≤Xn-1≤xn是测试的一组数据,还有一个关键值列表,该列表中对应不同的Cn值,这些Cn值界定了该数据是否相关的范围;其特征在于计算T(X2-Xn-1)、T(X1-Xn-1)、T(X2-Xn)及T(X1-Xn),如果T(X2-Xn-1)满足<Cn-2,且T(X1-Xn-1)<Cn-1、T(X2-Xn)<Cn-1及T(X1-Xn)<Cn,则说明在测试的一组数据中没有不相干数据。2、如权利要求1所述的一种数据统计的方法,其特征在于如果T(XrXn》满足〈Cn.2,且T(X广X^)〈Cw、T(X2-Xn)〈Cn-,及T(X广Xn)>Cn,则说明在测试的一组数据中x,,xn为不相干数据。3、如权利要求1所述的一种数据统计的方法,其特征在于足〈Cw,且T(X广X^)〈C^、T(X2-Xn)〉C^及T(X广Xn)〈Cn,一组数据中Xn为不相干数据。4、如权利要求1所述的一种数据统计的方法,其特征在于足〈Cn.2,且T(X,-Xn.0〈d、T(X2-Xn)〉Cn—,及T(X广Xn)〉Cn,一组数据中Xn为不相干数据。5、如权利要求1所述的一种数据统计的方法,其特征在于足〈Cn-2,且T(X广Xn-))X^、T(X2-Xn)〈C^及T(X广Xn)〈Cn,一组数据中X,为不相干教:据。6、如权利要求1所述的一种数据统计的方法,其特征在于足〈Cn.2,且T(X广Xn.,)〉0^、T(X2-Xn)<Cn.,及T(X广XJ>C一组数据中Xi为不相干凄t据。7、如权利要求1所述的一种数据统计的方法,其特征在于如果T(X2-X^)满足《-2,且T(X广Xn—,)d、T(X2-Xn)〉Cn-,及T(X广Xn)<Cn,则说明在测试的一组数据中XbXn为不相干数据。8、如权利要求1所述的一种数据统计的方法,其特征在于如果T(XrX^)满足〈Cn-2,且T(X广X^)〉Cn.,、T(X2-Xn)〉C^及T(X广Xn)>Cn,则说明在测试的一组数据中X!,Xn为不相干数据。如果T(X2画X^)满则说明在测试的如果T(x2-x^;)满则"i兌明在测试的如果T(XrX^)满则说明在测试的如果T(XrXn.,)满,则说明在测试的全文摘要本发明提供的一种数据统计的方法,其根据右边公式获取T值,其中,x<sub>1</sub>≤x<sub>2</sub>≤…≤x<sub>n-1</sub>≤x<sub>n</sub>是测试的一组数据,还有一个关键值列表,该列表中对应不同的C<sub>n</sub>值,这些C<sub>n</sub>值界定了该数据是否相关的范围;其中,计算T(X<sub>2</sub>-X<sub>n-1</sub>)、T(X<sub>1</sub>-X<sub>n-1</sub>)、T(X<sub>2</sub>-X<sub>n</sub>)及T(X<sub>1</sub>-X<sub>n</sub>),如果T(X<sub>2</sub>-X<sub>n-1</sub>)满足<C<sub>n-2</sub>,且T(X<sub>1</sub>-X<sub>n-1</sub>)<C<sub>n-1</sub>、T(X<sub>2</sub>-X<sub>n</sub>)<C<sub>n-1</sub>及T(X<sub>1</sub>-X<sub>n</sub>)<C<sub>n</sub>,则说明在测试的一组数据中没有不相干数据。与现有技术相比,本发明的方法简单,而且完全可以通过计算机实现,无需人工对应查找,有效提高统计效率和准确度。文档编号G06F17/00GK101241488SQ200710037159公开日2008年8月13日申请日期2007年2月6日优先权日2007年2月6日发明者吕秋玲,戴准宇,王明珠,陈淑美申请人:中芯国际集成电路制造(上海)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1