一种故障定位方法

文档序号:6111088阅读:363来源:国知局
专利名称:一种故障定位方法
技术领域
本发明涉及电路板的测试领域,尤其是涉及一种针对电路板上器件的故障定位方法。
背景技术
在电路板的生产测试领域,电路板的缺陷主要分为两大类,一类为工艺缺陷,即加工过程中产生的电路板上器件的短路、断路、调件等缺陷,针对这一类缺陷,通常使用工艺测试手段,如AOI(Automated OpticalInspection,自动光学检测)、AXI(Automated X-ray Inspection,自动X光检验)、ICT(In-Circuit Test,在线测试)等进行覆盖。电路板的另一类缺陷为器件的性能缺陷,如存储器内部存储单元的损坏,这类缺陷通常只能通过FT(Function Test,功能测试)测试才能覆盖。采用工艺测试,失败后可以很明确的知道是哪个器件、管脚出现了问题;但从FT测试的故障定位到具体哪个器件故障则比较困难,特别是对于高复杂性的单板,FT测试的故障定位能力不足,直接导致了单板维修的困难,甚至无法维修。
现有技术中针对FT测试的故障定位能力不足,通常会采用工艺测试进行故障定位或者工程技术人员依靠经验判断故障位置。
但是,采用工艺测试进行故障定位只能定位工艺性的缺陷和简单的逻辑功能,对复杂逻辑,时序,电路性能的缺陷无法检出;而工程技术人员依靠经验判断故障位置同时存在如下缺点1.工程技术人员需要有大量的单板维修的经验,对于高复杂度单板的维修,这样的经验的建立需要较长的时间;2.对于高复杂度单板,其密度高,使用大量的BGA(Ball Grid Array,球栅阵列结构)封装器件,导致器件的拆装次数都有严格的限制,不能随意的进行器件更换,更换器件的成本很高,如果试探失败,则会造成很大的浪费;3.经验的传递困难。

发明内容
本发明的目的在于,提供一种故障定位方法,能够在单板出现故障时定位到特定的器件,并且该方法具有不断修正定位能力的功能。
为实现本目的,本发明提供了一种故障定位方法,包括步骤(A)针对单板建立故障模式和测试项之间的相关性矩阵;(B)通过故障定位率FDR和故障隔离率FIR优化相关性矩阵;(C)通过维修数据优化相关性矩阵;(D)当单板发生故障时,根据优化后的相关性矩阵定位故障器件。
步骤(A)所述的相关性矩阵为 其中,第i行矩阵为[di1 di2 … dij],表明了故障模式Fi与各测试项的相关性,其表示当器件失效时,哪些测试项的测试结果为失败;第j列矩阵为d1jd2j···dij,]]>表明了测试项Tj与各故障模式的相关性,其表示测试项Tj失败时存在哪些可能的故障模式;其中,dij为1表示相关,0表示不相关。
所述的故障模式Fi的建立包括步骤
(A1)获得器件故障模式库;(A2)通过单板的BOM清单得到该单板的器件列表;(A3)通过器件列表和器件故障模式库得到该单板的所有器件的故障模式列表。
步骤(B)所述的FDR是可检测到的故障模式数ND与单板上器件可能发生的故障模式总数N之比。
步骤(B)所述的FIR是可定位的故障模式数NIL与可检测到的故障模式数ND之比。
步骤(B)进一步包括针对已经建立的相关性矩阵,得到确定的FDR和FIR,如果FDR、FIR指标达不到期望值FDR=95%、FIR=60%,则通过增加测试项来优化测试方案,重建相关性矩阵;如果FDR、FIR指标达到了期望值FDR=95%、FIR=60%,则该相关性矩阵进入实际应用优化阶段。
步骤(C)所述的通过维修数据优化相关性矩阵是当发现了一个故障,完成维修后,将维修记录录入到对应的相关性矩阵中。
所述的将维修记录录入到对应的相关性矩阵中是故障表现为Tj测试项失败,维修发现是Fi故障模式导致的测试失败,则在Tj,Fi对应的单元累加1。
步骤(D)所述的根据优化后的相关性矩阵定位故障器件是根据优化后的相关性矩阵,利用贝叶斯定理,得到各故障模式导致出现测试项失败的概率,根据该概率,实现故障器件的定位。
步骤(D)进一步包括步骤(D1)找到所有失败的测试项,累加每个故障模式对应的所有失败的测试项的相关性系数,得到每个故障模式所有失败项的累加值;(D2)找到所有通过的测试项,累加每个故障模式对应的所有通过的测试项的相关性系数,得到每个故障模式所有通过项的累加值;(D3)对单板上的每个故障模式,将其所有失败项的累加值减去所有通过项的累加值,如果得到的结果为正数,则直接记录;如果得到的结果为负数,则改为0并记录;(D4)计算只有一个故障模式故障的情况下,各故障模式出现故障的概率;(D5)根据各故障模式出现故障的概率的大小决定优先更换哪个器件。
步骤(D4)满足如下关系P(Aj|B)=P(Aj)*P(B|Aj)ΣP(Aj)*P(B|Aj)]]>其中,P(Aj|B)表示当检测到一个故障模式故障时,该故障模式为Aj的概率;P(B)表示抽出一个故障模式进行检测,该故障模式出现故障的概率;P(Aj)表示故障模式Aj在单板上出现的概率;P(B|Aj)表示抽出故障模式Aj进行检测,该故障模式Aj出现故障的概率,其等于Dj×∑j,其中,Dj表示某故障模式在所有单板上出现故障的概率,∑j表示某故障模式在测试单板上出现的历史次数。
实施本发明,可以在单板出现故障时,根据建立并且优化后的相关性矩阵,利用贝叶斯定理计算单板上各器件出现故障的概率,并根据概率的大小决定优先更换哪个器件,实现故障的定位。
本发明的方法针对单板建立故障模式和测试项之间的相关性矩阵,并通过实际应用的维修数据对相关性矩阵进行优化,随着维修数据的积累,可不断修正其定位能力。
实施本发明,在故障定位方法的设计阶段即考虑单板器件故障定位的能力,且该方法使维修经验实现数据化,可以达到经验继承的目的。


图1是一个典型电路的模型图;图2是本发明中通过FDR和FIR优化相关性矩阵的流程图;图3是本发明中通过维修数据优化相关性矩阵的流程图;图4是本发明的方法的原理图。
具体实施例方式
本发明提供了一种故障定位方法,其能够在单板出现故障时定位到特定的器件,并且该方法具有不断修正定位能力的功能,如图4所示,该方法的实现具体如下步骤1、针对单板建模,建立故障模式和测试项之间的对应关系,所谓故障模式即为单板上各器件可能发生的失效的情况,采用如下的相关性矩阵形式 其中,第i行矩阵Fi为[di1 di2 … dij]表明了故障模式Fi与各测试项的相关性,其表示当器件失效时,哪些测试项的测试结果为失败;故障模式Fi的建立如下(1.1)获得器件故障模式库,其中包含所有的器件,以及该器件的所有故障模式;(1.2)通过单板的BOM清单(Bill of Material,物料清单)得到该单板的器件列表;(1.3)通过器件列表和器件故障模式库得到该单板的所有器件的故障模式列表。
而第j列矩阵Tj为d1jd2j···dij]]>表明了测试项Tj与各故障模式的相关性,其表示测试项Tj失败时存在哪些可能的故障模式。
如果器件的故障在某个测试项中可能被检测到,则在矩阵中的对应位置填1,表示相关;如果不能检测到,则在矩阵中的对应位置填0,表示不相关。
下面结合具体实施例说明相关性矩阵的建立图1是一个典型电路的模型图,如图1所示,单板上各器件及其功能为CPU为单板的主控单元,RAM1和RAM2用于保存CPU运行时的数据,RAM1和RAM2挂在CPU的同一条总线上;功能模块FUN1、FUN2和FUN3用于信号处理,输入信号从FUN1进入,最后从FUN3输出。
在图1所示的实施例中,为简单起见,默认每个器件只有一个失效模式,即芯片整体失效;实际应用时,一个器件通常有多个失效模式。
如图1所示的测试项为T1位置测试,只覆盖FUN1,因此T1只和FUN1相关;T2位置测试,同时覆盖FUN1和FUN2,因此T2和FUN1、FUN2都相关;T3位置测试,同时覆盖FUN1、FUN2和FUN3,因此T3和FUN1、FUN2、FUN3都相关;T4为CPU自检,因此T4只和CPU相关;T5为CPU对RAM1读写测试,因此T5和CPU、RAM1都相关;T6为CPU对RAM2读写测试,因此T6和CPU、RAM2都相关。
根据单板上各器件及其与各测试项之间的相关性,可以得到如表1所示数据的相关性矩阵

表1其相关性矩阵为000111000010000001111000011000001000]]>步骤2、通过故障定位率和故障隔离率优化相关性矩阵单板上故障模式和测试项的相关性矩阵建立后,可以得到一些定量的指标,如故障定位率FDR和故障隔离率FIR。
其中,FDR可检测到的故障模式数ND与单板上器件可能发生的故障模式总数N之比,用百分数表示FDR=NDN×100%]]>FIR可定位的故障模式数NIL与可检测到的故障模式数ND之比,用百分数表示
FIR=NILND×100%]]>所述的可定位指的是当测试项结果为确定的T1,T2,..Tj时(其中Tj表示的是Tj测试项的测试结果,通过或失败),可以判断是特定的故障模式发生了。
实际应用中有FIR1、FIR2等数据,其数据表示定位的精确程度,如FIR1表示的是可以定位到一个故障模式;FIR2表示的是可以定位到两个故障模式。
在计算中可采用各故障模式的历史失效率,各故障模式的比例等实际数据来对上述公式进行修正即对ND、N进行加权处理,对应某个故障模式Fi[di1 di2 … dij]标记当di1~dij中有一个不为零,则Xi=1,否则Xi=0,则不修正时ND=∑Xi;修正时ND=∑Xi×Pi;其中Pi表示该故障模式的历史失效率,其他类似。
对于可实际应用的相关性矩阵,通常设置的故障定位率和故障隔离率的期望值为FDR=95%,FIR=60%。
图2是本发明中通过FDR和FIR优化相关性矩阵的流程图,如图2所示,针对已经建立的相关性矩阵,可以得到确定的FDR和FIR,如果FDR、FIR指标达不到期望值,则需要通过增加测试项等方法来优化测试方案,然后重建相关性矩阵。如果FDR、FIR指标达到了期望值,则相关性矩阵可以进入实际应用优化阶段。
上述表1数据的相关性矩阵的FDR和FIR分别为由表1中的数据可知由于单板上的每一个故障模式均可被检测到,故ND=6;单板上总共有6个失效模式,即每一个器件的故障模式作为一个失效模式,故N=6,因此FDR=66×100%=100%]]>由表1中的数据可知由于各故障模式的向量[di1 di2 … dij]互不相同,所有器件均可被区分,故NIL=6;由于单板上的每一个故障模式均可被检测到,故ND=6,因此FIR=66×100%=100%]]>如果图1所示的测试项中取消T2位置测试,则得到如表2所示数据的相关性矩阵

表2其相关性矩阵为001110001000001110000100001000]]>由表2数据可知,采用表2数据的相关性矩阵的FDR和FIR分别为FDR=66×100%=100%]]>
式中Q为单根桩需注浆材料重量(t);D为设计树根桩直径(m);L为设计树根桩长度(m)Y砂为溜砂坡干容重(t/m3)η为加入注浆材料系数(%)。即加入注浆材料的重量占此根树根桩总重量的百分比。对于粒状、片状溜砂坡η取15%~20%;对于碎石状溜砂坡η取25%~30%,还可加入20%的中、细砂。
表1花管树根桩固砂参数匹配建议值

由表3可以看出,T1、T2、T4、T5、T6测试通过,T3测试失败,则由相关性矩阵得到的可能的故障器件的集合为(FUN1,FUN2,FUN3);同时由于T1测试通过,因此FUN1状态为正常;由于T2测试通过,因此FUN1和FUN2状态为正常;最终得到故障器件为FUN3。
更换FUN3,重新进行T3测试,如果通过,则说明定位正确,此时将T3和FUN3之间的相关性增强,如FUN3和T3对应的单元累加1。
当维修的测试结果如表4所示时

表4由表4可以看出,T1、T2、T3、T4、T6测试通过,T5测试失败,根据相关性矩阵定位出现故障的器件应该是RAM1,但是维修发现实际损坏的器件为RAM2,这时需要分析原因,实际上RAM1和RAM2同时挂在CPU的一条总线上,当RAM2损坏而导致其强占总线时,CPU对RAM1的读写就会失败,在这种情况下,就需要将这样的经验保存在相关性矩阵中,即增加T5和RAM2的相关性,如在对应的单元累加1。
步骤4、应用优化后的相关性矩阵定位故障器件随着累加数据的不断增加,当单板发生故障时,利用贝叶斯定理,可以得到各故障模式出现的概率,根据这些概率值,实现故障器件的定位。
下面结合具体实施例对利用贝叶斯定理实现故障器件的定位做进一步说明在积累一端时间的数据后,可能出现如表5所示的数据

表5其中,Dj表示某故障模式在所有单板上出现故障的概率,举例如CPU可以用在很多其他的单板上,如一年中共使用了10000片该CPU,在所有单板上一共发现了35个CPU损坏,则该概率为35/10000;dij用来表示测试项Ti和器件Aj的相关性。
当单板发生故障时,通过如下步骤进行故障器件的定位,如表5所示,假设T4项和T5项测试项失败时4.1找到所有失败的测试项,累加每个故障模式对应的所有失败的测试项的相关性系数,得到每个故障模式所有失败项的累加值,得到如表6所示的每个器件的累加值

表64.2找到所有通过的测试项,累加每个故障模式对应的所有通过的测试项的相关性系数,得到每个故障模式所有通过项的累加值,得到如表7所示的每个器件的累加值

表74.3对单板上的每个故障模式,将其所有失败项的累加值减去所有通过项的累加值,如果得到的结果为正数,则直接记录;如果得到的结果为负数,则改为0并记录,即∑j=max(∑failj-∑okj;0),该∑j表示某故障模式在测试单板上出现的历史次数,得到如表8所示的数据

表84.4计算只有一个故障模式故障的情况下,各故障模式出现故障的概率实际应用中,一个器件有多个故障模式,当计算只有一个故障模式故障的情况下,各故障模式出现故障的概率,定义如下P(B)表示抽出一个故障模式进行检测,该故障模式出现故障的概率;P(Aj)表示故障模式Aj在单板上出现的概率,认为每个故障模式出现的概率都相等,即P(Aj)=1;P(B|Aj)表示抽出故障模式Aj进行检测,该故障模式Aj出现故障的概率,其等于Dj×∑j;则当检测到一个故障模式故障时,该故障模式为Aj的概率为P(Aj|B)=P(Aj)*P(B|Aj)ΣP(Aj)*P(B|Aj)]]>对于表8所示数据,其∑P(Aj)*P(B|Aj)=D0×6+D1×3+D2×8+D3×0+D4×0+D5×0=D0×6+D1×3+D2×8可以得到如表9所示的概率

表94.5根据各故障模式出现故障的概率的大小决定优先更换哪个器件即根据P(Aj|B)的大小决定优先更换哪个器件。
通过上述的方法,可以在单板出现故障时,根据建立并且优化后的相关性矩阵,利用贝叶斯定理计算单板上各器件出现故障的概率,并根据概率的大小决定优先更换哪个器件,实现故障的定位。
实施本发明,针对单板建立故障模式和测试项之间的相关性矩阵,并通过实际应用的维修数据对相关性矩阵进行优化,随着维修数据的积累,本发明的方法可不断修正其定位能力。
实施本发明,在故障定位方法的设计阶段即考虑单板器件故障定位的能力,且该方法使维修经验实现数据化,可以达到经验继承的目的。
以上所述,仅为本发明较佳的具体实施方式
,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
权利要求
1.一种故障定位方法,其特征在于包括步骤(A)针对单板建立故障模式和测试项之间的相关性矩阵;(B)通过故障定位率FDR和故障隔离率FIR优化相关性矩阵;(C)通过维修数据优化相关性矩阵;(D)当单板发生故障时,根据优化后的相关性矩阵定位故障器件。
2.如权利要求1所述的方法,其特征在于步骤(A)所述的相关性矩阵为 其中,第i行矩阵为[di1 di2 … dij],表明了故障模式Fi与各测试项的相关性,其表示当器件失效时,哪些测试项的测试结果为失败;第j列矩阵为d1jd2j···dij,]]>表明了测试项Tj与各故障模式的相关性,其表示测试项Tj失败时存在哪些可能的故障模式;其中,dij为1表示相关,0表示不相关。
3.如权利要求2所述的方法,其特征在于所述的故障模式Fi的建立包括步骤(A1)获得器件故障模式库;(A2)通过单板的BOM清单得到该单板的器件列表;(A3)通过器件列表和器件故障模式库得到该单板的所有器件的故障模式列表。
4.如权利要求1所述的方法,其特征在于步骤(B)所述的FDR是可检测到的故障模式数ND与单板上器件可能发生的故障模式总数N之比。
5.如权利要求1所述的方法,其特征在于步骤(B)所述的FIR是可定位的故障模式数NIL与可检测到的故障模式数ND之比。
6.如权利要求1所述的方法,其特征在于步骤(B)进一步包括针对已经建立的相关性矩阵,得到确定的FDR和FIR,如果FDR、FIR指标达不到期望值FDR=95%、FIR=60%,则通过增加测试项来优化测试方案,重建相关性矩阵;如果FDR、FIR指标达到了期望值FDR=95%、FIR=60%,则该相关性矩阵进入实际应用优化阶段。
7.如权利要求1所述的方法,其特征在于步骤(C)所述的通过维修数据优化相关性矩阵是当发现了一个故障,完成维修后,将维修记录录入到对应的相关性矩阵中。
8.如权利要求7所述的方法,其特征在于所述的将维修记录录入到对应的相关性矩阵中是故障表现为Tj测试项失败,维修发现是Fi故障模式导致的测试失败,则在Tj,Fi对应的单元累加1。
9.如权利要求1所述的方法,其特征在于步骤(D)所述的根据优化后的相关性矩阵定位故障器件是根据优化后的相关性矩阵,利用贝叶斯定理,得到各故障模式导致出现测试项失败的概率,根据该概率,实现故障器件的定位。
10.如权利要求9所述的方法,其特征在于步骤(D)进一步包括步骤(D1)找到所有失败的测试项,累加每个故障模式对应的所有失败的测试项的相关性系数,得到每个故障模式所有失败项的累加值;(D2)找到所有通过的测试项,累加每个故障模式对应的所有通过的测试项的相关性系数,得到每个故障模式所有通过项的累加值;(D3)对单板上的每个故障模式,将其所有失败项的累加值减去所有通过项的累加值,如果得到的结果为正数,则直接记录;如果得到的结果为负数,则改为0并记录;(D4)计算只有一个故障模式故障的情况下,各故障模式出现故障的概率;(D5)根据各故障模式出现故障的概率的大小决定优先更换哪个器件。
11.如权利要求10所述的方法,其特征在于步骤(D4)满足如下关系P(Aj|B)=P(Aj)*P(B|Aj)ΣP(Aj)*P(B|Aj)]]>其中,P(Aj|B)表示当检测到一个故障模式故障时,该故障模式为Aj的概率;P(B)表示抽出一个故障模式进行检测,该故障模式出现故障的概率;P(Aj)表示故障模式Aj在单板上出现的概率;P(B|Aj)表示抽出故障模式Aj进行检测,该故障模式Aj出现故障的概率,其等于Dj×∑j,其中,Dj表示某故障模式在所有单板上出现故障的概率,∑j表示某故障模式在测试单板上出现的历史次数。
全文摘要
一种故障定位方法,包括步骤(A)针对单板建立故障模式和测试项之间的相关性矩阵;(B)通过故障定位率FDR和故障隔离率FIR优化相关性矩阵;(C)通过维修数据优化相关性矩阵;(D)当单板发生故障时,根据优化后的相关性矩阵定位故障器件。实施本发明,可以在单板出现故障时,根据建立并且优化后的相关性矩阵,利用贝叶斯定理计算单板上各器件出现故障的概率,并根据概率的大小决定优先更换哪个器件,实现故障的定位,本发明的方法具有不断修正定位能力的功能,且该方法使维修经验实现数据化,可以达到经验继承的目的。
文档编号G01R31/00GK1851491SQ20061000827
公开日2006年10月25日 申请日期2006年2月20日 优先权日2006年2月20日
发明者吴祥 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1