一种根因分析方法、装置、电子设备和介质与流程

文档序号:28268642发布日期:2021-12-31 19:12阅读:76来源:国知局
一种根因分析方法、装置、电子设备和介质与流程

1.本技术涉及制造业技术领域,特别涉及一种根因分析方法、装置、电子设备和介质。


背景技术:

2.随着科技的发展和进步,显示面板和有机发光二极管(organic light

emitting diode,oled)显示屏等产品在生产制造过程中的工艺越来越复杂。通常制造一个手机屏幕或电脑屏幕等类似的产品从原材料的加工到制作完成需要历经数以百计的工艺,如:镀膜、清洗、刻蚀等。为了提高效率,每个工艺下又有多台生产设备同时工作,因此当产品发生不良时,想要从这些成百上千个设备找出导致产品发生不良的根因设备是非常困难的。
3.根因分析是一项结构化的问题处理方法,用以逐步找出问题的根本原因并加以解决,而不仅仅关注问题的表征。不同的行业对应的根因分析方法是不同的,在显示面板和oled等高端制造业的不良根因分析中,传统的根因分析过程冗长且繁杂,且人工分析效率低,往往一个产品产生不良的根因需要数周的时间才能有结果,且结果的好坏无法保证,如果分析方向错误还需要重新进行分析。
4.因此,目前的根因分析方法准确性和效率较低。


技术实现要素:

5.本技术实施例提供了一种根因分析方法、装置、电子设备和介质,用以提高根因分析的效率和准确率。
6.第一方面,本技术实施例提供了一种根因分析方法,包括:
7.获取多个产品的缺陷信息;所述多个产品流经第一工艺中的多个设备;所述缺陷信息是根据所述产品的尺寸和所述产品出现缺陷的区域的尺寸确定的;根据所述缺陷信息,确定所述多个产品中正样本的数目和负样本的数目;其中,所述正样本是所述缺陷信息大于或等于第一阈值的样本,所述负样本是所述缺陷信息小于所述第一阈值的样本;确定流经所述多个设备中每个设备的产品中正样本的数目和负样本的数目;根据所述流经所述多个设备的产品中正样本的数目和负样本的数目,以及所述流经每个设备的产品中正样本的数目和负样本的数目,得到所述多个设备的多个分组;其中,每个分组中包括第一小组和第二小组,所述第一小组中的设备数量和所述第二小组中的设备数量之和等于所述多个设备的数量;确定所述多个分组中每个分组的概率值;所述概率值表示所述分组错误的概率;将所述概率值从小到大排序,确定所述多个分组中所述概率值靠前的n个分组;所述n个分组中第一小组中的设备或第二小组中的设备为根因。
8.现有的根因分析方法大都依据缺陷产品的所有履历信息对一个工艺中单一设备上的参数进行分析。这种根因分析方法效率较低。而且这种根因分析方法是从单一设备出发进行根因分析的,没有考虑多个设备为根因的可能性。基于上述方案,通过对缺陷产品的缺陷信息进行根因分析并且对多个设备组合为根因的情况加以考虑可以提高根因分析效
率和准确性。
9.一种可能的实现方式,所述获取多个产品的缺陷信息,包括:获取所述多个产品的履历信息;所述履历信息包括所述产品的工艺标识、所述产品在生产过程中流经的设备的设备标识和所述产品的缺陷信息;根据所述履历信息,获取所述多个产品的缺陷信息。
10.基于上述方案,获取缺陷产品的缺陷信息,可以减少用于根因分析的数据量。
11.一种可能的实现方式,所述缺陷信息包括:所述产品的缺陷个数或所述产品的缺陷比率,以及所述产品的缺陷标识;所述缺陷个数用于表示所述产品中出现缺陷的第一区域的数量,所述第一区域的尺寸是预定义的;所述缺陷比率用于表示所述产品中出现缺陷的第一区域的数量与所述产品中所述第一区域的总数量的比值,所述第一区域的尺寸是预定义的。
12.基于上述方案,可以根据缺陷标识以及缺陷比率或缺陷个数对缺陷产品进行筛选,可以进一步减少根因分析的数据量。
13.一种可能的实现方式,根据所述缺陷信息,确定所述多个产品中正样本的数目和负样本的数目,包括:根据所述缺陷信息,通过聚类算法,确定所述多个产品中正样本的数目和负样本的数目。
14.基于上述方案,通过聚类方法对正负样本进行划分可以依据此对同一工艺的设备进行排序。
15.一种可能的实现方式,所述确定所述多个产品中正样本的数目和负样本的数目,包括:确定所述多个产品中所述正样本的数目与所述负样本的数目的比值;确定所述多个产品中所述正样本的数目与总样本的数目的比值;所述总样本的数目为所述多个产品的总数目;所述确定流经所述多个设备中每个设备的产品中正样本的数目和负样本的数目,包括:确定所述每个设备的产品中所述正样本的数目与所述负样本的数目的比值;确定所述每个设备的产品中所述正样本的数目与所述总样本的数目的比值。
16.基于上述方案,通过计算多个产品中所述正样本的数目与所述负样本的数目的比值、多个产品中所述正样本的数目与总样本的数目的比值、每个设备的产品中所述正样本的数目与所述负样本的数目的比值和每个设备的产品中所述正样本的数目与所述总样本的数目的比值可以得到各个设备生产过程中生产出缺陷产品的情况,依据这种情况后续对设备进行分组会更加准确。
17.一种可能的实现方式,所述根据所述流经所述多个设备的产品中正样本的数目和负样本的数目,以及所述流经每个设备的产品中正样本的数目和负样本的数目,得到所述多个设备的多个分组,包括:确定所述每个设备的产品中所述正样本的数目与所述总样本的数目的比值均大于多个产品中所述正样本的数目与所述总样本的数目的比值与第二阈值的积;将所述多个设备中前i个设备划分为第一小组,第i+1个到第x个设备分为第二小组;x为所述多个设备的总数目,x为大于等于1的整数;i取遍从1到x

1之间的整数。
18.基于上述方案,通过这种方式进行设备分组可以考虑到各个分组为根因的可能性,可以提高根因分析结果的准确性。
19.一种可能的实现方式,所述将所述概率值从小到大排序,确定所述多个分组中所述概率值靠前的n个分组,包括:针对所述n个分组中任一分组,执行下述操作:根据假设检验方法确定所述概率值;当所述概率值小于第三阈值时确定分组准确;所述第三阈值为根
据所述假设检验方法确定的显著性水平;根据所述概率值p计算相关性因子α;根据所述第一小组中的每个设备的产品中所述正样本的数目与所述总样本的数目的比值的方差d1,所述第二小组中的每个设备的产品中所述正样本的数目与所述总样本的数目的比值的方差d2和多个产品中所述正样本的数目与所述总样本的数目的比值的方差d3计算离散因子β;根据所述任一分组中的所有设备的总样本的数目s计算长度因子γ;根据所述相关性因子α、所述离散因子β和所述长度因子γ计算所述分组的分数;将所述多个分组按照所述分组的分数进行降序排列;确定所述多个分组中分数n个最高的分组中的第一小组中的多个设备是根因。
20.基于上述方案,通过构建多个统计因子来计算分数从而判断设备分组为根因的可能性,可以提高根因分析的准确性。
21.一种可能的实现方式,包括:
22.所述相关性因子α满足以下公式:α=1

p;
23.所述离散因子β满足以下公式:β=1

(d1+d2)/d3;
24.所述长度因子γ满足以下公式:γ=sigmoid(s);
25.所述分组的分数score是满足以下公式:
26.基于上述方案,按照上述公式进行计算可以得到分数越高的设备分组是根因的可能性越大。
27.一种可能的实现方式,获取所述多个产品的履历信息;所述履历信息包括所述产品在生产过程中流经的设备的设备标识;对所述设备标识进行去重操作;根据所述每个设备的产品中所述正样本的数目与所述负样本的数目的比值,将所述设备标识进行降序排列。
28.基于上述方案,通过去重可以得到多个不同的设备的统计值,按照每个设备的产品中正样本的数目与负样本的数目的比值进行降序排列可以使得到分组的第一小组中的设备为根因。
29.第二方面,本技术实施例提供了一种根因分析装置,包括:
30.获取单元,用于获取多个产品的缺陷信息;所述多个产品流经第一工艺中的多个设备;所述缺陷信息是根据所述产品的尺寸和所述产品出现缺陷的区域的尺寸确定的;
31.处理单元,用于执行下述操作:根据所述缺陷信息,确定所述多个产品中正样本的数目和负样本的数目;其中,所述正样本是所述缺陷信息大于或等于第一阈值的样本,所述负样本是所述缺陷信息小于所述第一阈值的样本;确定流经所述多个设备中每个设备的产品中正样本的数目和负样本的数目;根据所述流经所述多个设备的产品中正样本的数目和负样本的数目,以及所述流经每个设备的产品中正样本的数目和负样本的数目,得到所述多个设备的多个分组;其中,每个分组中包括第一小组和第二小组,所述第一小组中的设备数量和所述第二小组中的设备数量之和等于所述多个设备的数量;确定所述多个分组中每个分组的概率值;所述概率值表示所述分组错误的概率;将所述概率值从小到大排序,确定所述多个分组中所述概率值靠前的n个分组;所述n个分组中第一小组中的设备或第二小组中的设备为根因。
32.一种可能的实现方式,所述获取单元获取多个产品的缺陷信息,用于:
33.获取所述多个产品的履历信息;所述履历信息包括所述产品的工艺标识、所述产品在生产过程中流经的设备的设备标识和所述产品的缺陷信息;
34.根据所述履历信息,获取所述多个产品的缺陷信息。
35.一种可能的实现方式,所述缺陷信息包括:所述产品的缺陷个数或所述产品的缺陷比率,以及所述产品的缺陷标识;所述缺陷个数用于表示所述产品中出现缺陷的第一区域的数量,所述第一区域的尺寸是预定义的;所述缺陷比率用于表示所述产品中出现缺陷的第一区域的数量与所述产品中所述第一区域的总数量的比值,所述第一区域的尺寸是预定义的。
36.一种可能的实现方式,所述处理单元根据所述缺陷信息,确定所述多个产品中正样本的数目和负样本的数目,具体用于:根据所述缺陷信息,通过聚类算法,确定所述多个产品中正样本的数目和负样本的数目。
37.一种可能的实现方式,所述处理单元确定所述多个产品中正样本的数目和负样本的数目,具体用于:确定所述多个产品中所述正样本的数目与所述负样本的数目的比值;确定所述多个产品中所述正样本的数目与总样本的数目的比值;所述总样本的数目为所述多个产品的总数目;所述确定流经所述多个设备中每个设备的产品中正样本的数目和负样本的数目,包括:确定所述每个设备的产品中所述正样本的数目与所述负样本的数目的比值;确定所述每个设备的产品中所述正样本的数目与所述总样本的数目的比值。
38.一种可能的实现方式,所述处理单元根据所述流经所述多个设备的产品中正样本的数目和负样本的数目,以及所述流经每个设备的产品中正样本的数目和负样本的数目,得到所述多个设备的多个分组,具体用于:确定所述每个设备的产品中所述正样本的数目与所述总样本的数目的比值均大于多个产品中所述正样本的数目与所述总样本的数目的比值与第二阈值的积;将所述多个设备中前i个设备划分为第一小组,第i+1个到第x个设备分为第二小组;x为所述多个设备的总数目,x为大于等于1的整数;i取遍从1到x

1之间的整数。
39.一种可能的实现方式,所述处理单元将所述概率值从小到大排序,确定所述多个分组中所述概率值靠前的n个分组,用于:针对所述n个分组中任一分组,执行下述操作:根据假设检验方法确定所述概率值;当所述概率值小于第三阈值时确定分组准确;所述第三阈值为根据所述假设检验方法确定的显著性水平;根据所述概率值p计算相关性因子α;根据所述第一小组中的每个设备的产品中所述正样本的数目与所述总样本的数目的比值的方差d1,所述第二小组中的每个设备的产品中所述正样本的数目与所述总样本的数目的比值的方差d2和多个产品中所述正样本的数目与所述总样本的数目的比值的方差d3计算离散因子β;根据所述任一分组中的所有设备的总样本的数目s计算长度因子γ;根据所述相关性因子α、所述离散因子β和所述长度因子γ计算所述分组的分数;将所述多个分组按照所述分组的分数进行降序排列;确定所述多个分组中分数n个最高的分组中的第一小组中的多个设备是根因。
40.一种可能的实现方式,具体用于:
41.所述相关性因子α满足以下公式:α=1

p;
42.所述离散因子β满足以下公式:β=1

(d1+d2)/d3;
43.所述长度因子γ满足以下公式:γ=sigmoid(s);
44.所述分组的分数score是满足以下公式:
45.一种可能的实现方式,还用于:获取所述多个产品的履历信息;所述履历信息包括所述产品在生产过程中流经的设备的设备标识;对所述设备标识进行去重操作;根据所述每个设备的产品中所述正样本的数目与所述负样本的数目的比值,将所述设备标识进行降序排列。
46.第三方面,本技术实施例提供了一种电子设备,所述电子设备包括处理器和存储器;
47.所述存储器,用于存储计算机程序或指令;
48.所述处理器,用于执行存储器中的计算机程序或指令,以利用控制器中的硬件资源执行第一方面任一种可能实现方式中方法的操作步骤。
49.第四方面,本技术提供一种计算机可读存储介质,计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面的方法。
50.上述第二方面至第四方面中的各个方面以及各个方面可能达到的技术效果请参照上述针对第一方面或第一方面中的各种可能方案可以达到的技术效果说明,这里不再重复赘述。
附图说明
51.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例。
52.图1为本技术实施例提供的产品生产过程示意图;
53.图2为本技术实施例提供的一种根因分析方法的示例性流程图之一;
54.图3为本技术实施例提供的设备小组划分示意图;
55.图4为本技术实施例提供的一种根因分析装置;
56.图5为本技术实施例提供的电子设备。
具体实施方式
57.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术技术方案的一部分实施例,而不是全部的实施例。基于本技术文件中记载的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术技术方案保护的范围。
58.本技术实施例中的术语“第一”和“第二”是用于区别不同对象,而非用于描述特定顺序。此外,术语“包括”以及它们任何变形,意图在于覆盖不排他的保护。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本技术中的“多个”可以表示至少两个,例如可以是两个、三个或者更多个,本技术实施例不做限制。
59.另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,在不做特别说明的情况下,一般表示前后关联对象是一种“或”的关系。
60.参阅图1,为本技术实施例提供的产品生产过程示意图。如图1所示,假设生产一种产品需要三道工艺,且每个工艺有三台设备同时工作。则产品在生产过程中依次流经工艺1、工艺2和工艺3。首先进入工艺1,将多个产品分配到设备1

1、设备1

2和1

3中同时进行加工。加工完成后进入工艺2,同样的,将多个产品分配到设备2

1、设备2

2和2

3中同时进行加工。加工完成后进入工艺3,同样的,将多个产品分配到设备3

1、设备3

2和3

3中同时进行加工。
61.目前,根因分析方法大都依据缺陷产品的履历信息对一个工艺中单一设备上的参数进行分析。这种根因分析方法依据的是缺陷产品的所有的履历信息,需要的数据很庞大,在根因分析的过程中是费时费力的,效率较低。而且这种根因分析方法是从单一设备出发进行根因分析的,没有考虑多个设备为根因的可能性,即没有分析多个设备的相关性。那么如何提高根因分析效率和准确性亟待解决。
62.有鉴于此,本技术实施例提供了一种根因分析方法。该方法包括:首先获取数据库中流经第一工艺的多个产品的缺陷信息。其次,根据多个产品的缺陷信息,将第一工艺中多个设备进行分组,得到多个分组。然后,从多个分组中选择较为可靠的n个分组,将n个分组中的设备作为根因。
63.参阅图2,为本技术实施例提供的一种根因分析方法的示例性流程图之一,可包括以下流程。该方法可以应用于具有根因分析功能的装置,如处理器、根因分析设备或者芯片等。
64.s201,装置获取多个产品的缺陷信息。
65.其中,上述多个产品流经第一工艺中的多个设备。装置在产品的生产过程中会将产品的标识、产品的型号、产品流经的工艺的工艺标识、产品流经的设备的设备标识和产品流经各个设备的时间等信息记录为产品的履历信息保存在工厂的数据库中。
66.在一个示例中,在生产过程中或者生产完成后如果发现产品有缺陷,则将其缺陷信息添加到数据库中产品的履历信息中。其中,缺陷信息可以包括缺陷个数或缺陷比率以及缺陷标识。缺陷个数或缺陷比率是根据产品的尺寸和产品出现缺陷的区域的尺寸确定的。举例来说,可以根据产品的尺寸将产品分为a个区域,当这a个区域中有b个区域发生缺陷时,该产品的缺陷个数为b,该产品的缺陷比值为b/a。当缺陷比率小于阈值的时候,产品虽然有缺陷但是可以正常使用,当缺陷比率大于阈值时,产品不能正常使用。缺陷标识则是用来表示产品具体出现了什么缺陷以及缺陷的分类,可以用标识符来表示。
67.每个产品都有自己的产品标识,根据该标识可以从工厂的数据库中获取该产品的履历信息。装置可以根据第一工艺的工艺标识,从有缺陷的产品中获取流经第一工艺的多个产品的履历信息,并从履历信息中获取到缺陷信息。
68.可选的,设备可以通过建立大数据存储数据库来建立缺陷产品数据库。缺陷产品数据库中包含所有缺陷产品的履历信息。举例来说,可以是分布式数据库hadoop或非关系型数据库hbase等数据库,本技术对此不作限定。根据缺陷产品的产品标识在工厂数据库中找到缺陷产品的履历信息,然后每隔一段时间将缺陷产品的履历信息通过数据仓库技术
(extract

transform

load,etl)抽取到缺陷产品数据库中。
69.装置在进行根因分析之前要对缺陷产品数据库中产品的履历信息进行筛选,可以根据缺陷产品的生产时间和缺陷标识对缺陷产品的履历信息进行筛选,得到固定时间段下包含某种特定缺陷的所有产品的履历信息,然后基于筛选后的产品的履历信息进行根因分析。
70.基于上述方案,通过建立缺陷产品数据库可以提高分析效率,且通过大数据组件抽取缺陷产品的履历信息不会对工厂的实际生产造成影响。在进行根因分析之前要进行信息的筛选,可以缩小根因分析的范围,减小工作量。
71.s202,装置根据缺陷信息,确定多个产品中正样本的数目和负样本的数目。
72.其中,正样本是缺陷信息大于或等于第一阈值的样本,负样本是缺陷信息小于第一阈值的样本。
73.装置可以将包含某一特定缺陷标识的多个产品的缺陷信息中的缺陷个数或缺陷比率输入聚类算法,得到多个产品中正样本的数目和负样本的数目以及划分正样本和负样本的第一阈值。举例来说,可以将包含划痕缺陷的多个产品的缺陷比率输入聚类算法,得到划分正样本和负样本的第一阈值,缺陷比率大于第一阈值的产品为正样本,缺陷比率小于第一阈值的产品为负样本。
74.可选的,聚类算法可以采用dbscan或者均值漂移聚类算法等,本技术对此不作限定。
75.装置确定多个产品中正样本的数目和负样本的数目之后计算多个产品中正样本的数目和负样本的数目的比值以及正样本的数目与总样本的数目的比值。
76.s203,装置确定流经多个设备中每个设备的产品中正样本的数目和负样本的数目。
77.装置可以计算多个设备中每个设备的产品中正样本的数目和负样本的数目,然后根据各个设备的产品中正样本的数目和负样本的数目计算各个设备的产品中正样本的数目和负样本的数目的比值,最后计算各个设备的产品中正样本的数目与总样本的数目的比值。
78.装置获取多个产品的履历信息并对多个产品的履历信息中的设备标识进行去重操作,然后按照各个设备的产品中正样本的数目和负样本的数目的比值对各个设备的设备标识进行降序排列,也就是按照各个设备的产品中正样本的数目和负样本的数目的比值对各个设备按照从大到小的顺序排列。举例来说,设备a的正样本的数目和负样本的数目的比值为1,设备b的正样本的数目和负样本的数目的比值为1.5,设备c的正样本的数目和负样本的数目的比值为0.67。则将设备a、设备b和设备c按照设备b、设备a和设备c的顺序排列,并记作设备1、设备2和设备3。
79.s204,装置根据流经多个设备的产品中正样本的数目和负样本的数目,以及流经每个设备的产品中正样本的数目和负样本的数目,得到多个设备的多个分组。
80.其中,每个分组中包括第一小组和第二小组,第一小组中的设备数量和第二小组中的设备数量之和等于多个设备的数量。
81.装置分别判断各个设备的产品中正样本的数目占总样本的数目的比值是否均大于多个产品中的正样本的数目占总样本的数目的比值与第二阈值的乘积。如果有任一设备
的产品中正样本的数目占总样本的数目的比值小于多个产品中的正样本的数目占总样本的数目的比值与第二阈值的乘积,则退出计算。如果装置分别判断各个设备的产品中正样本的数目占总样本的数目的比值均大于多个产品中的正样本的数目占总样本的数目的比值与第二阈值的乘积,则对设备进行分组。
82.其中,上述第二阈值threshold可以满足下述公式1。
[0083][0084]
其中,r
i
表示第i个设备的产品中正样本的数目占总样本的数目的比值,n表示第一工艺中设备的个数,0.25为根据经验得到的常数,本技术对此不作限定。
[0085]
分组方式为:依次将前i个设备划分为第一小组,剩余设备即为第二小组得到多种分组方式,其中,i取遍从1到n

1的整数。
[0086]
参见图3,为本技术实施例提供的设备小组划分示意图。假设第一工艺包含四个设备同时进行工作,则当这四个设备的产品中正样本的数目占总样本的数目的比值均大于多个产品中的正样本的数目占总样本的数目的比值与第二阈值的乘积时,得到三个分组,i=1时将设备1划分为第一小组,设备2、设备3和设备4划分为第二小组。i=2时将设备1和设备2划分为第一小组,设备3和设备4划分为第二小组。i=3时将设备1、设备2和设备3划分为第一小组,设备4划分为第二小组。
[0087]
s205,装置确定多个分组中每个分组的概率值;概率值表示分组错误的概率。
[0088]
装置对每一分组均通过对第一小组设备组合和第二小组设备组合进行假设检验来判断分组的合理性,得到表示分组错误的概率值。其中,假设检验方法可以采用卡方检验,本技术对此不作限定。
[0089]
s206,装置将概率值从小到大排序,确定多个分组中概率值靠前的n个分组;n个分组中第一小组中的设备或第二小组中的设备为根因。
[0090]
由于概率值越小表示分组可能出现错误的概率越小,因此将多个分组按照概率值从小到大排序,概率值靠前的n个分组中第一小组中的设备或第二小组中的设备为根因。
[0091]
基于上述方案,通过加入对不同设备分组的考虑,可以提高根因分析结果的准确性。
[0092]
一种可能的实现方式,将多个产品中的正样本的数目与总样本的数目的比值设为r,分别判断r1是否大于r*threshold,r2是否大于r*threshold,以此类推一直判断到r
n
是否大于r*threshold。如果任一设备出现r小于或等于r*threshold的情况则退出计算,如果r1到r
n
均大于r*threshold,则令i=1,也就是将第一个设备划分为第一小组,剩余设备为第二小组。对这种分组方式执行下述操作:
[0093]
装置通过假设检验方法计算分组错误的概率值p,当p小于第三阈值时确定分组准确。其中,第三阈值为显著性水平,显著性水平可以取0.05等,本技术对此不作限定。
[0094]
具体的,首先根据分组错误的概率值p计算相关性因子α,如公式2所示:
[0095]
α=1

p
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(公式2)
[0096]
然后分别计算第一小组中的每个设备的产品中正样本的数目与总样本的数目的比值的方差d1,第二小组中的每个设备的产品中正样本的数目与总样本的数目的比值的方差d2和多个产品中正样本的数目与总样本的数目的比值的方差d3。通过d1、d2和d3计算离散因子β,如公式3所示:
[0097]
β=1

(d1+d2)/d3
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(公式3)
[0098]
对分组中所有设备中的产品总样本的数目s作sigmoid变换得到长度因子γ,计算公式如公式4所示:
[0099]
γ=sigmoid(s)(公式4)
[0100]
根据上述相关性因子、离散因子和长度因子计算分组的分数score,计算公式如公式5所示:
[0101][0102]
得到i=1时的分数后,继续令i=2并重复上述计算分组错误的概率值和计算分数的操作,直到i取遍1到n

1之间的整数。
[0103]
装置得到第一工艺中所有分组的分数后,将各个分组根据分数从大到小排序。然后装置确定在第一工艺中多个分组中分数靠前的n个分组中的第一小组或第二小组中的多个设备为根因。
[0104]
由于本技术实施例中对各个设备按照该设备的正样本的数目与负样本的数目的比值进行降序排列,因此在本技术实施例中装置在第一工艺中确定分数靠前的n个分组中的第一小组中的多个设备为根因。
[0105]
可选的,若将各个设备按照该设备的正样本的数目与负样本的数目的比值进行升序排列,可得到多个分组中得分最高的分组中的第二小组为根因。
[0106]
另一种可能的实现方式,首先判断r1、r2……
r
n
是否均大于r*threshold。如果任一设备出现r小于或等于r*threshold的情况则退出计算,如果r1到r
n
均大于r*threshold,则按照s204的分组方式将第一工艺的全部设备进行分组,然后对第一工艺的各个分组计算分数,然后根据分数对各个分组进行从大到小排序。最后装置确定在第一工艺中多个分组中分数靠前的n个分组中的第一小组中的多个设备为根因。其中,分数计算方法如上述描述所示,在此不再赘述。
[0107]
在一个示例中,装置可以针对第二工艺重复s201

s206,直到遍历生产过程的所有工艺,得到各个工艺对应的根因设备分组,然后将每个工艺确定的前n个分组再根据根因得分降序排列,可以定位出分数靠前的m个分组,确定这m个分组中的第一小组为根因。其中,n和m均为根据需求或者经验预设的,各个工艺的n可以取不同值也可以取相同值本技术对此不作限定。
[0108]
基于上述方法的同一构思,参见图4,为本技术实施例提供的一种根因分析装置400,装置400能够执行上述方法中的各个步骤,为了避免重复,此处不再详述。该装置400包括获取单元401和处理单元402。
[0109]
在一种场景下:
[0110]
获取单元401用于;获取多个产品的缺陷信息;所述多个产品流经第一工艺中的多个设备;所述缺陷信息是根据所述产品的尺寸和所述产品出现缺陷的区域的尺寸确定的;
[0111]
处理单元402,用于执行下述操作:
[0112]
根据所述缺陷信息,确定所述多个产品中正样本的数目和负样本的数目;其中,所述正样本是所述缺陷信息大于或等于第一阈值的样本,所述负样本是所述缺陷信息小于所述第一阈值的样本;
[0113]
确定流经所述多个设备中每个设备的产品中正样本的数目和负样本的数目;
[0114]
根据所述流经所述多个设备的产品中正样本的数目和负样本的数目,以及所述流经每个设备的产品中正样本的数目和负样本的数目,得到所述多个设备的多个分组;其中,每个分组中包括第一小组和第二小组,所述第一小组中的设备数量和所述第二小组中的设备数量之和等于所述多个设备的数量;
[0115]
确定所述多个分组中每个分组的概率值;所述概率值表示所述分组错误的概率;
[0116]
将所述概率值从小到大排序,确定所述多个分组中所述概率值靠前的n个分组;所述n个分组中第一小组中的设备或第二小组中的设备为根因。
[0117]
一种可能的实现方式,所述获取单元401获取多个产品的缺陷信息,用于:获取所述多个产品的履历信息;所述履历信息包括所述产品的工艺标识、所述产品在生产过程中流经的设备的设备标识和所述产品的缺陷信息;根据所述履历信息,获取所述多个产品的缺陷信息。
[0118]
一种可能的实现方式,所述缺陷信息包括:所述产品的缺陷个数或所述产品的缺陷比率,以及所述产品的缺陷标识;所述缺陷个数用于表示所述产品中出现缺陷的第一区域的数量,所述第一区域的尺寸是预定义的;所述缺陷比率用于表示所述产品中出现缺陷的第一区域的数量与所述产品中所述第一区域的总数量的比值,所述第一区域的尺寸是预定义的。
[0119]
一种可能的实现方式,所述处理单元402根据所述缺陷信息,确定所述多个产品中正样本的数目和负样本的数目,具体用于:根据所述缺陷信息,通过聚类算法,确定所述多个产品中正样本的数目和负样本的数目。
[0120]
一种可能的实现方式,所述处理单元402确定所述多个产品中正样本的数目和负样本的数目,具体用于:确定所述多个产品中所述正样本的数目与所述负样本的数目的比值;确定所述多个产品中所述正样本的数目与总样本的数目的比值;所述总样本的数目为所述多个产品的总数目;所述确定流经所述多个设备中每个设备的产品中正样本的数目和负样本的数目,包括:确定所述每个设备的产品中所述正样本的数目与所述负样本的数目的比值;确定所述每个设备的产品中所述正样本的数目与所述总样本的数目的比值。
[0121]
一种可能的实现方式,所述处理单元402根据所述流经所述多个设备的产品中正样本的数目和负样本的数目,以及所述流经每个设备的产品中正样本的数目和负样本的数目,得到所述多个设备的多个分组,具体用于:确定所述每个设备的产品中所述正样本的数目与所述总样本的数目的比值均大于多个产品中所述正样本的数目与所述总样本的数目的比值与第二阈值的积;将所述多个设备中前i个设备划分为第一小组,第i+1个到第x个设备分为第二小组;x为所述多个设备的总数目,x为大于等于1的整数;i取遍从1到x

1之间的整数。
[0122]
一种可能的实现方式,所述处理单元402将所述概率值从小到大排序,确定所述多个分组中所述概率值靠前的n个分组,具体用于:针对所述n个分组中任一分组,执行下述操作:根据假设检验方法确定所述概率值;当所述概率值小于第三阈值时确定分组准确;所述第三阈值为根据所述假设检验方法确定的显著性水平;根据所述概率值p计算相关性因子α;根据所述第一小组中的每个设备的产品中所述正样本的数目与所述总样本的数目的比值的方差d1,所述第二小组中的每个设备的产品中所述正样本的数目与所述总样本的数目
的比值的方差d2和多个产品中所述正样本的数目与所述总样本的数目的比值的方差d3计算离散因子β;根据所述任一分组中的所有设备的总样本的数目s计算长度因子γ;根据所述相关性因子α、所述离散因子β和所述长度因子γ计算所述分组的分数;将所述多个分组按照所述分组的分数进行降序排列;确定所述多个分组中分数n个最高的分组中的第一小组中的多个设备是根因。
[0123]
一种可能的实现方式,所述处理单元402具体用于:
[0124]
所述相关性因子α满足以下公式:α=1

p;
[0125]
所述离散因子β满足以下公式:β=1

(d1+d2)/d3;
[0126]
所述长度因子γ满足以下公式:γ=sigmoid(s);
[0127]
所述分组的分数score是满足以下公式:
[0128]
一种可能的实现方式,所述处理单元402还用于:获取所述多个产品的履历信息;所述履历信息包括所述产品在生产过程中流经的设备的设备标识;对所述设备标识进行去重操作;根据所述每个设备的产品中所述正样本的数目与所述负样本的数目的比值,将所述设备标识进行降序排列。
[0129]
基于上述方法的同一构思,参见图5,为本技术实施例提供的电子设备,该电子设备包括处理器501和存储器502。存储器502,用于存储计算机指令,处理器501,与存储器连接,用于执行存储器中的计算机指令,且在执行计算机指令时实现上述任一方法的步骤。
[0130]
本技术实施例还提供了一种计算机可读存储介质,其上存储有计算机指令,当计算机指令在计算机上运行时,使得计算机执行上述任一方法的步骤。
[0131]
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。
[0132]
虽然以上描述了本技术的具体实施方式,但是本领域的技术人员应当理解,这些仅是举例说明,本技术的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本技术的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本技术的保护范围。尽管已描述了本技术的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本技术范围的所有变更和修改。
[0133]
显然,本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的范围。这样,倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内,则本技术也意图包含这些改动和变型在内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1