影响要因特定方法

文档序号:6593350阅读:220来源:国知局
专利名称:影响要因特定方法
技术领域
本发明涉及影响要因特定方法和影响要因特定装置,详细而言,涉及特定对目的 变量的值影响大的说明变量的影响要因特定方法及影响要因特定装置。这种影响要因特定 方法及影响要因特定装置,其典型应用为在制造工艺中,用于特定对制品的检查结果施加 影响的制造条件。本发明又涉及用于使计算机执行这种影响要因特定方法的影响要因特定程序。本发明也涉及记录这种影响要因特定程序的计算机可读记录介质。
背景技术
作为明确目的变量与说明变量的关系以特定对目的变量的值影响大的说明变量 (影响要因分析)用的技术,在质量管理、要因分析等领域广泛利用回归分析法等统计解析 法。以回归分析法为首的许多分析法是将获得定量测量的数据作为前提来对这些数据作多 元解析的方法。然而,在需要这些分析法的许多领域中得到的数据未必限于仅为量变量,不 满足上述前提的情况不少。例如,以在制造工艺中、用于特定对制品的检查结果产生影响的 制造条件的分析为例,则在记录制造条件的工艺数据中,除用作材料的气体的流量、温度、 压力、长度等量变量之外,还混有制造装置的名称、制造诀窍的名称、制造日期和时间等质 变量。作为即使在说明变量中混杂有质变量和量变量也能进行分析的分析方法(多变 量分析法),已知非专利文献1 (林知己夫著《数量化的方法》,东洋经济新报社,1974年)或 非专利文献2(田中豐、脇本和昌著《多变量统计解析法》,现代数学社,1983年)中记载的 林的“I类数量化法”。在该I类数量化法中,即使说明变量中混杂有质变量和量变量也仍 能进行分析,但这限于说明变量中的量变量与目的变量线性相关的情况。这里,在制造工艺的工艺数据那样的现实数据中,目的变量与说明变量的相关关 系不清楚,不能获得是线性的前提。因此,一直以来,实施以下方法S卩,将量变量变换成质的虚拟变量,对该变换后的 数据应用上述I类数量化法。即,对在说明变量中混杂有质变量和量变量的数据,将量变量 根据其值变换成高、中、低等质的虚拟变量,对变换后的数据使用上述I类数量化法。该方法在例如将图1所示那样的数据作为分析对象时,按照以下的步骤进行。此 夕卜,图1中的“检查数据”栏的数据(数值)是目的变量,“XI”栏、“X2”栏的数据是说明变 量。“XI,,栏的数据是A、B、C这样的质变量,“X2”栏的数据是数值,即量变量。首先,如图2所示,此“X2”栏的数据中,将数值为1 3的数据变换成“低”,数值 为4 7的数据变换成“中”,数值为8 10的数据变换成“高”。也就是说,将用数值表示 的量变量按照其值来虚拟变换成“低”、“中”、“高”这样的质变量(X2’)。其次,为了应用I类数量化法,如图3所示,对上述图2的数据制成交叉制表 (cross tabulation)。该交叉制表的累计数为I类数量化法的正规方程的系数。正规方程 的右边是对应于各项目的类别的目的变量的值之和。因而,如下式那样求出正规方程。
IOa11 + Aan + 5a22 +a = 404 5an + a2l + a22 + Sa23 = 280 5 O13 + Or22 + 4^23 = 334 4au +au +Sa21 =245 5 O11 + O12 + 13 +7au = 305
O11 + 3an + 4a13 + Sa23 = 468
在该正规方程中,取α 21 = O。解该正规方程,则求出的解如下。
=45. 57, a12 = 62. 72, a13 = 75. 18, a21 = O, a22 = -8. 68, a23 = -8. 31由此,算出相当于检查数据的X1、X2的偏相关系数,则Xl的偏相关系数为0.635, X2的偏相关系数为0.236。根据该值,能判断为Xl对检查数据的影响比X2要大(影响要 因分析结束)。现有技术文献非专利文献非专利文献1 林知己夫著《数量化的方法》,东洋经济新报社,1974年非专利文献2 田中豐、脇本和昌著《多变量统计解析法》,现代数学社,1983年

发明内容
在上述方法(即将量变量变换成质的虚拟变量,对该变换后的数据应用I类数量 化法)中,不需要目的变量与说明变量的相关关系为线性的前提。然而,上述方法存在因将量变量变换成质变量而产生信息损失的问题。因此,本发明的课题在于,提供一种影响要因特定方法及影响要因特定装置,上述 影响要因特定方法即使在说明变量中混有质变量和量变量也能进行分析,不需要目的变量 与说明变量的相关关系为线性的前提,而且不产生信息损失。为了解决上述课题,本发明的影响要因特定方法,对分析对象数据特定说明变量中影响目的变量的要因,该分析对象数据根据这些 变量的变化包含多组数据,上述多组数据相当于含1种以上的质变量及该质变量所对应的 1种以上的量变量的上述说明变量的数据、和相当于用上述说明变量说明的上述目的变量 的数据,根据上述说明变量中的上述质变量具有的水准将上述说明变量中的上述量变量 组成的各数据组分别划分成多个段,对每一上述段分别用该段和补足该段的空栏获得能作 为量变量处理的伪数据组,对由上述虚拟数据组的集合组成的说明变量和上述目的变量应用多变量分析法 来特定影响上述目的变量的影响要因。此处,相当于量变量的数据是表示数值的数据。此外,相当于质变量的数据是例如 表示装置编号的字符数据。“数据组”是指由因“变量”的变化而获得的多个数据组成的组。“变量”对例如每 一制品或每一批制品变化。目的变量中的“影响目的变量的要因”指包括对目的变量影响最大的要因。“多变量分析法”用公知的普通方法就足够。
本发明的影响要因特定方法中,首先,根据上述说明变量中的上述质变量具有的 水准将分析对象数据包含的说明变量中的量变量组成的各数据组分别划分成多个段。由 此,对每一上述段分别用该段和补足该段的空栏获得能作为量变量处理的伪数据组。然后, 对由上述伪数据组的集合组成的说明变量和上述目的变量应用多变量分析法特定影响上 述目的变量的影响要因。在进行这样处理的情况下,即使说明变量中混有质变量和量变量也能进行分析。 另外,不需要目的变量与说明变量的相关关系为线性的前提。而且,不产生信息损失。此外,本发明的较具体的结构中,使上述说明变量中的上述量变量组成的各数据 组存储到第1存储部。另外,利用计算机的中央运算处理装置读出第1存储部中存储的存 储内容,分别根据上述说明变量中的上述质变量具有的水准划分成多个段,对每一上述段 分别用该段和补足该段的空栏获得能作为量变量处理的伪数据组。使得到的上述伪数据组 的集合作为新的分析对象数据存储到第2存储部。然后,利用计算机的中央运算处理装置 读出上述第2存储部的存储内容,对由上述伪数据组的集合组成的说明变量和上述目的变 量应用多变量分析法特定影响上述目的变量的影响要因。一种实施方式的影响要因特定方法,其特征在于,在将上述说明变量中的上述量变量组成的各数据组划分成多个段前,选择上述说明变量中的某质变量具有的某水准,根据该水准将上述说明变量中包含的全部数据组划分成多个数据群,在上述分群后的多个数据群之间,判断这些数据群对应的上述目的变量的值之间 是否存在显著差,仅在存在上述显著差时采用该水准。在上述这一实施方式的影响要因特定方法中,在上述说明变量中的1种以上的质 变量具有的水准中,仅采用上述分群后的多个数据群间在这些数据群对应的上述目的变量 的值之间存在显著差的。因而,抑制上述伪数据组的数量不必要地增多。其结果在于,能期 待数据处理时间缩短及分析结果的精度提高。一种实施方式的影响要因特定方法,其特征在于,判断上述目的变量的值之间是 否存在显著差时,使用F检验、决策树分析或相关法则。在上述这一实施方式的影响要因特定方法中,能判断上述目的变量的值之间是否 存在显著差。尤其在使用F检验的情况下,能定量地明确判断是否进行数据变换。一种实施方式的影响要因特定方法,其特征在于,上述分析对象数据是涉及包含1个以上制造工序的制造工艺的数据,上述分析对象数据中包含的上述说明变量由记录上述各制造工序的制造条件的 工艺数据组成,上述目的变量由将上述制造工艺的制品的检查结果作为质变量或量变量记录的 测试数据组成,上述各变量的变化相当于上述工艺数据和测试数据在每一制品的变化。此处,各装置工序的“制造条件”广泛包含作为质变量的装置编号或制造诀窍、负 责人等类别以及作为量变量的装置的调整值、温度、压力、气体流量等运转状态。在上述这一实施方式的影响要因特定方法中,将涉及制造工艺的工艺数据和测试 数据作为分析对象数据,进行影响要因的特定。由此,在制造工艺中,将表示对制品的检查结果的测试数据作为目的变量,将表示制造条件的工艺数据作为说明变量,则能对产生不 合格的要因的特定或制造合格品用的制造条件进行分析。例如,使表示各工序的制造条件 的数据分别对应于1个数据组,则能对某工序方便地特定哪个类别(装置编号或制造诀窍、 负责人等)时的哪个变量(装置的调整值、温度、压力、气体流量等)是产生不合格的要因。一种实施方式的影响要因特定方法,其特征在于,对由上述伪数据组的集合组成的说明变量和上述目的变量应用多变量分析法时,对于每一上述伪数据组,根据上述测试数据的值将该伪数据组内的数据分类成合 格品数据和不合格品数据,算出上述合格品数据的平均值,用该平均值填充该伪数据组内 的空栏,按照上述各伪数据组的上述合格品数据的平均值基准点相同的方式,将上述各伪 数据组内的数据变换到特征量空间,在上述特征量空间中,提取对上述不合格品数据相对应的点与上述基准点之间的 距离有贡献的特征量,根据上述提取出的特征量,特定影响上述测试数据的上述工艺数据内的影响要 因。在这一实施方式的影响要因特定方法中,能高精度地特定影响上述测试数据的上 述工艺数据内的影响要因。此外,上述基准点最好是上述特征空间的原点。在这种情况下,计算处理简单。一种实施方式的影响要因特定方法,其特征在于,在将上述各伪数据组内的数据 变换到特征量空间时,将上述各伪数据组内的数据标准化,使得上述合格品数据的平均值 为0而且标准偏差为1,之后,进行上述变换。在这一实施方式的影响要因特定方法中,将上述各伪数据组内的数据标准化,使 得上述合格品数据的平均值为0而且标准偏差为1。也就是说,使全部说明变量的尺度统 一。因而,能用相同的评价基准评价各说明变量的影响度。一种实施方式的影响要因特定方法,其特征在于,算出定量表示上述工艺数据内 的影响要因近似准确的程度的评价指标,根据算出的评价指标将上述影响要因作为候补排 列并输出。在这一实施方式的影响要因特定方法中,根据算出的评价指标将上述影响要因作 为候补排列并输出。该输出能取一览表显示的形态。因而,根据该输出,用户(包含制造工 艺的维护负责人、操作者,下文相同)能方便地判断影响要因的确实性。即,用户能从所输 出的影响要因候补中最近似准确的候补开始,依次确认该候补是否实际为产生不合格品的 要因。因而,能以最小限度的劳力确认发生不合格品的要因。一种实施方式的影响要因特定方法,其特征在于,利用主分量分析获得上述特征
量空间。这一实施方式的影响要因特定方法,利用主分量分析获得上述特征量空间。在这 种情况下,能防止说明变量之间具有强相关关系时的过量拟合。因而,分析精度提高。一种实施方式的影响要因特定方法,其特征在于,在上述特征量空间中,算出将上 述基准点作为基准的各上述不合格品数据对霍特林的T2统计量的贡献,根据该贡献获得定 量表示上述工艺数据内的影响要因近似准确程度的评价指标。
这一实施方式的影响要因特定方法,在上述特征量空间算出将上述基准点作为基 准的各上述不合格品数据对霍特林的T2统计量的贡献,根据该贡献获得上述评价指标。在 这种情况下,能算出相对于离开主分量空间内的基准点(其典型为原点)的距离的各说明 变量的影响度。也就是说,可用数值方式表示各说明变量在何种程度上影响不合格品的发 生。一种实施方式的影响要因特定方法,其特征在于,在上述特征量空间分别算出将 上述基准点作为基准的各上述合格品数据对霍特林的T2统计量的贡献和各上述不合格品 数据对霍特林的T2统计量的贡献,将表示这些贡献之比的值作为定量表示上述工艺数据内 的影响要因近似准确程度的评价指标。这一实施方式的影响要因特定方法,将表示上述基准点作为基准的各上述合格品 数据对霍特林的T2统计量的贡献与各上述不合格品数据对霍特林的T2统计量的贡献之比 的值作为上述评价指标。因而,能评价合格品条件与不合格品条件的差异。也就是说,即使 目的变量与要因的相关关系为线性相关和非线性相关中的任一相关关系,也能特定影响目 的变量的要因。一种实施方式的影响要因特定方法,其特征在于,在上述特征量空间,从上述影响 要因的候补去除以上述基本点为基准的各上述不合格品数据对霍特林的T2统计量的贡献 比某阈值要小的变量。这一实施方式的影响要因特定方法,从上述影响要因的候补去除以上述基准点为 基准的各上述不合格品数据对霍特林的T2统计量的贡献比某阈值要小的变量。因而,可去 掉对不合格品的产生几乎没有影响的噪声等造成的微小影响要因。一种实施方式的影响要因特定方法,其特征在于,在基板上制造多个上述制品,对每一上述基板进行基于上述测试数据的值的合格品和不合格品的判别。这一一实施方式的影响要因特定方法,对每一基板进行合格品和非合格品的判 别。这样进行的情况下,与对每一上述制品进行合格品和非合格品判别时相比,能减少数 据,对概略掌握并分析产生不合格品的趋势有效。—种实施方式的影响要因特定方法,其特征在于,在基板上制造多个上述制品,对每一上述制品进行基于上述测试数据的值的合格品和不合格品的判别。这一实施方式的影响要因特定方法,对每一上述制品进行基于上述测试数据的值 的合格品和不合格品的判别。因而,能以制品为单位精度良好地分析产生不合格品的要因。 还能通过将制品在基板上的位置用于说明变量,分析基板上的位置与产生不合格的关系。本发明的影响要因特定装置,对分析对象数据特定说明变量中影响目的变量的要因,该分析对象数据根据这些 变量的变化包含多组数据,上述多组数据相当于含1种以上的质变量和该质变量所对应的 1种以上的量变量的上述说明变量的数据、和相当于用上述说明变量说明的上述目的变量 的数据,上述影响要因特定装置包括数据变换部,该数据变换部根据上述说明变量中的上述质变量具有的水准将上述说明变量中的上述量变量组成的各数据组分别分成多个段,对每一上述段分别用该段和补 足该段的空栏获得能作为量变量处理的伪数据组;以及,影响要因分析部,该影响要因分析部对由上述伪数据组的集合组成的说明变量和 上述目的变量应用多变量分析法,来特定影响上述目的变量的影响要因。在本发明的影响要因特定装置中,首先,数据变换部根据上述说明变量中的上述 质变量具有的水准将分析对象数据包含的说明变量中的量变量组成的各数据组分别划分 成多个段。由此,对每一上述段分别用该段和补足该段的空栏获得能作为量变量处理的伪 数据组。然后,影响要因分析部对由上述伪数据组的集合组成的说明变量和上述目的变量 应用多变量分析法,来特定影响上述目的变量的影响要因。在这样处理的情况下,即使说明变量中混有质变量和量变量也能进行分析。不需 要目的变量与说明变量的相关关系为线性的前提。而且,不产生信息损失。一种实施方式的影响要因特定装置,其特征在于,上述分析对象数据是涉及包含1个以上制造工序的制造工艺的数据,上述分析对象数据中包含的上述说明变量由记录上述各制造工序的制造条件的 工艺数据组成,上述目的变量由将对上述制造工艺的制品的检查结果作为质变量或量变量记录 的测试数据组成,上述各变量的变化相当于上述工艺数据和测试数据在每一制品的变化,上述影响要因特定装置包括数据读入部,该数据读入部带有关联关系地取得上述工艺数据和上述测试数据; 以及,输出部,该输出部进行表示上述影响要因分析部特定的影响要因的显示。这一实施方式的影响要因特定装置中,作为上述分析对象数据,数据读入部带有 关联关系地取得涉及制造工艺的上述工艺数据和上述测试数据。然后,输出部进行表示上 述影响要因分析部特定的影响要因的显示。因而,根据该显示,用户能方便地判断影响要因 的确实性。一种实施方式的影响要因特定装置,其特征在于,包括算出表示上述工艺数据内的影响要因的近似准确程度的评价指标的评价指 标计算部,上述输出部根据该算出的评价指标排列并输出上述影响要因的候补。这一实施方式的影响要因特定装置中,上述输出部根据算出的定量的评价指标排 列并输出上述影响要因的候补。该输出能取一览表显示的形态。因而,根据该输出,用户能 方便地判断影响要因的确实性。即,用户能从所输出的影响要因候补中最近似准确的候补 开始,依次确认该候补是否实际为发生不合格品的要因。因而,能以最小限度的劳力确认产 生不合格品的要因。此外,上述输出部最好根据用户的指示或自动地使对该影响要因的候补的工艺数 据和测试数据、以及将这些工艺数据和测试数据图形化的数据显示在显示屏幕上。这样处 理的情况下,用户能方便地从所输出的影响要因候补中最近似准确的候补开始,依次确认 该候补是否实际为发生不合格品的要因。
本发明的影响要因特定程序用于使计算机执行上述影响要因特定方法。本发明的记录介质,计算机可读取,其特征在于,记录上述影响要因特定程序。


图1是用于说明应用以往的I类数量化法的方法的、示例说明变量中混有质变量 和量变量的数据的图。图2是示出将图1中的变量变换成虚拟变量而得到的数据的图。图3是示出累计图2中的数据而得到的交叉制表。图4是示出本发明一实施方式的影响要因特定方法的处理流程的图。图5是示出减少质变量具有的水准中用于划分数据组的水准的数量的处理流程 的图。图6是将应用影响要因特定方法的分析对象数据作为数据阵示出的图。图7是将包含伪数据组的集合的新分析对象数据作为数据阵示出的图,该伪数据 组是根据各说明变量中的质变量具有的水准分别将图6中说明变量中的量变量组成的各 数据组分成多个段而得到的。图8是示出包含图7所示伪数据组集合的数据阵中建立合格品数据的局部阵Xg 的图。图9是示出包含图7所示伪数据组集合的数据阵中建立不合格品数据的局部阵Xb 的图。图10是示出将图8所示的阵Xg标准化后得到的阵的图。图11是示出将图9所示的阵Xb标准化后得到的阵的图。图12是示出将图7所示数据阵作为对象时在主分量分析过程算出的阵SR的图。图13是示出将图7所示数据阵作为对象时在主分量分析过程算出的阵VR的图。图14是示出相当于上述主分量分析的特征量空间中的合格品数据的坐标的主分 量得分TgR的图。图15是示出相当于上述主分量分析的特征量空间中的不合格品数据的坐标的主 分量得分TbR的图。图16是示出上述主分量分析的主分量得分TR的协方差阵Σ T的图。图17是示出上述主分量分析的霍特林的T2统计量的图。图18是示出对上述主分量分析中的第ρ变量的T2统计量的贡献的图。图19是示出对上述合格品数据算出的T2统计量的贡献的图。图20是示出对上述不合格品数据算出的T2统计量的贡献的图。图21是示出对上述合格品数据的第ρ变量的T2统计量的归一化后的贡献的图。图22是示出对上述不合格品数据的第ρ变量的T2统计量的归一化后的贡献的图。图23是示出将图7所示数据阵当作对象时作为用于影响要因特定的评价指标算 出的乖离度指标IoK的图。图24是示出用该乖离度指标IoK按递减的顺序以一览表的形态输出影响要因的 候补的例子的图。图25是画出作为影响要因候补的项目“Α工序_A1 (1号机)”的值与检查结果的对应关系的分布图。图26是示出对作为图6所示A工序所涉及的质变量的装置编号1号机、2号机和 作为B工序所涉及质变量的装置编号1号机、2号机总结投放数、不合格数、不合格率而得到 的表的图。图27是示出总结作为A工序的1号机、2号机所涉及的目的变量的检查结果(测 试数据)而得到的表的图。图28是示出总结作为B工序的1号机、2号机所涉及的目的变量的检查结果(测 试数据)而得到的表的图。图29是示出适合实施上述影响要因特定方法的影响要因特定装置的方框结构的 图。符号说明
200-影响要因特定装置
201-输入装置
202-用户接口
203-数据读入部
204-数据处理部
205-评价值计算部
206-输出部
207-显示装置
208-工艺数据保管装置
213-测试数据保管装置
220-主体
300-制造工艺
具体实施例方式下面,利用附图所示的实施方式详细说明本发明。本发明一实施方式的影响要因特定方法将涉及包含A工序和B工序这两个制造工 序的制造工艺的数据作为分析对象数据。上述分析对象数据中包含的说明变量包含记录各制造工序的制造条件的工艺数 据。各制造工序的制造条件广泛包含作为质变量的装置编号或制造诀窍、负责人等类别、及 作为量变量的装置调整值、温度、压力、气体流量等运转状态。在图6的例子中,在A工序中 包含作为质变量的装置编号(1号机、2号机)、作为量变量的调整值(A工序_A1、A工序_ A2)。另外,在B工序中包含作为质变量的装置编号(1号机、2号机)、作为量变量的调整值 (B工序_B1、B工序_B2)。上述分析对象数据中包含的目的变量由测试数据组成,该测试数据将上述制造工 艺的制品的检查结果(做出的结果或性能评价结果)记录作为质变量或量变量。在图6的 例子中,作为量变量(数值数据)包含对制品的检查结果。使每一制品(Lot01、Lot02、……)与上述说明变量和目的变量相对应。上述说明 变量、目的变量的变化分别相当于上述工艺数据、测试数据在每一制品的变化。
在图6的例子中,对于每一制品(Lot01、Lot02、……),作为目的变量的检查结果 (测试数据)按2. 10,2. 71、……这样进行变化。在本例中,若检查结果为0至3. 5范围内 的值,则为“合格品”,若为该范围以外的值,则为“不合格品”。另外,对于每一制品(Lot01、Lot02、……),作为说明变量的工艺数据被设定或变 化如下。即,A工序中,制品LotOl至制品LotlO使用装置编号“1号机”,制品Lotll至制 品Lot20使用装置编号“2号机”。A工序中,对于每一制品(LotOU Lot02、……),调整值 “A工序_A1”按0. 17、0.41、……这样进行变化,调整值“Α工序_Α2”按0. 31、0. 76、…… 这样进行变化。另一方面,B工序中,制品LotOl至制品Lot05使用装置编号“1号机”,制品 Lot06至制品LotlO使用装置编号“2号机”,制品Lotll至制品Lotl5使用装置编号“1号 机”,并且制品Lotl6至制品Lot20使用装置编号“2号机”。B工序中,对于每一制品(LotO 1、 Lot02、……),调整值1工序_81”按0.16、0.35、……这样进行变化,调整值“B工序_ B2”按0.98、0.03、……这样进行变化。在图6的例子中,将工艺数据中A工序的装置编号“1号机”和“2号机”、B工序的 装置编号“1号机”和“2号机”分别作为质变量具有的“水准”加以掌握。另外,将图6中的量变量组成的数据(例如调整值“A工序_A1”的数据)从制品 LotOl至Lot20发生变化的20个数据的组称为“数据组”。在这一实施方式的影响要因特定方法中,对上述分析对象数据按照图4所示的流 程来特定作为说明变量的工艺数据中的、对作为目的变量的检查结果施加影响的要因。(i)首先,图4的步骤SlOl中,根据说明变量中的质变量具有的水准分别将说明变 量中的量变量组成的各数据组分成多个段。例如,将图6中的调整值“A工序_A1”的数据组如图7所示那样根据A工序的装 置编号“ 1号机”和“2号机”的这两个水准分成两个段(“Α工序_A1 (1号机),,栏的10个 数据和“A工序_A1(2号机)”栏)的10个数据。同样,将图6中的调整值“A工序_A2”的 数据组如图7所示那样根据A工序的装置编号“ 1号机”和“2号机”这两个水准分成两个 段(“A工序_A2 (1号机),,栏的10个数据和“A工序_A2 (2号机),,栏的10个数据。另外,将图6中的调整值“B工序_B1”的数据组如图7所示那样根据B工序的装置 编号“ 1号机”和“2号机”这两个水准分成两个段(“B工序_B1 (1号机)”栏的5个X 2 (共 10个)数据和“B工序_B1 (2号机)”栏的5个X 2 (共10个)数据。同样,将图6中的调 整值“B工序_B2”的数据组如图7所示那样根据B工序的装置编号“1号机”和“2号机” 这两个水准分成两个段(“B工序_B2 (1号机)”栏的5个X 2 (共10个)数据和“B工序 _B2(2号机)”栏的5个X2(共10个)数据。(ii)其次,在图4中的步骤S102,如这种的"A工序_A1 (1号机),,栏、‘‘A工序_ Al (2号机)”栏、“B工序_B1 (1号机)”栏、“B工序_B1 (2号机)”栏那样,分别将作为量变 量的数据段和补足该数据段的空栏(图7中斜线所示的部分)组成的组当作“伪数据组”。 在该阶段中,空栏中无数据。这些伪数据组可作为量变量处理,后文将讲述。(iii)接着,在图4中的步骤ST103,对上述伪数据组的集合组成的说明变量和上 述目的变量应用多变量分析法来特定影响上述目的变量的影响要因。在该例中,作为多变 量分析法,进行主分量分析。如对图6所述那样,在本例中,若作为上述目的变量的检查结果(测试数据)为O至3. 5范围内的值,则为“合格品”,若为该范围以外的值则为“不合格品”。将包含图7所示伪数据组的集合的工艺数据建立的数据阵X设为下式(N 数据的 数量,P 变量的数量)。X e Rnxp然后,对于每一伪数据组,根据上述测试数据的值,将该伪数据组内的数据判别为 合格品数据和不合格品数据。然后,将该数据阵X中的、对基于测试数据被判断为合格品的 制品的数据(下文称为“合格品数据”)建立的局部阵Xg如图8所示那样设为下式(Ng:特 性正常的数据的数量)。Xg e Rnsxp又将该数据阵X中的、对基于测试数据被判断为不合格品的制品的数据(下文称 为“不合格品数据”)建立的局部阵Xb如图9所示那样设为下式(Nb 特性不合格的数据的
数量)。Xb e RNbxp此外,在本例中,用合格品、不合格品的全部数据进行分析,但也可用将合格品或 不合格品或者这两者的数据分群,来使用一部分数据的方法。接着,在图8所示的阵Xg中,对每一伪数据组算出该伪数据组中所包含的合格品 数据的平均值和标准偏差值。在本例中,用该平均值填充该伪数据组内的空栏。对每一伪 数据组,用上述平均值和标准偏差值对该伪数据组进行标准化。如图10所示,将由该标准 化得到的阵设为&。另外,在图9所示的阵Xb中,对于每一伪数据组,用该数据组所对应的 阵Xg中的伪数据组的标准化中所使用的上述平均值和标准偏差值来进行标准化。如图11 所示,将由该标准化得到的阵设为涵。应当注意的是,图10、图11中,在图8、图9中分别形 成空栏的部位因使用上述平均值的上述标准化而数据变为0。接着,将图10、图11所示的&、万作为对象进行主分量分析。首先,对图10所示的阵进行奇异值分解并获得下式。
__「y ο Xg = USV =[UR U0] ^ s [VR Vj此处,上式中,U和V是正交阵。S是对角阵,在该对角元素中,奇异值sr按降序排 列。R是采用的主分量的数量。UR是将U中到第R列为止的部分作为元素的局部阵。SR是 如图12所示那样将S中到R行、R列为止的部分作为元素的局部阵。另外,VR是如图13所 示那样将V中到第R列为止的部分作为元素的局部阵。对于该阵,利用下式算出相当于特征量空间中的合格品数据的坐标的主分量得分 TgR (参考图14)。TgR=XgVR同样,对于图11所示的阵,利用下式算出相当于特征量空间中的不合格品数据的 坐标的主分量得分TbR(参考图15)。Tbft = XbVR图14、图15所示的TgR、TbR中,从第1列开始,依次为第1主分量、第2主分量、……、第R主分量。(iv)接着,在图4中的步骤S103中进行特定影响要因用的分析。首先,利用下式算出主分量得分TR的协方差阵Σ Τ(参考图16)。
权利要求
1.一种影响要因特定方法,其特征在于,对分析对象数据特定说明变量中影响目的变量的要因,该分析对象数据根据这些变 量的变化包含多组数据,该多组数据相当于含1种以上的质变量及该质变量所对应的1种 以上的量变量的所述说明变量的数据、和相当于用所述说明变量说明的所述目的变量的数 据,根据所述说明变量中的所述质变量具有的水准将由所述说明变量中的所述量变量组 成的各数据组分别分成多个段,对每一所述段分别用该段和补足该段的空栏获得能作为量 变量处理的伪数据组,对由所述伪数据组的集合组成的说明变量和所述目的变量应用多变量分析法,来特定 影响所述目的变量的影响要因。
2.如权利要求1所述的影响要因特定方法,其特征在于,在将由所述说明变量中的所述量变量组成的各数据组分成多个段前, 选择所述说明变量中的某质变量具有的某水准, 根据该水准将所述说明变量中包含的全部数据组分成多个数据群, 在分群后的所述多个数据群之间判断这些数据群对应的所述目的变量的值之间是否 存在显著差,仅在存在所述显著差时采用该水准。
3.如权利要求2所述的影响要因特定方法,其特征在于,判断所述目的变量的值之间是否存在显著差时,使用F检验、决策树分析或相关法则。
4.如权利要求1、2或3所述的影响要因特定方法,其特征在于,所述分析对象数据是涉及包含1个以上制造工序的制造工艺的数据, 所述分析对象数据中包含的所述说明变量由记录所述各制造工序的制造条件的工艺 数据组成,所述目的变量由将所述制造工艺得到的制品的检查结果作为质变量或量变量以记录 的测试数据组成,所述各变量的变化相当于所述工艺数据和测试数据在每一制品的变化。
5.如权利要求4所述的影响要因特定方法,其特征在于,对由所述伪数据组的集合组成的说明变量和所述目的变量应用多变量分析法,这时, 对每一所述伪数据组根据所述测试数据的值将该伪数据组内的数据分类成合格品数 据和不合格品数据,并算出所述合格品数据的平均值,用该平均值填充该伪数据组内的空 栏,以所述各伪数据组的所述合格品数据的平均值成为同一基准点的方式,将所述各伪数 据组内的数据变换到特征量空间,在所述特征量空间提取对与所述不合格品数据对应的点和所述基准点之间的距离有 贡献的特征量,根据所述提取出的特征量特定影响所述测试数据的所述工艺数据内的影响要因。
6.如权利要求5所述的影响要因特定方法,其特征在于,在将所述各伪数据组内的数据变换到特征量空间时,将所述各伪数据组内的数据标准 化,使得所述合格品数据的平均值为0且标准偏差为1,然后,进行所述变换。
7.如权利要求5所述的影响要因特定方法,其特征在于,算出定量表示所述工艺规程数据内的影响要因近似准确的程度的评价指标,根据算出 的评价指标将所述影响要因作为候补排列并输出。
8.如权利要求5所述的影响要因特定方法,其特征在于,利用主分量分析获得所述特征量空间。
9.如权利要求8所述的影响要因特定方法,其特征在于,在所述特征量空间,算出将所述基准点作为基准的各所述不合格品数据对霍特林的T2 统计量的贡献,根据此贡献获得定量表示所述工艺数据内的影响要因近似准确程度的评价 指标。
10.如权利要求8所述的影响要因特定方法,其特征在于,在所述特征量空间,分别算出将所述基准点作为基准的各所述合格品数据对霍特林的 T2统计量的贡献和各所述不合格品数据对霍特林的T2统计量的贡献,将表示这些贡献之比 的值作为定量表示所述工艺规程数据内的影响要因近似准确程度的评价指标。
11.如权利要求8所述的影响要因特定方法,其特征在于,在所述特征量空间,从所述影响要因的候补去除将所述基准点作为基准的各所述不合 格品数据对霍特林的T2统计量的贡献比某阈值要小的变量。
12.如权利要求5所述的影响要因特定方法,其特征在于,在基板上制造多个所述制品,对每一所述基板进行基于所述测试数据的值的合格品和不合格品的判别。
13.如权利要求5所述的影响要因特定方法,其特征在于,在基板上制造多个所述制品,对每一所述制品进行基于所述测试数据的值的合格品和不合格品的判别。
14.一种影响要因特定装置,其特征在于,对分析对象数据特定说明变量中影响目的变量的要因,该分析对象数据根据这些变 量的变化包含多组数据,该多组数据相当于含1种以上的质变量及该质变量所对应的1种 以上的量变量的所述说明变量的数据、和相当于用所述说明变量说明的所述目的变量的数 据,所述影响要因特定装置包括数据变换部,该数据变换部根据所述说明变量中的所述质变量具有的水准将由所述说 明变量中的所述量变量组成的各数据组分别分成多个段,对每一所述段分别用该段和补足 该段的空栏获得能作为量变量处理的伪数据组;影响要因分析部,该影响要因分析部对由所述伪数据组的集合组成的说明变量和所述 目的变量应用多变量分析法,来特定影响所述目的变量的影响要因。
15.如权利要求14所述的影响要因特定装置,其特征在于,所述分析对象数据是涉及包含1个以上制造工序的制造工艺的数据,所述分析对象数据中包含的所述说明变量由记录所述各制造工序的制造条件的工艺 数据组成,所述目的变量由将所述制造工艺得到的制品的检查结果作为质变量或量变量以记录 的测试数据组成,所述各变量的变化相当于所述工艺数据和测试数据在每一制品的变化;所述影响要因特定装置包括数据读入部,该数据读入部带有关联关系地取得所述工艺数据和所述测试数据;以及, 输出部,该输出部进行表示所述影响要因分析部特定的影响要因的显示。
16.如权利要求15所述的影响要因特定装置,其特征在于,包括算出表示所述工艺数据内的影响要因的近似准确程度的评价指标的评价指标计 算部,所述输出部根据该算出的评价指标排列并输出所述影响要因的候补。
17.一种影响要因特定程序,其特征在于,用于使计算机执行权利要求1中记载的影响要因特定方法。
18.—种记录介质,计算机可读取,其特征在于,记录权利要求17中记载的影响要因特定程序。
全文摘要
本发明的目的在于提供一种影响要因特定方法。分析对象数据根据说明变量和目的变量的变化,包含多组数据,该多组数据相当于含1种以上的质变量与该质变量所对应的1种以上的量变量的所述说明变量的数据、和相当于用所述说明变量说明的所述目的变量的数据。根据所述说明变量中的质变量具有的水准将说明变量中的量变量组成的各数据组分别分成多个段(S101)。由此,对每一段分别用该段和补足该段的空栏获得能作为量变量处理的伪数据组(S102)。对由伪数据组的集合组成的说明变量和目的变量应用多变量分析法特定影响目的变量的影响要因(S103)。
文档编号G06Q50/00GK102007510SQ20098011373
公开日2011年4月6日 申请日期2009年4月14日 优先权日2008年4月15日
发明者一色昭寿 申请人:夏普株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1