在运行具有数据组集合的设备时找到错误的方法

文档序号：6453715阅读：165来源：国知局

专利名称：在运行具有数据组集合的设备时找到错误的方法
技术领域：
本发明涉及一种在运行具有数据组集合的设备时找到错误的方法。
背景技术：
在现代技术的很多领域都要处理大规模的数据。通常这些数据是以数据组的形式组织的。每个数据组在此包括特定数量的单个数据。每单个数据在此又可以具有不同的值，
数据组通常被结构化为使得其单个数据以某种方式组合或相互关联。例如在汽车中，一个数据组可以包含汽车中所有传感器的输出值或测量值，这些输出值或测量值是在特定时刻或特定时间间隔内采集的。在例如保险的数据处理设备中，一个数据组例如可以包括特定保险的全部已知个人数据或保险数据。
目前在现代自动化系统中，要记录或产生大规模的测量数据或控制数据，并用于控制设备。因此，这样也会积累很多数据或数据组。不限制一般性的，下面就以自动化技术为例来描述本发明。
在采集或产生数据时以及在传递数据时都可能产生错误。例如产生测量数据的传感器可能出现故障或者提供有错的数据。数据组或这些数据组的一部分可能在自动处理时由于程序错误而被搞错。在手动输入特征值或参数时可能出现错误输入或打字错误。所有这些都可能导致从质量不足到生产停滞的不同问题。
目前虽然在概念化、规划或启动相应的设备期间对检查经过处理的数据花费了很大力气，但是仍然会出现有错的数据被太晚发现的问题。这样通常已经出现了缺陷，或者这种缺陷一直持续到有错数据的来源被锁定为止。
目前缺少有效的搜索方法来识别数据组集合中的错误数据组。以手动方式无法再检查或检验一直增长的数据组集合。因此目前需要用于查找有错数据组的自动化方法。
到目前为止，数据或数据组的自动检查通常只是实施为边界值检
查。对数据组中的每单个数据确定有效范围，如最小值和最大值之间的间隔或者容许值的集合。位于所容许的有效范围之外的所有值都被识别
为无效。例如在轧钢车床中公知，只有厚度为2cm到20cm的原材料才能被轧制。因此包含材料厚度为0. 2cm或200cm的数据组，肯定是错误的。
通过该公知方法只能找出粗略的错误，因为数据容许值的边界必须开放到使得所有理论上可能的值都要被识别为没有错误。例如由于材料弄错而产生的较小的错误是找不到的。如果对上述例子轧钢车床中的工人放上厚度为20cm的材料，但是产生厚度值为2cm的输入数据，则该错误无法通过上述方法识别。

发明内容
本发明要解决的技术问题是提供一种改进的、用于找到数据组集合中的有错数据组的方法。
该技术问题如下解决。本发明基于以下思想。通常一个数据组包含了用于完整描述一项行为或一个过程的全部数据。例如，在自动化技术中出发点是，也采集在自动化设备中运行的过程的所有过程参数，并组合到数据组中。否则该过程的进行就不能被预见或者提供强烈偏差的结果。一个数据组的所有数据因此通过某种方式组合或彼此关联。这种关联或组合还是可以再现的，即大致相同的数据组的数据围绕剩余误差波动。这种组合例如在神经网络可以反映这种组合时产生。所提到的关联或组合在此不必清楚知道，也不需要可以描述，更不需要有针对性地模拟，只需要这种关联或组合存在。
本发明还基于这样的思想数据组的数据分为所谓的输入数据和目标数据。上述组合发生作用的方式是，使得在输入数据相同或相似时产生类似的目标数据，只是稍微相差一个对输入数据和目标数据构成的相应组合来说典型的剩余误差。然后神经网络例如可以在其输出端上由输入数据作为输入来重新产生包含相应剩余误差的目标数据。目标数据比由于剩余误差引起的与该规则偏离更大的数据组，被分类为有错的或可能有错的数据。
因此换句话说，本发明的基本思想在于，通过以下方式识别出有错的数据组，即错误的目标数据在输入数据给定或在输入数据类似时与假
定为无错的其它目标数据或者可以由输入数据和目标数据推导出的组合相矛盾。
本发明的方法基于M个数据组，它们分别包括N个输入数据和至少一个与这些输入数据相关的目标数据。输入数据和目标数据的区分例如可以通过数据本身的类型来进行。由于在自动化设备中例如通常采集所有与过程有关的数据以保证过程输出端上的产品相同或产品质量恒定，因此例如可以选择过程技术的测量数据作为输入数据，将产生的物品或过程产品的测量值选为目标数据。可替换的，还可以随意地进行分配，也就是数据组的待检查的数据被选择为目标数据，其余数据被选择为输入数据。
数据组的N个数据与目标数据一起还可以只是更大的总数据组的一个子集。换句话说，首先从每个总数据组中删除不会考察的数据，然后将本发明的方法仅用于总数据组的数据的相应子集。这可以得到节省计算时间的优点。只需要保证目标数据尽可能精确地通过输入数据定义。
每个输入数据可以采取不同的值，但是这些值分别限于其各自的值域。从而用24V驱动的测量传感器例如仅输出0V到24V的电压。由于这样一来每个输入数据处于有限值域内的一条数字线上，因此通过将全部N个输入数据组合为数据组(根据向量的方式)可以扩展出N维的超六面体或输入数据空间。因此输入数据空间是有限的。因此所有可以想到的输入数据的值组合都在输入数据空间的超立体内。由此为N维输入数据空间内的每个点分配相应数据组的目标数据值，该输入数据空间的坐标通过数据组的输入数据给定。
在用于在具有M个数据组的数据组集合中找到错误的数据组的方法
中，将输入数据的至少一个值域划分为Kn个间隔。由此在N维输入空间
中，形成总共n&个N维单元或超六面体，即输入数据空间的子空间。
这些子空间通过所述间隔的间隔边界限制，因此分别具有所述间隔作为边长。
至少一个这样形成的单元将被选为待检验的单元。由此从数据组的
在此哪些数据组形成确定该检验标准的基础可以是不同的。检验标准可以从一个或多个或所有单元的一个或多个或所有数据组的值中获得。
借助该检验标准检验待检验单元中的目标数据的值。因此要检验全部数据组的所有目标数据，这些数据组与其输入数据的值位于待检验的单元内或该输入数据的值域的相应间隔内。换句话说，要检验这样的数
据组，即这些数据组的N维坐标以输入数据的形式位于待检验单元的相应N维超六面体中。所选出的单元的每个其目标数据的值不满足检验标准的数据组，被识别为有错。
因此不仅目标数据，整个数据组都被分类为有错。由于输入数据和目标数据的选择可能是任意的，因此本发明的方法不仅可以找出目标数据中的错误，也可以找出整个数据组中的错误。
由于检验标准是从目标数据的值中获得而且因此是基于以该目标数据为基础的过程或特性来获得的，因此该检验标准明显比目前公知的最小值-最大值检查或边界值检查更为狭窄。最小值-最大值检查或边界值检查仅相当于检验输入数据是否在输入数据空间内。
检验标准通常对每个单元是不同的，从而对不同的数据组、也就是具有不同输入数据的数据组，不同的检验标准适用于这些数据组的目标数据。因此在这些检验标准中集成了迄今为止还不可能的真实性检验。
被识别为有错的数据组例如可以显示给设备驱动者看，从而该设备驱动者可以更为精确地检查相应的数据组。由此该方法提供了一种用于标记可疑数据组的预先过滤方式。由此显著减少了由设备驱动者真实手动或特殊检验的数据组的数量。如果随后证明这些可疑数据组确实是有错的，则一方面可以将该识别用于改善例如基于该数据组的自动化设备，另一方面该数据组可以不再被继续使用。
有错的数据组可以提供有关其它错误源的指示，例如在多个处理步骤之后才产生错误的目标数据的错误源。找到有错的数据组例如还可以与警报触发或类似的东西相结合，如果该数据组例如来自制造系统的话。但是警报系统在目标标准在更长的时间内优化之后才有意义，从而只有真正有错的数据组才被标记为有错的，错误警报的份额不会超过可
接受的限度。
通过本发明的方法可以对设备运行产生更有效的错误搜索，更快速的启动，更高的产品质量和更少的干扰情况。
检验标准在该方法的运行过程中或随着时间的流逝也会与新产生的各个数据组相匹配，也就是与输入数据和目标数据的值组合匹配，因
为检验标准是从这些输入数据和目标数据中产生的。
输入数据的间隔可以通过等间隔地划分该输入数据的值域来形成。值域的等间隔划分可以特别简单和没有关于输入数据的相互組合或者与目标数据的组合的先验知识或经验地实现。由此例如可以预先给定用于所有输入参数的固定数量的间隔。
识来形成。先验知识例如是关于特定的划分好于其它划分的理论考虑或实验经验。一方面重要的输入参数可以得到比不重要的输入参数更精细的划分。另一方面可以选择非等间隔的划分，使得在一个单元内的目标参数的增加对所有单元是大致相同的。
作为检验标准，为每个单元确定目标数据值的自己的局部容差范围，该容差范围明显比全局的容许值域更为狭窄。由此完成了用于测试数据组或目标数据是否满足检验标准的数学条件。这种检验标准因此可以受到简单和快速的分析，这会大大加快整个方法。
局部容差范围由阈值和容许的偏差构成。检验标准中的阈值和容许的偏差可以通过统计方法从目标数据值中确定。依据哪些数据，即依据来自哪些单元的哪些数据组来采用该统计方法，可以如上所述采用不同
的方式。
统计方法特别适用于以数字方式获取不可清楚地实现和诸如此类
这些i程仍然具有一"结构，即在目标值有很好的可再现性时只有比较小的剩余分散度。
如果在一个单元内目标值通常位于一定的值域内，则假定位于该值域之外的各个值是有错的。目标标准中的阈值因此可以确定为所选择的单元的数据组的所有目标数据的平均值。由此各个有错的值几乎不改变平均值。有错的值可以基于其与平均值之间有特别大的距离而识别出来。换句话说，对有错的数据组的查找由局部的、也就是仅针对相应的单元确定的值执行。
与局部阈值之间的容许偏差优选根据在所有单元上平均的局部标准偏差来计算。为此当然还可以使用其它与标准偏差相类似的度量，如分散度。在此，权重或可相乘的加权因子确定容差范围的真正宽度，而且例如可以实验性地确定。
虽然原则上可以使用(用于计算容许偏差的在单元内的目标参数的)局部标准偏差，但是这是不利的，因为该标准偏差由于有错的数据组而产生比在所有单元上平均的标准偏差更强的误差。
还可以不对局部分散度求平均，而对所有数据组确定目标值的全局分散度，也就是不考虑单元边界。接着可以通过对全局分散度加权确定容差范围。该方法变形提供了用于通过考虑所有数据组来判断有错的数据组的替换度量。所提到的替换度量多多少少适用于特定的应用情况。哪种变形用于哪种应用情况是最佳的，大多可以通过经验值或事先测试来确定。
除了由所有数据或待检查单元的数据获得的统计度量之外，替代的还可以采用关于待检查单元的预测来判断待检查单元的数据组是否有错。因此在该方法中可以产生用于将输入数据映射为目标数据的实验模型，从而用于所选择的单元的目标标准可以用该实验模型确定。通过采用实验模型可以尝试模拟目标数据和输入数据之间的关系。换句话说，由此尝试在已给定待检查单元中的输入数据时产生对目标数据值的预测。接着检查该单元中的目标值是否在围绕预测值的容差范围之外，以便在必要时将该目标值标记为有错的。
可以使用不同类型的实验模型，如多层感知器(MLP)，即非线性神经网络或由 DE10203787. 6 知的没有时间项的实时模型 (Just-in-Time-Modelling， JIT)。用几句话说，产生所有数据组的经过加权的平均值，其中产生由相应输入数据(即输入数据向量)到所检查单元的中点的N维超距离构成的加权。在超空间中相邻的数据组因此
得到最强的加权。在此，标准化可以例如借助单元的边长执行，该边长也就是间隔，值域被划分为这些间隔。这种措施尤其取决于单元的边长，
因此在这种情况下推荐值域的手动划分。JIT较MLP更好的优点是其更高的精度和更少的计算时间，因为取消了 MLP所需要的学习阶段。
在确定目标标准时，可以朝夂除待检查的单元，也就是il目标标准基于除开待检查单元之外的所有单元或所有单元的子集来确定。因此在待检查单元或有错数据组中的有错的值不会被用于确定目标标准。目标标准不会因为待检查单元的有错数据组而出错。
如果在一个单元中具有至少两个由数据组构成的分组(集群)，该数据组就它们的目标值来说分别彼此紧邻，但是在它们之间加入例如大于局部阻挡(Sperrung)的空隙，则存在只有一个数据分组是正确的，而其它数据分组都是错误的怀疑。具有多个数据分组(集群)的单元在下面称为异型单元。在此，在有错的数据分组中存在越多的数据，局部形成平均值的方法就越不可能识别出这些数据。由此，在排除来自所考察的异型单元的所有数据的条件下只有上述方法才有助于产生实验模型。
用于找到"异型"单元，即找到具有多个数据分组的单元的可能方法可以如下所述运行所选择的单元的目标值根据它们的大小分类，确定每两个相邻目标值的差，将大于空隙边界值的差定义为空隙。从而在待检查单元中的目标值形成越来越高的相邻排列，这些目标值根据没有空隙还是存在空隙的中间连接而相邻排列。具有相互之间没有空隙地相邻排列的目标值的数据组，被组合成集群。在一个单元中一个集群的所有数据组由此依据目标标准被一起识别为有错的或者没有错误。利用这种类型的方法变形，可以确定有错数据组的整个集合或分组，也就是集群。
由此为了检验是否有错，不是用在待检查单元中确定的检验标准测试目标值，而是用从周围的单元或剩余单元或所有单元确定的检验标准来测试目标值。该目标值由此例如来自上述实验模型。
由此在形成集群之后，为每个集群确定属于该集群的目标值的平均值，并用该目标标准检验该平均值。换句话说，通过形成集群以及关于相应平均值的目标标准分别进行分析，可以在单元中产生子分组。这种措施用于将有错的集群从整体上与没有错误的集群分开，
待检验单元中的检验标准还可以这样来确定在离该检验标准最近的数据组或集群之外的单元的所有数据组都被识别为有错的。通过这种方法变形保证，在异型单元中只有一个集群或者在一个单元中只有一个数据组被识别为正确，其它的都被识别为有错的。该检验标准换句话i兌是"最适合"标准。
如上所述，通过不同的方法变形可以将待检查单元中目标值的各个偏差者、单元内的错误值的整个集群，或者待检查单元的所有数据组识别和标记为有错。为了最合适地识别出全部有错的数据组，可以在如上所述的第一方法过程中查找并消除各个有错的数据组，也就是偏差者，查找和消除其余数据组中的有错集群，以及接着查找和必要时消除所有有错的单元。
在此，"消除"意思是在找到有错的数据组之后在其它检查中不再检查该数据组。在随后的步骤中的目标标准由此基于新的数据来获得，也就是在排除了目前已经找到的有错数据的条件下。因此该目标标准在该方法的运行过程中始终是最佳的，因为总是从其数据基础中去掉有错的值。
优选的还有，多次执行每个过程步骤，或者再次执行整个过滤过程。

为了进一步描述本发明，参照附图的实施例。分别以示意的原理图示出
图1以极度简化的图示出具有设备控制和神经网络的钢带轧制车
床，
图2示出在图1的轧制车床中产生的具有两个输入值和一个目标值的数据组，
图3示出图2的数据組的目标值，绘制在输入值之上，图4示出用于找到有错的数据组的方法的流程图。
具体实施例方式
图1以极度简化的图示出钢轧制车床2，具有相应的设备控制装置 4。在钢轧制车床2中通过示意性示出的轧制将原材料6、即金属板坯轧制成金属带8作为轧制车床2的最终产品。
设备控制装置4包括两个传感器10a, 10b，传感器10a采集原材料 6的宽度b,传感器10b采集钢轧制车床2中的轧制力F。设备控制装置 4还包括键盘12，通过该键盘未示出的工人，也就是将原材料6送入钢轧制车床2的人，将原材料6的碳含量c作为百分比数值输入。
为了控制或监视钢轧制车床2中的轧制过程，在设备控制装置4中集成了神经网络14。神经网络14模拟钢轧制过程，并在知道原材料6 的宽度b和碳含量c时在制造出金属带8之前就计算出所期待或产生的轧制力F。神经网络14由此产生对在轧制过程期间、也就是在稍后时刻
所测得的值F的预测。
因此对原材料6的每个被轧制成金属带8的块，都存在一个数据组 16,该数据组包括3个数据18a-c或变量，这些数据分别包含特定的、个体的原材料6或由这些原材料制造的金属带8的数值，即以mm为单位的宽度b，百分比的碳含量c，以及kN为单位的轧制力F。
在特定的制造日，在钢轧制车床2中总共制造M个金属带8。因此在设备控制装置4中总共累积了 M个数据组16，这些数据组在图2中示出。
对于钢轧制车床2已知以下边界条件原材料6的宽度b只能在 1100mm到1400迈m之间变化，因为只有这样的原材料8才能购买到或可以加工。原材料6中的碳含量的浓度c由其制造商保证，并在O. 30%到 0.60%之间。其它原材料肯定不能在轧制车床2中加工。只有那些经过轧制的、轧制力F在200kN到2000kN之间的金属带才作为钢轧制车床的最终产品，也就是金属带8，因为这是由设备预先给定的值。具有其它值的金属带8肯定不能在轧制车床2中通过。
M个数据组16应当接受是否有错的检查，也就是应当找到有错的数据组16并标记为有错。按照现有技术，目前通过设备控制装置4中未示出的计算单元只能检验参数b、 c、 F的间隔边界，也就是单个数据 18a-c。例如，值c<0. 30%或>0. 60%的数据组16被标记为有错的。根据上述前提条件，这种结果可能例如只是键盘12上的输入错误，因为明确已知具有这种碳含量c的原料是不能使用的。这种数据组16在图2 中已经被剔除了。图2中所有数据组的值b、 c、 F因此在单个数据18a -c的允"i午的范围内。
为了执行本发明的方法，现在在所有数据组16中选择一个数据，
也就是单个数据18c或轧制力F作为该方法的目标数据或目标值。单个数据18a、 18b或宽度b和碳含量c，将被选为该方法的两个输入数据或输入值。由此N-2。由于轧制力F实际上在轧制过程中基于轧制车床2 的设置如轧制位置、加工温度等而首先是强制地从值b和c中产生，因此该选择是有意义的。由于在极度简化的例子中，用单个数据18a、 18b (轧制车床2的所有其余参数都是恒定的)就已知对轧制力F产生影响的全部参数，因此不考虑制造容差，在事先给定值对一宽度b和碳含量 c时就能调节出始终大致相等的轧制力F。
在图3中示出所有M个数据组16。输入数据18a、 18b，也就是值b、 c在它们所允许的值域Wl和W2内跨越一个二维输入空间20,因为N = 2。因此根据现有技术中的不像真实值的前提条件，输入数据18a、 18b的所有值对必须在输入空间20内。在输入空间20中，具有号码1 - 3、M-l 和M的数据组分别通过十字来标记。单个数据18a、 18b的值在此形成笛卡儿坐标。
在根据图4的方法中，在第一步骤38中单个数据18a、 18b的值域被划分为3个分别大小相等的间隔1 至113，和I"至I"。通过划分为间隔Iu至123,输入空间20#皮分为9个单元Zu至Z33。
因此所有M个数据组16在这9个单元Zn至Z33之一中是唯一的。从而例如在单元Z31中存在全部宽度b在1300mm到n00mm之间、碳含量c在0. 30%到0. 40%之间的数据组16。每个数据组在此都具有一个目标值，也就是轧制力F。各轧制力F的划分在图4中针对单元Zn至Z33 中每一个单元分开地显示为直方图fn至f"。每个直方图对作为横坐标的相应的轧制力F都是将轧制力F的频度绘制在纵坐标上。例如，对于单元Z32的直方图f32，绘出位于单元Z32中的具有号码1和M的数据组 16。相应的1800kN和1200kN的轧制力F在直方图fu的F轴上同样通过十字标记出。
为了找到有错的数据组16，在下个步骤40中对9个单元Zu至Z33
中每一个单元计算平均值^至&，和标准偏差CTu至C733。在图3的例子
中，例如对单元31给出1400kN的平均值巧和230N的标准偏差CTn。
接着在步骤31中，计算平均的局部分散度巧。。，作为所有分散度C7n
至o"的平均值。在该示例中《。,250N。同时将全部M个数据组16的所有F值的全局分散度cv。b确定为F的最大值和F的最小值之差。
接着在循环42中，对每个单元Zu至Z33都选择为待检查单元一次。在选出的单元中检查该单元是否包含这样的数据组16,即该数据组的轧制力F与这些单元的相应平均值^至&相差超过a^^。这种检查就是本发明的检验标准。满足这些条件的数据组16被标记为有错的，并不再被考察。在单元Z3,的例子中，例如包含轧制力F在300kN附近的数据组16。该数据组在图3中被标记为错误数据22。作为参数a，在单元 Z3,中选择3。错误数据22与平均值&之间的距离大于3巧。￡。该数据组由此净皮标记为无效，并不再被考察。
换句话说，在循环42中识别出各个就单个数据18a - c来说与其它多个数据组16有偏差的数据组16,也就是所谓的偏差者，并标记为无效的数据组16。
循环42描述了识别有错的数据组16的第一可能。循环42可以单独执行，或者与下面介绍的其它方法变形结合执行。步骤40 - 42可以多次重复，直到不再找到有错的数据或错误数据22为止。
但是有益的是，上述方法变形按照在图4中执行的顺序连续执行。将在循环42中识别出的有错数据组从所有数据组16的总集合中去掉，也就是随后的检查已经是针对原始M个数据组的经过预过滤的集合或子集进行。通过消除有错的数据组，统计度量等如平均值f或标准偏差CT 更为精确，也就是i兌统计度量越来越多地对应于无错和正确的运4亍过程的值，以及与此关联的数据组16中单个数据18a-c的值。
为了识别出其他有错的数据组，在循环42之后接着进行分类步骤 44。在分类步骤44中，对每个待检查单元Zu至Zn分别按照大小、即增大还是减小地排列单个数据18c，即相应单元的所有数据组16的轧制力F。这在图3中通过直方图fn至f33也已经示出，图4又再次清楚地示出。在每两个相邻的轧制力F之间确定它们的距离26。大于边界值 P&的距离26被识别为空隙28.在该示例中，选择参数p-2。具有没有空隙28而组合起来的轧制力F的数据组16，被组合为集群或分组30a、 30b。
在图3中，单元Z,2示出在单元12中的数据组16的轧制力F的值分布，该数据组16由于空隙28被分为两个分组30a、 30b。单元Z12因此称为"异型单元"。
在这种异型单元Z!2中，存在分组之一 30a或30b与上面找到的偏
差者或错误数据22相反是有错值18c的一整个分组的怀疑。
因此在与步骤40相应的步骤46中，在单元Z!2内，对每个分组30a 和30b分开地确定各自的轧制力F的平均值巧2。和巧26，这些轧制力在图 3中也示出了。
由于在单元Zu中存在多个平均值，在本例中是两个，因此在这些平均值中不能像上面那样优先假设哪个是正确的平均值。因此必须按照其它方式来估计单元Zu中期待的正确目标值，即平均值。
因此在估计步骤48中，丢弃以数据组16为基础的过程的实验模型 32。在本例中，尝试模拟轧制车床2，使得在給定宽度值b和碳含量值 c作为输入参数时，模型32提供期待的轧制力F作为输出参数。为此在 9个单元Z 至Z33中采用除了待检查单元如单元Zu之外的所有单元来建模。也就是说，仅采用剩余的8个单元的数据组16来确定待检查单元 Z，2的估计值巧。模型32在此例如是如上所述MLP或JIT。
在估计步骤48中确定的估计值巧在图3中示出。对所有分组，在本例中也就是两个分组30a、 30b来说，检查分组30a、 30b的平均值，在本例中是巧2。和巧26哪个靠估计值巧最近。在图3中是分组30a的平均值巧2。靠估计值巧最近。该平均值被认为是有效的。剩余分组(在本例中是分组30b)的全部数据组l6因此被标记为有错的。因此在步骤48 中，对分组30a、 30b的平均值^。或^^与估计值巧之间的最小距离进行检查就是本发明的检验标准。当然该路径还可以是，将数据组16的分类和空隙18的查找按照某种方式分配给该检验标准。
因此利用步骤44到48的方法变形，还可以识别出按分组的有错的数据组16，如数据组16的分组30b，并标记为无效，然后被排除出其它方法。
然后利用在图4中在估计步骤48之后的第三种方法变形，还找出在一个单元中作为没有空隙28的封闭的分组在整体上是有错的数据组。这在图3中针对单元Z!3示出。
在步骤50中，和步骤40 —样又确定全部单元Z 至Z33的平均值^ 至F33 。但是由于在本例中中间的数据组被作为有错的数据组已经排除，因此在此在步骤50中给出平均值^至戸33的其它数值。然后再次执行与估计步骤48相对应的估计步骤52,但是仍然以经过改变的数据为基础，从而对每个单元Zn至Z33还计算出相应的估计值巧^至;^。这与步骤48
一样也是选择性地在相同的实验模型32或经过修改的实验模型32上进行，其中对每个估计值l至^L排除相应的单元Zn至Z33。
接着在检验步骤54中对每个单元Zn至Z33检验它们的平均值^至巧3是否与相应的估计值l至F33,偏差超过^^。在此不是采用局部分散度巧。j而是替换的也采用全局分散度。检验条件，也就是检验标准，就是该偏差是否小于1&。在本例中选择"-3， 1 = 0.2。
在步骤54中与步骤42 —样使用借助用因子加权的局部分散度^ 或全局分散度&。6的检验标准。
相应找到的数据组仍然被标记为无效。在图3中，在方法步骤50 至54中对单元Z,3识别出其数据组16的唯一分组34就其所计算的平均值巧3来说与根据剩余的8个单元Zn至Z33(没有Z13 )估计的平均值巧^偏差超过0. 2~。6。因此单元Zn的所有数据组16被标记为无效。
权利要求
1.一种用于在具有数据组集合(M)的设备运行时找到错误的方法，该设备尤其是自动化设备，其中每个数据组(16)具有一定数量(N)的输入数据(18a，18b)和至少一个与该输入数据相关的目标数据(18c)，其中每个输入数据(18a，18b)仅采取值域(Wn)内的值，由此输入数据(18a，18b)形成输入数据空间(20)，具有以下步骤:将至少一个值域(Wn)划分为多个间隔(Ik，n)由此在输入空间(20)中形成N维单元(Z)，这些单元分别具有所述间隔(Ik，n)作为边长，至少一个单元(Z)被选为待检验的单元(Z)，从数据组(16)的目标数据(18c)的值(F)中获得检验所选出的单元(Z)的数据组(16)的目标数据(18c)的检验标准(42，44，48)，所选出的单元(Z)的每个其目标数据(18c)的值(F)不满足检验标准(42，44，48)的数据组(16)，被识别为有错，并借助该数据组找到设备中的错误。
2. 根据权利要求1所述的方法，其中对于输入数据(18a， 18b)的所述间隔(Ik,n)是通过将该输入数据(18a， 18b)的值域(Wn)等间隔地划分为预定数量的间隔(Ik,n)来形成的。
3. 根据权利要求1所述的方法，其中对于输入数据(18a， 18b)的所述间隔(Ik,n )是采用关于该输入数据(18a， 18b )和/或目标数据(18c ) 的先验知识通过手动配置地划分该输入数据的值域(Wn)来形成。
4. 根据权利要求1至3中任一项所述的方法，其中作为检验标准 (42， 44， 48)，确定目标数据(18c)的值(F)的容差范围(P±CT )。
5. 根据权利要求4所述的方法，其中所述检验标准(42， 44， 48) 通过统计方法从目标数据(18c)的值(F)中确定。
6. 根据权利要求4或5所述的方法，其中作为额定值(P )确定所选择的单元(Z )的数据组(16 )的目标数据(18c )的平均值。
7. 根据权利要求4至6中任一项所述的方法，其中所述容差范围 (F±cj )通过用所选择的单元(Z )的相应目标数据(18c )的标准偏差 (CT)进行的加权(a， P， i)来确定。
8. 根据权利要求4至6中任一项所述的方法，其中所述容差范围 (CT)通过用相应目标数据(18c)的在所有单元(Z)上平均的标准偏差(ct)进行的加权(a， p， i)来确定。
9. 根据权利要求4至8中任一项所述的方法，其中对所有数据组(16)确定目标值的全局分散度(CTg),通过对全局分散度(cyg)的加权("/J确定所述容差范围。
10. 根据权利要求1至9中任一项所述的方法，其中产生用于将输入数据(18a， 18b )映射为目标数据(18c )的实验模型(32),采用实验模型(32 )确定所选择的单元(Z )的目标标准(48， 54 )。
11. 根据权利要求1至10中任一项所述的方法，其中基于所有单元(Z)或除了待检查单元(Z)之外的所有单元(Z)的子集来确定目标标准(48， 54)。
12. 根据权利要求1至11中任一项所述的方法，其中所选择的单元(Z)的目标值(18c)根据它们的大小分类，确定每两个相邻目标值(18c)的差(26)，将大于空隙边界值的差(26)定义为空隙(28), 将具有没有空隙地相邻排列的目标值(18c)的数据组(16)，组合成集群(30a， 30b)，将集群(30a， 30b)的数据组(16)依据检验标准(42, 44， 48) 一起识别为有错的或者没有错误。
13. 根据权利要求12所述的方法，其中为每个集群(30a， 30b) 确定属于该集群的目标值(18c)的平均值，并用所述检验标准(42， 44， 48)检验该平均值。
14. 根据权利要求12或13所述的方法，其中所述检验标准(42， 44， 48)这样来确定在离该检验标准H2， 44， 48 )最近的数据组(18 ) 或集群(3"之外的单元(Z)的所有数据组(16)都被识别为有错的。
全文摘要
本发明涉及一种用于在具有数据组集合(M)的设备运行时找到错误的方法，其中每个数据组(16)具有一定数量(N)的输入数据(18a，b)和至少一个与该输入数据相关的目标数据(18c)，其中每个输入数据(18a，b)仅采取值域(Wn)内的值，由此输入数据(18a，b)形成输入数据空间(20)，具有以下步骤将至少一个值域(Wn)划分为多个间隔(Ik，n)，由此在输入空间(20)中形成N维单元(Z)，这些单元分别具有所述间隔(Ik，n)作为边长，至少一个单元(Z)被选为待检验的单元(Z)，从数据组(16)的目标数据(18c)的值(F)中获得检验所选出的单元(Z)的数据组(16)的目标数据(18c)的检验标准(42，44，48)，所选出的单元(Z)的每个其目标数据(18c)的值(F)不满足检验标准(42，44，48)的数据组(16)，被识别为有错。
文档编号G06F11/34GK101375254SQ200780003540
公开日2009年2月25日申请日期2007年1月3日优先权日2006年1月25日
发明者E·布罗斯申请人:西门子公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：E.布罗斯
技术所有人：西门子公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。