发现时间系列中的预兆子序列的方法和系统与流程

文档序号:18413465发布日期:2019-08-13 19:02阅读:300来源:国知局
发现时间系列中的预兆子序列的方法和系统与流程

本公开总体上涉及设备故障的检测和预测,并且具体地说,使用时间系列数据来检测和/或预测机器故障。



背景技术:

现代计算机系统从各种物理系统收集大量信息。这些物理机器通常经受按规则工作周期组织的重复负载,并且往往会以一种或多或少的常规模式磨损,由于部分或完全破损而逐渐达到它们故障时的状态。保持这些机器处于良好的工作状态是与其运行相关的重要任务,并且如何以及何时执行维护对其运行的经济方面具有非常显著的影响。一种维护策略是仅在机器发生故障后进行修理(也称为纠正性维护)。这种策略往往不是最优的,因为整个故障机器的修理可能比在机器中断之前更换单个部件更昂贵,并且机器故障也可能导致材料浪费,不可接受的产品质量,甚至可能危及操作机器的人员。在纠正性维护不可行或经济选择的情况下,使用不同的策略-以固定间隔(例如,一年)定期维护机器。这种以安全为关键的机器的例子是电梯和汽车;在世界上大部分地区,它们的维护每年进行一次,并且颁发对应证书。这种策略通常称为预防性维护。



技术实现要素:

[技术问题]

尽管预防性维护解决了与机器维护相关联的安全问题,但在许多情况下,其在经济上不是最佳的。预防性维护的第一个问题是维护周期的长度通常是任意的(例如,一年或一个月),并且更多的是有关检查机构的便利性和检查过程的后勤工作(例如,发布汽车检查标签),而不是机器的实际需要。第二个问题是单个维护周期对于一组机器中的所有机器来说可能不是最佳的,其中一些机器是新的并且可能不需要经常需要,而旧机器可能需要更频繁的维护。

在机器分析行业,通常将传感器用于测量机器参数。随着机器操作仪表化的增加,从监测机器运行的传感器收集大量数据。来自一些传感器的数据也可能以相对较高的频度生成,这进一步导致大量数据。可以分析来自与机器相关联的传感器的数据流以确定机器的状态。例如,在一些情况下,可以分析来自与机器相关联的传感器的数据流以确定机器是否未按预期执行(这被称为设备故障)。无法快速处理来自传感器的数据可能导致信息丢失,这些信息可能指示或预测机器故障。因此,本领域需要一种从大量数据中检测和/或预测机器故障的改进方法。

本公开的一些实施方式基于如下认识:最普遍地,通过在可以对机器故障进行预测时的当前时刻之前的任何时间观测的信息,可以指示机器的状况。这可以包括在当前时刻或之前的任何时刻的任何观测变量的任何传感器读数,并且另外包括任何有序或无序的、连续或非连续的一组这样的读数。例如,本公开的实施方式包括在时间系列中发现具有关于将来事件(如机器的故障)的最大预测力的子序列。我们的认识包括至少一个假设,即,在事件发生之前的某个时间,该时间系列的特征将作为即将发生的事件的前兆而改变。这种变化可能被表达为出现之前未见过的一个或更多个子序列,我们将其识别为“预测模式”。

在解决检测和预测机器故障的问题时,必须克服几个挑战。例如,首先发现分析可能条件描述的整个空间是一项计算繁重的任务,而且,该空间中的许多可能条件描述符不太可能对应于可能指示将来故障的典型早期警告信号。基于此,需要将条件描述符的空间限制为较小的子空间。在限制条件描述符的空间时,首先将条件描述符表示为一个或更多个观测变量的时间滞后窗口,并且窗口长度固定。如果采用这种固定长度的描述符,那么可以根据收集的历史数据构建训练数据集,其中该训练集中的每个例子包含输入矢量,该输入矢量对应于来自该时间系列中的时间点的选择条件描述符,并且标量输出变量是该时间故障之前的时间。然后可以通过利用机器学习算法来处理训练例的这种格式。

然而,我们面临着第二个挑战,即,为了应用固定长度的描述符,需要知道时间窗口的正确大小,而这是未知的。我们发现,尝试确定时间窗口的正确大小是一项比我们想象的更难克服的任务。因为通过拟合单独的预测模型来尝试所有可能的大小在计算上是不实际的,而且,尚不清楚如何比较所有模型的预测准确度以便确定最好的一个。

我们通过实验认识到,如果分析了哪些模式在时间系列的正常区段中没有出现,但确实发生在接近故障的区段中,即,异常时间系列,那么时间系列中的模式可以高度预测将来的故障。本公开的方法和系统使观测到的从候选模式到正常时间系列的最接近距离与观测到的候选模式到异常时间系列的最接近距离之间的间隔(margin)最大化。后处理步骤消除了在正常运行期间可能自然发生的重复模式。

换句话说,基于我们的认识,可以从故障时刻开始迭代地搜索异常区域,每次迭代都能够将特定划分定义成正常区域/异常区域。例如,针对每次迭代,可以应用小形(shapelet)发现算法来搜索预测模式,直到发现最佳预测模式。使用小形发现算法的至少一个优点是获取不同长度的预测模式的有效搜索。在内部,小形发现算法根据预定测量标准来优化预测模式,例如,预测模式应当尽可能与异常区域中的一个模式相似并且尽可能与正常区域中的所有模式不同。

然而,对于这样的测量标准,我们发现搜索正确长度的正常区域的过程受限,因为其总是试图最小化正常区域的长度,因为较小的正常区域不太可能包括预测模式(空的正常区域根本不包括模式)。我们注意到,如果不正确地选择了正常区域,那么预测模式可以完美地表征正常行为。因此,为了克服这个其它限制,我们认识到,一种解决方案是在测量标准中增加预测模式应当仅存在于异常区域中一次的条件。这允许我们在时间系列中发现具有关于将来事件(如故障等)的最大预测力的子序列。

[问题的解决方案]

根据本公开实施方式,提供了一种确定表示机器运行的时间系列数据中的模式的系统。所述系统包括与所述机器通信的传感器以及输出接口。计算机可读存储器存储和提供由与所述机器通信的所述传感器生成的一组训练数据例。其中,每个训练数据例表示所述机器在以所述机器故障为结束的时段内的运行。与所述计算机可读存储器通信的处理器被配置成将所述一组训练数据例中的每个训练数据例迭代地划分成正常状态区域和异常状态区域。所述处理器还确定所述正常状态区域中不存在并且仅在每个异常状态区域中出现一次的预测模式,并且确定所述异常状态区域的长度。其中,每次迭代包括:(1)选择每个训练数据例内的所述异常状态区域的当前时间系列长度,该当前时间系列长度从所述机器进入异常运行模式时的估计时刻开始,并且在所述机器故障时刻结束。其中,每次迭代,所述当前时间系列长度从时间系列开始到所述机器故障结束被缩短一个时间步长的增量,使得所述当前时间系列长度短于所述训练数据例内为前一迭代选择的所述异常状态区域的前一当前时间系列长度;(2)将所述一组训练数据例中的每个训练数据例划分成所述正常状态区域和具有所述当前时间系列长度的所述异常状态区域;(3)识别所述一组训练数据例中的模式,使得该模式不同于所述一组训练数据例中的所有正常状态区域中存在的任何其它模式,并且类似于所述一组训练数据例的每个异常状态区域中的正好一个模式;并且(4)如果发现该模式,则选择该模式作为所述预测模式。最后,经由与所述处理器通信的输出接口输出所述预测模式或者将所述预测模式存储在所述计算机可读存储器中,其中,所述预测模式是对即将发生的故障的预测估计并帮助管理所述机器。

根据本公开另一实施方式,提供了一种在表示机器的运行的时间系列数据中确定模式的方法。所述方法包括:访问存储在计算机可读存储器中的一组训练数据例,所述一组训练数据例由与所述机器通信的传感器生成。其中,每个训练数据例表示所述机器在以所述机器故障为结束的时段内的运行。通过所述计算机:将所述一组训练数据例中的每个训练数据例迭代地划分成正常状态区域和异常状态区域;确定所述正常状态区域中不存在并且仅在每个异常状态区域中出现一次的预测模式;并且确定所述异常状态区域的长度。其中,每次迭代包括:(1)选择每个训练数据例内的所述异常状态区域的当前时间系列长度,该当前时间系列长度从所述机器进入异常运行模式时的估计时刻开始,并且在所述机器故障时刻结束。其中,每次迭代,所述当前时间系列长度从时间系列开始到所述机器故障结束被缩短一个时间步长的增量,使得所述当前时间系列长度短于所述训练数据例内为前一迭代选择的所述异常状态区域的前一当前时间系列长度;(2)将所述一组训练数据例中的每个训练数据例划分成所述正常状态区域和具有所述当前时间系列长度的所述异常状态区域;(3)识别所述一组训练数据例中的模式,使得该模式不同于所述一组训练数据例中的所有正常状态区域中存在的任何其它模式,而是类似于所述一组训练数据例的每个异常状态区域中的正好一个模式;并且(4)如果发现该模式,则选择该模式作为所述预测模式。最后,将所述预测模式存储在与所述计算机通信的所述计算机可读存储器中,或者经由与所述计算机通信的输出接口输出所述预测模式。其中,所述预测模式是对即将发生的故障的预测估计并帮助管理所述机器。

根据本公开另一实施方式,一种包含可通过计算机执行的程序的非暂时性计算机可读存储介质,该程序用于执行方法。所述方法包括以下步骤:访问存储在所述非暂时性计算机可读存储介质中的一组训练数据例,所述一组训练数据例由与所述机器通信的传感器生成的。其中,每个训练数据例都表示所述机器在以所述机器故障为结束的时段内的运行。通过与所述非暂时性计算机可读存储介质通信的所述计算机:将所述一组训练数据例中的每个训练数据例迭代地划分成正常状态区域和异常状态区域;确定所述正常状态区域中不存在并且仅在每个异常状态区域中出现一次的预测模式;并且确定所述异常状态区域的长度。其中,每次迭代包括:(1)选择每个训练数据例内的所述异常状态区域的当前时间系列长度,所述当前时间系列长度从所述机器进入异常运行模式时的估计时刻开始,并且在所述机器故障时刻结束。其中,每次迭代,所述当前时间系列长度从时间系列开始到所述机器故障结束时缩短一个时间步长的增量,使得所述当前时间系列长度短于所述训练数据例内为前一迭代选择的所述异常状态区域的前一当前时间系列长度;(2)将所述一组训练数据例中的每个训练数据例划分成所述正常状态区域和具有所述当前时间系列长度的所述异常状态区域;(3)识别所述一组训练数据例中的模式,使得该模式不同于所述一组训练数据例中的所有正常状态区域中存在的任何其它模式,并且类似于所述一组训练数据例的每个异常状态区域中的正好一个模式;并且(4)如果发现该模式,则选择该模式作为所述预测模式。最后,将所述预测模式存储在所述非暂时性计算机可读存储介质中或者经由与所述计算机通信的输出接口输出所述预测模式,其中,所述预测模式是对即将发生的故障的预测估计并帮助管理所述机器。

参照附图,对目前所公开实施方式加以进一步描述。所示附图不一定是按比例的,相反,要强调的是,通常被置于例示目前所公开实施方式的原理之下。

附图说明

图1a是例示根据本公开实施方式的确定表示机器的运行的时间系列数据中的模式的系统的框图。

图1b是例示根据本公开实施方式的、图1a的系统的组件的框图。

图1c是例示根据本公开实施方式的、图1a的实值时间系列中的预测模式的图。

图1d是例示图1a的根据本公开实施方式确定表示机器的运行的时间系列数据中的模式的系统步骤的框图。

图2是例示根据本公开实施方式的使用强力最大间隔算法来发现子序列的最大间隔(maxbound)的图。

图3是例示根据本公开实施方式的使用强力最小间隔算法来发现子序列的最小间隔(minbound)的图。

图4是例示根据本公开实施方式的搜索所有可能预测模式的图。

图5是例示根据本公开实施方式的使用mdl的基本概念的图,使用mdl来比较两个子序列的相似性以评估子序列的相似性。

图6是例示根据本公开实施方式的在t未知时并且使用基于mdl概念的算法来确定合适t的图,图6示出了当t太大时。

图7是例示根据本公开实施方式的发现正常模式的最大可能时段的图。

图8是例示根据本公开实施方式的重置t的图。

图9a是例示根据本公开实施方式的另一实施方式的步骤的框图,所述步骤并入来自第二机器的测试数据的以识别预测模式,并且使用先前存储的预测模式与第二机器的所识别的预测模式相比较来预测第二机器的故障。

图9b是例示根据本公开实施方式的、图9a的系统的组件的框图。

图10a是例示根据本公开实施方式的另一实施方式的步骤的框图,所述步骤并入来自与第三机器类型不同的传感器的测试数据流,使用先前存储的预测模式与第三机器的所识别的两个预测模式相比较来预测第三机器的故障。

图10b是例示根据本公开实施方式的、图10a的系统的组件的框图。

图11a是例示根据本公开实施方式的另一实施方式的步骤的框图,所述步骤并入来自与第四机器类型相同的传感器的测试数据流,使用先前存储的预测模式与第四机器的超过预定阈值的所识别的预测模式相比较来预测第四机器的故障。

图11b是例示根据本公开实施方式的、图11a的系统的组件的框图。

图11c是例示并入来自与第五机器的类型相同的传感器的测试数据流的另一实施方式的步骤的框图。

图12是例示根据本公开实施方式的、可以利用另选计算机或处理器来实现的图1a的方法的框图。

图13是例示根据本公开实施方式的确定表示机器的运行的时间系列数据中的模式的另一方法的框图。

具体实施方式

虽然上述附图阐述了目前公开的实施方式,但也可以设想其它实施方式,如讨论中提到的。本公开通过表述而非限制的方式来呈现例示性实施方式。本领域技术人员可以设计出落入目前所公开实施方式的原理的范围和精神内的许多其它变型例和实施方式。

下面的描述仅提供了示例性实施方式,而非旨在对本公开的范围、适用性,或构造进行限制。相反,示例性实施方式的以下描述将向本领域技术人员提供用于实现一个或更多个示例性实施方式的使能描述。在不脱离如所附权利要求书中阐述的所公开主旨的精神和范围的情况下,设想了可以对部件的功能和排布结构进行的各种改变。

在以下描述中给出具体细节以提供对实施方式的透彻理解。然而,本领域普通技术人员应当明白,这些实施方式可以在不需要这些具体细节的情况下来实践。例如,所公开主旨中的系统、处理以及其它部件可以以框图形式示出为组件,以便在不必要的细节上模糊这些实施方式。在其它情况下,公知的处理、结构,以及技术可以在没有不必要的细节的情况下被示出,以便避免模糊这些实施方式。而且,各个附图中的相同标号和指定表示相同部件。

而且,单独的实施方式可以被描述为被描绘为流程图、程序框图、数据流图、结构图,或框图的处理。尽管流程图可以将操作描述为顺序处理,但许多操作可以并行或同时执行。另外,操作的次序可以重新排列。处理可以在其操作完成时终止,但可以具有图中未讨论或包括的附加步骤。而且,并非任何具体描述处理中的所有操作都可能发生在所有实施方式中。处理可以对应于方法、功能、过程、子例程、子程序等。当一个处理对应一个函数时,该函数的终止可以对应于该函数返回至调用函数或主函数。

而且,所公开主旨的实施方式可以至少部分地、人工或自动实现。可以通过使用机器、硬件、软件、固件、中间件、微代码、硬件描述语言,或任何其组合来执行或至少辅助手动或自动实现。当以软件、固件、中间件或微代码实现时,执行必要任务的程序代码或代码段可以存储在机器可读介质中。处理器可以执行必要的任务。

术语定义

根据关于本公开的术语的定义,术语“小形”可以被定义为时间系列的特征子序列,其有助于区分该时间系列所属于的类别。

本公开实施方式的概述

图1a和图1b是例示根据本公开实施方式的确定表示机器(即,发电机102)的运行的时间系列数据中的模式的系统100的框图。系统100包括与机器102通信的传感器104。计算机可读存储器112存储和提供由与机器102通信的传感器104生成的一组训练数据例。其中,每个训练数据例表示以机器102故障为结束的时段内的机器102的运行。传感器104收集机器102的运行数据,该运行数据可以存储在存储器106中或直接去往输入接口/预处理器108,并接着发送至处理器114。在处理时,数据被存储在存储器112中或经由输出接口116输出。

本公开的至少一个实现基于在时间系列中发现具有关于将来事件(如故障)的最大预测力的子序列。至少有一个潜在的假设是在事件发生前的某一个时间t,该时间系列的特征将作为即将发生的事件的前兆而改变。这种变化可以被表达为出现之前未见过的一个或更多个子序列。将这种子序列定义或称为“预测模式”,如上所述。

仍参照图1a和图1b,如果t已知,那么这个问题可以简化成监督学习问题,其中,系统状态在故障前的时间t内可以被认为是异常的,而对于其余时间来说是正常的。该目的是学习区分正常状态与异常状态的分类器。然而,该系统的实际健康状况通常是不可观测的,假设其由一些可检测的预测模式表示。如果在每个时间系列中只有一个预测模式,则可以无需修改就将小形发现算法应用于该问题。但在现实生活系统中,并非总是如此。希望检测尽可能多的预测模式,使得能够及早预测故障。此外,最终目标不是分类,而是通过检查预测模式是否与时间系列的某些部分相匹配来预测时间系列中故障的发生。小形发现算法并不总能保证这种“匹配”。因此,设计了一种最大间隔算法,该算法能够在故障之前发现在两个或更多个时间系列中出现的所有预测模式。为了加速搜索,设计了一个上限,其能够删减实验中超过60%的数据。

然而,在大多数情况下,t实际上是未知的,这大大加重了这个问题。如果猜测t的值太小,那么可能会不考虑该预测模式。如果猜测的t太大,那么搜索空间呈平方地增长,并且很可能会发现虚假的正常模式,只是因为那些模式没有足够的时间在我们猜测的系统变化点之前显露出来。例如,假设时间系列的长度为n,并且t远大于n/2,那么可能会发现长度为n-t的大量子序列,这些子序列完全区分正常状态和异常状态,只要这些子序列没有直接出现在时间系列的开头。

为了最大化发现有用预测模式并避免发现虚假规律的机会,设计了一种基于最小描述长度概念的算法来帮助确定合适的t。

仍参照图1a和图1b,如果假设t是已知的,那么系统状态在故障前的时间t内可以被认为是异常的,而对于其余时间来说正常。该目的是学习可以用于区分正常状态与异常状态的子序列。尽管该系统的实际健康状况通常是不可观测到的,但假设其表现为一些可检测的预测模式。

如果将此视为分类问题,那么将发现小形发现算法是直接适用的。然而,小形发现算法或其它分类算法在它们仅发现最小子序列集合来区分异常区域与正常区域时它们就会终止,而在现实生活系统中,可以存在比最小集合多很多的预测模式。在我们的问题设定中,发现所有这些模式是可取的,以这种方式,我们将能够做出更早且更准确的预测。此外,分类算法不能总是保证某些模式的“出现”,因为类别拆分点/边界可能离类别中心很远。因此,分类算法在此不符合我们的需求。

然而,在讨论发现预测模式之前,首先需要在形式上规定一种方法来衡量时间系列子序列的预测能力。通常,我们希望预测模式:(a)是时间系列的异常区域中的子序列;(b)与任何时间系列的正常区域中的任何子序列非常不同;以及(c)与另一个时间系列的异常区域中的至少一个子序列非常相似。

条件(a)和(b)可以是直观的。条件(c)也是必需的,因为如果模式只出现在一次性系列中,其很可能是噪声,而且不能将其概括为预测规律。因此,数据集中的时间系列越多越好。

图1c是例示根据本公开实施方式的、图1a的实值时间系列中的预测模式115的图。其中,该图的各个方面标记为:预测模式1–115、“n”-417、正常区域-118、异常区域t-119以及故障点-121。

其中,图1c示出了实值空间中的问题的示例。图1c的子序列(即,标记为“预测模式”)115是符合所有三个条件的唯一子序列,并且是我们希望识别的预测模式。

因而,如何才能学会怎样识别可用于区分正常状态与异常状态的子序列而不是获取可能是噪声的模式,并且以测量(即,标识该组训练数据例中的预测模式)时间系列子序列的预测能力的结果而结束?

本公开的系统最初开始(即,图1a的步骤1)访问一组训练数据例并选择每个训练数据例中的异常状态区域的初始当前时间系列长度,该异常状态区域从机器进入异常运行模式时的估计时刻开始,并且在所述机器故障时刻结束。应注意,预测模式候选可以具有各种长度。目前,假设长度是固定值或初始当前时间系列长度,并且假设具有n个时间系列或例如图1c的“n”117的数据集。记住,如上提到,假设t已知,因此,系统状态在故障前的时间t内可以被认为是异常的,而对于其余时间来说正常。而且,该目的是学习可以用于区分正常状态与异常状态的子序列。尽管该系统的实际健康状况通常是不可观测到的,但假设其表现为一些可检测的预测模式。

图1a的步骤2包括将每个训练数据例划分成正常状态区域和异常状态区域。如上提到,由于知道t,因此,可以将整个数据集拆分为具有所有时间系列中的正常区域的正常数据集和具有所有时间系列中的异常区域的异常数据集。

图1a的步骤3包括识别该组训练数据例中的模式,其中,该模式不同于该组训练数据例中的所有正常状态区域中存在的任何其它模式,而是类似于该组训练数据例的每个异常状态区域中的正好一个模式。然而,“非常不同”有多么不同,并且“匹配”有多相似?

图1a的步骤4包括迭代地划分每个训练数据例,其包括通过每次迭代将当前时间系列长度缩短一个时间步长的增量,因此当前时间系列长度短于该训练数据例内为前一迭代选择的异常状态区域的前一当前时间系列长度。至少一个方面包括仅将异常区域缩短一个时间步长,这意味着正常区域相应地增加一个时间步长。用作训练例的时间系列的总持续时间在所有迭代中保持不变,并且在不同迭代中进行进行不同划分。

图1a的步骤5包括如果发现该模式,则选择该模式作为预测模式。最后,图1a和图1b经由与处理器114通信的输出接口116输出预测模式或者将该预测模式存储在计算机可读存储器112中,其中,该预测模式是对机器102即将发生的故障的预测估计并帮助管理机器102。

因此,根据本公开,图1c例示了图1a的实值时间系列中的预测模式115。其中,图1c示出了实值空间中的问题的例子,并且图1c的子序列(即,标记为“预测模式”)115是符合所有三个条件的唯一子序列,并且是我们希望识别的预测模式。记住,这三个条件包括:(a)是时间系列的异常区域中的子序列;(b)与任何时间系列的正常区域中的任何子序列非常不同;以及(c)与另一个时间系列的异常区域中的至少一个子序列非常相似。这可以用另一种方式表达为:识别该模式,该模式不同于该组训练数据例中的所有正常状态区域中存在的任何其它模式,而是类似于该组训练数据例的每个异常状态区域中的正好一个模式,即,图1c的预测模式115。

本公开的组件方面

参照图1b,组件可以提供本公开的附加特征。例如,处理器114可以是计算机110的一部分,即,计算机或处理器,其中,计算机110可以包括输入接口108,以从传感器104接收训练数据和/或从可能的外部存储器装置106接收训练数据。其中,外部存储装置106存储由传感器104根据机器102的运行生成的训练数据。然而,系统可能是基于实时的,使得传感器104可以根据系统的具体需求、系统的用户、需要系统的特定运行配置,直接与输入接口108、存储器112或处理器114通信。而且,传感器104可以生成包括参数的数据,使得每个参数可以涉及机器的运行,包括以下各项中的一个或组合:流体力(fluidforce)数据、流体能量数据、振动数据、温度数据、电压数据或电流数据。

仍参照图1b,传感器104可以持续测量机器的电气特性并提供传感器数据流,它们可以在被存储和/或现场处理或者中继至另一个位置。传感器104可以测量/感测参数,诸如机器的压力或其它可测量的类似参数。例如,传感器104可以在一周期间按每天一次的间隔并且在另一周期间按不同间隔对来自机器102的参数进行采样。而且,标识训练数据流进入存储器112的进入时间、日期和时间的定时信息可以包括在存储器112中。而且,用于标识训练数据流中的无效数据的定时信息可以存储在存储器112中。例如,无效数据可能是故障传感器的结果。

仍参照图1b,预期各个机器可以来自由电梯、汽车、空调机、电动机、发电机等,甚至整个工厂所组成的组。而且,时间系列数据可能是从动物(如人)的器官收集的数据,所述数据提供可以经由传感器104监测或记录的电气模式,因此数据可以由本公开的系统100获取并处理。

仍参照图1b,输入接口/预处理器108可以被配置成在从传感器接收到数据时检测故障的传感器,其中,如果确定传感器故障,则可以去除在特定时段期间与该故障传感器相关联的任何数据。可能的是,输入接口/预处理器108可以基于与训练数据流一起提供的信息(即,定时信息或其它信息),仅从该训练数据流的不包括无效数据(无效数据例如是指在传感器发生故障时生成的训练数据)的部分提取训练数据例。输入接口/预处理器108还可以将在传感器104生成训练数据流之后存储在存储器112中达超过用户预先指定时段、天数等的较长时间的训练数据考虑为无效,并且排除训练数据流中的包括这种数据的部分。接口/预处理器108可以执行训练数据例的提取,使得相邻训练数据段之间的交叠足以减少相邻训练数据段之间的数据的不希望的冗余。应注意,相邻训练数据例之间的交叠可以设定成或限制成约10%、30%、40%、50%、60%、70%或80%的最大值,或者10%至80%之间的某一增量,诸如15%、25%、35%等。

本公开步骤的实施方式

图1d是例示根据本公开实施方式的、图1a和图1b的系统步骤的框图,所述系统步骤确定表示机器的运行的时间系列数据中的模式。

参照图1d的步骤145和步骤150,步骤145包括访问存储器112以获取该组训练数据例。步骤150规定了该组训练数据例中的每个训练数据例表示机器102在以故障为结束的时段内的运行。

图1c的步骤155包括为每个训练数据例内的异常状态区域选择当前时间系列长度,该当前时间系列长度在所估计的故障时刻并且在发生故障时结束。例如,假设时间系列的长度为n,并且t远大于n/2,那么可能会发现长度为n-t的大量子序列,它们完全区分正常状态和异常状态,只要该子序列没有直接出现在时间系列的开头。

图1c的步骤160包括将每个训练数据例划分成正常状态区域和异常状态区域。应注意,一组训练数据例的时段可以是以下之一:相同的时段,或者所述一组训练数据例中的一些训练数据例具有与所述一组组训练数据例中的其它训练数据例时段不同的时段。而且,该组训练数据例中的每个训练数据例可以按规则采样率采样,或对于该组训练数据例是近似相同时段。

图1c的步骤165包括特定于正常状态区域的数据,使得正常状态区域包括机器的正常运行而没有任何机器故障迹象。应注意,候选预测模式可以具有各种长度。现在假设该长度是固定值l。假设具有n个时间系列的数据集:d={d1,d2,…,dn}。因为知道t,所以可以将整个数据集分成具有所有时间系列中的正常区域的正常数据集dnormal={d1,normal,d2,normal,…,dn,normal}。如上提到,处理器基于标识该组训练数据例中的每个训练数据例的、在机器正常运行时由机器的传感器生成的部分的数据,将该训练数据例划分成正常状态区域,并且基于标识该组训练数据例中的每个训练数据例的、在该机器无法正常运行并且最后导致该机器故障时由机器的传感器生成的部分的数据,将该训练数据例划分成异常状态区域。

图1c的步骤170包括特定于异常状态区域的数据,以使异常状态区域对应于该机器无法正常运行而以机器故障结束。而且,异常状态区域的当前时间系列长度是该组训练数据例中的每个训练数据例的异常状态区域内的离散时间数据量。例如,因为知道t,所以可以将整个数据集分成具有所有时间系列的异常区域的异常数据集dabnormal={d1,abnormal,d2,abnormal,…,dn,abnormal}。假设具有候选si,j,其是第i个时间系列中的di,abnormal异常区域的子序列。si,j在di,abnormal的第j个数据点开始并且具有长度l。假设dnormal中的最近邻si,i为距离为并且中的最近邻si,j为距离为然后希望发现最大化并且最小化的子序列si,j。然而,通常不可能同时进行最大化和最小化。因而,作为合理近似,将具有长度l的预测模式候选规定为在di,abnormal的第j数据点开始的子序列si,j,使得而且,如果该预测模式与正常区域中的模式之间的欧几里德距离超过预先指定阈值,那么该预测模式与正常区域中的模式不同。更进一步地,如果该预测模式与正常区域中的模式之间的欧几里德距离低于预先指定阈值,那么该预测模式与正常区域中的模式被视为相似。

图1c的步骤175包括识别一组训练数据例中的模式,使得该模式不同于该组训练数据例中的所有正常状态区域中存在的任何其它模式,而是类似于该组训练数据例的每个异常状态区域中的正好一个模式。例如,我们将规定为si,j的间隔,并且将寻找具有固定长度l的预测模式候选的算法称为最大间隔算法。应注意,搜索预测模式可以通过快速小形发现算法来执行。

参照图1c的步骤180和步骤185,步骤180包括迭代地划分每个训练数据例,并且步骤185包括每次迭代将当前时间系列长度缩短一个时间步长的增量,因此当前时间系列长度短于该训练数据例内为前一迭代选择的异常状态区域的前一当前时间系列长度。如上提到,至少一个方面包括仅将异常区域缩短一个时间步长,这意味着正常区域相应地增加一个时间步长。用作训练例的时间系列的总持续时间在所有迭代中保持不变,并且在不同迭代进行不同地划分。

图1d的步骤190包括如果方向该模式则选择该模式作为预测模式。根据本申请,上述特定步骤可以不必采用如上所述的顺序,而是采用某一其它顺序。

最大间隔算法

图2是例示根据本公开实施方式的使用强力最大间隔算法来发现子序列的最大间隔(maxbound)的图。其中,“r”205表示在异常数据集中的随机选择的子序列,“s”210表示异常数据集中的候选预测子序列,rnnn215表示正常数据集中的与r最相似的子序列,而snnn220表示正常数据集中的与s最相似的子序列。这里的相似性是根据适当选择的距离度量来规定的,例如,相同长度l的两个子序列之间的欧几里德距离

如果使用强力最大间隔算法,那么需要搜索dabnormal中的长度为l的所有子序列,并且针对每个子序列si,j,需要在dnormal和两者中发现该子序列的最近邻。如果假设数据集中的时间系列数量为n,并且每个时间系列的最大长度为m,那么该算法的复杂性为o(m2n2l)。即使使用更聪明的技巧来加速欧几里德距离的评估以便分离出o(l)的复杂性,复杂性仍为o(m2n2)。如果搜索所有长度的子序列,那么复杂性变为o(m3n2),在数据集很大的情况下,这是难以处理的。

每个子序列的最近邻搜索具有复杂性o(mn)。如果可以降低数据集中大部分子序列的复杂性,那么可以极大地加速该算法。因此,代替使用强力算法,在此引入针对子序列最大间隔的新颖上限。如果该上限超过最佳间隔,那么可以简单地删除该子序列,并且避免寻找最近邻。

由于si,j的间隔为因此可以独立得到针对的上限和针对的下限。使用maxbound来表示的上限,而使用minbound来表示的下限。那么,si,j的间隔的上限为maxbound-minbound。

假设当前候选为s=si,j,其是di,abnormal中的子序列。具有di,abnormal中的随机子序列r≠s。dnormal中的r的最近邻为rnnn,而s的最近邻为snnn,如图2中所示。然后具有dist(s,snnn)≤dist(s,rnnn)。如果具有di,abnormal中的固定数量的这种随机子序列r1,r2,…,rp,则具有dist(s,snnn)≤min(dist(s,rnnn))。这得到了s的maxbound。

图3是例示根据本公开实施方式的使用算法来发现子序列的最小间隔(minbound)的图。其中,“r”305表示异常数据集中的随机选择的子序列,“s”310表示异常数据集中的候选预测子序列,rnnab315表示异常数据集中与r最接近的子序列,并且snnab320表示异常数据集中与s最接近的子序列。

现在,假设中的r的最近邻为rnnab,并且s的最近邻为snnab,如图3中所示那样。然后,具有dist(s,snnab)≥dist(r,snnab)-dist(r,s)≥dist(r,rnnab)-dist(r,s)。如果具有di,abnormal中的固定数量的这种随机子序列r1,r2,…,rp,那么具有dist(s,snnab)≥max(dist(r,rnnab)-dist(r,s))。这得到了s的minbound。现在,具有s的间隔的上限:dist(s,snnn)-dist(s,snnab)≤maxbound-minbound。

表1示出了由上限加速的智能最大间隔算法。该算法采用数据集d、固定的t、候选子序列的长度l以及随机子序列的数量r作为输入,然后输出具有最大间隔的预测模式pp,异常区域中预测模式的最近邻是ppnn,并且最大间隔值是mm。

表1最大间隔算法

第1行至第5行根据t将整个数据集划分成普通数据集和异常数据集。第8行至第17行在第i个异常时间系列中随机选择长度为l的r子序列,并在dnormal和两者中发现它们的最近邻。在中描述了的最近邻搜索算法findnn。第19行至第36行在具有最大间隔的第i异常时间系列中搜索长度为l的子序列s。第22行和第23行分别计算s的maxbound和minbound。表2中示出了计算maxbound,表3中示出了计算minbound。两种算法的第3行中的ed函数评估两个子序列之间的欧几里德距离。

表2maxbound算法

表3minbound算法

通过maxbound和minbound评估的间隔上限大大加速了最大间隔算法。到目前为止,实验显示加速达一个数量级以上。

选择所有长度的最佳预测模式

最大间隔算法展示了如何发现具有固定长度l的最佳预测模式。由于l未在时间系列中给出,因此需要搜索所有可能的长度,并且规定长度不变的最大间隔度量。在这里,仅仅选择长度为的子序列。

通过mdl寻找所有可能的预测模式

图4是例示根据本公开实施方式的通过利用最小描述长度(mdl)的所有可能预测模式的图。其中,该图的各个方面标记为:预测模式1-115,第二预测模式-416,“n”-417,正常区域-418,异常区域t-419以及故障点-421。

直到现在,有一种方法可以在运行直至故障(run-to-failure)时间系列的数据集中发现最具预测性的模式。但有时在该时间系列中可能存在超过一个预测模式。例如,图4示出了在机器的几个部分损坏时,可以首先检测到指示部分1破裂的时间系列子序列,然后是指示部分2破裂的另一时间系列子序列等。

另请注意,最大间隔算法仅在异常区域中选择一对相似的子序列,因而它们只与两个时间系列有关。如果有超过两个时间系列,那么还需要在其余时间系列中发现预测模式的“匹配”。

仍参照图4,在数据集中发现完全相同的两个子序列非常困难,因为信号中总是存在噪声。可能想到建立距离阈值来区分“匹配”和“不匹配”,但没有正式的方法来设定这种阈值。而且,鉴于种类繁多的子序列长度、形状等,需要规定许多这样的阈值,这是不可行的。

图5是例示根据本公开实施方式的使用mdl的基本概念的图,使用mdl来比较两个子序列的相似性,以评估子序列的相似性。其中,该图的各个方面标记为:“a”529是熵(a),“a1”531是熵(a1),而“h”533被称作假设。而且,mdl是这个问题的解,使得示出利用mdl来评估子序列相似性的基本概念。

本质上,可以使用描述长度(dl:descriptionlength)来表示为表达子序列所需的位长度。熵是dl的良好度量。具有dl(a)=entropy(a),dl(h)=entropy(h),a′=a-h和(a′)=entropy(a′)。h被称作假设。如果将子序列视为假设,那么代替使用dlold=dl(a)+dl(h)个位来表示所述一对a和h,可以使用dlnew=entropy(h)+entropy(a-h)。这里节约的位数是bittosave=dlnew-dlold=dl(a)-dl(a-h)。这两个子序列彼此非常相似,因此在这种情况下,dl(a′)=entropy(a′)非常小。结果,bittosave是一个很大的正数。所以本质上,如果子序列彼此非常相似,那么应当具有很大的正bittosave。否则bittosave是负的。

仍参照图5,详细描述了如何基于mdl按时间系列制成子序列集群。在这里,使用类似方法在运行直至故障时间系列中寻找预测模式集群,但其在下列方面不同:

(1)在多个时间系列而不是仅一个时间系列的异常区域中寻找预测模式;

(2)基于最大间隔算法而不是模体(motif)发现算法来寻找候选预测模式;

(3)主循环中的例程是不同的:

(a)如果异常区域中不再有未标记子序列,则结束。否则通过最大间隔算法发现一对预测模式;

(b)然后通过评估bittosave来调查这对模式是否匹配。如果bittosave<0,则结束。否则,使用createcluster处理来为发现的预测模式创建一个集群;以及

(c)然后,迭代地使用addtocluster处理将子序列添加至预测模式集群,直到bittosave≤0。标出添加的所有子序列。然后再次转向(a)。

(4)不使用mergecluster处理。

直到这一点,能够在知道t时发现所有预测模式。

当t未知时

图6是例示根据本公开实施方式的在t未知时并且使用基于mdl概念的算法来确定合适t的图,并且示出了当t太大时。其中,该图的各个方面标记为:假的正常模式612,异常区域t-619以及故障点-621。

图7是例示根据本公开实施方式的发现正常模式的最大可能时段的图。其中,该图的各个方面标记为:假的正常模式712,潜在预测模式p-749以及故障点-721。

图8是例示根据本公开实施方式的重置t的图。其中,该图的各个方面标记为:预测模式-815,异常区域t-819以及故障点-821。

参照图6、图7及图8,在大多数现实生活中,t实际上是未知的,这大大加重了这个问题。如果猜测t的值太小,则可能仅因为无法在异常区域发现该预测模式而不考虑它。

图6示出当t太大时,例如,如果猜测的t太大,则搜索空间呈平方式增长,并且很可能会发现假的正常模式612,只是因为那些模式没有足够的时间在我们猜到的系统变化点之前显露出来。图6的图例示了当t未知时,和使用基于mdl概念的算法来确定合适的t。例如,假设时间系列的长度为n,并且t远大于n/2,那么可能会发现长度为n-t的大量子序列,它们完全区分正常状态和异常状态,只要这些子序列没有直接出现在时间系列的开头。

图7是例示根据本公开实施方式的发现正常模式的最大可能时段的图。例如,为了最大化发现有用预测模式并避免发现假规律的机会,设计了一种基于mdl概念的算法来确定合适的t。

图8是例示根据本公开实施方式的重置t的图,并且示出了该算法的基本概念。

参照图6,首先,t被设定成一个很大的数,因此拆分点在时间系列中尽可能早地出现。在该情况下,将会有大部分正常模式不显露在正常区域中,而是显露在异常区域中。当试图发现不同长度的预测模式时,将发现最大间隔算法将挑选正常模式(粗体/红色)。那么怎么知道该模式是正常的呢?

解决方案是mdl。利用如在章节“通过mdl寻找所有可能预测模式”中描述的类似例程,可以通过addtocluster操作直到bittosave<0为止来发现数据集中候选模式的所有“匹配”。如图7示出,之后,可以评估数据集中候选模式的最大可能时段p。如果p≥t,那么拆分点放置得太早,以致于模式显露在正常区域中,所以该模式实际上是正常的,而不能被视为预测模式。然后,在第一次出现该候选模式后移动拆分点并重新生成预测模式,如图8所示。

迭代该处理,并且直到最大间隔算法发现所有长度的预测模式(即,上面的步骤180),具有p<t,或者该预测模式在时间系列中最多只出现一次。t在迭代终止后被正确设定。

在正确设定t之后,可以简单地按区段运行该算法以发现所有可能的预测模式(即,上面的步骤185)。

图9a是例示根据本公开实施方式的并入了来自第二机器的测试数据以识别预测模式,并且使用先前存储的预测模式与第二机器的所识别的预测模式相比较来预测第二机器的故障的另一实施方式的步骤的框图。而且,第二机器可以类似于所述机器,并且第二机器的每个传感器测量与所述机器的传感器中的相应传感器相同的参数。更进一步地,第二机器的测试数据例可以具有与所述机器的该组训练数据例中的每个训练数据例相同的时段,或者第二机器的测试数据例可以具有与所述机器的该组训练数据例中的每个训练数据例的常规采样率相同的采样率。

图9b是例示根据本公开实施方式的、图9a的系统的组件的框图。第二机器902或发电机可以包括可选地连接至存储器906或直接连接至预处理器108(其可以连接到存储器112)的传感器904。预处理器将数据发送至处理器114以进行处理,并且处理后的数据可以存储在存储器112中或者经由输出接口116输出。

参照图9a和图9b,在步骤995,方法900包括:通过预处理器108,接收来自第二机器902的传感器904的测试数据流。而且,与计算机和计算机可读存储器通信的用户接口在接收到来自用户接口的表面的用户输入时,在计算机可读存储器中获取并存储该组训练数据例。

步骤995包括确定第二机器的预测模式,并且如果发现该预测模式,则根据经由步骤945至990处理测试数据流或该组测试数据例来选择该预测模式。

步骤999基于第二机器902的所确定的预测模式,确定第二机器的所确定的预测模式是否对应于存储器112中的存储的预测模式,以预测第二机器902的故障。

具体地,从测试数据流中提取的一个或更多个测试数据例是否预测第二机器902的故障。从测试数据流的一个或更多个部分提取所述一个或更多个测试数据例。例如,处理器114可以确定从测试数据流中提取的一个或更多个测试数据例是否预测机器902的故障。按与训练数据例中的被用于生成所确定预测模式的存储训练数据相同的采样率对测试数据流的一个或更多个部分中的测试数据进行采样。而且,方法900可以包括:如果一个或更多个测试数据例中预测第二机器902的故障的测试数据例的数量与基于所确定的预测模式处理的一个或更多个测试数据例(来自经由步骤945到步骤990的测试数据例)的总数的比率超过阈值,则预测第二机器902的故障。例如,该阈值可以是基于经验分析确定的值。

在一些示例实施方式中,方法900可以包括:在从训练数据流的一个或更多个部分中提取训练数据例时,排除可能包括无效数据的一部分训练数据流。方法900还可以包括按如下方式提取训练数据例:两个连续/相邻数据例具有交叠数据部分和非交叠数据部分,其中,交叠数据部分小于训练数据段长度的阈值百分比,该阈值百分比可以是预定的,诸如10%、40%或80%。

图10a是例示根据本公开实施方式的并入了来自第三机器的来自作为不同类型的传感器的测试数据流,使用先前存储的预测模式与第三机器的所识别的两个预测模式相比较来预测第三机器的故障的另一实施方式的步骤的框图。

图10b是例示根据本公开实施方式的、图10a的系统的组件的框图。第三机器1002或发电机可以包括可选地连接至存储器1006或直接连接至预处理器108(其可以连接到存储器112)的传感器1004。预处理器108将数据发送至处理器114以进行处理,并且处理后的数据可以存储在存储器112中或者经由输出接口116输出。

参照图10a和图10b,在图10a的步骤1005,方法1000包括:通过预处理器108,接收来自第三机器1002的两个传感器1004的两个测试数据流,其中,传感器1004是不同类型的。

图10a的步骤1010包括从第三机器1002的两个测试数据流中的每个测试数据流中提取一组测试数据例。

步骤1010包括基于所存储的一组训练数据例(包括每个训练数据例的正常状态区域和异常状态区域),来识别第三机器的两组测试数据例中的每个测试数据例,其对应于至少一个所存储的训练数据例的所存储的正常状态区域或至少一个所存储的训练数据例的至少一个所存储的异常状态区域,以识别第三机器的每个测试数据流的预测模式。

步骤1010包括在与存储器中的所存储的预测模式进行比较时,通过从两个传感器的两个测试数据流中取得两个预测模式中的任一个来预测第三机器的故障。

参照图11a和图11b,在图11a的步骤1105,方法1100包括步骤1145,取得来自第四机器的相同类型和数据的多个传感器的多个测试数据流,其中,每个测试数据流包括一组测试数据例。下一步骤1150包括从来自第四机器的多个传感器的多个测试数据流中提取每组测试数据例的测试数据例。

图11b是例示根据本公开实施方式的、图11a的系统的组件的框图。第四机器1102或发电机可以包括可选地连接至存储器1106或直接连接至预处理器108(其可以连接到存储器112)的传感器1104。预处理器108将数据发送至处理器114以进行处理,并且处理后的数据可以存储在存储器112中或者经由输出接口116输出。

图11a的步骤1155包括在所估计的故障时刻和以故障为结束时为多个测试数据例中的每个测试数据例内的异常状态区域选择当前时间系列长度。

图11a的步骤1160包括将每个测试数据例划分成正常状态区域和异常状态区域。可选地,针对所述组的测试数据例的时段可以是以下之一:相同的时段,或者该组测试数据例中的一些测试数据例具有与该组测试数据例中的其它测试数据例时段不同的时段。而且,可选地,该组测试数据例中的每个测试数据例可以以规则采样率或针对该组测试数据例的近似相同时段进行采样。

图11a的步骤1165包括特定于正常状态区域的数据,使得正常状态区域包括第四机器的正常运行,而没有第四机器的任何故障迹象。

图11a的步骤1170包括特定于异常状态区域的数据,使得异常状态区域对应于第四机器无法正常运行而最后导致第四机器故障。

图11a的步骤1175包括识别所述组的测试数据例中的模式,使得该模式不同于所述组的测试数据例中的所有正常状态区域中存在的任何其它模式,而是类似于所述组的测试数据例的每个异常状态区域中的正好一个模式。

步骤1180包括迭代处理,该迭代处理包括迭代地划分每个训练数据例,并且步骤185包括每次迭代将当前时间系列长度缩短一个时间步长的增量,因此当前时间系列长度短于该训练数据例内为前一迭代选择的异常状态区域的前一当前时间系列长度。

图11a的步骤1185包括每次迭代将当前时间系列长度缩短一个时间步长的增量,因此当前时间系列长度短于该测试数据例内为前一迭代选择的异常状态区域的前一当前时间系列长度。

图11a系统的步骤1190包括如果发现该模式,则选择该模式作为预测模式。具体而言,针对每组训练数据例,选择一模式作为第四机器的预测模式(假设发现该模式)并且存储在存储器中,其中,针对来自多个传感器的多个数据流的每个测试数据流的每组测试数据,该存储器包括第四机器的多个存储的预测模式。

图11a系统的步骤1195包括按照从最高预测准确度到最低预测准确度的降序对多个传感器进行排序,并且可选地,可以丢弃来自低于预定准确度阈值的传感器的一些测试数据流。

预期传感器的排序可以通过几种方法。例如,为了识别传感器904当中的用于故障预测的最相关传感器,可以针对来自相应传感器904的每个测试数据流的多个特征计算单个传感器分类准确度值。在一些示例实施方式中,所计算的特征可以是平均值、缺失数据点、平均斜率、测量结果比以及指数式衰减。平均值是指每个测试数据值的平均值,排除任何缺失数据点。例如,平均值可以用作特征,因为故障可能与特定参数(例如,振动或某一其它测量结果)相对于该参数的正常值的减少或增加相关。

图11c是例示根据本公开一实施方式的并入了来自第五机器的来自作为相同类型的传感器的测试数据流,使用先前存储的预测模式与第五机器的超过预定阈值的所识别的预测模式相比较来预测第五机器的故障的另一实施方式的步骤的框图。

图11c的步骤1105包括从第五机器的传感器接收测试数据流。步骤1110包括从第五机器的测试数据流中提取多组测试数据例。步骤1115包括基于所存储的一组训练数据例(包括每个训练数据例的正常状态区域和异常状态区域),通过评估第五机器的多组测试数据例中的每个测试数据例,来识别高于预定准确度阈值的测试数据例,其对应于至少一个存储的训练数据例的存储的正常状态区域或至少一个存储的训练数据例的至少一个存储的异常状态区域,以识别每个测试数据流的预测模式,预测第五机器的故障。

图12是例示根据本公开实施方式的、可以利用另选计算机或处理器来实现的图1a的方法的框图。计算机1211包括:处理器1240、计算机可读存储器1212、存储部1258以及具有显示器1252和键盘1251的用户接口1249,它们通过总线1256连接。例如,与处理器1240和计算机可读存储器1212通信的用户接口1264在接收到来自用户接口1264的表面(键盘表面1264)的用户输入时,获取该组训练数据例并存储在计算机可读存储器1212中。

计算机1211可以包括电源1254,根据应用,电源1254可以可选地位于计算机1211的外部。通过总线1256链接的可以是适于连接至显示装置1248的用户输入接口1257,其中,显示装置1248可以包括计算机监视器、摄像头、电视机、投影仪或移动装置等。打印机接口1259也可以通过总线1256连接并适于连接至打印装置1232,其中,打印装置1232可以包括液体喷墨打印机、固体墨水打印机、大型商用打印机、热敏打印机、uv打印机或热升华打印机等。网络接口控制器(nic)1234被配置为通过总线1256连接至网络1236,其中,时间系列数据或其它数据等可以呈现于计算机1211外部的第三方显示装置、第三方成像装置和/或第三方打印装置上。

仍参照图12,时间系列数据或其它数据等可以通过网络1236的通信信道传送,和/或存储在存储系统1258内以供存储和/或进一步处理。而且,时间系列数据或其它数据可以以无线方式或硬布线方式从接收器1246(或外部接收器1238)接收,或者以无线方式或硬布线方式经由发送器1247(或外部发送器1239)发送,接收器1246和发送器1247均通过总线1256连接。计算机1211可以经由输入接口1208连接至外部感测装置1244和外部输入/输出装置1241。例如,外部感测装置1244可以包括收集机器的收集时间系列数据之前-期间-之后的数据的传感器。例如,环境条件接近机器或不接近机器,即,在机器处或其附近的温度、机器位置的建筑物的温度、机器的建筑物外的室外温度、机器本身的视频、接近机器的区域的视频、未接近机器的区域的视频、与机器各方面有关的其它数据。计算机1211可以连接至其它外部计算机1242。输出接口1209可以用于输出来自处理器1240的处理后数据。

图13是例示根据本公开实施方式的确定表示第六机器1302的运行的时间系列数据中的模式的另一方法1300的框图。方法1300包括与第六机器1302通信的传感器1304。计算机可读存储器1312存储和提供由与第六机器1302通信的传感器1304生成的一组测试数据例。其中,每个测试数据例表示第六机器1302在以该第六机器1302故障为结束的一时段内的运行。输入接口/预处理器1308可以与存储器1306一起利用。经评价的预测模式可以存储在存储器1312中或者经由输出接口1316输出。

该方法包括识别每个预测模式的特征的表征模块,并且其中,计算机可读存储器包括存储的可执行指令,所述指令基于来自该组训练数据例的数据来存储每个预测模式和每个预测模式的识别特征。而且,该方法包括基于所识别的特征,对来自该组训练数据例的与预定的预测模式相对应的每个预测模式进行验证并对预测模式进行评价的过滤器。更进一步地,基于所识别的特征排除每个预测模式并对该预测模式进行评价的过滤器,其中,计算机可读存储器存储超出可行性阈值限制的每个评价的预测模式。

仍参照图13,该方法还包括:从与第六机器通信的传感器接收测试数据例并存储在计算机可读存储器中。由计算机基于计算机可读存储器中的至少一个存储的预测模式,确定从测试数据例中提取的一个或更多个测试数据段是否标识与计算机可读存储器中的至少一个存储的预测模式相对应的第二机器的模式。如果发现该模式,则选择该模式作为第二预测模式。最后,将第二预测模式存储在计算机可读存储器中或经由与计算机通信的输出接口输出该第二预测模式,其中,该第二预测模式有助于管理第二机器。

该表征模块可以为发现的每个预测模式确定不同的特征。该表征模块读取预测模式及其关联特征,计算模式和模式的特征,并将结果写回处理器。模式特征的示例是对称数。对称性是对模式的两半的相似性的度量。例如,在头肩形态模式的情况下,对称数可以识别头部的平衡程度以及左右肩部彼此的相似程度。

可以将模式和模式特征信息传递给基于所规定的标准筛选输出的过滤器。这些可以由存储器中的预先存储数据来提供。过滤器限制传递出系统的模式,以确保所递送的模式满足特定的最小阈值。例如,过滤器可以指定仅传递高对称数的模式。

仍参照图13,该方法还包括:利用表征模块识别每个预测模式的特征,其中,计算机可读存储器包括存储的可执行指令,所述指令基于来自该组训练数据例的数据来存储每个预测模式的识别特征。利用过滤器,基于预测模式的识别特征,对来自该组训练数据例的与预定预测模式相对应的每个预测模式进行验证并对该预测模式进行评价。利用过滤器,基于所识别的特征排除每个预测模式并对该预测模式进行评价,其中,计算机可读存储器存储超出可行性阈值限制的每个评价的预测模式。

仍参照图13,该方法还包括:从与第二机器通信的传感器接收测试数据例并存储在计算机可读存储器中。由计算机基于计算机可读存储器中的至少一个存储的预测模式来确定从测试数据例中提取的一个或更多个测试数据段是否标识与计算机可读存储器中的至少一个存储的预测模式相对应的第二机器的模式。如果发现该模式,则选择该模式作为第二预测模式。最后,将第二预测模式存储在计算机可读存储器中或者经由与计算机通信的输出接口输出该预测模式,其中,该第二预测模式有助于管理第二机器。

而且,在此概述的各种方法或处理可以被编码为可以在采用多种操作系统或平台中的任一种的一个或更多个处理器上执行的软件。另外,这种软件可以利用许多合适编程语言和/或编程或脚本工具中的任一种来编写,而且还可以编译为在框架或虚拟机上执行的可执行机器语言代码或中间代码。通常情况下,该程序模块的功能可以如在各种实施方式中所希望的组合或分布。

而且,本公开的实施方式可以被具体实施为已经提供了其示例的方法。作为该方法的一部分执行的动作可以按任何合适方式来安排。因此,即使在例示性实施方式中被示出为顺序动作,也可以构造按与所例示相比不同的次序来执行动作的实施方式,其可以包括同时执行一些动作。而且,在权利要求书中使用诸如“第一”、“第二”的普通术语来修改权利要求部件不独立地暗示一个权利要求部件的任何优先级、优先权,或次序超过执行方法的动作的另一或临时次序,而是仅仅被用作用于区分具有特定名称的一个权利要求部件与具有相同名称(但供普通术语使用)的另一部件的标记,以区分这些权利要求部件。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1