异常设备的检测方法及装置与流程

文档序号:18101611发布日期:2019-07-06 11:23阅读:186来源:国知局
异常设备的检测方法及装置与流程
本说明书一个或多个实施例涉及异常检测
技术领域
,尤其涉及一种异常设备的检测方法及装置。
背景技术
:通过在数据中心等系统内配置告警机制,可以对系统内的被监控系统的运行状态进行监控,从而及时发现和解决被监控系统可能出现的异常状况。在相关技术中,通过采集系统内被监控系统的性能指标的数据(即性能数据),并将性能数据与预定义的性能阈值进行比较,可以在性能数据不符合性能阈值的情况下,判定相应的被监控系统可能存在异常。技术实现要素:有鉴于此,本说明书一个或多个实施例提供一种异常设备的检测方法及装置。为实现上述目的,本说明书一个或多个实施例提供技术方案如下:根据本说明书一个或多个实施例的第一方面,提出了一种异常设备的检测方法,包括:获取被监控系统的性能指标的实际数据;确定所述实际数据中处于时间序列上的稳定区间的第一实际数据、处于时间序列上的不稳定区间的第二实际数据;对所述第一实际数据进行评估得到第一评估结果、对所述第二实际数据进行评估得到第二评估结果;根据所述第一评估结果和所述第二评估结果确定所述被监控系统中的异常设备。根据本说明书一个或多个实施例的第二方面,提出了一种异常设备的检测装置,包括:获取单元,获取被监控系统的性能指标的实际数据;确定单元,确定所述实际数据中处于时间序列上的稳定区间的第一实际数据、处于时间序列上的不稳定区间的第二实际数据;评估单元,对所述第一实际数据进行评估得到第一评估结果、对所述第二实际数据进行评估得到第二评估结果;识别单元,根据所述第一评估结果和所述第二评估结果确定所述被监控系统中的异常设备。附图说明图1是一示例性实施例提供的一种数据中心的结构示意图。图2是一示例性实施例提供的一种异常设备的检测方法的流程图。图3是一示例性实施例提供的一种告警系统针对数据中心实施异常检测的流程图。图4是一示例性实施例提供的一种性能指标x在三个运行周期内的历史数据的曲线示意图。图5是一示例性实施例提供的一种1分钟负载平均值、5分钟负载平均值和15分钟负载平均值的实际数据的曲线示意图。图6是一示例性实施例提供的一种经过box-cox变换算法处理后的1分钟负载平均值的实际数据的正态分布示意图。图7是一示例性实施例提供的一种电子设备的结构示意图。图8是一示例性实施例提供的一种异常设备的检测装置的框图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书一个或多个实施例相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书一个或多个实施例的一些方面相一致的装置和方法的例子。需要说明的是:在其他实施例中并不一定按照本说明书示出和描述的顺序来执行相应方法的步骤。在一些其他实施例中,其方法所包括的步骤可以比本说明书所描述的更多或更少。此外,本说明书中所描述的单个步骤,在其他实施例中可能被分解为多个步骤进行描述;而本说明书中所描述的多个步骤,在其他实施例中也可能被合并为单个步骤进行描述。图1是一示例性实施例提供的一种数据中心的结构示意图。如图1所示,在数据中心中配置有设备11、设备12、设备13等硬件设备以及告警系统14。其中,设备11-13等硬件设备通过独立或配合运行应用程序,以实现该数据中心的特定功能。告警系统14通过监测数据中心的性能指标,以确定该数据中心所处的运行状况。其中,该性能指标可以来自于设备11-13等硬件设备的硬件状态,也可以来自硬件设备上运行的应用程序的软件状态,或者还可以存在其他来源,本说明书并不对此进行限制。通过对性能指标进行监测,告警系统14可以及时发现数据中心内可能出现的异常设备,使得告警系统14可以向预设对象发出提示或告警,以便于及时诊断、分析或处理该异常情况,其中该预设对象可以包括数据中心的工作人员或自动化处理系统等,本说明书并不对此进行限制。在本说明书的实施例中,通过对告警系统14的异常检测方案予以优化和改进,可使监测操作更为准确、灵敏,避免对异常的误报而导致工作人员的人力资源或其他资源的浪费,确保数据中心的正常运行。其中,数据中心仅为本说明书中提供的异常检测方案的一种应用对象;实际上,除了数据中心之外,本说明书的异常检测方案还可以应用于其他任何电子设备、结构或系统,本说明书并不对此进行限制。图2是一示例性实施例提供的一种异常设备的检测方法的流程图。如图2所示,该方法可以包括以下步骤:步骤202,获取被监控系统的性能指标的实际数据。在一实施例中,性能指标可以包括用于反映被监控系统的运行状况的任意参数,比如吞吐量、事件计数、操作持续时间、内存或存储大小等,本说明书并不对此进行限制。在一实施例中,可以针对所述被监控系统的性能指标进行相关性分析;其中,当相关联的多个性能指标的实际数据均被获取时,可以筛除所述相关联的多个性能指标中至少一个性能指标的实际数据,而仅保留部分(一个或多个)性能指标的实际数据,据此减少后续过程中所需处理的数据量。举例而言,假定获取的实际数据对应的性能指标包括1分钟内的负载平均值、5分钟内的负载平均值、15分钟内的负载平均值,如果这三个性能指标之间相关联(例如关联程度大于预设程度),可以仅选用1分钟内的负载平均值对应的实际数据、筛除5分钟内的负载平均值和15分钟内的负载平均值对应的实际数据,从而仅需要针对1分钟内的负载平均值对应的实际数据进行处理,以降低后续步骤中的数据处理量,而不会对最终的评估结果等造成不良影响。在一实施例中,可以确定性能指标的实际数据是否满足预定义的标准数据结构,如果不满足则可以对实际数据进行调整、以使其满足于该标准数据结构。例如,假定该标准数据结构可以包括正态分布结构,可以通过诸如高斯分布变换、box-cox变换等算法对实际数据进行调整,以使其满足于正态分布的标准数据结构。步骤204,确定所述实际数据中处于时间序列上的稳定区间的第一实际数据、处于时间序列上的不稳定区间的第二实际数据。在一实施例中,所述被监控系统的运行周期在时间序列上被划分为若干时段;当所述性能指标在被选取的多个运行周期内的同一时段的历史数据均呈稳定状态时,所述同一时段被确定为属于所述稳定区间,当所述同一时段的历史数据在至少一个被选取的运行周期内呈不稳定状态时,所述同一时段被确定为属于所述不稳定区间。举例而言,假定被监控系统的运行周期为一天,选取的多个运行周期可以包括最近三天、即最近的连续三个运行周期,如果时段9:00~12:00在这三个运行周期内均处于稳定状态,可以将该时段9:00~12:00确定为属于稳定区间;而如果时段3:20~4:10在这三个运行周期内的至少一个运行周期处于不稳定状态,可以将该时段3:20~4:10确定为属于不稳定区间。在一实施例中,稳定区间可以包括一个或多个时段。在一实施例中,不稳定区间可以包括一个或多个时段。在一实施例中,可以按照特定的细粒度对运行周期进行时段划分,比如时、分、秒等,本说明书并不对此进行限制。在一实施例中,稳定状态的时段表明被监控系统在相关时段内的性能指标,能够在多个运行周期内均能够维持较小波动或不存在波动;而不稳定状态的时段表明被监控系统在相关时段内的性能指标,在多个运行周期内存在至少一次较大波动。在一实施例中,可以通过性能指标的数值特征来识别各个时段的稳定性,比如不稳定状态的时段可以包括以下至少之一:峰值时段(即出现峰值的时段)、噪声时段(即存在噪声的时段)等,而稳定状态的时段则并不包含上述的峰值时段或噪声时段等。在一实施例中,所述稳定状态的时段可以包括所述运行周期内除所述不稳定状态的时段之外的其他时段,即稳定状态与不稳定状态的时段可以在运行周期内互补、共同组成完整的运行周期。在其他实施例中,稳定状态与不稳定状态的时段并不一定在运行周期内呈互补,比如还可能存在不确定状态的时段、不关注的时段等,本说明书并不对此进行限制。在一实施例中,可以通过时序模式发现算法对被监控系统在多个运行周期内的性能指标的历史数据进行分析,以确定出上述的稳定区间和不稳定区间。步骤206,对所述第一实际数据进行评估得到第一评估结果、对所述第二实际数据进行评估得到第二评估结果。在一实施例中,分别对第一实际数据和所述第二实际数据进行评估,以分别得到相应的第一评估结果和第二评估结果。在一实施例中,假定采用第一算法对第一实际数据进行评估、采用第二算法对第二实际数据进行评估,所述第一算法和所述第二算法可以采用无监督算法,从而在无需标记数据参与处理的情况下,即可识别出被监控系统中的异常设备,从而极大地减轻了工作人员的处理负担。在一实施例中,第一算法可以包括以下可选算法中至少之一:时间序列挖掘算法、聚类算法、统计学习算法、回归分析算法等。在一实施例中,第二算法可以包括以下可选算法中至少之一:聚类算法、统计学习算法、回归分析算法。步骤208,根据所述第一评估结果和第二评估结果确定所述被监控系统中的异常设备。在一实施例中,当所述第一算法包括多种可选算法时,每一可选算法存在对应的权重值,对所述第一实际数据的评估结果包括对多种可选算法分别得出的评估分值进行加权计算得到的第一加权评估分值,从而能够综合多种可选算法的优势对异常设备进行联合检测,有助于提升对异常设备的检测能力。在一实施例中,当所述第二算法包括多种可选算法时,每一可选算法存在对应的权重值,对所述第二实际数据的评估结果包括对多种可选算法分别得出的评估分值进行加权计算得到的第二加权评估分值,从而能够综合多种可选算法的优势对异常设备进行联合检测,有助于提升对异常设备的检测能力。在一实施例中,可以将所述评估结果与标记数据进行比较,以分析作为所述第一算法或所述第二算法的各个可选算法的评估准确度,然后根据所述评估准确度对相应的可选算法进行改进。例如,可选算法可以根据预定义的评估阈值对性能指标的实际数据进行评估,以生成相应的评估分值,则对可选算法进行改进时可以调整该评估阈值的数值大小;再例如,当第一算法或第二算法中包含多个可选算法时,可以调整各个可选算法对应的权重值大小。为了便于理解,下面以告警系统对数据中心实施异常检测为例,对本说明书的技术方案进行详细说明。图3是一示例性实施例提供的一种告警系统针对数据中心实施异常检测的流程图。如图3所示,该监控流程可以包括以下步骤:步骤302,获取性能指标的历史数据。在一实施例中,告警系统可以配置有数据采集功能,使得告警系统可以获取数据中心的性能指标的历史数据。例如,告警系统可以配置有etl(extract-transform-load,抽取-转换-加载)模块,并通过该etl模块对数据中心的性能指标的历史数据进行采集,该历史数据可以包括全量历史数据,也可以包括一历史时间段内的历史数据,本说明书并不对此进行限制。在一实施例中,通过增加性能指标的类型,可以至少在一定程度内提升对数据中心的异常检测能力,因而可以使获取的历史数据所属的性能指标尽可能全面,以便于实现对数据中心的全面检测。例如,性能指标可以包括1分钟负载平均值、5分钟负载平均值、15分钟负载平均值、cpu利用率、吞吐量(每秒查询量)、延迟(响应时长)、线程数、内存或存储大小等,本说明书并不对此进行限制。步骤304,确定稳定区间和不稳定区间。在一实施例中,数据中心存在一定的运行周期,比如1天、3天、1周、1个月等,本说明书并不对此进行限制。在一实施例中,根据数据中心在多个运行周期内的运行状态,可以发现数据中心存在的一些运行规律。假定数据中心的运行周期为每个自然日的00:00~24:00,可以选取某一性能指标x在最近三个运行周期(如第d-1天至第d-3天;在其他实施例中,还可以采用其他方式选取多个运行周期,本说明书并不对此进行限制)的历史数据,这些历史数据可以被表达为如图4所示的三条曲线;相应地,可以通过下述原理发现上述的运行规律:在时间序列上,运行周期可以包含若干时段,比如在“时”(或分、秒等)粒度下可以包括24个时段;然后,针对运行周期内的每一时段,可以将上述的性能指标x在三个运行周期中对应的历史数据进行比较。比如在图4所示的时间段41内,数据中心在三个运行周期的性能数值(即性能指标x的历史数据的数值)均位于稳定状态,即数据中心在三个运行周期中对应于该时间段41处均不存在峰值时段(包含峰值的时段)或噪音时段(包含噪音的时段),使得三条曲线中对应于该时间段41处的取值相同或相近(如差值小于预设数值),因而可以认为该时间段41属于运行周期内的稳定区间。类似地,可以将如图4所示的时间段42、时间段43等作为运行周期内的稳定区间。而对于图4所示的时间段44,由于数据中心在三个运行周期的性能数值处于不稳定状态,即数据中心在至少一个运行周期中对应于该时间段44处存在峰值时段或噪音时段,使得三条曲线中对应于该时间段44处的取值由于随机性的峰值或噪音而存在较大差异,因而可以认为该时间段44属于运行周期内的不稳定区间。类似地,可以将如图4所示的时间段45等作为运行周期内的不稳定区间。因此,可以选取基于上述原理或类似原理的算法,对数据中心在特定的多个运行周期内的各项性能指标的历史数据进行分析,从而分别针对每一性能指标将运行周期划分为相应的稳定区间和不稳定区间;举例而言,该算法可以包括时间序列模式发现(timeseriesmotifdiscovery)算法,以用于在时间序列上发现运行周期中的“稳定区间”、“不稳定区间”等时序模式。在一实施例中,可以同时识别出稳定区间和不稳定区间;在另一实施例中,可以仅识别出稳定区间而将剩余的时段均作为不稳定区间,或者可以仅识别出不稳定区间而将剩余的时段均作为稳定区间。在一实施例中,上述的步骤302-304可以基于数据中心的性能指标的历史数据进行处理,因而可以由告警系统对历史数据进行离线处理,以确定出运行周期内的稳定区间和不稳定区间。而在下述步骤306-314中,可以针对数据中心的性能指标的实际数据进行在线分析,以识别出该数据中心内的异常设备。步骤306,采集性能指标的实际数据。在一实施例中,步骤302涉及的性能指标的数量应当不小于步骤306涉及的性能指标,以确保在后续步骤中可以基于步骤302-304得到的离线处理结果顺利完成在线分析。在一实施例中,性能指标的实际数据可以包括数据中心内的每台设备的1分钟负载平均值、5分钟负载平均值、15分钟负载平均值、cpu利用率、吞吐量(每秒查询量)、延迟(响应时长)、线程数、内存或存储大小等,本说明书并不对此进行限制。告警系统可以按照每台设备在数据中心内的所处位置、所属设备组、正在运行的应用程序等,对采集到的上述实际数据进行数据聚合。在一实施例中,告警系统可以对采集到的实际数据进行数据清洗。例如,告警系统可以确定出实际数据在时间序列上的缺失值,并对缺失值予以补全(补全的缺失值可以采用默认值,或者可以采用相邻时间点的数值,或者可以采用附近预设时间段内的数据均值等,本说明书并不对此进行限制);再例如,告警系统可以清除显著违反业务规则的实际数据等。在一实施例中,告警系统可以根据采集到的各个性能指标的实际数据,针对各个性能指标进行相关性分析。如图5所示,以1分钟负载平均值、5分钟负载平均值和15分钟负载平均值为例,如果这三个性能指标的实际数据之间存在显著相关性(即三者相关联,且关联程度大于预设程度),那么可以仅选取部分性能指标的实际数据来用于后续的异常检测过程,而无需对所有实际数据进行处理,以降低资源占用;比如,可以仅选取1分钟负载平均值的实际数据,而无需对5分钟负载平均值、15分钟负载平均值的实际数据进行后续处理。在一实施例中,告警系统可以对采集到的性能指标的实际数据进行标准化处理,以使得实际数据均符合预定义的标准化数据结构。举例而言,该标准化数据结构可以包括正态分布结构,假定告警系统选取了上述的1分钟负载平均值,该告警系统可以进一步确定该1分钟负载平均值的实际数据是否符合上述的正态分布结构,如果不符合可以通过诸如高斯分布变换、box-cox变换等算法对相应的实际数据进行变换处理,以将其调整为符合于该正态分布结构;比如图6示出了经过box-cox变换算法处理后的上述1分钟负载平均值的实际数据,通过在变换过程中采用0.4次幂(即针对原始结构的实际数据取0.4次幂),使得该1分钟负载平均值的实际数据符合上述的正态分布结构。在一实施例中,告警系统可以为工作人员或其他数据消费者提供标准的开放式api(applicationprogramminginterface,应用程序编程接口),以供其针对性能指标的实际数据进行编程访问。步骤308,对实际数据进行区间划分。在一实施例中,根据步骤304中确定出的稳定区间和不稳定区间,针对采集到的性能指标的实际数据,可以将该实际数据划分至处于稳定区间的第一实际数据、处于不稳定区间的第二实际数据,以分别对第一实际数据和第二实际数据进行分析处理。步骤310,确定可选算法。在一实施例中,针对处于稳定区间的第一实际数据,可以采用第一算法(该第一算法可以包括一种或多种可选算法),而针对处于不稳定区间的第二实际数据,可以采用第二算法(该第二算法可以包括一种或多种可选算法)。步骤312a,对第一实际数据进行评估。在一实施例中,告警系统可以通过基于上述第一算法的评估模型,对该第一实际数据进行评估。例如,该第一算法可以包括下述至少一种可选算法:时间序列挖掘算法、聚类算法、统计学习算法、回归分析算法等,本说明书并不对此进行限制。当第一算法包括时间序列挖掘算法时,对于任一性能指标的第一实际数据可以对实施下述处理:1)选择适当的时间窗口,分别对该第一实际数据中对应于每台设备的数据、对应于每台设备所属的设备组的数据进行平滑处理,比如这里可以采用savitzky-golay滤波器实现该平滑处理;或者,在其他实施例中可以采用卡尔曼(kalman)滤波器、移动窗口平均滤波器、巴特沃斯(butterworth)滤波器等平滑或低通滤波器实现该平滑处理。其中,数据中心内的所有设备可以被认为属于一个设备组;或者,数据中心内的设备可以被按照位置、功能或其他维度进行组别划分,以形成多个设备组。2)分别针对每个设备组实施下述处理:在每个时间窗口内,确定第一实际数据中对应于每一设备组的数据对应的设备组平滑值,并将该设备组平滑值作为该设备组内的每台设备的预期值,同时分别确定第一实际数据中对应于每台设备的数据对应的设备平滑值;然后,分别计算每台设备的设备平滑值与相应的预期值之间的距离。3)将每台设备对应的距离与预定义的阈值进行比较,以确定每台设备被认为是异常设备的概率,即时间序列挖掘算法为每台设备提供的评估分值。其中,上述的阈值可以包括预先通过统计学习确定出的数值,比如该统计学习的算法可以包括“three-sigma”规则、中值绝对偏差法(medianabsolutedeviationapproach)等,本说明书并不对此进行限制。当第一算法包括聚类算法时,该聚类算法可以包括基于密度的算法,比如dbscan(density-basedspatialclusteringofapplicationswithnoise,具有噪声的基于密度的聚类方法)、lof(localoutlierfactor,局部异常因子)算法等,该聚类算法还可以包括基于预测的算法,比如一类支持向量机(one-classsvm,即one-classsupportvectormachines)等,本说明书并不对此进行限制。当第一算法包括统计学习算法时,该统计学习算法可以包括“three-sigma”规则、中值绝对偏差法、土耳其测试(turkeytesting)等,本说明书并不对此进行限制;基于上述统计学习算法,可以选取设备组内与所有设备的平均值或中位数明显偏离的设备。在一实施例中,当第一算法同时包括多种可选算法时,告警系统可以分别通过基于每一可选算法的评估模型对第一实际数据进行分析得到相应的评估分值,然后根据每种可选算法对应的权重值,对这些可选算法得到的评估分值进行加权计算(比如加权和计算等),从而得到这些可选算法对应于第一实际数据的综合评分——第一加权评估分值。步骤312b,对第二实际数据进行评估。在一实施例中,告警系统可以通过基于上述第二算法的评估模型对该第二实际数据进行评估。例如,该第二算法可以包括下述至少一种可选算法:聚类算法、统计学习算法、回归分析算法等,本说明书并不对此进行限制。在一实施例中,当第二算法同时包括多种可选算法时,告警系统可以分别通过基于每一可选算法的评估模型对第二实际数据进行分析得到相应的评估分值,然后根据每种可选算法对应的权重值,对这些可选算法得到的评估分值进行加权计算(比如加权和计算等),从而得到这些可选算法对应于第二实际数据的综合评分——第二加权评估分值。步骤314,获得每台设备的风险评分。在一实施例中,由于第一实际数据对应于运行周期内的稳定区间、第二实际数据对应于运行周期内的不稳定区间,因而综合对第一实际数据的评估结果与对第二实际数据的评估结果,可以获得针对数据中心内每台设备的风险评分。步骤316,根据步骤314获得的评估结果,以及标记数据集合,分析基于可选算法的评估模型。在一实施例中,标记数据集合内可以包括工作人员对数据中心的性能指标的实际数据进行手动标记后的标记数据,由工作人员根据实际情况将实际数据标记为异常状态或正常状态。在一实施例中,告警系统基于上述的第一算法、第二算法中的可选算法对性能指标的实际数据进行评估时,可能出现多种情况,比如:将异常数据识别为异常数据、将异常数据识别为正常数据、将正常数据识别为正常数据、将正常数据识别为异常数据;通过将评估结果与标记数据集合进行比较,可以确定出上述可选算法对于性能指标的实际数据的识别效果,比如该识别效果可以表现为每一可选算法对应的评估模型的精确率(precision)、召回率(recall)、准确率(accuracy)、f1值等,本说明书并不对此进行限制。步骤318,改进基于可选算法的评估模型。在一实施例中,根据每一可选算法对应的评估模型的评估效果,可以对基于可选算法的评估模型进行改进。例如,可以改进评估模型中用于评价实际数据的异常概率的阈值(例如上文中针对“时间序列挖掘算法”的描述中涉及到的阈值)。再例如,可以改进各个可选算法对应的评估模型的权重值。基于上述的步骤316-318,告警系统可以自动反馈针对每台设备的风险评分,从而基于标记数据集合实现对基于可选算法的评估模型的持续改进。其中,该自动反馈过程可以在线或离线实现,本说明书并不对此进行限制。举例而言,可以参照下述反馈公式实现该自动反馈和相应改进:其中,s表示总异常得分,si表示第i个评估模型的异常得分,wi表示第i个评估模型的权重值,fi表示对第i个评估模型的准确性的综合评估分值(类似于f1值)。在一实施例中,告警系统可以连接至数据中心的事件管理平台,使得告警系统可以向该事件管理平台发送告警信息。其中,告警信息可以包括:1)基于标记数据集合对基于可选算法的评估模型的效果分析。例如下表1所示,假定告警系统采用的可选算法包括一类支持向量机、统计算法、时间序列挖掘算法、dbscan算法、回归分析算法等,可以从精确率、召回率和f1值等方面对基于上述可选算法的评估模型予以评价。可选算法精确率召回率f1值一类支持向量机80%80%0.400统计算法90%50%0.321时间序列挖掘算法80%85%0.412dbscan算法75%75%0.375回归分析算法85%70%0.384表12)每个异常设备的详情信息。例如,该详情信息可以包括下表2所示的设备id、风险评分;此外,该详情信息还可以包括设备ip、异常发生的时间戳、具有异常行为的性能指标等其他类型的信息,本说明书并不对此限制。表2综上所述,本说明书中通过将数据中心的运行周期划分为稳定区间和不稳定区间,并分别针对不同区间内的性能指标的实际数据进行异常评估,可以针对数据中心内的每台设备的异常状况给出风险评分,相比于相关技术中的技术方案可以显著提升对数据中心的异常检测效率。同时,通过在异常评估的过程中采用针对多种组合算法,并基于标记数据对基于这些算法的评估模型进行持续改进,能够进一步提升本说明书中所采用的技术方案的性能。图7是一示例性实施例提供的一种电子设备的示意结构图。请参考图7,在硬件层面,该电子设备包括处理器702、内部总线704、网络接口706、内存708以及非易失性存储器710,当然还可能包括其他业务所需要的硬件。处理器702从非易失性存储器710中读取对应的计算机程序到内存708中然后运行,在逻辑层面上形成异常设备的检测装置。当然,除了软件实现方式之外,本说明书一个或多个实施例并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。请参考图8,在软件实施方式中,该异常设备的检测装置可以包括:获取单元81,获取被监控系统的性能指标的实际数据;确定单元82,确定所述实际数据中处于时间序列上的稳定区间的第一实际数据、处于时间序列上的不稳定区间的第二实际数据;评估单元83,对所述第一实际数据进行评估得到第一评估结果、对所述第二实际数据进行评估得到第二评估结果;识别单元84,根据所述第一评估结果和所述第二评估结果确定所述被监控系统中的异常设备。可选的,所述被监控系统的运行周期在时间序列上被划分为若干时段;当所述性能指标在被选取的多个运行周期内的同一时段的历史数据均呈稳定状态时,所述同一时段被确定为属于所述稳定区间,当所述同一时段的历史数据在至少一个被选取的运行周期内呈不稳定状态时,所述同一时段被确定为属于所述不稳定区间。可选的,所述不稳定状态的时段包括以下至少之一:峰值时段、噪声时段;所述稳定状态的时段包括所述运行周期内除所述不稳定状态的时段之外的其他时段。可选的,所述稳定区间和所述不稳定区间是从所述运行周期内通过时序模式发现算法进行确定得到。可选的,采用无监督算法对所述第一实际数据、所述第二实际数据进行评估。可选的,通过以下可选算法中至少之一对所述第一实际数据进行评估:时间序列挖掘算法、聚类算法、统计学习算法、回归分析算法;通过以下可选算法中至少之一对所述第二实际数据进行评估:聚类算法、统计学习算法、回归分析算法。可选的,当采用多种可选算法对所述第一实际数据进行评估时,每一可选算法存在对应的权重值,对所述第一实际数据的评估结果包括对多种可选算法分别得出的评估分值进行加权计算得到的第一加权评估分值;当采用多种可选算法对所述第二实际数据进行评估时,每一可选算法存在对应的权重值,对所述第二实际数据的评估结果包括对多种可选算法分别得出的评估分值进行加权计算得到的第二加权评估分值。可选的,还包括:比较单元85,将所述评估结果与标记数据进行比较,以分析用于对所述第一实际数据或所述第二实际数据进行评估的各个可选算法的评估准确度;改进单元86,根据所述评估准确度对相应的可选算法进行改进。可选的,还包括:分析单元87,针对所述被监控系统的性能指标进行相关性分析;筛除单元88,当相关联的多个性能指标的实际数据均被获取时,筛除所述相关联的多个性能指标中至少一个性能指标的实际数据。上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。在一个典型的配置中,计算机包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。内存是计算机可读介质的示例。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带、磁盘存储、量子存储器、基于石墨烯的存储介质或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。在本说明书一个或多个实施例使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。应当理解,尽管在本说明书一个或多个实施例可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。以上所述仅为本说明书一个或多个实施例的较佳实施例而已,并不用以限制本说明书一个或多个实施例,凡在本说明书一个或多个实施例的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例保护的范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1