一种告警分析方法、装置及存储介质与流程

文档序号：25991567发布日期：2021-07-23 21:03阅读：144来源：国知局

本公开涉及通信领域，尤其涉及一种告警分析方法、装置及存储介质。
背景技术：
：波分复用(wavelengthdivisionmultiplexing，wdm)网络在传输发生故障时，会引发一系列网络告警并生成告警信息。为了排除wdm网络中发生的故障，需要对wdm网络生成的告警信息进行分析处理，以定位故障发生的位置。现有的网络告警信息分析处理一般采用人工的方式来完成，具体为通过告警监控方式监视当前wdm网络的告警信息，然后由维护人员根据制定的故障定位规则，对其中级别较高的告警信息进行相应处理。然而，上述现有方案中故障定位规则对于所有故障告警信息的适用能力有限，同时人工处理的方式也会消耗大量的人力资源，导致wdm网络的运营维护成本提高。并且，在有大量告警信息发生时，现有方案可能导致告警处理的延后与遗漏，无法有效保障告警处理的实时性和准确性。技术实现要素：本公开提供一种告警分析方法、装置及存储介质，用以解决现阶段人工分析处理告警信息的方式成本较高和无法有效保障告警处理的实时性和准确性的问题。为达到上述目的，本公开的实施例采用如下技术方案：第一方面，本公开提供一种告警分析方法，包括：首先，获取告警组的告警类型、告警生成相对距离以及告警组长度，其中，告警组含有一个或多个告警信息，告警生成相对距离是指生成告警信息的两个相邻物理端口之间的相对距离，告警组长度是指告警组中含有的告警信息的数目。之后，根据这三个特征来计算出各个告警组的聚类参考数据，每个告警组的聚类参考数据体现了该告警组与其余各个告警组之间所包含的告警信息数据的总体相似程度。之后，根据告警组的聚类参考数据，结合具体的预设算法，来计算聚类结果。在聚类结果中，所有告警组被分入对应的故障类型。最后，根据每个告警组在聚类结果中所属的故障类型，再结合故障定位规则中此故障类型对应的故障发生位置，确定该告警组中告警信息所反映的故障发生的具体位置。基于上述技术方案，通过从告警组的告警类型、相邻物理端口告警信息之间的相对距离以及告警信息数量三个特征来构建关联告警信息的类型坐标数据，并结合相关预设算法，对获取到的告警信息进行聚类。再根据聚类结果，结合预设的故障定位规则，确定故障发生的位置。本公开的方案能够对告警信息进行智能化、自动化地分析，并对告警信息进行相关性的归纳聚类，得出的聚类结果直观显示了告警信息所代表的故障类型，为运维人员进行故障定位时提供了强有力的依据，降低了运维人员工作量，进而在提高了告警处理的实时性、准确性的同时，减少了运维所需的人力、物力等成本。在一种可能的设计方案中，在根据告警组的告警类型、告警生成相对距离以及告警组长度，确定告警组的聚类参考数据之前，方法还包括：获取告警数据，告警数据包括至少一个告警信息；根据告警信息所属的时间窗和复用段，将告警数据分为一个或多个告警组。在一种可能的设计方案中，根据告警组的告警类型、告警生成相对距离以及告警组长度，确定告警组的聚类参考数据，具体包括：根据告警组的告警类型、告警生成相对距离以及告警组长度，确定不同告警组之间的数据相似度；根据不同告警组之间的数据相似度，确定告警组的聚类参考数据。第二方面，本公开提供一种告警分析装置，包括获取模块和处理模块。获取模块，用于获取告警组的告警类型、告警生成相对距离以及告警组长度；其中，告警组包括至少一个告警信息，告警生成相对距离用于表征生成告警信息的两个相邻物理端口之间的相对距离，告警组长度用于表征告警组内告警信息的数目。处理模块，用于根据告警组的告警类型、告警生成相对距离以及告警组长度，确定告警组的聚类参考数据；其中，聚类参考数据用于表征不同告警组之间所包含的告警信息的相似程度。处理模块，还用于根据告警组的聚类参考数据和预设算法，确定聚类结果；其中，聚类结果包括至少一个故障类型，每个故障类型包括至少一个告警组。处理模块，还用于根据聚类结果和预设的故障定位规则，确定故障发生位置。在一种可能的设计方案中，获取模块，还用于获取告警数据，告警数据包括至少一个告警信息。处理模块，还用于根据告警信息所属的时间窗和复用段，将告警数据分为一个或多个告警组。在一种可能的设计方案中，处理模块，还用于告警组的告警类型、告警生成相对距离以及告警组长度，确定不同告警组之间的数据相似度；处理模块，还用于根据不同告警组之间的数据相似度，确定告警组的聚类参考数据。可选地，第二方面所述的告警分析装置还可以包括存储模块，该存储模块存储有程序或指令。当处理模块执行该程序或指令时，使得告警分析装置可以执行上述方法实施例所述的告警分析方法。此外，第二方面所述的告警分析装置的技术效果可以参考上述第一方面所述的告警分析方法的技术效果，此处不再赘述。第三方面，本公开提供一种存储一个或多个程序的计算机可读存储介质，该一个或多个程序包括指令，上述指令当被本公开的电子设备执行时使计算机执行如第一方面和第一方面的任一种可能的实现方式中所描述的告警分析方法。第四方面，本公开提供一种电子设备，包括：处理器以及存储器；其中，存储器用于存储一个或多个程序，一个或多个程序包括计算机执行指令，当电子设备运行时，处理器执行存储器存储的计算机执行指令，以使电子设备执行如第一方面和第一方面的任一种可能的实现方式中所描述的告警分析方法。第五方面，本公开提供一种包含指令的计算机程序产品，当该指令在计算机上运行时，使得本公开的电子设备执行如第一方面和第一方面的任一种可能的实现方式中所描述的告警分析方法。第六方面，本公开提供一种芯片，芯片包括处理器和通信接口，通信接口和处理器耦合，处理器用于运行计算机程序或指令，以实现如第一方面和第一方面的任一种可能的实现方式中所描述的告警分析方法。附图说明图1为本公开的实施例提供的一种告警分析方法的流程示意图；图2为本公开的实施例提供的一种告警分析装置的结构示意图；图3为本公开的实施例提供的另一种告警分析装置的结构示意图。具体实施方式下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本公开保护的范围。本文中字符“/”，一般表示前后关联对象是一种“或者”的关系。例如，a/b可以理解为a或者b。本公开的说明书和权利要求书中的术语“第一”和“第二”是用于区别不同的对象，而不是用于描述对象的特定顺序。例如，第一边缘服务节点和第二边缘服务节点是用于区别不同的边缘服务节点，而不是用于描述边缘服务节点的特征顺序。此外，本公开的描述中所提到的术语“包括”和“具有”以及它们的任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括其他没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。另外，在本公开实施例中，“示例性的”、或者“例如”等词用于表示作例子、例证或说明。本公开中被描述为“示例性的”或“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言，使用“示例性的”、或者“例如”等词旨在以具体方式呈现概念。为了便于理解本公开的技术方案，下面对一些技术术语进行介绍。1、wdm网络波分复用(wdm，wavelengthdivisionmultiplexing)是将两种或多种不同波长的光载波信号(携带各种信息)在发送端汇合在一起，并耦合到光线路的同一根光纤中进行传输的技术。在接收端接收到光载波信号后，会将各种波长的光载波分离，然后由光接收机作进一步处理以恢复原信号，由此，波分复用wdm技术能够实现在同一根光纤中同时传输两个或众多不同波长光信号。而使用波分复用wdm技术的数据传输网络被称为wdm网络。2、k均值聚类算法k均值聚类算法(k-meansclusteringalgorithm)是一种迭代求解的聚类分析算法，由于简洁和效率使得他成为所有聚类算法中最广泛使用的算法。具体步骤是：预将数据分为k组，则随机选取k个对象作为初始的聚类中心，然后计算每个对象与各个种子聚类中心之间的距离，把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本，聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。而k均值聚类算法的终止条件可由人工进行设定，例如终止条件可以是没有对象被重新分配给不同的聚类、没有聚类中心再发生变化、误差平方和局部最小等。本公开实施例提供的告警分析方法及装置可以应用于运营商对wdm网络的运营维护。在本公开实施例的具体应用场景中，在告警分析装置对告警信息进行收集并分析后，会输出针对收集到的告警信息的聚类结果。根据预先设定的故障定位规则，每一类告警信息都有其对应的故障类型和故障生成的物理位置。由此，技术人员在获取告警分析装置输出的聚类结果后，能够实时并准确的确定故障类型和该故障发生的位置。下面结合说明书附图，对本公开所提供的技术方案进行具体阐述。示例性的，如图1所示，为本公开实施例提供的一种告警分析方法的流程示意图，该方法包括以下步骤：s101、获取告警数据，并将告警数据分为一个或多个告警组。其中，告警数据即为告警分析装置在运行时间内所收集到的所有告警信息。可选的，告警信息由wdm网络的网络管理设备上报给告警分析装置。其中，每一条告警信息都有其所属的时间窗和复用段。其中，时间窗的时间长短可由人工进行预设，本实施例对此不作限定。复用段即表明了该告警信息在整体拓扑关系中所处的位置。需要说明的是，告警数据的整体拓扑关系可以根据每条告警信息所属的网元、链路及交叉链接等资源数据来构建。网元、链路及交叉链接等资源数据能够从wdm网络的网络管理设备处获取。可以理解的是，根据每条告警信息所属的时间窗和复用段，可以将属于同一时间窗和复用段的告警信息分入一个告警组内，进而能够将全部告警信息分为一个或多个告警组。s102、获取告警组的告警类型、告警生成相对距离以及告警组长度。其中，告警组的告警类型、告警生成相对距离以及告警组长度具体体现为三个数值。告警组的告警类型的数值长度为n，n为正整数；告警生成相对距离的数值长度为m，m为正整数。n、m的取值大小可以根据需求进行设定，本实施例不做限定。下面结合示例对告警组的告警类型、告警生成相对距离以及告警组长度的对应数值的计算进行说明：(1)、告警组的告警类型用于表征该告警组中不同告警信息的类型出现的频次。示例性的，告警信息的类型具体表现为产生告警信息的板卡的类型与告警名称的组合。例如，对于一个告警信息，产生该告警信息的板卡的类型为sfiu，告警信息的名称为mut_los，则该告警信息的类型为sfiu+mut_los。告警组的告警类型，其数据长度为n，n即为全部告警数据中所包含的告警信息的类型。告警组的告警类型具体获取过程为：统计该告警组中出现的不同告警信息的类型的频次，并用相应的数值表示。示例性的，不同告警信息的类型出现频次对应的数值如表1所示。表1告警信息的类型出现频次与数值对应表出现频次0123≥4对应数值012320可以理解的是，表1中之所以将出现频次大于等于4时对应的数值都选取为20，是因为在wdm网络的复用段中出现频次大于等于4的告警往往可能是来自同一类的故障。因此，出现频次大于等于4时对应的数值将不再线性增长选取，而是都选取为20，便于区分。需要说明的是，表1中告警信息的类型出现频次与数值的对应关系仅为一个示例，在实际计算中，可以根据需求进行调整，本实施例不做限定。这样一来，该告警组中不同告警信息的类型出现的频次就具体转化为一个数据长度为n的数值。(2)、告警生成相对距离用于表征生成告警信息的两个相邻物理端口之间的相对距离。可选的，预先对每个复用段上的物理端口进行依次编号。在将告警数据划分为一个或多个告警组后，根据物理端口的编号，对每个告警组内所有的告警信息对应的物理端口进行由小致大的排序。这样一来，对于相邻的每两个物理端口生成的两个告警信息，计算出它们对应的物理端口的编号之间的差值，即为这两个告警信息生成的相对距离。之后，将相对距离划分为m个区间，统计不同相对距离区间出现的频次，也用对应的数值进行表示。示例性的，将相对距离分为五个区间，即0、1、2至5、6至9、10及以上，则此时告警信息生成的相对距离、出现频次与选取对应数值的关系与表2所示。表2相对距离、出现频次与数值对应表可以理解的是，由于存在一个物理端口生成了多个告警信息的情况，因此对物理端口进行编号排序后，该物理端口生成的告警信息之间的相对距离为0。需要说明的是，表2中相对距离、出现频次与选取数值的对应关系仅为一个示例，在实际计算中，可以根据需求进行调整，本实施例不做限定。这样一来，在上述示例中，告警生成相对距离就具体表现为一个长度为m的数值。(3)、告警组长度用于表征该告警组内包含的告警信息的数目。示例性的，告警组包含的告警信息的数目多少与选取数值的对应关系如表3所示。表3告警组包含的告警信息数目与数值对应表告警信息数目1-5≥6对应数值05需要说明的是，表3中告警组包含的告警信息的数目多少与选取数值的对应关系仅为一个示例，在实际计算中，可以根据需求进行调整，本实施例不做限定。这样一来，告警组内包含的告警信息的数目就具体表现为一个数值。s103、根据告警组的告警类型、告警生成相对距离以及告警组长度，确定不同告警组之间的数据相似度。示例性的，本实施例用欧式距离来体现不同告警组之间的数据相似度。欧氏距离的计算满足以下公式：其中，x、y表示不同的告警组，d(x，y)标识告警组x与告警组y之间的欧氏距离，i表示一个数据计算位数，根据s102可知，计算欧式距离时的数据计算总位数为n+m+1。可以理解的是，假设告警组的数量为p，则计算得出的不同告警组数据之间的欧式距离d共有(p2-p)/2个。需要说明的是，本实施例中具体用欧式距离来体现不同告警组之间的数据相似度仅为一个示例，在实际计算中，可以根据选取其它类型的计算方法，本实施例不做限定。s104、根据不同告警组之间的数据相似度，确定告警组的聚类参考数据。可选的，将步骤s103中的欧氏距离及告警组的编号作为聚类参考数据。s105、根据告警组的聚类参考数据和预设算法，确定聚类结果。可选的，预设算法选取k均值聚类算法。可以理解的是，根据告警组的聚类参考数据和预设算法对告警组进行聚类后，将所有告警组分成了数个不同的类别，即为聚类结果。在聚类结果中，一个类别对应一个故障类型，也是该类别中包含的告警组都属于的故障类型。s106、根据聚类结果和预设的故障定位规则，确定故障发生位置。其中，故障定位规则由人工根据不同的场景进行预先设定。例如，针对聚类结果中的一个类别，定义其故障发生于告警信息差生的距离最近的两个物理端口之间。需要说明的是，故障定位规则根据不同的应用场景等需求可以进行相应的调整，本实施例不做限定。基于上述技术方案，通过从告警组的告警类型、相邻物理端口告警信息之间的相对距离以及告警信息数量三个特征来构建关联告警信息的类型坐标数据，并结合相关预设算法，对获取到的告警信息进行聚类。再根据聚类结果，结合预设的故障定位规则，确定故障发生的位置。本公开的方案能够对告警信息进行智能化、自动化地分析，并对告警信息进行相关性的归纳聚类，得出的聚类结果直观显示了告警信息所代表的故障类型，为运维人员进行故障定位时提供了强有力的依据，降低了运维人员工作量，进而在提高了告警处理的实时性、准确性的同时，减少了运维所需的人力、物力等成本。本公开实施例可以根据上述方法示例对告警分析装置进行功能模块或者功能单元的划分，例如，可以对应各个功能划分各个功能模块或者功能单元，也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块或者功能单元的形式实现。其中，本公开实施例中对模块或者单元的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。示例性的，如图2所示，为本公开实施例所涉及的一种告警分析装置的一种可能的结构示意图。该告警分析装置包括200：获取模块201和处理模块202。其中，获取模块201，用于获取告警组的告警类型、告警生成相对距离以及告警组长度。例如，结合图1，获取模块201具体用于执行步骤102。处理模块202，用于根据告警组的告警类型、告警生成相对距离以及告警组长度，确定告警组的聚类参考数据。例如，结合图1，处理模块202具体用于执行步骤104。处理模块202，还用于根据告警组的聚类参考数据和预设算法，确定聚类结果。例如，结合图1，处理模块202具体用于执行步骤105。处理模块202，还用于根据聚类结果和预设的故障定位规则，确定故障发生位置。例如，结合图1，处理模块202具体用于执行步骤106。可选的，获取模块201，还用于获取告警数据，告警数据包括至少一个告警信息。例如，结合图1，处理模块202具体用于执行步骤101。可选的，处理模块202，还用于根据告警信息所属的时间窗和复用段，将告警数据分为一个或多个告警组。例如，结合图1，处理模块202具体用于执行步骤101。可选的，处理模块202，还用于告警组的告警类型、告警生成相对距离以及告警组长度，确定不同告警组之间的数据相似度。例如，结合图1，处理模块202具体用于执行步骤103。可选的，处理模块202，还用于根据不同告警组之间的数据相似度，确定告警组的聚类参考数据。例如，结合图1，处理模块202具体用于执行步骤104。可选地，告警分析装置200还可以包括存储模块(图2中以虚线框示出)，该存储模块存储有程序或指令。当处理模块202执行该程序或指令时，使得告警分析装置可以执行上述方法实施例所述的告警分析方法。此外，图2所述的告警分析装置的技术效果可以参考上述实施例所述的告警分析方法的技术效果，此处不再赘述。示例性地，图3为上述实施例中所涉及的告警分析装置的又一种可能的结构示意图。如图3所示，告警分析装置300包括：处理器302。其中，处理器302，用于对该告警分析装置的动作进行控制管理，例如，执行上述获取模块201和处理模块202执行的步骤，和/或用于执行本文所描述的技术方案的其它过程。上述处理器302可以是实现或执行结合本公开内容所描述的各种示例性的逻辑方框，模块和电路。该处理器可以是中央处理器，通用处理器，数字信号处理器，专用集成电路，现场可编程门阵列或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本公开公开内容所描述的各种示例性的逻辑方框，模块和电路。所述处理器也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，dsp和微处理器的组合等。可选地，告警分析装置300还可以包括通信接口303、存储器301和总线304。其中，通信接口303用于支持告警分析装置200与其他网络实体的通信。存储器301用于存储该告警分析装置的程序代码和数据。其中，存储器301可以是告警分析装置中的存储器，该存储器可以包括易失性存储器，例如随机存取存储器；该存储器也可以包括非易失性存储器，例如只读存储器，快闪存储器，硬盘或固态硬盘；该存储器还可以包括上述种类的存储器的组合。总线304可以是扩展工业标准结构(extendedindustrystandardarchitecture，eisa)总线等。总线304可以分为地址总线、数据总线、控制总线等。为便于表示，图3中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。通过以上的实施方式的描述，所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。上述描述的系统，装置和模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。本公开实施例提供一种包含指令的计算机程序产品，当所述计算机程序产品在本公开的电子设备上运行时，使得所述计算机执行上述方法实施例所述的告警分析方法。本公开实施例还提供一种计算机可读存储介质，计算机可读存储介质中存储有指令，当计算机执行该指令时，该本公开的电子设备执行上述方法实施例所示的方法流程中告警分析装置执行的各个步骤。其中，计算机可读存储介质，例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘。随机存取存储器(randomaccessmemory，ram)、只读存储器(read-onlymemory，rom)、可擦式可编程只读存储器(erasableprogrammablereadonlymemory，eprom)、寄存器、硬盘、光纤、便携式紧凑磁盘只读存储器(compactdiscread-onlymemory，cd-rom)、光存储器件、磁存储器件、或者上述的人以合适的组合、或者本领域数值的任何其他形式的计算机可读存储介质。一种示例性的存储介质耦合至处理器，从而使处理器能够从该存储介质读取信息，且可向该存储介质写入信息。当然，存储介质也可以是处理器的组成部分。处理器和存储介质可以位于特定用途集成电路(applicationspecificintegratedcircuit，asic)中。在本公开实施例中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。以上所述，仅为本公开的具体实施方式，但本公开的保护范围并不局限于此，任何在本公开揭露的技术范围内的变化或替换，都应涵盖在本公开的保护范围之内。因此，本公开的保护范围应该以权利要求的保护范围为准。当前第1页12

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：赵良;师严;张贺;张晶晶;史正思;沈世奎;王硕
技术所有人：中国联合网络通信集团有限公司
我是此专利的发明人

上一篇：一种用于可溶性桥塞的密封结构的制作方法
上一篇：一种基于强化学习的网络链路性能指标异常定位方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。