一种变更风险评估方法、设备及存储介质

文档序号:31628118发布日期:2022-09-24 01:11阅读:149来源:国知局
一种变更风险评估方法、设备及存储介质

1.本技术涉及云技术领域,尤其涉及一种变更风险评估方法、设备及存储介质。


背景技术:

2.随着云技术的发展,云的规模越来越大,功能更新的频率也越来越高。在云网络中发生的针对功能组件执行的代码修改、配置新功能、修复bug等操作可被称为变更。
3.目前,运维人员会在提交变更之前,对变更进行严格的分析和测试,其中,顺利通过测试的变更将被认为是无风险的。但是,由于云的真实环境在规模、软硬件版本、工作负载情况、组件交互情况等各个方面都可能与测试环境有所不同,这导致,针对变更的测试结果的准确性不足。在那些已经通过测试的变更中可能存在有缺陷的变更,而这部分有缺陷的变更在上线后,可能会给云带来灾难性的故障。


技术实现要素:

4.本技术的多个方面提供一种变更风险评估方法、设备及存储介质,用以更加合理、更加准确地评估变更的风险。
5.本技术实施例提供一种变更风险评估方法,包括:
6.响应于风险评估指令,根据云网络中预置的拓扑信息确定目标变更事件对应的变更影响范围,所述拓扑信息中包含云网络中不同级别对象之间的隶属关系以及同级别对象之间的关联关系,所述变更影响范围中包括所述目标变更事件的变更对象对应的至少一层上级对象以及所关联的同级别对象;
7.收集云网络中在所述目标变更事件发生后的预设时间范围内所产生的多项告警信息;
8.根据所述拓扑信息分别确定所述多项告警信息各自对应的告警影响范围,所述告警影响范围包括所述告警信息的告警发生对象对应的至少一层上级对象以及所关联的同级别对象;
9.从所述多项告警信息中选择与所述目标变更事件适配的至少一项目标告警信息,所述目标告警信息对应的告警影响范围与所述变更影响范围之间具有重叠部分;
10.基于所述至少一项目标告警信息,对所述目标变更事件进行风险评估。
11.本技术实施例还提供一种计算设备,包括存储器和处理器;
12.所述存储器用于存储一条或多条计算机指令;
13.所述处理器与所述存储器耦合,用于执行所述一条或多条计算机指令,以用于:
14.响应于风险评估指令,根据云网络中预置的拓扑信息确定目标变更事件对应的变更影响范围,所述拓扑信息中包含云网络中不同级别对象之间的隶属关系以及同级别对象之间的关联关系,所述变更影响范围中包括所述目标变更事件的变更对象对应的至少一层上级对象以及所关联的同级别对象;
15.收集云网络中在所述目标变更事件发生后的预设时间范围内所产生的多项告警
信息;
16.根据所述拓扑信息分别确定所述多项告警信息各自对应的告警影响范围,所述告警影响范围包括所述告警信息的告警发生对象对应的至少一层上级对象以及所关联的同级别对象;
17.从所述多项告警信息中选择与所述目标变更事件适配的至少一项目标告警信息,所述目标告警信息对应的告警影响范围与所述变更影响范围之间具有重叠部分;
18.基于所述至少一项目标告警信息,对所述目标变更事件进行风险评估。
19.本技术实施例还提供一种存储计算机指令的计算机可读存储介质,当所述计算机指令被一个或多个处理器执行时,致使所述一个或多个处理器执行前述的变更风险评估方法。
20.在本技术实施例中,可基于云网络中预置的拓扑信息合理扩大目标变更事件的变更影响范围,这可保证变更风险评估工作的观测范围足够大,有助于提升风险评估的准确性;还可引入告警信息作为变更风险评估的依据,通过收集云网络中产生的告警信息并基于拓扑信息合理扩大各项告警信息的告警影响范围,这可及时发现云网络中尚未显现出的潜在告警,并将这些潜在告警充分参与到变更风险评估过程中;在此基础上,还可通过判断告警影响范围和变更影响范围之间是否具有重叠部分,来发现与目标变更事件匹配的目标告警信息,这样,不仅可将扩展后的变更影响范围修正至更加准确的范围,还可精准地、全面地命中所需的告警信息来计算变更风险值。从而,可实现更加全面、高效、准确地评估变更的风险。
附图说明
21.此处所说明的附图用来提供对本技术的进一步理解,构成本技术的一部分,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
22.图1a为本技术一示例性实施例提供的一种变更风险评估方法的流程示意图;
23.图1b为本技术一示例性实施例提供的一种变更风险评估方案的逻辑示意图;
24.图2a为本技术一示例性实施例提供的一种对变更对象进行网络范围扩展的逻辑示意图;
25.图2b为本技术一示例性实施例提供的一种对告警发生对象进行网络范围扩展的逻辑示意图;
26.图3为本技术一示例性实施例提供的一种为目标变更事件选择目标告警信息的方案逻辑示意图;
27.图4为本技术一示例性实施例提供的一种匹配后的变更影响范围的效果示意图;
28.图5为本技术一示例性实施例提供的一种风险阈值确定方案的逻辑示意图;
29.图6为本技术又一示例性实施例提供的一种计算设备的结构示意图。
具体实施方式
30.为使本技术的目的、技术方案和优点更加清楚,下面将结合本技术具体实施例及相应的附图对本技术技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做
出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
31.目前,采用测试的方式来对变更进行风险评估,但是这种方式的评估结果准确性不足,可能会给云带来灾难性故障。为此,本技术的一些实施例中:可基于云网络中预置的拓扑信息合理扩大目标变更事件的变更影响范围,这可保证变更风险评估工作的观测范围足够大,有助于提升风险评估的准确性;还可引入告警信息作为变更风险评估的依据,通过收集云网络中产生的告警信息并基于拓扑信息合理扩大各项告警信息的告警影响范围,这可及时发现云网络中尚未显现出的潜在告警,并将这些潜在告警充分参与到变更风险评估过程中;在此基础上,还可通过判断告警影响范围和变更影响范围之间是否具有重叠部分,来发现与目标变更事件匹配的目标告警信息,这样,不仅可将扩展后的变更影响范围修正至更加准确的范围,还可精准地、全面地命中所需的告警信息来计算变更风险值。从而,可实现更加全面、高效、准确地评估变更的风险。
32.以下结合附图,详细说明本技术各实施例提供的技术方案。
33.图1a为本技术一示例性实施例提供的一种变更风险评估方法的流程示意图,该方法可由变更风险评估装置执行,该变更风险评估装置可实现为软件和/或硬件的结合,该变更风险评估装置可集成在计算设备中。参考图1a,该方法可包括:
34.步骤100、响应于风险评估指令,根据云网络中预置的拓扑信息确定目标变更事件对应的变更影响范围,拓扑信息中包含云网络中不同级别对象之间的隶属关系以及同级别对象之间的关联关系,变更影响范围中包括目标变更事件的变更对象对应的至少一层上级对象以及所关联的同级别对象;
35.步骤101、收集云网络中在目标变更事件发生后的预设时间范围内所产生的多项告警信息;
36.步骤102、根据拓扑信息分别确定多项告警信息各自对应的告警影响范围,告警影响范围包括告警信息的告警发生对象对应的至少一层上级对象以及所关联的同级别对象;
37.步骤103、从多项告警信息中选择与目标变更事件适配的至少一项目标告警信息,目标告警信息对应的告警影响范围与变更影响范围之间具有重叠部分;
38.步骤104、基于至少一项目标告警信息,对目标变更事件进行风险评估。
39.本实施例提供的变更风险评估方法可应用于云网络中对变更的运维场景。其中,云网络可以是指云计算基础架构中的软件定义的计算网络,当然,这里的定义仅是狭义的,本实施例中的云网络可泛指基于云技术而构建的网络架构。本实施例中,可将在云网络中发生的针对功能组件执行的代码修改、配置新功能、修复bug等操作称为变更。本实施例提供的变更风险评估方法可应用于变更上线之前的测试阶段以取代现有的测试方法,也可应用于变更上线后对变更进行继续跟踪评估,以及时发现测试阶段中未检出的变更风险,从而有效避免因变更导致的云故障。
40.随着云规模的不断扩大,云网络中发生的变更数量是巨大的,仅单日的版本发布、日常运维等导致的变更次数就有可能超过万次。本实施例中的目标变更事件可用于指代云网络中发生的任意一次变更,一次变更中通常会指定变更对象,例如,一次修复bug类的变更中,可指定云网络中的某个网关组件作为变更对象。本实施例中,一个变更事件中指定的变更对象可以是一个或多个,当变更对象为多个时,该多个变更对象之间至少存在一层共同所属的级别对象,例如,上述的修复buge类的变更中可指定网关组件a和交换机组件b,且
网关组件a和交换机组件b位于同一可用区(级别对象)中。当然,这仅是优选地,本实施例并不限于此,同一变更事件中的多个变更对象之间也可并无上述限定,对此,本实施例中,只需在变更事件内部按上述要求进行变更对象分组,并按组来分析变更风险后再进行分析结果综合,即可实现对变更事件的风险评估。为便于方案说明,后文中将默认采用上述的优先的实现方式来定义目标变更事件。
41.本实施例中,可周期性或根据其它触发条件来触发风险评估指令,应当理解的是,本实施例中将在变更事件的存续时间内不断执行图1a中所示的变更风险评估逻辑,从而对变更事件进行跟踪评估,例如,每隔10s评估一次。跟踪评估的结束时机可根据时机需要进行设定,例如,可设定为在变更事件开始后的预设时长后停止评估,或者在变更事件对应的风险评估结果低于预设标准的状态已经持续预设时长后停止评估,等等,本实施例对此不做限定。
42.基于此,参考图1a,在步骤100中,可响应于风险评估指令,合理扩大目标变更事件对应的变更影响范围。其中,变更影响范围的扩大是指将目标变更事件的影响范围从变更对象扩展至更大的范围。例如,变更对象为物理网关时,目标变更事件原本的变更影响范围是云网络中的一个设备,可逐步将其扩展至设备所属的集群,扩展至设备所属的可用区,扩展至设备所属的地区region等。这样,可将目标变更事件的变更影响范围扩大,为目标变更事件提供了足够大了观测范围,在足够大的观测范围内对目标变更事件进行观测,可有效提高风险评估的准确性。
43.本实施例中,可在云网络中划分出多级别对象,并基于多级别对象预先定义云网络中的拓扑信息。其中,多种级别对象可包括但不限于实例、网元、应用、设备、集群、可用区、地区等等。在云网络中,拓扑信息中可包含不同级别对象之间隶属关系以及同级别对象之间的关联关系。示例性的隶属关系可以是,设备从属于集群,集群从属于可用区,而可用区从属于地区;示例性的同级别对象之间的关联关系可以是,不同实例之间可能存在资源关联关系或者实例与应用之间可能存在资源关联关系等,本实施例对拓扑信息中包含的具体关系逻辑不做限定。本实施例中,不同级别对象的规格不同,例如,地区的规格要大于可用区;同级别对象之间的规格可相同也可近似,例如,实例、应用属于同级别对象,当然,这仅是示例性的,本实施例对此并不做限定。基于云网络中的拓扑信息,可将一个变更对象或一个告警发生对象扩展至更大的影响范围,这其中包含同级别内的扩展以及向更高级别的扩展。
44.在此基础上,本实施例中,在确定目标变更事件对应的变更影响范围的过程中,可按照云网络中预置的拓扑信息,逐级别查找变更对象所隶属的级别对象,以获得与变更对象对应的至少一层上级对象;还可查找与变更对象存在关联的同级别对象;从而确定出的变更影响范围中可包括目标变更事件的变更对象对应的至少一层上级对象以及所关联的同级别对象。本实施例中,在查找变更对象对应的至少一层上级对象的过程中,可将指定级别的对象作为结束条件,这样,可逐级别查找变更对象所隶属的级别对象,直至查找到指定级别的对象后结束查找,以获得目标变更事件的变更对象对应的至少一层上级对象。例如,指定级别的对象可以是地区region,当然,这仅是示例性的,本实施例对此不做限定。
45.这样,扩展获得的变更影响范围可记录目标变更事件可能影响到的多层级别对象。
46.图1b为本技术一示例性实施例提供的一种变更风险评估方案的逻辑示意图。参考图1b,可从云网络中的变更系统中获知变更事件,而变更事件中将指定变更对象。
47.参考图1b,本实施例中还创新性地提出引入告警信息来作为变更风险评估的依据。云网络中通常部署有成熟的监测系统,监测系统用于监测云网络中各个点位上的运行状态,例如,监测流量状态、丢包状态、时延状态等等,监测系统中将产生大量的告警信息,本实施例中,可收集云网络中监测系统产生的告警信息,并将这些告警信息作为变更风险评估的依据。正如前文提及的,变更风险评估工作可以采用周期性或其它触发条件的形式被触发,触发一次风险评估指令的情况下,本实施例中可收集上一次风险评估结束后,云网络中新增的告警信息,作为本次变更风险评估工作的依据。
48.目前,为了监测的精准性,云网络中的监测系统通常是采用单点监测的方式,监测对象通常处于实例、设备、网元、应用等层面,相应的,告警信息中的告警发生对象通常是单点的。为此,本实施例中,参考图1a,在步骤101中,可收集云网络中在目标变更事件发生后的预设时间范围内所产生的多项告警信息。
49.在此基础上,在步骤102中,可根据拓扑信息分别确定多项告警信息各自对应的告警影响范围,告警影响范围包括告警信息的告警发生对象对应的至少一层上级对象以及所关联的同级别对象。其中,告警信息中可包含告警发生对象、告警级别以及告警描述内容等信息。其中,告警发生对象是指云网络中发生异常情况的对象,其上的异常情况触发监测系统发出了告警信息。不同告警信息中的告警发生对象所处的级别对象可能不尽相同,告警发生对象所处的级别对象可包括但不限于前述的实例、设备、网元、应用等层面。本实施例中,可将告警信息对应的原始影响范围扩大,使告警信息可覆盖更大的影响范围,这可将告警信息赋予至扩大后的影响范围。很多时候,在变更有缺陷的情况下,变更的影响范围可能是跨组件的,短时间内,变更导致的异常可能仅显现在几个点位上,而其对其它点位造成的异常可能尚未显现出来,为此,本实施例中,通过对告警信息进行影响范围扩展,将在单点上发现的告警合理扩展到更大范围,以充分发现扩大后的告警影响范围中尚未显现出的潜在告警,并可将这些尚未显现出来的潜在告警充分参与到变更风险评估过程中,为变更风险评估工作提供更加全面的依据。
50.实际应用中,步骤100和步骤102中的影响范围扩展操作可以是同步执行的,本实施例中并不限定先后顺序。且告警影响范围的扩大逻辑和变更影响范围的扩大逻辑基本类似,在此不再详细重复关于告警影响范围的扩大操作的细节。
51.在此基础上,参考图1a和图1b,在步骤103中,可从多项告警信息中选择与目标变更事件适配的至少一项目标告警信息。这里,可将变更影响范围和告警影响范围进行重叠分析,将与变更影响范围具有重叠部分的告警影响范围所对应的告警信息作为目标告警信息。也即是,目标告警信息的告警影响范围需与目标变更事件的变更影响范围具有重叠部分,其中重叠部分中包含至少一个级别对象。正如前文提及的,本实施例中,将目标变更事件的观测范围进行了扩大,将告警信息的覆盖范围进行了扩大,通过对扩展获得的变更影响范围和告警影响范围进行重叠分析,可快速地确定出变更影响范围中可能发生告警的级别对象,这可将扩展获得的变更影响范围再修正至更加准确的范围。由于修正后的范围是充分考虑了云网络中已经显现的告警以及前述步骤102中囊括的尚未显现出的潜在告警而确定出的,因此,不仅可保证变更风险评估的全面性和准确性,还可进一步精简变更的观测
范围,减少计算量。
52.值得说明的是,本实施例中是从目标变更事件的角度来描述步骤102中的匹配过程,但应当理解的是,本实施例中并不限定告警信息与变更事件在匹配过程的角色主次,可以从每个变更事件的角度去从多项告警信息中寻找目标告警信息,也可以从每项告警信息的角度去从多个变更事件中去寻找匹配的变更事件,而该告警信息自然成为匹配到的变更事件对应的目标告警信息。而且,匹配操作可以是同步的,当然也可以是异步的,本实施例对此不做限定。
53.在确定出与目标变更事件适配的至少一项目标告警信息之后,在步骤104中,可基于至少一项目标告警信息,对目标变更事件进行风险评估。本实施例中,可通过对至少一项目标告警信息进行分析,来评估目标变更事件是否存在风险。本实施例中可采用多种实现方式来基于目标告警信息对目标变更事件进行变更风险评估,具体的实现方式将在后续实施例中进行详细说明。
54.据此,本实施例中,可基于云网络中预置的拓扑信息合理扩大目标变更事件的变更影响范围,这可保证变更风险评估工作的观测范围足够大,有助于提升风险评估的准确性;还可引入告警信息作为变更风险评估的依据,通过收集云网络中产生的告警信息并基于拓扑信息合理扩大各项告警信息的告警影响范围,这可及时发现云网络中尚未显现出的潜在告警,并将这些潜在告警充分参与到变更风险评估过程中;在此基础上,还可通过判断告警影响范围和变更影响范围之间是否具有重叠部分,来发现与目标变更事件匹配的目标告警信息,这样,不仅可将扩展后的变更影响范围修正至更加准确的范围,还可精准地、全面地命中所需的告警信息来计算变更风险值。从而,可实现更加全面、高效、准确地评估变更的风险。另外,由于告警信息是可覆盖全网的,因此,通过本实施例提出的告警信息的匹配方案,可将与变更对象之间跨组件的告警信息引入到目标变更对象的风险评估工作中,这可有效解决目前无法跨组件评估变更的困境(通常不同组件是由不同部门负责,目前变更测试工作通常只放在变更对象的负责部门来进行,其它相关组件的负责部门对变更甚至是无感知的)。
55.在上述或下述实施例中,云网络中的上述拓扑信息可采用树结构,也即是,可通过拓扑树的形式来表征云网络中的上述拓扑信息。拓扑树可遵循分层结构,将不同级别对象合理分配在拓扑树的各个层中。例如,设备类对象的上一层可以是集群类对象,在上一层可以是可用区类对象,再上一层可以是地区类对象。
56.基于此,一种变更影响范围的确定方案可以是:按照拓扑信息对应的树结构,将目标变更事件的变更对象对应的至少一层上级对象以及所关联的同级别对象组织为以变更对象作为根节点的变更拓扑树,以表征变更影响范围。图2a为本技术一示例性实施例提供的一种确定变更影响范围的逻辑示意图。参考图2a,目标变更事件中的变更对象为avs设备,根据云网络中的拓扑信息,可将avs设备逐级别扩展至其所属的avs集群、可用区及地区region,从而获得变更影响范围,也即是图2a中最右侧的变更拓扑树。当然,图2a中,仅示出了变更对象为设备时的拓扑树结构,对于变更对象所属的初始级别对象为其它对象的情况,可根据云网络中预置的拓扑信息进行适应性地扩展。
57.同样,一种告警影响范围的确定方案可以是:按照拓扑信息对应的树结构,将告警信息的告警发生对象对应的至少一层上级对象以及所关联的同级别对象组织为以告警发
生对象作为根节点的告警拓扑树,以表征告警影响范围。图2b为本技术一示例性实施例提供的一种确定告警影响范围的逻辑示意图,参考图2b,第一告警信息为eip实例告警,这种情况下,可首先找到第一告警信息中的告警对象,也即是eip实例,以及基于云网络中预置的拓扑信息,找到与eip实例存在资源关联关系的ecs实例;之后,可分别找到承载eip实例的xgw集群和承载ecs实例的avs设备;再按照与图2a类似的方式,继续将xgw集群逐级别扩展至其所属的可用区及地区region,以及将avs设备逐级别扩展至其所属的avs集群、可用区及地区region,从而获得告警影响范围,也即是图2b中最右侧侧告警拓扑树。
58.应当理解的是,本实施例中,在云网络中划分出了多级别对象,而在每种级别对象下则可存在多个实际对象,例如,实例类级别对象下可存在实例1、实例2、实例3等若干实例,而可用区类级别对象下则可存在可用区a、可用区b等若干可用区。本实施例中,在为目标变更事件构建变更拓扑树的过程中,只需将变更对象根据自己所属的级别对象在云网络中的拓扑信息内对号入座即可,而基于拓扑信息可确定出与变更对象存在拓扑关系的其它级别对象下的实际对象。
59.在变更影响范围和告警影响范围都采用拓扑树来表征的情况下,在从多项告警信息中选择与目标变更事件适配的至少一项目标告警信息的过程中,若告警拓扑树和变更告警树之间是否存在重叠的树节点,则可确定相应的告警影响范围与变更影响范围具有重叠部分。
60.图3为本技术一示例性实施例提供的一种为目标变更事件选择目标告警信息的方案逻辑示意图。参考图3,左侧为目标变更事件对应的变更拓扑树,右侧为两项告警信息各自对应的告警拓扑树,可见,两棵告警拓扑树均与变更拓扑树存在重叠的树节点,因此,图3中的两项告警信息均可确定为目标变更事件对应的目标告警信息。这样,通过拓扑树的方式,可方便快捷准确地为目标变更事件确定出适配的目标告警信息。
61.据此,本实施例中,可采用拓扑树的方式来表征变更影响范围和告警影响范围,这不仅可清楚、全面地呈现影响范围扩展操作所扩展出的至少一层级别对象,还可呈现扩展出的对象与变更对象之间的隶属关系、资源关联关系等拓扑信息。当然,本实施例中,还可采用其它方式来表征变更影响范围和告警影响范围,例如,可采用【第一级别对象、第二级别对象

;级别对象之间的拓扑信息】的数据结构来表征,也可采用集合+标签的方式来表征等,本实施例并不限于此。
62.图4为本技术一示例性实施例提供的一种匹配后的变更影响范围的效果示意图。参考图 4,经过上述匹配过程后,至少一个目标告警信息将关联至目标变更事件对应的变更影响范围中,具体地,至少一个目标告警信息将关联至其在变更影响范围中所重叠的最小的级别对象。举例来说,图4中,存在1个p3级别的目标告警信息与变更拓扑树重叠的最小的级别对象为avs设备1,则可将该目标告警信息关联至变更拓扑树中的avs设备1节点,同样的情况,变更拓扑树中的avs设备2节点和avs设备3节点上也被关联上了告警信息;还存在1 个p1级别的目标告警信息与变更拓扑树重叠的最小的级别对象为avs集群1,则可将该目标告警信息关联至变更拓扑树中的avs集群1节点。
63.在上述或下述实施例中,可采用多种实现方式来基于至少一项目标告警信息而对目标变更事件进行风险评估。
64.在一种可选的实现方式中,可获取至少一项目标告警信息中记录的告警级别;根
据至少一项目标告警信息各自对应的告警级别,计算目标变更事件对应的风险评估值;若风险评估值满足预设条件,则确定目标变更事件存在风险。其中,告警级别为告警信息中的已有信息,其用于表征相应异常事件的严重程度、影响程度等。
65.在该实现方式中,可从至少一项目标告警信息中分别提取告警级别,并将提取到的告警级别作为变更风险评估的依据。这使得风险评估值的计算逻辑更加简洁、巧妙。
66.其中,风险评估值可用于表征目标变更事件的风险程度,通常,风险评估值越高代表目标变更事件的风险程度越高,其可能给云带来故障的可能性越高、造成的故障的严重程度可能也更高。
67.在该实现方式中,在根据至少一项目标告警信息各自对应的告警级别,计算目标变更事件对应的风险评估值的过程中:可分别确定至少一项目标告警信息各自与目标变更事件的关联程度;按照关联程度为至少一项目标告警信息分配权重;根据至少一项目标告警信息各自对应的告警级别及权重,计算目标变更事件对应的风险评估值。
68.其中,关联程度用于表征告警影响范围和变更影响范围之间的契合程度,变更影响范围中与告警影响范围的重叠部分越多表征变更影响范围与告警影响范围的契合程度越高,可为相应的目标告警信息分配更高的关联程度。为此,可查找变更影响范围和至少一项目标告警信息各自对应的告警影响范围之间重叠部分中的最小的级别对象;根据至少一项目标告警信息各自对应的最小的级别对象到变更对象之间的级别距离,为至少一项目标告警信息分配关联程度。其中,级别距离实质上是最小的级别对象与变更对象之间的隶属关系中的层级数。可选地,若变更影响范围和告警影响范围采用拓扑树表征,则可查找变更影响范围和至少一项目标告警信息各自对应的告警影响范围之间重叠部分中的最低树节点,其中,单个树节点对应一个级别对象;根据至少一项目标告警信息各自对应的最低树节点在表征变更影响范围的变更拓扑树中与变更对象之间的拓扑距离,确定至少一项目标告警信息各自对应的级别距离。其中,所对应的最低树节点在表征变更影响范围的拓扑树中的位置相同的目标告警信息之间具有相同的级别距离。参考图3,右上的告警拓扑树与左侧变更拓扑树之间重叠的最低树节点为avs设备2;而右下的告警拓扑树与左侧变更拓扑树之间重叠的最低树节点则为可用区a,显然,右上的告警拓扑树对应的目标告警信息将获得比右下的告警拓扑树对应的目标告警信息更高的关联程度。实际应用中,可采用级别距离来表示关联程度,参考图3,右上的告警拓扑树与变更拓扑树之间的级别距离为1,则可为其对应的目标告警分配关联程度 1;右下的告警拓扑树与变更拓扑树之间的级别距离为2,则可为其对应的目标告警分配关联程度2。
69.在此基础上,可按照关联程度为至少一个目标告警信息分配权重,通常,关联程度越高的目标告警信息可分配更高的权重,以体现其对目标变更事件更高的参考作用。另外,相同关联程度的目标告警信息可分配到同样的权重。
70.可选地,可按照以下公式来计算权重:
[0071][0072]
其中,p为上述的关联程度(可使用拓扑距离来表示),α、β为经验参数,q为当前级别距离对应的级别对象中的告警比例。告警比例用于表征变更影响范围中同级别内匹配到告警信息的对象数在该级别内全部对象数中的占比。举例来说,参考图4,在变更拓扑树的
最小的级别内avs设备1、avs设备2和avs设备3下的所有ecs实例全部匹配到了告警信息,则该层的告警比例可以为1(也即是100%);基于同样的理由,上一级别内avs集群1下的 3个avs设备也全部匹配到了告警信息,因此,告警比例同样可以为1;而再上一级别内的可用区a下只有avs集群1匹配到了告警信息,则可用区a的告警比例则可以是1/21(也即是该可用区中的21个集群中,只有1个匹配到了告警信息),再上一级别内地区的告警比例则可以为1/5。在此基础上,当要计算变更影响范围中级别距离为1(对应图中的最级别对象 avs设备1-3)的告警信息对应的关联程度时,可将上式中的q赋值为1,从而求取出f(1);同理,当要计算级别距离为3的告警信息对应的关联程度时,可将上式中的q赋值为1/21,从而求取出f(3)。
[0073]
其中,在根据至少一项目标告警信息各自对应的告警级别及权重,计算目标变更事件对应的风险评估值的过程中,可获取为至少一项目标告警信息各自对应的告警级别分配的初始风险值;基于至少一项目标告警信息各自对应的权重,对至少一项目标告警信息各自对应的初始风险值进行加权求和;根据加权求和的结果,确定目标变更事件对应的风险评估值。
[0074]
可选地,一种为不同告警级别分配的初始风险值的示例性方案可以是:确定不同告警级别各自对应的基础风险值;统计不同告警级别各自在云网络中发生的历史频次;基于不同告警级别各自对应的历史频次,为不同告警级别分配调整系数;在不同告警级别下,按照相应的调整系数对相应的基础风险值进行加权,以获得不同告警级别各自对应的初始风险值。其中,对于历史频次更高的告警级别,可为其分配更高的调整系数,以使其初始风险值更高一些,对最终的风险评估值的影响也将更大一些。在该示例性方案中,考虑了不同告警级别在云网络中发生的历史频次来对基础风险值进行了微调,这样,随着云网络中发生的告警情况的变化,不同告警级别各自对应的初始风险值也将是动态变化的。当然,在该实现方式中,还可采用其它示例性方案来为不同告警级别分配初始风险值,而并不限于此。
[0075]
在此基础上,可获取至少一项目标告警信息各自对应的告警级别的初始风险值。
[0076]
在该实现方式中,风险评估值的计算逻辑可表征为以下公式:
[0077]vp
=x*(1+f(p));
[0078]
v=v1+v2+

+v
p
[0079]
其中,v表示目标变更事件的风险评估值,v
p
表示所有拓扑距离为p的目标告警信息所导致风险评估值之和,p表示前述的拓扑距离,f(p)表示关联程度为p的目标告警信息所分配到的权重,x表示关联程度为p的各个目标告警信息对应的初始风险值。可知,目标变更事件的风险评估值等于对所有目标告警信息的初始风险值进行加权求和的结果再加上所有目标告警信息的初始风险值。
[0080]
通过这种方式来计算风险评估值,可将云网络中发生的与目标变更事件相匹配的目标告警信息作为风险评估的依据,也可根据目标告警信息与目标变更事件的关联程度来分类各向目标告警信息在计算风险评估值过程中的参与程度,这样,可综合考虑所有目标告警信息提供的风险依据,避免因其中少量目标告警信息而片面地判断目标变更事件存在风险。例如,云网络中的告警信息有可能是用户行为所导致的,但是这些告警信息很难被准确地剔除出来,在该实现方式中,即使这些用户行为导致的告警信息参与到风险评估值的计算过程中来,由于用户行为导致的告警信息通常是局部的、暂时的,因此,其在风险评估
值计算过程中的参与程度并不会过于强烈,这无形中将这类告警信息对最终风险评估值的影响力进行了弱化,可有效避免因用户行为而导致的风险评估误判问题。
[0081]
上述实现方式可通过将目标告警信息关联至目标变更事件,而且通过告警比例、权重、调整系数、初始风险值等多种维度来综合考量各项目标告警信息应当在风险评估值中发挥的影响程度,从而合理地分析目标告警信息,以获得风险评估值。
[0082]
应当理解的是,本实施例中,还可采用其它实现方式来根据目标告警信息计算出风险评估值,例如,采用机器学习的方式来学习告警信息与风险评估值之间的映射关系等等,本实施例在此不做详述。
[0083]
进一步地,本实施例中,还可设定风险阈值,并将前述的预设条件设置为超过风险阈值,这样,在为目标变更事件计算出的风险评估值超过风险阈值的情况下,可确定目标变更事件存在风险。在确定目标变更事件存在风险的情况下,可发出提醒通知;提醒通知可输出给运维人员,以供运维人员确认对目标变更事件的处置方案,例如,可以是暂停变更或在线修改变更等,本实施例在此不做限定。
[0084]
一种示例性的确定风险阈值的方案可以是:持续收集为云网络中发生的历史变更事件所计算的风险评估值,作为评估值样本;按照不同风险评估值各自被记录的次数,对收集到的评估值样本进行分布拟合,以获得拟合函数;基于拟合函数,选取风险阈值。
[0085]
图5为本技术一示例性实施例提供的一种风险阈值确定方案的逻辑示意图,参考图5,可以评估值样本中的风险评估值作为x轴,以评估值样本涉及到的各个风险评估值被记录次数为y轴,获得风险评估值的分布数据,并生成对应的分布拟合函数。
[0086]
在选取风险阈值的过程中:若评估值样本的数量高于指定数量,则基于拟合函数对评估值样本进行分布排序;从分布排序后的评估值样本中选择与预置误报率适配的目标评估值样本;将目标评估值样本对应的风险评估值作为风险阈值;若评估值样本的数量低于指定数量,则则基于拟合函数对评估值样本进行分布排序;从分布排序后的评估值样本中选择与预置分布累计概率适配的目标评估值样本;将目标评估值样本对应的风险评估值作为风险阈值。例如,图5中评估值样本不足500(对应前述的指定数量)条,若评估值样本为100条,按照预置分布累计概率为99%为条件,则计算出风险阈值为9.4,这样,在目标变更事件的风险评估值高于9.4的情况下,将被认定为存在风险。
[0087]
据此,本实施例中,可基于目标告警信息,简洁、高效、准确地计算出目标变更事件对应的风险评估值,并通过判断风险评估值是否超过风险阈值来研判目标变更事件是否存在风险,从而可在变更测试阶段或者变更上线后的运行阶段中,及时发现变更事件的风险,进而有效规避变更可能给云带来的故障。
[0088]
需要说明的是,上述实施例所提供方法的各步骤的执行主体均可以是同一设备,或者,该方法也由不同设备作为执行主体。在上述实施例及附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。
[0089]
图6为本技术又一示例性实施例提供的一种计算设备的结构示意图。如图6所示,该计算设备包括:存储器60和处理器61。
[0090]
处理器61,与存储器60耦合,用于执行存储器60中的计算机程序,以用于:
[0091]
响应于风险评估指令,根据云网络中预置的拓扑信息确定目标变更事件对应的变更影响范围,拓扑信息中包含云网络中不同级别对象之间的隶属关系以及同级别对象之间的关联关系,变更影响范围中包括目标变更事件的变更对象对应的至少一层上级对象以及所关联的同级别对象;
[0092]
收集云网络中在目标变更事件发生后的预设时间范围内所产生的多项告警信息;
[0093]
根据拓扑信息分别确定多项告警信息各自对应的告警影响范围,告警影响范围包括告警信息的告警发生对象对应的至少一层上级对象以及所关联的同级别对象;
[0094]
从多项告警信息中选择与目标变更事件适配的至少一项目标告警信息,目标告警信息对应的告警影响范围与变更影响范围之间具有重叠部分;
[0095]
基于至少一项目标告警信息,对目标变更事件进行风险评估。
[0096]
在一可选实施例中,处理器61在确定变更影响范围中包括的目标变更事件的变更对象对应的至少一层上级对象的过程中,用于:
[0097]
按照拓扑信息,逐级别查找变更对象所隶属的级别对象,直至查找到指定级别的对象后结束查找,以获得目标变更事件的变更对象对应的至少一层上级对象;
[0098]
确定告警影响范围中包括的告警信息的告警发生对象对应的至少一层上级对象的过程中,用于:
[0099]
按照拓扑信息,逐级别查找告警发生对象所隶属的级别对象,直至查找到指定级别的对象后结束查找,以获得告警信息的告警发生对象对应的至少一层上级对象。
[0100]
在一可选实施例中,拓扑信息采用树结构,处理器61还可用于:
[0101]
按照拓扑信息对应的树结构,将目标变更事件的变更对象对应的至少一层上级对象以及所关联的同级别对象组织为以变更对象作为根节点的变更拓扑树,以表征变更影响范围;
[0102]
按照拓扑信息对应的树结构,将告警信息的告警发生对象对应的至少一层上级对象以及所关联的同级别对象组织为以告警发生对象作为根节点的告警拓扑树,以表征告警影响范围。
[0103]
在一可选实施例中,处理器61在基于至少一项目标告警信息,对目标变更事件进行风险评估过程中,用于:
[0104]
获取至少一项目标告警信息中记录的告警级别;
[0105]
根据至少一项目标告警信息各自对应的告警级别,计算目标变更事件对应的风险评估值;
[0106]
若风险评估值满足高于风险阈值,则确定目标变更事件存在风险。
[0107]
在一可选实施例中,处理器61在根据至少一项目标告警信息各自对应的告警级别,计算目标变更事件对应的风险评估值过程中,用于:
[0108]
分别确定至少一项目标告警信息各自与目标变更事件的关联程度;
[0109]
按照关联程度为至少一项目标告警信息分配权重;
[0110]
根据至少一项目标告警信息各自对应的告警级别及权重,计算目标变更事件对应的风险评估值。
[0111]
在一可选实施例中,处理器61在分别确定至少一项目标告警信息各自与目标变更
事件的关联程度过程中,用于:
[0112]
查找变更影响范围和至少一项目标告警信息各自对应的告警影响范围之间重叠部分中的最小的级别对象;
[0113]
根据至少一项目标告警信息各自对应的最小的级别对象到变更对象之间的级别距离,为至少一项目标告警信息分配关联程度。
[0114]
在一可选实施例中,处理器61在查找变更影响范围和至少一项目标告警信息各自对应的告警影响范围之间重叠部分中的最小的级别对象过程中,用于:
[0115]
若变更影响范围和告警影响范围采用拓扑树表征,则查找变更影响范围和至少一项目标告警信息各自对应的告警影响范围之间重叠部分中的最低树节点,其中,单个树节点对应一个级别对象;
[0116]
确定级别距离的过程中,用于:
[0117]
根据至少一项目标告警信息各自对应的最低树节点在表征变更影响范围的变更拓扑树中与变更对象之间的拓扑距离,确定至少一项目标告警信息各自对应的级别距离。
[0118]
在一可选实施例中,处理器61在根据至少一项目标告警信息各自对应的告警级别及权重,计算目标变更事件对应的风险评估值过程中,用于:
[0119]
获取为至少一项目标告警信息各自对应的告警级别分配的初始风险值;
[0120]
基于至少一项目标告警信息各自对应的权重,对至少一项目标告警信息各自对应的初始风险值进行加权求和;
[0121]
根据加权求和的结果,确定目标变更事件对应的风险评估值。
[0122]
在一可选实施例中,处理器61在为不同告警级别分配的初始风险值的过程中,用于:
[0123]
确定不同告警级别各自对应的基础风险值;
[0124]
统计不同告警级别各自在云网络中发生的历史频次;
[0125]
基于不同告警级别各自对应的历史频次,为不同告警级别分配调整系数;
[0126]
在不同告警级别下,按照相应的调整系数对相应的基础风险值进行加权,以获得不同告警级别各自对应的初始风险值。
[0127]
在一可选实施例中,处理器61还可用于:
[0128]
持续收集为云网络中发生的历史变更事件所计算的风险评估值,作为评估值样本;
[0129]
按照不同风险评估值各自被记录的次数,对收集到的评估值样本进行分布拟合,以获得拟合函数;
[0130]
基于拟合函数,选取风险阈值。
[0131]
进一步,如图6所示,该计算设备还包括:通信组件62、电源组件63等其它组件。图6中仅示意性给出部分组件,并不意味着计算设备只包括图6所示组件。
[0132]
值得说明的是,上述关于计算设备各实施例中的技术细节,可参考前述的方法实施例中的相关描述,为节省篇幅,在此不再赘述,但这不应造成本技术保护范围的损失。
[0133]
相应地,本技术实施例还提供一种存储有计算机程序的计算机可读存储介质,计算机程序被执行时能够实现上述方法实施例中可由计算设备执行的各步骤。
[0134]
上述图6中的存储器,用于存储计算机程序,并可被配置为存储其它各种数据以支
持在计算平台上的操作。这些数据的示例包括用于在计算平台上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。
[0135]
上述图6中的通信组件,被配置为便于通信组件所在设备和其他设备之间有线或无线方式的通信。通信组件所在设备可以接入基于通信标准的无线网络,如wifi,2g、3g、4g/lte、5g等移动通信网络,或它们的组合。在一个示例性实施例中,通信组件经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频识别(rfid) 技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其他技术来实现。
[0136]
上述图6中的电源组件,为电源组件所在设备的各种组件提供电力。电源组件可以包括电源管理系统,一个或多个电源,及其他与为电源组件所在设备生成、管理和分配电力相关联的组件。
[0137]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0138]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/ 或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/ 或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0139]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0140]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0141]
在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
[0142]
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。内存是计算机可读介质的
示例。
[0143]
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带式磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
[0144]
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0145]
以上所述仅为本技术的实施例而已,并不用于限制本技术。对于本领域技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1