一种场景化根因分析应用的制作方法

文档序号:24811660发布日期:2021-04-27 12:54阅读:147来源:国知局
一种场景化根因分析应用的制作方法

1.本发明涉及一种场景化根因分析应用。


背景技术:

2.随着企业上云趋势,人工智能、大数据等众多前沿技术的发展,传统运维业务也面临着需要变革,如何利用这些技术提升日常工作效率成为了当前行业需要考虑的问题。现在行业中数字化场景的应用和业务模式的多样化发展,造成日常支撑这些服务的企业it系统的规模和复杂性普遍大幅提高,企业内部运维团队日常工作中面临的压力和挑战日益俱增,对于日常公司服务的任何一次服务中断事件都有可能对公司业务造成极大甚至无法挽回的影响。面对海量的运维指标,如何快速定位问题所发生的业务层面,达到精准化报警、快速解决问题的目标就成为运维监控常态化的需求。因此我们只有当故障发生时候,能够快速、准确有效的定位到故障根源,通过快速修复才能保障公司数字业务的稳定可靠运行。当前大部分企业普遍采用多种监控系统来分散的实现不同的技术栈监控,但是当出现故障时,运维技术人员通常需要从用户使用的终端应用和设备进行排查,对各个it环节的运行状态和性能进行端到端分析,从全栈全维度的角度深入的对故障问题进行定位。但是现在的传统统计型和跟踪型根因分析系统各有缺点,导致无法快速准确定位根源故障,需要大量的人工参与,从而延长了排障时间。就目前而言,纯依赖运维人员的经验和手工操作的传统故障排查方式效率十分低下,无法应对当前大规模、分布式、异构it系统的运维管理,现下必须要能够利用基于大数据和机器学习智能运维技术构成的根因分析系统才能在最短时间内精确的定位故障的根本原因,全面提升运维人员的故障修复时间,减少故障发生时对企业业务的影响。


技术实现要素:

3.为了解决上述问题,本发明提供一种场景化根因分析应用。
4.本发明中的一种场景化根因分析应用,包括以下步骤:
5.s1:通过cmdp自动发现生成业务拓扑关系图,场景化根因分析应用通过同步cmdp的业务应用拓扑图,以及通过根因分析应用系统自身发现监控基础架构、监控应用调用、监控应用日志数据关系;
6.s2:根因分析应用根据cmdp获取的拓扑图关联apm、基础监控、日志监控数据组成应用关系拓扑图;
7.s3:根因分析应用根据多维权重确定故障根因。
8.上述方案中,所述s1中包括s11:首先通过cmdp自动发现并生成业务拓扑关系图,发现层用于实现各类系统、设备信息的采集获取工作;
9.s12:通过自动发现或在各类系统设备上配置规则,实时获取数据信息,为数据提供支持;
10.s13:场景化根因分析应用通过同步cmdp的业务应用拓扑图,以及通过根因分析应
用系统自身发现监控基础架构、监控应用调用、监控应用日志数据关系生成相应的场景拓扑图。
11.上述方案中,还包括以下步骤:
12.s4:当有故障发生时,根因分析应用基于智能算法判断当前问题事件的故障根因节点,并将问题事件的发生故障信息汇集展示到页面当中,利用根因分析结果快速定位故障发生的原因,如果当前场景设定了修复脚本,可以迅速的对发生故障进行自愈修复。
13.上述方案中,还包括以下步骤:
14.s5:根因分析系统基于场景当中预设的修复建议,将会自动匹配场景当中预设的关联建议,并根据发生故障的修复建议快速找到修复故障的处理方法。
15.上述方案中,还包括以下步骤:
16.s6:通过封装脚本,实现故障的自动化处置。
17.本发明的优点和有益效果在于:本发明提供一种场景化根因分析应用。场景化根因分析系统从现有的it运维数据库cmdp中提取设备间的关联关系,基于agent发现系统的关联性,从而通过系统设备之间的连接关系来构建拓扑图及通过日志文件从共享数据之间构建拓扑关系图。应用根因分析系统能够大幅度的减少业务系统出现问题中断后的故障恢复时间,大大弥补运维工作人员经验不足甚至减少运维工作人员对日常经验的依赖,并可以通过内置脚本进行故障的自愈。根因分析精确度如果最大限度满足用户的需求,将帮助企业快速建设智能化运维体系。场景化根因分析系统同步cmdp业务拓扑,根据多维权重预测根因,并针对不同场景预设修复建议。帮助运维人员快速定位业务及应用维度的问题根因,快速修复故障,并转换个人经验形成故障闭环,降低整体故障率。
附图说明
18.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
19.图1为本发明的流程图。
具体实施方式
20.下面结合附图和实施例,对本发明的具体实施方式作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
21.如图1所示,本发明提供一种场景化根因分析,包括以下步骤:
22.s1:通过cmdp自动发现生成业务拓扑关系图,场景化根因分析应用通过同步cmdp的业务应用拓扑图,以及通过根因分析应用系统自身发现监控基础架构、监控应用调用、监控应用日志数据关系;
23.s2:根因分析应用根据cmdp获取的拓扑图关联apm、基础监控、日志监控数据组成应用关系拓扑图;
24.s3:根因分析应用根据多维权重确定故障根因。
25.上述s1中包括s11:首先通过cmdp自动发现并生成业务拓扑关系图,发现层用于实
现各类系统、设备信息的采集获取工作;
26.s12:通过自动发现或在各类系统设备上配置规则,实时获取数据信息,为数据提供支持;
27.s13:场景化根因分析应用通过同步cmdp的业务应用拓扑图,以及通过根因分析应用系统自身发现监控基础架构、监控应用调用、监控应用日志数据关系生成相应的场景拓扑图。
28.s4:当有故障发生时,根因分析应用基于智能算法判断当前问题事件的故障根因节点,并将问题事件的发生故障信息汇集展示到页面当中,利用根因分析结果可以帮助运维工作人员快速定位故障发生的原因,并且如果当前场景设定了修复脚本,可以迅速的对发生故障进行自愈修复,从而降低故障发生带来的损失。
29.s5:根因分析系统基于场景当中预设的修复建议,将会自动匹配场景当中预设的关联建议,并把发生故障的修复建议提示给运维人员,实现快速找到修复故障的处理方法。
30.s6:通过封装脚本,运维人员可进一步进行处置程序,实现故障的自动化处置。根据多维权重预测根因,针对不同场景预设修复建议。从而快速的定位业务及应用维度的故障根因,快速定位修复故障,并转换个人经验形成故障闭环,降低业务系统整体故障率。
31.当业务应用之间的数据存在逻辑关系时,根据数据逻辑关系给出的根源,当数据存在结构性的时候,会根据图算法模型对根因进行分析,然后再将不同的算法模型对场景和不同的元数据进行适配,对异常故障进行有效的根本问题进行定位。然后在可能引起故障问题的因素中,追溯到导致故障发生的问题因素,并根据预设的场景建议给出解决故障的方案。场景化根因分析应用利用机器学习和深度学习的方法,能够找出不同数据元素的之间的关系,从而利用这些关系判断哪些因素是故障发生的根本原因。
32.场景化根因分析应用基于大数据技术和机器学习算法,将cmdp的业务拓扑图同步给根因分析应用,根因分析应用对收集的各种监控系统的告警消息与数据信息进行统一的接入与处理,同时根因分析应用支持告警事件的通知、响应、定级、跟踪以及多维权重分析。根因分析应用运用动态基线等算法,从而实现故障事件的告警收敛、异常检测、根因分析等,帮助企业打通数据孤岛,统一运维的标准与告警事件管理,减少对运维的事务性干扰,提升运维的整体管理水平。帮助运维人员快速定位业务及应用维度的问题根因,快速修复故障,并转换个人经验形成故障闭环,降低整体故障率。
33.以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1