运维任务处理方法、装置、计算机设备和存储介质与流程

文档序号:15845356发布日期:2018-11-07 08:56阅读:177来源:国知局
运维任务处理方法、装置、计算机设备和存储介质与流程

本申请涉及计算机技术领域,特别是涉及一种运维任务处理方法、装置、计算机设备和存储介质。

背景技术

近年来,以金融行业为代表的大型业务系统,尤其是其在线关键业务系统对运维管理的刚性需求持续快速增长,以保障其关键业务系统能够持续不间断地稳定运行。然而传统金融行业的it(informationtechnology,信息技术产业)运维平台大多停留在数据流转层面,真正的数据处理往往依赖运维人员人工完成。随着需要运维管理的业务系统增多,运维人员难以保证对大量系统问题及时做出响应,从而影响企业it服务效率。



技术实现要素:

基于此,有必要针对上述技术问题,提供一种能够提高运维管理效率,进而提高企业it服务效率的运维任务处理方法、装置、计算机设备和存储介质。

一种运维任务处理方法,所述方法包括:对指定的监控节点进行监控,根据监控结果进行监控告警;基于所述监控告警生成待处理的运维任务;识别所述运维任务的任务类型;当所述任务类型为配置变更时,根据配置变更的任务处理逻辑,调用相应的处理组件对所述运维任务进行处理,得到对应的变更配置项;对所述变更配置项进行变更风险测算;当测算结果低于阈值时,根据所述变更配置项进行配置变更。

在其中一个实施例中,所述对指定的监控节点进行监控,根据监控结果进行监控告警,包括:当接收到对所述监控节点的访问请求时,在所述访问请求中提取特征字段;根据所述特征字段生成所述访问请求对应的特征向量;将所述特征向量输入预设的安全监控模型,检测访问请求是否为风险访问;统计在监控时段检测到的风险访问的数量;当所述数量达到阈值时,进行监控告警。

在其中一个实施例中,所述根据监控结果进行监控告警,包括:获取所述监控节点上部署的当前版本软件的第一缺陷数据;根据所述第一缺陷数据生成当前版本软件对应的缺陷累积实际趋势图;获取所述监控节点上部署的历史版本软件的第二缺陷数据;根据所述第二缺陷数据生成当前版本软件对应的缺陷累积预测趋势图;计算所述缺陷累积实际趋势图与所述缺陷累积预测趋势图的偏差度;根据所述偏差度确定监控节点的告警频率,按照告警频率进行监控告警。

在其中一个实施例中,所述基于所述监控告警生成待处理的运维任务,包括:对所述监控告警进行解析,提取得到多个告警关键词。获取预设的多种任务类型分别对应的关键词集合,将所述告警关键词与多个关键词集合进行匹配,确定所述监控告警对应的任务类型;获取所述任务类型对应的任务模板,根据所述任务模板中的多个模板元素,在所述监控告警中提取对应的字段值进行模板填充,生成所述运维任务。

在其中一个实施例中,所述调用相应的处理组件对所述运维任务进行处理之前,还包括:获取运维知识图谱;所述运维知识图谱包括多种运维指标对应的运维策略;确定每种运维指标对应的任务类型;基于所述运维指标生成相应任务类型的任务标签;对所述运维策略进行语义分析,将所述运维策略分解为多个执行步骤,并确定多个执行步骤的执行顺序和关联性;获取每个执行步骤对应的执行脚本,根据多个执行步骤的执行顺序和关联性对多个执行脚本进行拼接,得到相应任务标签对应的处理组件。

在其中一个实施例中,所述对所述变更配置项进行变更风险测算,包括:确定所述运维任务的变更项目类型;获取所述变更项目类型对应的配置模板;所述配置模板包括多个配置项以及每个配置项对应的多个配置区间,每个所述配置区间具有对应的风险因子;确定每个所述变更配置项所属的配置区间及对应的风险因子;根据每个变更配置项对应的风险因子,计算本次变更对应的风险值。

在其中一个实施例中,所述方法还包括:当测算结果大于或等于阈值时,基于所述运维任务生成配置页面,将所述配置页面发送至终端;监听所述终端在配置页面触发的配置变更事件,生成对应的事件标识;获取所述配置变更事件对应的业务标识和配置信息;将所述事件标识、业务标识及配置信息存储至数据库;将所述事件标识输入预设的文件转换组件;调用所述文件转换组件在所述数据库中读取所述配置标识对应的配置信息,将读取到的配置信息渲染为相应业务标识对应的配置子文件;根据渲染得到的配置子文件生成配置变更指令,将所述配置变更指令发送至所述监控节点,使所述监控节点将预存储的相同业务标识对应的配置子文件删除,执行渲染得到的配置子文件,完成对监控节点的配置变更。

一种运维任务处理装置,所述装置包括:运维监控模块,用于对指定的监控节点进行监控,根据监控结果进行监控告警;基于所述监控告警生成待处理的运维任务;任务处理模块,用于识别所述运维任务的任务类型;当所述任务类型为配置变更时,根据配置变更的任务处理逻辑,调用相应的处理组件对所述运维任务进行处理,得到对应的变更配置项;风险控制模块,用于对所述变更配置项进行变更风险测算;当测算结果低于阈值时,根据所述变更配置项进行配置变更。

一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:对指定的监控节点进行监控,根据监控结果进行监控告警;基于所述监控告警生成待处理的运维任务;识别所述运维任务的任务类型;当所述任务类型为配置变更时,根据配置变更的任务处理逻辑,调用相应的处理组件对所述运维任务进行处理,得到对应的变更配置项;对所述变更配置项进行变更风险测算;当测算结果低于阈值时,根据所述变更配置项进行配置变更。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:对指定的监控节点进行监控,根据监控结果进行监控告警;基于所述监控告警生成待处理的运维任务;识别所述运维任务的任务类型;当所述任务类型为配置变更时,根据配置变更的任务处理逻辑,调用相应的处理组件对所述运维任务进行处理,得到对应的变更配置项;对所述变更配置项进行变更风险测算;当测算结果低于阈值时,根据所述变更配置项进行配置变更。

上述运维任务处理方法、装置、计算机设备和存储介质,通过对指定的监控节点进行监控,可以根据监控结果进行监控告警;基于所述监控告警可以生成待处理的运维任务;根据运维任务的任务类型,可以调用相应的处理组件根据相应任务处理逻辑对所述运维任务进行处理;处理组件对任务类型为配置变更的运维任务进行处理得到对应的变更配置项;对所述目标配置值进行变更风险测算,可以根据所述变更配置项进行配置变更。由于预置了多种任务类型对应的处理组件,使得运维任务从生成到执行均可动完成,从而可以提高运维管理效率,进而提高企业it服务效率。此外,对处理组件的处理结果进行风险控制,提高运维任务处理可靠性。

附图说明

图1为一个实施例中运维任务处理方法的应用场景图;

图2为一个实施例中运维任务处理方法的流程示意图;

图3为一个实施例中运维任务处理装置的结构框图;

图4为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请提供的运维任务处理方法,可以应用于如图1所示的应用环境中。其中,终端102与运维服务器104通过网络进行通信。运维服务器104与被运维服务器(以下称“监控节点”)106通过网络进行通信。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。运维服务器104与监控节点106分别可以用独立的服务器或者是多个服务器组成的服务器集群来实现。运维服务器104上运行了自动化运维平台。监控节点106上运行了web应用。用户可以通过终端访问自动化运维平台和web应用。运维服务器104也可以与其中一个监控节点106为同一服务器,对此不作限制。自动化运维平台用于对多个监控节点106进行监控运维。自动化运维平台根据预先配置的节点标识对相应监控节点的应用、网络等多项指标进行监控,根据监控结果判断是否需要监控告警。若需要监控告警,自动化运维平台基于监控告警生成待处理的运维任务。运维任务具有对应的任务类型。自动化运维平台基于不同任务类型的运维任务预置了不同的处理组件。当任务类型为配置变更时,自动化运维平台调用相应的处理组件按照相应任务类型的任务处理逻辑对该运维任务进行处理,得到对应的变更配置项。自动化运维平台对变更配置项进行变更风险测算,当测算结果低于阈值时,根据变更配置项执行配置变更操作。上述运维任务处理过程,基于预置的多种任务类型对应的处理组件,使得运维任务从生成到执行均可自动完成,从而可以提高运维管理效率,进而提高企业it服务效率。

在一个实施例中,如图2所示,提供了一种运维任务处理方法,以该方法应用于图1中的运维服务器为例进行说明,包括以下步骤:

步骤202,对指定的监控节点进行监控,根据监控结果进行监控告警。

自动化运维平台预先配置了需要运维监控的监控节点的节点标识。根据预置的节点标识,自动化运维平台在相应监控节点部署监控组件,基于监控组件对监控节点在业务应用层、中间件层、基础设施层等多个层面进行监控,生成监控结果。业务应用层包括应用软件等;中间件层包括数据库、缓存等;基础设施层包括物理机、虚拟机、容器等。监控结果包括多个监控项。监控组件基于预置的多个监控项分别对应的监控指标,比较监控结果中每个监控项是否达到相应的监控指标。若监控结果中存储监控项为达到相应的监控指标,则生成监控告警,将监控告警发送至自动化运维平台。在另一个实施例中,监控组件按照预设时间频率将监控结果反馈至自动化运维平台,由自动化运维平台基于监控结果判断是否需要生成相应的运维任务。

步骤204,基于监控告警生成待处理的运维任务。

步骤206,识别运维任务的任务类型。

运维服务器预存了多种任务类型及每种任务类型分别对应的关键词集合。任务类型是指需要处理的运维任务的主要内容,如中间件资源配置、网络变更、配置变更或组件安装等。

运维服务器还预存了每种任务类型分别对应的任务模板和模板代码。任务模板可以是基于模板设计工具采用简单拖拽的方式设计而成。具体地,模板设计工具提供多种缩略图标以及对应的元素代码。缩略图标可以是模板元素的缩略图,如按钮、文本框或表格等。在设计任务模板时,模板设计工具展示包括模板编辑区和多个缩略图标的设计窗口。模板设计工具获取用户选定的缩略图标对应的元素代码,基于获取到的元素代码生成对应的模板元素,根据用户的拖拽操作将生成的模板元素添加至模板编辑区相应位置。模板设计工具获记录每个模板元素的添加顺序。模板设计工具基于用户触发的模板保存指令,确定模板编辑区中的多个模板元素之间的图层关系,获取预设的模板代码,根据图层关系对相应模板元素对应的元素代码进行变更,将变更后的元素代码分别添加至基础代码,得到任务模板以及对应的模板代码。

由于模板元素是基于元素代码动态生成的,而元素代码具有预置的视图逻辑,用户只需大胆的将模板元素拖拽至模板编辑区,即可拼接得到需要的任务模板,可以提高任务模板设计效率。在进行模板设计的同时完成模板代码的开发,减少了用户从零编程的负担,可以提高任务模板设计效率。

在一个实施例中,基于监控告警生成待处理的运维任务,包括:对监控告警进行解析,提取得到多个告警关键词。获取预设的多种任务类型分别对应的关键词集合,将告警关键词与多个关键词集合进行匹配,确定监控告警对应的任务类型。获取任务类型对应的任务模板,根据任务模板中的多个模板元素,在监控告警中提取对应的字段值进行模板填充,生成运维任务。

自动化运维平台对监控告警进行解析,提取得到多个告警关键词,将提取到的告警关键词与存储的多个关键词集合分别进行匹配,根据相匹配的关键词集合确定该监控告警对应的任务类型。根据监控告警对应的任务类型,自动化运维平台获取对应的任务模板,根据任务模板中的多个模板元素,在监控告警中提取对应的字段值进行模板填充,生成运维任务。

步骤208,当任务类型为配置变更时,根据配置变更的任务处理逻辑,调用相应的处理组件对运维任务进行处理,得到对应的变更配置项。

不同运维任务处理方式不同。例如,任务类型为配置变更的运维任务可以通过变更相应配置信息进行处理;任务类型为组件安装的运维任务可以通过部署相应组件来处理等。自动化运维平台预先集成了多种任务类型分别对应的处理组件。处理组件是基于相应类型任务处理逻辑编写的脚本。自动化运维平台调用不同的处理组件对运维任务进行处理。

当任务类型为配置变更时,自动化运维平台获取相应处理组件对应的执行参数。执行参数可以是从运维任务临时动态提取得到的,也可以是预先固定配置的。根据运维任务相应任务类型的任务处理逻辑,自动化运维平台调用处理组件对运维任务进行逻辑处理,得到处理结果。例如,处理组件基于预置的多种缺陷问题及每个缺陷问题对应的目标配置信息,对相应配置标识对应的初始配置信息进行调整。

自动化运维平台对监控节点的多种配置信息进行管理。配置信息包括硬件配置、软件配置、空间资源等。其中,硬件配置包括物理机配置、虚拟机配置、防火墙配置等;软件配置包括操作系统配置、应用系统配置、数据库配置等;空间资源包括机房配置、站点配置等。每种配置信息具有对应的配置标识。每种配置信息包括多个配置项。处理结果包括配置标识及对应的一个或多个变更配置项。变更配置项是指需要变更的配置项。

步骤210,对变更配置项进行变更风险测算。

为了提高运维任务处理的可靠性,对处理组件处理得到的变更配置项进行变更风险测算,对于变更风险高于阈值的变更配置项不予响应,可以转人工处理,以避免非但监控告警未处理而引起更大的缺陷问题。

在一个实施例中,对变更配置项进行变更风险测算,包括:确定运维任务的变更项目类型;获取变更项目类型对应的配置模板;配置模板包括多个配置项以及每个配置项对应的多个配置区间,每个配置区间具有对应的风险因子;确定每个变更配置项所属的配置区间及对应的风险因子;根据每个变更配置项对应的风险因子,计算本次变更对应的风险值。

自动化运维平台根据配置标识确定运维任务的变更项目类型,即判断需要变更哪种配置信息。每个配置标识具有对应的配置模板。配置模板包括多个配置项及每个配置项对应的配置规范。配置规范可以是配置值大小在预设范围内,数据类型为预设类型,或数据量不超过阈值等。不同配置项影响监控节点不同性能,可以通过将每个配置项对应的配置值大小范围划分为多个配置区间对配置变更进行安全控制。换言之,基于每个配置项设定对应的多个配置区间,并设置每个配置区间对应的风险因子。

自动化运维平台根据多个变更配置项在配置模板分别对应的配置项,确定变更配置项对应的目标配置值所属的配置区间,进而获取每个变更配置项对应的风险因子。自动化运维平台对多个变更配置项分别对应的风险因子进行预设逻辑运算,如求和运算、求平均值运算或散列运算等,将计算结果作为本次变更对应的风险值。例如,在进行物理资源配置变更时,若将cpu或内存等物理资源分配不合理,可能会造成业务运行速度慢或甚至根本无法运行。假设变更配置项包括cpu、内存和磁盘,各变更配置项对应的风险因子依次为0.4、0.1、0.1,则对应的物理资源配置变更风险值可以是0.4+0.1+0.1=0.6或0.6/3=0.2等。在另一个实施例中,配置模板中每个配置项具有对应的权重,对权重与相应风险因子作线性回归运算得到对应的风险值。风险值的计算方式有很多,对此不作限制。

步骤212,当测算结果低于阈值时,根据变更配置项进行配置变更。

当风险值等于或高于阈值时,表示本次变更存在较高风险,自动化运维平台获取多个运维人员标识对应的当前状态信息。基于当前状态信息在多个运维人员中筛选与工单需求匹配的目标运维人员,将运维任务发送至目标运维人员对应的终端。当风险值低于阈值时,表示本次变更存在较小的风险,自动化运维平台利用将变更配置项对应的初始配置值替换为目标配置值,实现配置变更。

本实施例中,通过对指定的监控节点进行监控,可以根据监控结果进行监控告警;基于监控告警可以生成待处理的运维任务;根据运维任务的任务类型,可以调用相应的处理组件根据相应任务处理逻辑对运维任务进行处理;处理组件对任务类型为配置变更的运维任务进行处理得到对应的变更配置项;对目标配置值进行变更风险测算,可以根据变更配置项进行配置变更。由于预置了多种任务类型对应的处理组件,使得运维任务从生成到执行均可动完成,从而可以提高运维管理效率,进而提高企业it服务效率。此外,对处理组件的处理结果进行风险控制,提高运维任务处理可靠性。

在一个实施例中,对指定的监控节点进行监控,根据监控结果进行监控告警,包括:当接收到对监控节点的访问请求时,在访问请求中提取特征字段;根据特征字段生成访问请求对应的特征向量;将特征向量输入预设的安全监控模型,检测访问请求是否为风险访问;统计在监控时段检测到的风险访问的数量;当数量达到阈值时,进行监控告警。

终端获取用户输入的web访问信息,根据web访问信息生成访问请求,将访问请求发送至监控节点。监控节点上部署的监控组件对接收到访问请求进行拦截。监控组件获取特征字段表,对获取到的数据访问请求进行解析,在获取到的数据访问请求中,提取与获取到的特征字段表中字段标识对应的特征字段。其中,特征字段表中记录了访问请求中报文的特征字段标识、特征字段的数据类型和特征字段。

监控组件提取到特征字段,根据特征字段与数值的映射关系将提取到的特征字段映射为数值,根据提取到的特征字段对应的数值添加到预设特征向量中与提到的特征字段所对应的位置,得到访问请求对应的特征向量。监控组件将生成的特征向量输入预先训练好的安全监控模型,利用安全监控模型对生成的特征向量进行处理,得到该访问请求是否构成风险访问的检测结果。

若访问请求构成风险访问,则监控组件拒绝该访问请求;若访问请求不构成风险访问,则监控组件允许访问请求进行访问。此外,监控组件统计监控时段接收到的构成风险访问的访问请求的数量,并在该数量达到阈值时生成监控告警,将监控告警发送至自动化运维平台。

本实施例中,通过预先训练好的安全监控模型,对监控节点进行安全监控,无需人工预设检测方式,减少了人工干预程度,缩短了对风险访问的检测时间,提高了风险访问检测准确率。

在一个实施例中,根据监控结果进行监控告警,包括:获取监控节点上部署的当前版本软件的第一缺陷数据;根据第一缺陷数据生成当前版本软件对应的缺陷累积实际趋势图;获取监控节点上部署的历史版本软件的第二缺陷数据;根据第二缺陷数据生成当前版本软件对应的缺陷累积预测趋势图;计算缺陷累积实际趋势图与缺陷累积预测趋势图的偏差度;根据偏差度确定监控节点的告警频率,按照告警频率进行监控告警。

当对监控节点进行业务应用层的监控时,自动化运维平台对该监控节点上部署的软件应用的软件质量进行检测,根据软件质量确定告警频率。具体的,自动化运维平台获取监控节点上部署的当前版本软件的第一缺陷数据。软件的生命周期包括多个时间节点。第一缺陷数据可以是开发人员和测试人员在不同时间节点上报至运维服务器。自动化运维平台根据当前版本软件的第一缺陷数据生成当前版本软件对应的缺陷累积实际趋势图。缺陷累积实际趋势图可以是以多个时间节点为横坐标,以不同时间节点的实际缺陷数量为纵坐标的折线图或柱状图等。

自动化运维平台获取历史版本软件的第二缺陷数据,根据第二缺陷数据生成当前版本软件对应的缺陷累积预测趋势图。具体的,自动化运维平台将第二缺陷数据输入预设模型生成当前版本软件对应的缺陷累积理想趋势图。预设模型可以是gompertz模型(一种软件质量分析模型)等。理想趋势图包括多个时间节点对应的理想缺陷数量。自动化运维平台计算多个历史版本软件在每个时间节点对应的实际缺陷平均数量,获取预设的每个时间节点对应的调整因子,根据调整因子、实际缺陷平均数量以及理想缺陷数量计算每个时间节点对应的预测缺陷数量。自动化运维平台根据每个时间节点对应的预测缺陷数量,生成当前版本软件对应的缺陷累积预测趋势图。

根据历史版本软件的实际缺陷数量对缺陷累积理想趋势图进行调整,使生成的缺陷累积预测趋势图可以很好的反应实际开发和测试等情况,从而可以提高软件质量监测的准确性。自动化运维平台将缺陷累积实际趋势图与缺陷累积预测趋势图进行叠加,计算缺陷数量重合的时间节点数量,根据重合的时间节点数量与统计的时间节点数量的比例,计算缺陷累积实际趋势图与缺陷累积预测趋势图的偏差度。偏差度包括多个时间节点对应的偏差值,偏差值可以是实际缺陷数量与预测缺陷数量的偏差数量或偏差比例等。

自动化运维平台通过对比多个版本的软件的偏差度,可以判断当前版本软件的软件质量。容易理解,软件质量与偏差度负相关,及偏差度越小,表示相应软件质量越好。自动化运维平台根据偏差度确定监控节点的告警频率。监控节点部署的当前版本软件的软件质量越差,发生监控告警的频率相对越高,为了避免监控告警频繁产生,可以增大偏差度大的监控节点的告警频率,减小偏差度小的监控节点的告警频率。

传统方式中,软件开发商在软件生命周期采用业界成熟的监测模型对软件质量进行监测。但该监测方式中采用的监测模型趋于理想化,软件产品本身以及软件开发和软件测试等过程的多样性,使得理想化的监测模型偏离实际情况。

本实施例中,由于缺陷累积预测趋势图是根据历史版本软件在多个时间节点对应的实际缺陷数量生成的,可以很好的反应实际开发和测试等情况,从而可以提高软件质量监测的准确性。

在一个实施例中,调用相应的处理组件对运维任务进行处理之前,还包括:获取运维知识图谱;运维知识图谱包括多种运维指标对应的运维策略;确定每种运维指标对应的任务类型;基于运维指标生成相应任务类型的任务标签;对运维策略进行语义分析,将运维策略分解为多个执行步骤,并确定多个执行步骤的执行顺序和关联性;获取每个执行步骤对应的执行脚本,根据多个执行步骤的执行顺序和关联性对多个执行脚本进行拼接,得到相应任务标签对应的处理组件。

随着需要处理的运维任务的任务类型的增多,需要跟随新增相应的处理组件。传统方式开发人员只能人工逐个编写每个处理组件,并通过人工对处理组件进行维护,这样不仅效率低,且易出错。本实施例运维服务器基于预存储的运维知识图谱和多个执行脚本,自动生成不同任务类型对应的处理组件。具体的,运维知识图谱可以是根据多个历史运维任务的处理记录生成的,也可以是用户根据以往的运维经验添加的运维任务及对应的运维方案。运维知识图谱包括多种运维指标及每种运维指标对应的运维策略。运维指标是指需要处理的运维任务。运维策略是对运维方案的描述。每种任务类型具有对应的一个或多个运维指标。例如,任务类型“网络变更”对应的运维指标可以包括“网络防火墙策略变更”、“私有云网络变更”等。由于同一任务类型对应的多种运维指标需要的任务参数项相同或相似,由此可以采用同一任务模板。容易理解,同一任务类型不同运维指标也可以采用不同任务模板。

运维服务器在运维指标中提取关键词,根据提取到的关键词生成该运维指标对应的任务标签,从而每个任务单类型具有对应的一个或多个任务标签。运维服务器对运维策略进行语义分析,将运维策略分解为多个执行步骤,并确定多个执行步骤的执行顺序和关联性。执行顺序包括异步执行和并发执行。关联性是指多个执行步骤之间的调用、嵌套等关系。运维服务器根据多个执行步骤的执行顺序和关联性,确定多个执行步骤的拼接逻辑,基于该拼接逻辑将多个执行脚本进行拼接,得到相应任务标签对应的处理组件。

本实施例中,用户只需根据以往的运维经验将运维任务及对应的运维方案维护至运维知识图谱,不断对运维知识图谱进行扩充,而无需关心后台编码,降低运维门槛;基于预设的多个执行脚本拼接生成处理组件,减少重复编程,提高处理组件生成效率。

在一个实施例中,方法还包括:当测算结果大于或等于阈值时,基于运维任务生成配置页面,将配置页面发送至终端;监听终端在配置页面触发的配置变更事件,生成对应的事件标识;获取配置变更事件对应的业务标识和配置信息;将事件标识、业务标识及配置信息存储至数据库;将事件标识输入预设的文件转换组件;调用文件转换组件在数据库中读取配置标识对应的配置信息,将读取到的配置信息渲染为相应业务标识对应的配置子文件;根据渲染得到的配置子文件生成配置变更指令,将配置变更指令发送至监控节点,使监控节点将预存储的相同业务标识对应的配置子文件删除,执行渲染得到的配置子文件,完成对监控节点的配置变更。

当本次变更的风险值大于或等于阈值时,自动化运维平台将运维任务发送至运维人员标识对应的终端,使运维人员对运维任务进行处理。传统方式,用户每次对监控节点进行配置管理,都要基于对配置文件的直接操作进行管理,操作不便。此外,传统的监控节点将多个服务器的配置信息记录至同一配置文件。例如,当nginx服务器需要对多个服务器集群进行负载均衡处理时,nginx服务器上执行的配置文件记录了多个服务器集群的信息。如此以来,当对某个服务器集群的配置信息进行变更时,则用户需要基于配置文件记录的全部配置信息进行配置管理,当配置文件记录的配置信息较多时会明显延长配置时间,降低配置效率。

为了解决上述问题,本实施例提供方便用户基于配置页面进行局部配置管理的配置方式。具体的,自动化运维平台生成运维任务对应的配置页面,将配置页面发送至运维人员标识对应的终端,使运维人员对运维任务进行处理。运维人员在终端基于配置页面进行配置变更。自动化运维平台部署了对应的数据库。自动化运维平台监听终端在配置页面触发的局部配置变更事件。当监听到局部配置变更事件时,自动化运维平台生成对应的事件标识,将事件标识输入预设的文件转换组件。自动化运维平台获取局部配置变更事件对应的业务标识和第一配置信息,将事件标识、业务标识及第一配置信息存储至数据库。自动化运维平台调用文件转换组件在数据库中读取新增的事件标识对应的第一配置信息,根据第一配置信息生成相应业务标识当前对应的配置子文件。例如,当需要变更负载均衡策略时,自动化运维平台调用文件转换组件,根据第一配置信息生成负载均衡配置脚本和地址匹配脚本;将负载均衡配置脚本和地址匹配脚本存储至指定目录;对指定目录下的全部负载均衡配置脚本和地址匹配脚本进行拼接,生成当前的配置子文件。

自动化运维平台预先将监控节点对应的配置文件拆分成更小维度的配置子文件,如监控节点中每个服务器对应的配置子文件,或者处理相同业务的服务器集群对应的配置子文件。换言之,自动化运维平台预先将监控节点对应的配置文件拆分为多个业务标识对应的配置子文件,并将拆分得到的配置子文件发送至相应监控节点执行。自动化运维平台根据当前的配置子文件生成局部配置变更指令,将局部配置变更指令发送至相应监控节点,使监控节点将预存储的相同业务标识对应的初始的配置子文件删除,并执行当前的配置子文件,使变更后的配置信息生效,完成对监控节点的局部配置变更。

本实施例中,借助数据库中转,使用户无需基于对配置文件的直接操作实现配置变更,提高操作便利性;将大的配置文件拆分成多个小的配置子文件,后续用户只需对相应业务标识对应的配置子文件进行修改即可实现局部配置更新,避免了每次对整个配置文件全量更新的繁琐,提高配置更新效率。

应该理解的是,虽然图2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图3所示,提供了一种运维任务处理装置,包括:运维监控模块302、任务处理模块304和风险控制模块306,其中:

运维监控模块302,用于对指定的监控节点进行监控,根据监控结果进行监控告警;基于监控告警生成待处理的运维任务。

任务处理模块304,用于识别运维任务的任务类型;当任务类型为配置变更时,根据配置变更的任务处理逻辑,调用相应的处理组件对运维任务进行处理,得到对应的变更配置项。

风险控制模块306,用于对变更配置项进行变更风险测算;当测算结果低于阈值时,根据变更配置项进行配置变更。

在一个实施例中,运维监控模块302还用于当接收到对监控节点的访问请求时,在访问请求中提取特征字段;根据特征字段生成访问请求对应的特征向量;将特征向量输入预设的安全监控模型,检测访问请求是否为风险访问;统计在监控时段检测到的风险访问的数量;当数量达到阈值时,进行监控告警。

在一个实施例中,运维监控模块302还用于获取监控节点上部署的当前版本软件的第一缺陷数据;根据第一缺陷数据生成当前版本软件对应的缺陷累积实际趋势图;获取监控节点上部署的历史版本软件的第二缺陷数据;根据第二缺陷数据生成当前版本软件对应的缺陷累积预测趋势图;计算缺陷累积实际趋势图与缺陷累积预测趋势图的偏差度;根据偏差度确定监控节点的告警频率,按照告警频率进行监控告警。

在一个实施例中,运维监控模块302还用于对监控告警进行解析,提取得到多个告警关键词。获取预设的多种任务类型分别对应的关键词集合,将告警关键词与多个关键词集合进行匹配,确定监控告警对应的任务类型;获取任务类型对应的任务模板,根据任务模板中的多个模板元素,在监控告警中提取对应的字段值进行模板填充,生成运维任务。

在一个实施例中,任务处理模块304还用于获取运维知识图谱;运维知识图谱包括多种运维指标对应的运维策略;确定每种运维指标对应的任务类型;基于运维指标生成相应任务类型的任务标签;对运维策略进行语义分析,将运维策略分解为多个执行步骤,并确定多个执行步骤的执行顺序和关联性;获取每个执行步骤对应的执行脚本,根据多个执行步骤的执行顺序和关联性对多个执行脚本进行拼接,得到相应任务标签对应的处理组件。

在一个实施例中,风险控制模块306,用于确定运维任务的变更项目类型;获取变更项目类型对应的配置模板;配置模板包括多个配置项以及每个配置项对应的多个配置区间,每个配置区间具有对应的风险因子;确定每个变更配置项所属的配置区间及对应的风险因子;根据每个变更配置项对应的风险因子,计算本次变更对应的风险值。

在一个实施例中,该装置还包括配置变更模块308,用于当测算结果大于或等于阈值时,基于运维任务生成配置页面,将配置页面发送至终端;监听终端在配置页面触发的配置变更事件,生成对应的事件标识;获取配置变更事件对应的业务标识和配置信息;将事件标识、业务标识及配置信息存储至数据库;将事件标识输入预设的文件转换组件;调用文件转换组件在数据库中读取配置标识对应的配置信息,将读取到的配置信息渲染为相应业务标识对应的配置子文件;根据渲染得到的配置子文件生成配置变更指令,将配置变更指令发送至监控节点,使监控节点将预存储的相同业务标识对应的配置子文件删除,执行渲染得到的配置子文件,完成对监控节点的配置变更。

关于运维任务处理装置的具体限定可以参见上文中对于运维任务处理方法的限定,在此不再赘述。上述运维任务处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储配置信息。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种运维任务处理方法。

本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:对指定的监控节点进行监控,根据监控结果进行监控告警;基于监控告警生成待处理的运维任务;识别运维任务的任务类型;当任务类型为配置变更时,根据配置变更的任务处理逻辑,调用相应的处理组件对运维任务进行处理,得到对应的变更配置项;对变更配置项进行变更风险测算;当测算结果低于阈值时,根据变更配置项进行配置变更。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:当接收到对监控节点的访问请求时,在访问请求中提取特征字段;根据特征字段生成访问请求对应的特征向量;将特征向量输入预设的安全监控模型,检测访问请求是否为风险访问;统计在监控时段检测到的风险访问的数量;当数量达到阈值时,进行监控告警。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取监控节点上部署的当前版本软件的第一缺陷数据;根据第一缺陷数据生成当前版本软件对应的缺陷累积实际趋势图;获取监控节点上部署的历史版本软件的第二缺陷数据;根据第二缺陷数据生成当前版本软件对应的缺陷累积预测趋势图;计算缺陷累积实际趋势图与缺陷累积预测趋势图的偏差度;根据偏差度确定监控节点的告警频率,按照告警频率进行监控告警。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:对监控告警进行解析,提取得到多个告警关键词。获取预设的多种任务类型分别对应的关键词集合,将告警关键词与多个关键词集合进行匹配,确定监控告警对应的任务类型;获取任务类型对应的任务模板,根据任务模板中的多个模板元素,在监控告警中提取对应的字段值进行模板填充,生成运维任务。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取运维知识图谱;运维知识图谱包括多种运维指标对应的运维策略;确定每种运维指标对应的任务类型;基于运维指标生成相应任务类型的任务标签;对运维策略进行语义分析,将运维策略分解为多个执行步骤,并确定多个执行步骤的执行顺序和关联性;获取每个执行步骤对应的执行脚本,根据多个执行步骤的执行顺序和关联性对多个执行脚本进行拼接,得到相应任务标签对应的处理组件。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:确定运维任务的变更项目类型;获取变更项目类型对应的配置模板;配置模板包括多个配置项以及每个配置项对应的多个配置区间,每个配置区间具有对应的风险因子;确定每个变更配置项所属的配置区间及对应的风险因子;根据每个变更配置项对应的风险因子,计算本次变更对应的风险值。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:当测算结果大于或等于阈值时,基于运维任务生成配置页面,将配置页面发送至终端;监听终端在配置页面触发的配置变更事件,生成对应的事件标识;获取配置变更事件对应的业务标识和配置信息;将事件标识、业务标识及配置信息存储至数据库;将事件标识输入预设的文件转换组件;调用文件转换组件在数据库中读取配置标识对应的配置信息,将读取到的配置信息渲染为相应业务标识对应的配置子文件;根据渲染得到的配置子文件生成配置变更指令,将配置变更指令发送至监控节点,使监控节点将预存储的相同业务标识对应的配置子文件删除,执行渲染得到的配置子文件,完成对监控节点的配置变更。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:对指定的监控节点进行监控,根据监控结果进行监控告警;基于监控告警生成待处理的运维任务;识别运维任务的任务类型;当任务类型为配置变更时,根据配置变更的任务处理逻辑,调用相应的处理组件对运维任务进行处理,得到对应的变更配置项;对变更配置项进行变更风险测算;当测算结果低于阈值时,根据变更配置项进行配置变更。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:当接收到对监控节点的访问请求时,在访问请求中提取特征字段;根据特征字段生成访问请求对应的特征向量;将特征向量输入预设的安全监控模型,检测访问请求是否为风险访问;统计在监控时段检测到的风险访问的数量;当数量达到阈值时,进行监控告警。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取监控节点上部署的当前版本软件的第一缺陷数据;根据第一缺陷数据生成当前版本软件对应的缺陷累积实际趋势图;获取监控节点上部署的历史版本软件的第二缺陷数据;根据第二缺陷数据生成当前版本软件对应的缺陷累积预测趋势图;计算缺陷累积实际趋势图与缺陷累积预测趋势图的偏差度;根据偏差度确定监控节点的告警频率,按照告警频率进行监控告警。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:对监控告警进行解析,提取得到多个告警关键词。获取预设的多种任务类型分别对应的关键词集合,将告警关键词与多个关键词集合进行匹配,确定监控告警对应的任务类型;获取任务类型对应的任务模板,根据任务模板中的多个模板元素,在监控告警中提取对应的字段值进行模板填充,生成运维任务。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取运维知识图谱;运维知识图谱包括多种运维指标对应的运维策略;确定每种运维指标对应的任务类型;基于运维指标生成相应任务类型的任务标签;对运维策略进行语义分析,将运维策略分解为多个执行步骤,并确定多个执行步骤的执行顺序和关联性;获取每个执行步骤对应的执行脚本,根据多个执行步骤的执行顺序和关联性对多个执行脚本进行拼接,得到相应任务标签对应的处理组件。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:确定运维任务的变更项目类型;获取变更项目类型对应的配置模板;配置模板包括多个配置项以及每个配置项对应的多个配置区间,每个配置区间具有对应的风险因子;确定每个变更配置项所属的配置区间及对应的风险因子;根据每个变更配置项对应的风险因子,计算本次变更对应的风险值。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:当测算结果大于或等于阈值时,基于运维任务生成配置页面,将配置页面发送至终端;监听终端在配置页面触发的配置变更事件,生成对应的事件标识;获取配置变更事件对应的业务标识和配置信息;将事件标识、业务标识及配置信息存储至数据库;将事件标识输入预设的文件转换组件;调用文件转换组件在数据库中读取配置标识对应的配置信息,将读取到的配置信息渲染为相应业务标识对应的配置子文件;根据渲染得到的配置子文件生成配置变更指令,将配置变更指令发送至监控节点,使监控节点将预存储的相同业务标识对应的配置子文件删除,执行渲染得到的配置子文件,完成对监控节点的配置变更。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1