报警信息处理方法、装置、设备及计算机可读存储介质与流程

文档序号:18406227发布日期:2019-08-10 00:24阅读:195来源:国知局
报警信息处理方法、装置、设备及计算机可读存储介质与流程

本发明涉及金融科技(fintech)技术领域,尤其涉及报警信息处理方法、装置、设备及计算机可读存储介质。



背景技术:

随着计算机技术的发展,越来越多的技术(大数据、分布式、区块链blockchain、人工智能等)应用在金融领域,传统金融业正在逐步向金融科技(fintech)转变,但由于金融行业的安全性、实时性要求,也对技术提出了更高的要求。

目前,各类金融机构(如商业银行、证券公司等)一般通过分布式系统处理和存储业务数据,并由一个报警管理平台收集分布式系统产生的报警信息,然后将报警信息上报至对应的责任人终端或群组。这种方式的缺陷在于:缺少对报警信息的进一步收敛和分析,导致系统运维人员会收到大量报警,而从大量的报警信息中找出重要的报警及分析报警原因,需要耗费较多的人力成本和时间成本。



技术实现要素:

本发明的主要目的在于提出一种报警信息处理方法、装置、设备及计算机可读存储介质,旨在实现对分布式系统产生的报警信息进行自动收敛和分析,从而降低对报警信息进行人工分析所产生的人力成本和时间成本。

为实现上述目的,本发明提供一种报警信息处理方法,所述方法包括如下步骤:

获取分布式系统的各子系统的报警信息,对所述报警信息进行解析,得到与所述报警信息对应的报警接口;

将同一子系统下来自于同一报警接口的报警信息合并为一条收敛报警信息,得到与所述各子系统对应的收敛报警信息;

分析所述收敛报警信息的报警原因;

将所述报警原因与所述收敛报警信息关联后发送至预设的运维人员终端。

优选地,所述获取分布式系统的各子系统的报警信息的步骤包括:

从预设的报警管理平台读取分布式系统的各子系统的报警信息,其中,所述报警管理平台用于收集所述各子系统的报警信息。

优选地,所述分析所述收敛报警信息的报警原因的步骤包括:

获取与所述收敛报警信息对应的子系统的系统名;

访问与所述系统名对应的发布平台,获取所述发布平台上的发布记录,所述发布记录中包含系统版本发布信息;

将所述发布记录作为所述收敛报警信息的报警原因。

优选地,所述将所述报警原因与所述收敛报警信息关联后发送至预设的运维人员终端的步骤包括:

查询与所述系统名对应的下游基础平台的报警信息表,获取所述报警信息表中的报警信息,其中,所述下游基础平台为与所述系统名对应的子系统的运行平台;

将所述报警原因、所述报警信息表中的报警信息和所述收敛报警信息关联后发送至预设的运维人员终端。

优选地,所述将所述报警原因与所述收敛报警信息关联后发送至预设的运维人员终端的步骤包括:

从预设的系统关联信息库中获取系统间关系树,所述系统间关系树用于表示所述分布式系统的各子系统之间的依赖关系;

根据所述系统间关系树确定与所述收敛报警信息对应的根因系统;

获取与所述根因系统对应的收敛报警信息和报警原因,将与所述根因系统对应的收敛报警信息和报警原因关联,并添加对应的根因标识后发送至预设的运维人员终端。

此外,为实现上述目的,本发明还提供一种报警信息处理装置,所述报警信息处理装置包括:

获取模块,用于获取分布式系统的各子系统的报警信息,对所述报警信息进行解析,得到与所述报警信息对应的报警接口;

合并模块,用于将同一子系统下来自于同一报警接口的报警信息合并为一条收敛报警信息,得到与所述各子系统对应的收敛报警信息;

分析模块,用于分析所述收敛报警信息的报警原因;

发送模块,用于将所述报警原因与所述收敛报警信息关联后发送至预设的运维人员终端。

优选地,所述获取模块还用于:

从预设的报警管理平台读取分布式系统的各子系统的报警信息,其中,所述报警管理平台用于收集所述各子系统的报警信息。

优选地,所述分析模块还用于:

获取与所述收敛报警信息对应的子系统的系统名;

访问与所述系统名对应的发布平台,获取所述发布平台上的发布记录,所述发布记录中包含系统版本发布信息;

将所述发布记录作为所述收敛报警信息的报警原因。

优选地,所述发送模块还用于:

查询与所述系统名对应的下游基础平台的报警信息表,获取所述报警信息表中的报警信息,其中,所述下游基础平台为与所述系统名对应的子系统的运行平台;

将所述报警原因、所述报警信息表中的报警信息和所述收敛报警信息关联后发送至预设的运维人员终端。

优选地,所述发送模块还用于:

从预设的系统关联信息库中获取系统间关系树,所述系统间关系树用于表示所述分布式系统的各子系统之间的依赖关系;

根据所述系统间关系树确定与所述收敛报警信息对应的根因系统;

获取与所述根因系统对应的收敛报警信息和报警原因,将与所述根因系统对应的收敛报警信息和报警原因关联,并添加对应的根因标识后发送至预设的运维人员终端。

此外,为实现上述目的,本发明还提供一种报警信息处理设备,所述报警信息处理设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的报警信息处理程序,所述报警信息处理程序被所述处理器执行时实现如上所述的报警信息处理方法的步骤。

此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有报警信息处理程序,所述报警信息处理程序被处理器执行时实现如上所述的报警信息处理方法的步骤。

本发明获取分布式系统的各子系统的报警信息,对所述报警信息进行解析,得到与所述报警信息对应的报警接口;将同一子系统下来自于同一报警接口的报警信息合并为一条收敛报警信息,得到与所述各子系统对应的收敛报警信息;分析所述收敛报警信息的报警原因;将所述报警原因与所述收敛报警信息关联后发送至预设的运维人员终端。本发明通过对分布式系统的报警信息按系统和报警接口进行合并,并分析合并后的收敛报警信息的报警原因,最终将报警原因与收敛报警信息关联后发送至预设的运维人员终端,实现了对分布式系统产生的报警信息进行自动收敛和分析,从而降低了对报警信息进行人工分析所产生的人力成本和时间成本。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的设备结构示意图;

图2为本发明报警信息处理方法第一实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

如图1所示,图1是本发明实施例方案涉及的硬件运行环境的设备结构示意图。

本发明实施例报警信息处理设备可以是pc机、服务器等设备。

如图1所示,该报警信息处理设备可以包括:处理器1001,例如cpu,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解,图1中示出的设备结构并不构成对设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及报警信息处理程序。

在图1所示的设备中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的报警信息处理程序,并执行下述方法实施例中的操作。

基于上述硬件结构,提出本发明报警信息处理方法各个实施例。

参照图2,图2为本发明报警信息处理方法第一实施例的流程示意图,所述方法包括:

步骤s10,获取分布式系统的各子系统的报警信息,对所述报警信息进行解析,得到与所述报警信息对应的报警接口;

在本实施例中,分布式系统是建立在网络之上的软件系统,在一个分布式系统中,一组独立的计算机展现给用户的是一个统一的整体,就好像是一个系统似的,系统拥有多种通用的物理和逻辑资源,可以动态的分配任务,分散的物理和逻辑资源通过计算机网络实现信息交换。目前,各类金融机构(如商业银行、证券公司等)一般通过分布式系统处理和存储业务数据,并由一个报警管理平台收集分布式系统产生的报警信息,然后将报警信息上报至对应的责任人终端或群组。

本实施例报警信息处理方法应用于报警信息处理设备。该报警信息处理设备可以是与报警管理平台共用物理主机,当然,为减轻报警管理平台的压力,该报警信息处理设备也可以是独立的与报警管理平台通信的服务器设备,具体实施时可灵活设置。

首先,报警信息处理设备获取分布式系统的各子系统的报警信息。在一实施方式中,上述步骤s10可以进一步包括:从预设的报警管理平台读取分布式系统的各子系统的报警信息,其中,所述报警管理平台用于收集所述各子系统的报警信息。

具体地,可以预先设置一个报警管理平台,该报警管理平台通过部署在分布式子系统的客户端程序或者web接口收集分布式系统的各子系统的报警信息,然后,报警信息处理设备从该报警管理平台读取报警信息,具体可以是读取分布式系统的各子系统在预设时长内(比如过去5分钟)产生的报警信息。其中,报警信息可以包括报警序号、报警内容、报警源、报警级别、报警接口、报警标题、系统名、报警时间等信息;分布式系统产生报警信息的报警条件可以包括业务指标(如转账成功率、扣款成功率等)未达到预设值、主机不可用、网络异常、数据库异常等,对应的报警事件可以包括主机报警、网络报警、数据库报警、系统变更报警等。

除了从报警管理平台读取报警信息外,报警信息处理设备也可以直接收集分布式系统的各子系统的报警信息,具体实施时可灵活设置。

在获取到分布式系统的各子系统的报警信息后,对报警信息进行解析,从而得到与报警信息对应的报警接口,其中不同的报警接口对应不同的报警指标,比如转账接口对应输出转账成功率报警,扣款接口对应输出扣款成功率报警等。

步骤s20,将同一子系统下来自于同一报警接口的报警信息合并为一条收敛报警信息,得到与所述各子系统对应的收敛报警信息;

该步骤中,由于来自于同一子系统的同一报警接口的报警信息的报警内容、报警级别、报警接口、报警标题、系统名一般是相同的,因此,可以将同一子系统下来自于同一报警接口的报警信息合并为一条收敛报警信息。比如对于子系统a,若产生的来自于报警接口1的报警信息有5条,则将这5条报警信息合并为一条收敛报警信息,若产生的来自于报警接口2的报警信息有2条,则将这2条报警信息合并为一条收敛报警信息。

分别对分布式系统的每个子系统进行报警信息合并处理,得到与各子系统对应的收敛报警信息,由此可以减少总的报警信息的条数,便于后续运维人员查看。

步骤s30,分析所述收敛报警信息的报警原因;

该步骤中,进一步分析与每条收敛报警信息对应的报警原因。在一实施方式中,该步骤s30可以包括:获取与所述收敛报警信息对应的子系统的系统名;访问与所述系统名对应的发布平台,获取所述发布平台上的发布记录,所述发布记录中包含系统版本发布信息;将所述发布记录作为所述收敛报警信息的报警原因。

考虑到新的系统版本发布一般会伴随着应用、网络或数据库变更,而这种变更很可能会导致系统在运行过程中产生报警,因此可以将其作为报警原因。具体地,对于一条收敛报警信息,首先对该收敛报警信息进行解析,以得到其来源的子系统的系统名,然后根据该系统名访问对应的发布平台并获取发布平台上的发布记录,该发布记录中包含该子系统的系统版本发布信息,其形式可以表示为:“beebekong在2019-04-0917:47:06做过本系统的版本发布”,之后,报警信息处理设备将获取到的发布记录作为该收敛报警信息的报警原因。

在另一实施方式中,也可以预先设置报警内容和报警原因之间的映射关系,比如与“扣款失败率超过预设值”对应的报警原因可以设置为“账户余额不足”,与“转账失败率超过预设值”对于的报警原因可以设置为“网络不可用”等,之后,报警信息处理设备根据收敛报警信息中的报警内容查找该预设的映射关系,即得到对应的报警原因。

上述两种方式均能够实现对可能的报警原因进行预测,从而降低了后续运维人员对报警原因进行人工分析的所产生的人力成本和时间成本。

步骤s40,将所述报警原因与所述收敛报警信息关联后发送至预设的运维人员终端。

该步骤中,将报警原因与对应的收敛报警信息进行关联,比如可以将报警原因添加至收敛报警信息中以实现两者关联,然后将关联后的信息发送至预设的运维人员终端,其中,运维人员终端可以是单个终端,也可以是群组,具体实施时可灵活设置。

进一步地,上述步骤s40可以包括:查询与所述系统名对应的下游基础平台的报警信息表,获取所述报警信息表中的报警信息,其中,所述下游基础平台为与所述系统名对应的子系统的运行平台;将所述报警原因、所述报警信息表中的报警信息和所述收敛报警信息关联后发送至预设的运维人员终端。

具体地,报警信息处理设备在获取到与收敛报警信息对应的子系统的系统名后,可以查询与系统名对应的下游基础平台的报警信息表,并获取该报警信息表中的报警信息,其中,下游基础平台为子系统的运行平台;之后,将报警原因、报警信息表中的报警信息和收敛报警信息关联后一并发送至预设的运维人员终端。如此实现了基础平台报警的自动联想,提高了发送的报警信息的全面性。

本实施例提出的报警信息处理方法,通过对分布式系统的报警信息按系统和报警接口进行合并,并分析合并后的收敛报警信息的报警原因,最终将报警原因与收敛报警信息关联后发送至预设的运维人员终端,实现了对分布式系统产生的报警信息进行自动收敛和分析,从而降低了对报警信息进行人工分析所产生的人力成本和时间成本。

进一步地,基于本发明报警信息处理方法第一实施例,提出本发明报警信息处理方法第二实施例。

在本实施例中,上述步骤s40可以包括:从预设的系统关联信息库中获取系统间关系树,所述系统间关系树用于表示所述分布式系统的各子系统之间的依赖关系;根据所述系统间关系树确定与所述收敛报警信息对应的根因系统;获取与所述根因系统对应的收敛报警信息和报警原因,将与所述根因系统对应的收敛报警信息和报警原因关联,并添加对应的根因标识后发送至预设的运维人员终端。

在本实施例中,考虑到单个系统异常时导致上下游系统同时报警,大量的报警会干扰运维人员定位根本原因。为此,可以预先设置一个系统关联信息库,该系统关联信息库中保存有系统间关系树,该系统间关系树用于表示分布式系统的各子系统之间的依赖关系,该依赖关系为任务依赖关系。

在将分布式系统的各子系统对应的收敛报警信息发送至运维人员终端之前,可以从预设的系统关联信息库中获取系统间关系树,然后根据所述系统间关系树确定与所述收敛报警信息对应的根因系统,比如,当子系统b依赖于子系统a时,则可以确定子系统a是子系统b产生报警的根因系统;之后,获取与该根因系统对应的收敛报警信息和报警原因,将与该根因系统对应的收敛报警信息和报警原因关联,并添加对应的根因标识后发送至预设的运维人员终端,其中根因标识可以是文字标识、图标标识等,具体实施时可灵活设置。

通过上述方式,实现了报警根因的自动分析,为根因系统的报警信息添加根因标识,便于运维人员快速定位报警的根本原因。

本发明还提供一种报警信息处理装置。所述报警信息处理装置包括:

获取模块,用于获取分布式系统的各子系统的报警信息,对所述报警信息进行解析,得到与所述报警信息对应的报警接口;

合并模块,用于将同一子系统下来自于同一报警接口的报警信息合并为一条收敛报警信息,得到与所述各子系统对应的收敛报警信息;

分析模块,用于分析所述收敛报警信息的报警原因;

发送模块,用于将所述报警原因与所述收敛报警信息关联后发送至预设的运维人员终端。

进一步地,所述获取模块还用于:

从预设的报警管理平台读取分布式系统的各子系统的报警信息,其中,所述报警管理平台用于收集所述各子系统的报警信息。

进一步地,所述分析模块还用于:

获取与所述收敛报警信息对应的子系统的系统名;

访问与所述系统名对应的发布平台,获取所述发布平台上的发布记录,所述发布记录中包含系统版本发布信息;

将所述发布记录作为所述收敛报警信息的报警原因。

进一步地,所述发送模块还用于:

查询与所述系统名对应的下游基础平台的报警信息表,获取所述报警信息表中的报警信息,其中,所述下游基础平台为与所述系统名对应的子系统的运行平台;

将所述报警原因、所述报警信息表中的报警信息和所述收敛报警信息关联后发送至预设的运维人员终端。

进一步地,所述发送模块还用于:

从预设的系统关联信息库中获取系统间关系树,所述系统间关系树用于表示所述分布式系统的各子系统之间的依赖关系;

根据所述系统间关系树确定与所述收敛报警信息对应的根因系统;

获取与所述根因系统对应的收敛报警信息和报警原因,将与所述根因系统对应的收敛报警信息和报警原因关联,并添加对应的根因标识后发送至预设的运维人员终端。

上述各程序模块所执行的方法可参照本发明报警信息处理方法各个实施例,此处不再赘述。

本发明还提供一种计算机可读存储介质。

本发明计算机可读存储介质上存储有报警信息处理程序,所述报警信息处理程序被处理器执行时实现如上所述的报警信息处理方法的步骤。

其中,在所述处理器上运行的报警信息处理程序被执行时所实现的方法可参照本发明报警信息处理方法各个实施例,此处不再赘述。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1