本发明涉及业务告警领域,尤其涉及一种业务告警方法、存储介质及装置。
背景技术:
随着公司业务数据和系统规模的快速增长,数据安全和系统稳定性越来越得到运维人员的关注和重视;通常某一处数据的错乱或者某一个系统的崩溃,都会导致大批量的数据异常,从而影响到公司业务的正常运作,所以数据及系统发生异常时的及时预警变得越来越重要。
现有的告警方式是采用传统技术将告警信息传输到机房,并安排运维人员驻点值守机房,时刻保持对监视屏幕的关注,以便及时掌握系统运行状态。现有的这种告警方式不仅效率较低、运维成本较高,而且容易出现漏报以及无法及时告警的情况。
因此,现有技术还有待于改进和发展。
技术实现要素:
鉴于上述现有技术的不足,本发明的目的在于提供一种业务告警方法、存储介质及装置,旨在解决现有的业务告警方式效率低、运维成本较高以及易出现漏报以及无法及时告警的问题。
本发明的技术方案如下:
一种业务告警方法,其中,包括步骤:
a、业务系统根据协议规则与告警平台建立连接;
b、当业务系统发生故障时,将告警信息发送至告警平台;
c、所述告警平台对接收到的告警信息进行分析整合处理,并将处理后的告警信息实时发送至与告警平台连接的移动终端。
所述的业务告警方法,其中,所述步骤a具体为:业务系统通过告警平台提供的webservice接口与所述告警平台建立连接。
所述的业务告警方法,其中,所述步骤b具体包括:
b1、预先在业务系统中创建http+json告警上报接口;
b2、当业务系统发生故障时,调用所述http+json告警上报接口,将告警信息发送至告警平台。
所述的业务告警方法,其中,所述告警信息包括业务系统标识、告警源、告警原因、告警描述、告警产生时间、业务系统当前登录用户账号、令牌、请求流水号以及扩展信息。
所述的业务告警方法,其中,所述步骤b还包括:
b10、告警平台对所述告警信息进行校验,判断所述告警信息是否有效;
b11、当判定所述告警信息无效时,则返回错误提示给业务系统;
b12、当判定所述告警信息有效时,则进入步骤c。
所述的业务告警方法,其中,所述步骤c具体包括:
c1、所述告警平台对接收到的告警信息进行分析整合处理,并根据唯一匹配规则判断所述告警信息是否已经存在告警平台的数据库中;
c2、当判定所述告警信息不存在告警平台的数据库中时,则将当前告警信息存入告警平台数据库中,并将所述告警信息发送至与告警平台连接的移动终端。
所述的业务告警方法,其中,所述步骤c2之后还包括:
c3、当判定所述告警信息存在告警平台的数据库中时,则进一步判断用户是否根据所述告警信息对所述业务系统进行了处理;
c4、当判定用户已经根据所述告警信息对所述业务系统进行了处理时,则将所述告警信息发送至与告警平台连接的移动终端;
c5、当判定用户未根据所述告警信息对所述业务系统进行处理时,则进一步判断所述告警信息的数量是否超过预设阈值;
c6、当所述告警信息的数量未超过预设阈值时,则将所述告警信息存入告警平台数据库并累积所述告警信息的数量;
c7、当所述告警信息的数量超过预设阈值时,则将所述告警信息再次发送至与告警平台连接的移动终端。
所述的业务告警方法,其中,所述步骤c中还包括:告警平台与移动终端预先建立tcp长连接。
一种存储介质,其中,存储有多条指令,所述指令适于由处理器加载并执行:
业务系统根据协议规则与告警平台建立连接;
当业务系统发生故障时,将告警信息发送至告警平台;
所述告警平台对接收到的告警信息进行分析整合处理,并将处理后的告警信息实时发送至与告警平台连接的移动终端。
一种业务告警装置,其中,包括处理器,适于实现个指令;以及存储器,适于存储多条指令,所述指令适于由处理器记载并执行上述任意一项所述业务告警方法的步骤。
有益效果:本发明创建了一个告警平台,业务系统根据协议规则可与所述告警平台建立连接,当业务系统发生故障时,便可将告警信息发送至告警平台,所述告警平台对接收到的告警信息进行分析整合处理,并将处理后的告警信息实时发送至与告警平台连接的移动终端;通过本发明可有效提升业务告警效率,降低运维成本,使得运维人员无需时刻值守在固定的监控台前,只要携带智能移动终端,就可以及时地收到告警信息,助其快速定位、处理业务数据或系统的异常,并且还可以有效避免告警信息的漏报。
附图说明
图1为本发明一种业务告警方法较佳实施例的流程图。
图2为本发明一种业务告警装置较佳实施例的结构框图。
具体实施方式
本发明提供一种业务告警方法、存储介质及装置,为使本发明的目的、技术方案及效果更加清楚、明确,以下对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参阅图1,图1为本发明一种业务告警方法较佳实施例的流程图,如图所示,其包括步骤:
s10、业务系统根据协议规则与告警平台建立连接;
s20、当业务系统发生故障时,将告警信息发送至告警平台;
s30、所述告警平台对接收到的告警信息进行分析整合处理,并将处理后的告警信息实时发送至与告警平台连接的移动终端。
具体来说,本发明创建了一个告警平台,所述告警平台是一个开放平台,可以对接任何的业务系统;所述业务系统只需要根据约定的协议规则接入所述告警平台,便可实现业务系统与告警平台的连接。具体地,所述业务系统通过告警平台提供的webservice接口与所述告警平台建立连接。
进一步,当所述业务系统与所述告警平台建立连接后,预先在所述业务系统中创建http+json告警上报接口,当业务系统发生故障时,则可调用所述http+json告警上报接口,将告警信息发送至告警平台;所述告警平台立即对接收到的告警信息进行分析整合处理,并将处理后的告警信息实时发送至与告警平台连接的移动终端;当用户看到移动终端上显示的告警信息时,便可快速定位并处理业务数据或系统的异常。
显然,通过本发明提供的业务告警方法,能够有效提升业务告警效率,降低运维成本,使得运维人员无需时刻值守在固定的监控台前,只要携带智能移动终端,就可以及时地收到告警信息,助其快速定位、处理业务数据或系统的异常,并且还可以有效避免告警信息的漏报。
进一步,在本发明中,当业务系统发生超时、超量、未授权、程序异常、响应太慢、网络异常等情况时,则调用所述http+json告警上报接口将告警信息发送至告警平台;
具体地,所述告警信息所包含的内容及编码格式是告警平台与业务系统预先约定配置好的,告警信息具体可包括业务系统标识、告警源、告警原因、告警描述、告警产生时间、业务系统当前登录用户账号、令牌、请求流水号以及扩展信息。
进一步,在本发明中,所述步骤s20还包括:
s21、告警平台对所述告警信息进行校验,判断所述告警信息是否有效;
具体来说,所述告警平台通过读取其缓存或其数据库中的系统标识、告警源以及告警原因等字典项,来校验所述告警信息是否有效;例如,当告警信息中的告警源不是告警平台规定配置的格式或未在告警平台缓存或数据库中找到相一致的告警源,则判定所述告警信息无效。
s22、当判定所述告警信息无效时,则返回错误提示给业务系统;
示例性地,当判定所述告警信息无效时,则返回错误提示给业务系统,所述错误提示可以为“请将告警源配置到告警平台中”等信息。
s23、当判定所述告警信息有效时,则进入步骤s30。
具体来说,当判定所述告警信息有效时,则进入步骤s30,例如,对所述告警信息进行进一步的分析整合,并保存至告警平台的数据库中。
进一步地,在本发明中,所述步骤s30具体包括:
s31、所述告警平台对接收到的告警信息进行分析整合处理,并根据唯一匹配规则判断所述告警信息是否已经存在告警平台的数据库中;
具体来说,所述告警平台对接收到的业务系统标识、告警源、告警原因、告警描述、告警产生时间、业务系统当前登录用户账号、令牌、请求流水号以及扩展信息进行分组、整合,形成规定格式的信息数据;进一步,本发明根据唯一匹配规则判断所述告警信息是否已经存在告警平台的数据库中;优选地,可根据告警信息中的告警源编码、告警原因编码以及特定扩展识别信息来匹配所述告警平台数据库中的数据,当在告警平台数据库中未匹配到与告警信息中相一致的告警源编码、告警原因编码以及特定扩展识别信息时,则判定所述告警信息是第一次出现的;
s32、当判定所述告警信息不存在告警平台的数据库中时,则将当前告警信息存入告警平台数据库中,并将所述告警信息发送至与告警平台连接的移动终端。
具体来说,当判定所述告警信息不存在告警平台的数据库中时,即所述告警信息是第一次出现,则将当前告警信息存入告警平台数据库,并将所述告警信息发送至与告警平台预先连接的移动终端,提醒运维人员及时处理业务系统或数据的异常。
更进一步,在本发明中,所述步骤s32之后还包括:
s33、当判定所述告警信息存在告警平台的数据库中时,则进一步判断用户是否根据所述告警信息对所述业务系统进行了处理;
s34、当判定用户已经根据所述告警信息对所述业务系统进行了处理时,则将所述告警信息发送至与告警平台连接的移动终端;
s35、当判定用户未根据所述告警信息对所述业务系统进行处理时,则进一步判断所述告警信息的数量是否超过预设阈值;
s36、当所述告警信息的数量未超过预设阈值时,则将所述告警信息存入告警平台数据库并累积所述告警信息的数量;
s37、当所述告警信息的数量超过预设阈值时,则将所述告警信息再次发送至与告警平台连接的移动终端。
具体来说,在步骤s33中,当判定所述告警信息存在告警平台的数据库中时,则说明用户已经收到了告警信息的提醒,但用户不一定及实地根据告警信息对业务系统进行了处理;因此,本发明需要进一步地判断用户是否根据所述告警信息对相应的业务系统进行了处理;
在步骤s34中,若判定用户已经根据所述告警信息对所述业务系统进行了处理,则说明该处理并未完全解决业务系统所反馈的问题或者只是暂时解决了业务系统所反馈的问题,因此,业务系统才会再一次的反馈相同的告警信息给告警平台,此时应再一次的将所述告警信息发送至移动终端,提醒用户对业务系统反馈的问题进行进一步地处理;
在步骤s35-s37中,若判定用户未根据所述告警信息对所述业务系统进行处理时,则进一步判断所述告警信息的数量是否超过预设阈值;也就是说,当用户收到了告警信息而未根据所述告警信息对所述业务系统进行处理时,说明该告警信息并不会对业务系统的运行造成较大的影响,用户并不着急对所述业务系统进行处理;因此,为了避免告警平台将同一告警信息持续发送至移动终端给用户带来的不便,本发明在所述告警平台上预先设置了接收同一告警信息的预设阈值,当所述告警平台接收到告警信息的数量未超过预设阈值时,则将所述告警信息存入告警平台数据库并累积告警平台接收所述告警信息的数量,直到告警平台接收所述告警信息的数量超过预设阈值时,则将所述告警信息再次发送至与告警平台连接的移动终端。
进一步地,当告警信息发送至移动终端后,用户可根据告警信息对业务系统的故障进行处理,并在移动终端上备注处理完成以及记录处理经验,便于其他运维的同事跟进处理。
更进一步地,本发明运用了消息推送技术,替代了传统的定时器轮询技术,在保证预警及时到达的同时,还能节省流量和设备电量,另外针对不同用户组的数据访问权限进行了个性化推送。
具体地,所述告警平台与移动终端预先建立tcp长连接,当告警平台接收到业务系统发来的告警信息时,会实时推送到移动终端上,较佳地,推送方式可包括电子邮件提醒,手机短信提醒或消息推送提醒等;下面介绍所述告警平台与所述移动终端是如何建立tcp长连接的:
对于ios系统而言,每个设备只要保持一个与apns的长连接,后台服务器将消息发给apns即可;具体流程如下:ios应用启动时注册apns消息推送功能,apns服务收到注册消息时会返回一串devicetoken给应用,应用将devicetoken传给后台服务器远端存储,当需要给应用推送消息时,后台服务器会将消息和devicetoken一并发送到苹果的apns服务器,apns再将消息推送到终端。
对于android系统来说,由于在国内的网络限制下,以及android系统的开放性,使得大部分的android设备并不支持google早前推出的gcm服务(类似apns的服务),所以需要客户端实现与服务器长连。由于大部分移动无线网络运营商都在链路一段时间内没有数据通讯时,会淘汰nat表中的对应项,造成链路中断,为了不让nat表失效,客户端采用alarmmanager(管理rtc硬件时钟的api,可以在cpu休眠时定时运行)定时发送心跳包,以刷新nat表项,避免被淘汰。这样客户端的推送服务会一直处于后台,与服务器的网络保持长连,等待接收消息推送。
基于上述方法,本发明还提供一种存储介质,其中,存储有多条指令,所述指令适于由处理器加载并执行:
业务系统根据协议规则与告警平台建立连接;
当业务系统发生故障时,将告警信息发送至告警平台;
所述告警平台对接收到的告警信息进行分析整合处理,并将处理后的告警信息实时发送至与告警平台连接的移动终端。
进一步,本发明还提供一种业务告警装置,其中,包括处理器10,适于实现个指令;以及存储器20,适于存储多条指令,所述指令适于由处理器10记载并执行上述任意一项所述的业务告警方法的步骤。
具体来说,所述处理器10在一些实施例中可以是一中央处理器,微处理器或其他数据处理芯片,用于运行所述存储器20中存储的程序代码或处理数据。
所述存储器20在一些实施例中可以是所述装置的内部存储单元,例如该装置的硬盘或内存。所述存储器20在另一些实施例中也可以是所述装置的外部存储器,例如所述装置上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。
进一步地,所述存储器20还可以既包括所述装置的内部存储单元也包括外部存储装置。所述存储器20用于存储安装于所述装置的应用软件及各类数据。所述存储器20还可以用于暂时地存储已经输出或者将要输出的数据。
综上所述,本发明创建了一个告警平台,业务系统根据协议规则可与所述告警平台建立连接,当业务系统发生故障时,便可将告警信息发送至告警平台,所述告警平台对接收到的告警信息进行分析整合处理,并将处理后的告警信息实时发送至与告警平台连接的移动终端;通过本发明可有效提升业务告警效率,降低运维成本,使得运维人员无需时刻值守在固定的监控台前,只要携带智能移动终端,就可以及时地收到告警信息,助其快速定位、处理业务数据或系统的异常,并且还可以有效避免告警信息的漏报。
应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。