一种基于监控助手实现系统运行情况监视的方法及系统与流程

文档序号:32015643发布日期:2022-11-02 20:08阅读:115来源:国知局
一种基于监控助手实现系统运行情况监视的方法及系统与流程

1.本技术涉及系统监控技术领域,尤其涉及一种基于监控助手实现系统运行情况监视的方法及系统。


背景技术:

2.随着互联网的发展,各种业务应用系统被开发,每个应用系统需要多个服务器来配合构建,因此业务系统及其服务器的维护就非常重要。系统维护最重要的是及时准确地掌握应用系统的运行状况,确保系统运行稳定。
3.目前现有技术中一般采用监控服务器来监控系统的运行状况,但是在使用系统过程中,如果监控服务器自身出现问题,将导致监控结果不准确,监控指挥中心值班人员值班期间也就无法准确获取系统运行信息,因此本技术提供一种基于监控助手实现业务系统运行情况监视方法及系统,不仅实现7*24小时在线接收消息提醒,且能及时、有效、准确地的了解系统运行情况。


技术实现要素:

4.本技术实施例的目的在于提供一种基于监控助手实现系统运行情况监视的方法及系统,以解决上述技术问题。具体技术方案如下:第一方面,提供了一种基于监控助手实现系统运行情况监视的方法,所述方法包括:主监控工作站按照预设监控频率获取被监控对象的第一系统运行状态信息,从监控工作站按照与主监控工作站相同的监控频率获取被监控对象的第二系统运行状态信息,所述第一运行状态信息和所述第二运行状态信息均包括系统应用服务在线状态、服务器运行状态、数据接口状态;主监控工作站将所述第一系统运行状态信息进行打包得到第一数据包,从监控工作站将所述第二系统运行状态信息进行打包得到第二数据包;主监控工作站和所述从监控工作站分别将所述第一数据包和第二数据包发送给对方进行交换;从监控工作站对所述第一数据包中的第一系统运行状态信息进行判断得到第一运行监控结果,并发送给主监控工作站;主监控工作站根据所述第二数据包中的第二系统运行状态信息进行判断得到第二运行监控结果;主监控工作站将所述第二运行监控结果与所述第一运行监控结果进行比较;若两者一致,则根据所述第二运行监控结果生成预警信息;将所述预警信息推送至监控客户端进行展示。
5.可选地,若第一运行监控结果与第二运行监控结果不一致,则所述方法还包括:将所述第一运行监控结果与所述第二监控结果合并得到两者并集;
根据两者并集生成预警信息。
6.可选地,在主监控工作站工作之前,所述方法还包括:主监控工作站向从监控工作站发送测试指令;判断是否在预设时间内接收到从监控工作站的反馈信号;若没有接收到,则向工作人员的移动终端中发送语音或短信提醒信息。
7.可选地,所述根据所述第二数据包中的第二系统运行状态信息进行判断得到第二运行监控结果包括:将所述第二系统运行状态信息与预设标准运行状态信息进行一一比较;将与所述预设标准运行状态信息不一致的运行状态信息确定为异常运行状态;将处于异常运行状态的第二系统运行状态信息的集合确定为第二运行监控结果。
8.可选地,所述方法还包括:根据所述第一系统运行状态信息判断被监控对象的负载状态;若负载状态为高峰状态,则增大监控频率;若负载状态为低谷状态,则减小监控频率。
9.可选地,所述主监控工作站和所述从监控工作站在工作过程中相互监控各自本身的运行状态。
10.第二方面,本技术提供一种基于监控助手实现系统运行情况监视的系统,包括:第一获取单元,用于主监控工作站按照预设监控频率获取被监控对象的第一系统运行状态信息,从监控工作站按照与主监控工作站相同的监控频率获取被监控对象的第二系统运行状态信息,所述第一运行状态信息和所述第二运行状态信息均包括系统应用服务在线状态、服务器运行状态、数据接口状态;第一打包单元,用于主监控工作站将所述第一系统运行状态信息进行打包得到第一数据包,从监控工作站将所述第二系统运行状态信息进行打包得到第二数据包;交换单元,用于主监控工作站和所述从监控工作站分别将所述第一数据包和第二数据包发送给对方进行交换;第一判断单元,用于从监控工作站对所述第一数据包中的第一系统运行状态信息进行判断得到第一运行监控结果,并发送给主监控工作站;第二判断单元,用于主监控工作站根据所述第二数据包中的第二系统运行状态信息进行判断得到第二运行监控结果;比较单元,用于主监控工作站将所述第二运行监控结果与所述第一运行监控结果进行比较;生成单元,用于若两者一致,则根据所述第二运行监控结果生成预警信息;推送单元,用于将所述预警信息推送至监控客户端进行展示。
11.第三方面,本技术提供一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现第一方面任一所述的方法步骤。
12.第四方面,本技术提供一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现第一方面任一所述的方法步骤。
13.第五方面,提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得
计算机执行上述任一所述的业务系统运行情况监视方法。
14.本技术实施例有益效果:本技术实施例提供了一种基于监控助手实现系统运行情况监视的方法及系统,本技术通过主监控工作站和从监控工作站对同一被监控对象同频监视,并将各自监视的运行状态信息交由对方进行判断,将判断的监视结果由主监控工作站进行最终确认,得到最终的监视结果集预警信息。通过这种相互监视的机制,大大提高了监视的准确性,以及监视工作的稳定性。
15.当然,实施本技术的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
16.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
17.图1为本技术实施例提供的一种基于监控助手实现系统运行情况监视的方法的流程图;图2为本技术实施例提供的一种基于监控助手实现系统运行情况监视的系统的结构示意图;图3为本技术实施例提供的一种电子设备的结构示意图。
具体实施方式
18.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
19.本技术实施例提供了一种基于监控助手实现系统运行情况监视的方法,可以应用于业务系统运行情况监视系统。该系统由主监控工作站和从监控工作站组成,用于监视业务应用系统的运行状态。主监控工作站和从监控工作站同时对同一业务应用系统进行监控。在一个示例中,业务应用系统可以为银行应用系统、企业oa应用系统、财务应用系统等。在主监控工作站和从监控工作站内均安装有监控客户端,通过两者客户端的关联账号信息建立主从关联关系。在业务应用系统及服务器内安装有用于获取业务应用系统运行数据的源代码,例如通过cron进程来定时运行监控脚本收集运行数据。
20.下面将结合具体实施方式,对本技术实施例提供的一种基于监控助手实现系统运行情况监视的方法进行详细的说明,如图1所示,具体步骤如下:步骤s101:主监控工作站按照预设监控频率获取被监控对象的第一系统运行状态信息,从监控工作站按照与主监控工作站相同的监控频率获取被监控对象的第二系统运行状态信息。
21.其中,所述第一运行状态信息和第二运行状态信息均包括系统应用服务在线状态、服务器运行状态、数据接口状态。在一个示例中,预设监控频率可以为5s/次。
22.其中,所述主监控工作站和所述从监控工作站对同一被监控对象进行同频监控。从监控工作站跟随主监控工作站的监控频率,第一数据包和第二数据包中的运行状态信息是在同一时刻对同一被监控对象的监控信息。
23.另外,在本技术一个具体实施例中,可以在主监控工作站和从监控工作站中通过同时安装监控助手客户端来实现步骤s101及后续工作过程,在主监控工作站和从监控工作站中通过预先绑定的主从账号来分别登录该监控助手,以实现获取被监控对象的运行状态及相互之间的数据交互。
24.可选地,所述方法还包括:根据所述第一系统运行状态信息判断被监控对象的负载状态。
25.具体来说,通过服务器运行状态来判断,其中服务器运行状态包括服务器内存、存储量、服务器运行任务数量等,将服务器的运行任务数量与预设范围阈值进行比较,例如预设范围阈值为100-1000,如果服务器运行任务数量超过预设范围阈值,则判断被监控对象的负载状态为高峰状态,如果服务器运行任务数量低于预设阈值,则判断被监控对象的负载状态为低谷状态。如果处于范围阈值内则按照预设频率进行监控。
26.若负载状态为高峰状态,则增大监控频率;若负载状态为低谷状态,则减小监控频率。
27.步骤s102:主监控工作站将所述第一系统运行状态信息进行打包得到第一数据包,从监控工作站将所述第二系统运行状态信息进行打包得到第二数据包。
28.步骤s103:主监控工作站和所述从监控工作站分别将所述第一数据包和第二数据包发送给对方进行交换。
29.步骤s104:从监控工作站对所述第一数据包中的第一系统运行状态信息进行判断得到第一运行监控结果,并发送给主监控工作站。
30.步骤s105:主监控工作站根据所述第二数据包中的第二系统运行状态信息进行判断得到第二运行监控结果。
31.可选地,所述根据所述第二系统运行状态信息判断得到第二运行监控结果包括:将所述第二系统运行状态信息与预设标准运行状态信息进行一一比较。
32.在本技术实施例中,预设标准运行状态为系统应用服务均为在线状态,服务器内存和运行任务数量均在预设范围内,数据接口处于接入状态。
33.将与所述预设标准运行状态信息不一致的运行状态信息确定为异常运行状态。
34.在本技术实施例中,不一致是指,系统应用某一个服务存在不在线的状态、数据某个接口未处于接入状态、服务器内存和运行任务数量超过预设范围。
35.将处于异常运行状态的第二系统运行状态信息的集合确定为第二运行监控结果。
36.步骤s106:主监控工作站将所述第二运行监控结果与所述第一运行监控结果进行比较。
37.步骤s107:若两者一致,则根据所述第二运行监控结果生成预警信息。
38.在该步骤中,该预警信息可以是语音预警信息,也可以是短信等文字预警信息。
39.步骤s108:将所述预警信息推送至监控客户端进行展示。
40.在该步骤中,预警信息可以通过弹窗方式进行推送,例如通过ssh的x选项,实现应用程序图形截面,该图像界面直接在客户端弹出窗口。
41.可选地,若第一运行监控结果与第二运行监控结果不一致,则所述方法还包括:将所述第一运行监控结果与所述第二监控结果合并得到两者并集;根据两者并集生成预警信息。
42.在一个示例中,例如主监控工作站和从监控工作站同时在监控被监控对象的数据接口状态,被监控对象有4个数据接口,分别为a、b、c、d,主监控工作站监控的第二监控结果为a、b接口异常,从监控工作站监控的第一监控结果为a、b、c接口异常。那么说明对于c接口两者判断不一致,c接口的状态未知,也需要列为异常,以由工作人员进一步判断,所以最终的监控结果就是a、b、c接口均异常,从而减少了监控的失误率。
43.可选地,在主监控工作站工作之前,所述方法还包括:向从监控工作站发送测试指令;判断是否在预设时间内接收到从监控工作站的反馈信号;若没有接收到,则向工作人员的移动终端中发送语音或短信提醒信息。
44.通过上述过程来判断从监控工作站是否开机,是否登录了监控客户端,如果登录了,则可以接受到主监控工作站发送的测试指令,并返回反馈信号,如果没有登录,则接受不到测试指令,并且也无法返回反馈信号,那么此时主监控工作站通过向工作人员的移动终端中发送语音或短信提醒信息,来提醒工作人员进行开机和登录,来保证主监控工作站和从监控工作站同时处于在线状态,保证监控工作的正常进行。
45.在另外的实施例中,在主监控工作站和从监控工作站工作过程中,主监控工作站和从监控工作站还可以相互监控各自自身的运行状态,从而保证监控系统的稳定运行。
46.第二方面,基于同样的发明构思,本技术提供一种基于监控助手实现系统运行情况监视的系统,如图2所示,该系统包括:第一获取单元201,用于主监控工作站按照预设监控频率获取被监控对象的第一系统运行状态信息,从监控工作站按照与主监控工作站相同的监控频率获取被监控对象的第二系统运行状态信息,所述第一运行状态信息和所述第二运行状态信息均包括系统应用服务在线状态、服务器运行状态、数据接口状态。
47.第一打包单元202,用于主监控工作站将所述第一系统运行状态信息进行打包得到第一数据包,从监控工作站将所述第二系统运行状态信息进行打包得到第二数据包。
48.交换单元203,用于主监控工作站和所述从监控工作站分别将所述第一数据包和第二数据包发送给对方进行交换。
49.第一判断单元204,用于从监控工作站对所述第一数据包中的第一系统运行状态信息进行判断得到第一运行监控结果,并发送给主监控工作站。
50.第二判断单元205,用于主监控工作站根据所述第二数据包中的第二系统运行状态信息进行判断得到第二运行监控结果。
51.比较单元206,用于主监控工作站将所述第二运行监控结果与第一运行监控结果进行比较。
52.生成单元207,用于若两者一致,则根据所述第二运行监控结果生成预警信息。
53.推送单元208,用于将所述预警信息推送至监控客户端进行展示。
54.基于相同的技术构思,本发明实施例还提供了一种电子设备,如图3所示,包括处理器301、通信接口302、存储器303和通信总线304,其中,处理器301,通信接口302,存储器
303通过通信总线304完成相互间的通信,存储器303,用于存放计算机程序;处理器301,用于执行存储器303上所存放的程序时,实现业务系统运行情况监视方法的步骤。
55.上述电子设备提到的通信总线可以是外设部件互连标准(peripheral component interconnect,pci)总线或扩展工业标准结构(extended industry standard architecture,eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
56.通信接口用于上述电子设备与其他设备之间的通信。
57.存储器可以包括随机存取存储器(random access memory,ram),也可以包括非易失性存储器(non-volatile memory,nvm),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
58.上述的处理器可以是通用处理器,包括中央处理器(central processing unit,cpu)、网络处理器(network processor,np)等;还可以是数字信号处理器(digital signal processing,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
59.在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一业务系统运行情况监视方法的步骤。
60.在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一业务系统运行情况监视方法。
61.在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘solid state disk(ssd))等。
62.需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除
在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
63.以上所述仅是本技术的具体实施方式,使本领域技术人员能够理解或实现本技术。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下,在其它实施例中实现。因此,本技术将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1