一种通信系统中节点的监控方法及系统的制作方法

文档序号:10660631阅读:633来源:国知局
一种通信系统中节点的监控方法及系统的制作方法
【专利摘要】本发明涉及一种通信系统中节点的监控方法及系统,其中方法包括:步骤1:对通信系统中由多个通信节点构成的多个通信链路进行监控;步骤2:定时采集所有通信节点中积压线程的数量;步骤3:当出现一个或多个通信节点中的积压线程的数量达到或超出预设阀值时,发出告警,所述积压线程数量达到或超出预设阀值的通信节点对应的通信链路停止工作,结束。通过监控各通信节点线程积压情况,达到一定积压阀值,通知前端该通信节点异常,避免交易拥塞堵死,提前规避风险,使客户端和用户无感知,提升用户体验;提前发现过载的应用,避免单节点拥堵,造成用户体验慢或者应用堵死导致瘫痪的情况。
【专利说明】
一种通信系统中节点的监控方法及系统
技术领域
[0001]本发明涉及一种通信系统中节点的监控方法及系统。
【背景技术】
[0002]互联网行业的发展,推动了电信行业的改革,由过去IBM小型机、ORACLE、TUXEDO向X86、Mysql、服务云化发展,三大运营商逐步实现云化改造。
[0003]云化部署后降低了单机维护成本和升级成本,但单节点的性能和稳定性与之前相比有所降低,要保证用户良好体验,做到7*24小时不间断服务,必须提前发现单节点故障,提前做出应对处理,防患于未然。

【发明内容】

[0004]本发明所要解决的技术问题是提供一种通过增加线程监控保障处理,提高系统稳定性和用户良好感知的通信系统中节点的监控方法及系统。
[0005]本发明解决上述技术问题的技术方案如下:一种通信系统中节点的监控方法,具体包括以下步骤:
[0006]步骤1:对通信系统中由多个通信节点构成的多个通信链路进行监控;
[0007]步骤2:定时采集所有通信节点中积压线程的数量;
[0008]步骤3:当出现一个或多个通信节点中的积压线程的数量达到或超出预设阀值时,发出告警,所述积压线程数量达到或超出预设阀值的通信节点对应的通信链路停止工作,结束。
[0009]本发明的有益效果是:通过监控各通信节点线程积压情况,达到一定积压阀值,通知前端该通信节点异常,避免交易拥塞堵死,提前规避风险,使客户端和用户无感知,提升用户体验;提前发现过载的应用,避免单节点拥堵,造成用户体验慢或者应用堵死导致瘫痪的情况。
[0010]在上述技术方案的基础上,本发明还可以做如下改进。
[0011 ]进一步,所述3具体包括以下步骤:
[0012]步骤3.1:选取一个通信链路作为当前通信链路;
[0013]步骤3.2:判断当前通信链路中的所有通信节点中线程积压的数量是否都小于预设阀值,如果是,执行步骤3.4;否则,执行步骤3.3;
[0014]步骤3.3:发出告警,当前通信链路停止工作,执行步骤3.4;
[0015]步骤3.4:判断是否还存在未判断通信链路,如果是,执行步骤3.1;否则,结束。
[0016]采用上述进一步方案的有益效果是,通信链路中可以包括多个通信节点,一旦其中任何一个通信节点线程积压数量超出阀值就会造成通信拥塞,因此,当任何一个通信节点出现线程积压数量超出阀值,立即停止所在通信链路的通信工作。
[0017]进一步,还包括步骤4:将监控过程及告警信息生成监控日志,并将监控日志进行保存。
[0018]采用上述进一步方案的有益效果是,通过监控日志可以在出问题后可以找到问题时间点和异常数据信息,便于维护人员对问题及时进行解决。
[0019]进一步,所述阀值通过预设固定值结合监控日志进行设置。
[0020]采用上述进一步方案的有益效果是,通过监控日志可以对已经设定的阀值进行调整,达到最佳,不会出现过载也不会出现负载不足的情况。
[0021]本发明解决上述技术问题的技术方案如下:一种通信系统中节点的监控系统,包括监控模块、采集模块和判断告警模块;
[0022]所述监控模块用于对通信系统中由多个通信节点构成的多个通信链路进行监控;
[0023]所述采集模块用于定时采集所有通信节点中积压线程的数量;
[0024]所述判断告警模块当出现一个或多个通信节点中的积压线程的数量达到或超出预设阀值时,发出告警,所述积压线程数量达到或超出预设阀值的通信节点对应的通信链路停止工作,结束。
[0025]本发明的有益效果是:通过监控各通信节点线程积压情况,达到一定积压阀值,通知前端该通信节点异常,避免交易拥塞堵死,提前规避风险,使客户端和用户无感知,提升用户体验;提前发现过载的应用,避免单节点拥堵,造成用户体验慢或者应用堵死导致瘫痪的情况。
[0026]在上述技术方案的基础上,本发明还可以做如下改进。
[0027]进一步,所述判断告警模块包括选取模块、判断模块和结束模块;
[0028]所述选取模块用于选取一个通信链路作为当前通信链路;
[0029]所述判断模块用于判断当前通信链路中的所有通信节点中线程积压的数量是否都小于预设阀值,如果是,触发结束模块;否则,发出告警,当前通信链路停止工作,触发结束模块;
[0030]所述结束模用于判断是否还存在未判断通信链路,如果是,触发选取模块选取其他通信链路为当前通信链路;否则,结束。
[0031]采用上述进一步方案的有益效果是,通信链路中可以包括多个通信节点,一旦其中任何一个通信节点线程积压数量超出阀值就会造成通信拥塞,因此,当任何一个通信节点出现线程积压数量超出阀值,立即停止所在通信链路的通信工作。
[0032]进一步,还包括日志模块,所述日志模块用于将监控过程及告警信息生成监控日志,并将监控日志进行保存。
[0033]采用上述进一步方案的有益效果是,通过监控日志可以在出问题后可以找到问题时间点和异常数据信息,便于维护人员对问题及时进行解决。
[0034]进一步,所述阀值通过预设固定值结合监控日志进行设置。
[0035]采用上述进一步方案的有益效果是,通过监控日志可以对已经设定的阀值进行调整,达到最佳,不会出现过载也不会出现负载不足的情况。
[0036]本方案的核心在于通过webI Ogi C提供的监控脚本,编写python脚本,实现对weblogic线程队列ThreadTotal、ThreadIdle指标监控,特点如下:
[0037]1、增加的监控脚本为后台程序,不依赖应用本身;
[0038]2、增加的监控不影响应用本身运行;
[0039]3、监控数据定时打印到指定日志文件,出问题后可以找到问题时间点和异常数据信息;
[0040]4、通过监控数据结果,根据经验设置阀值,达到阀值实现应用切换。
【附图说明】
[0041]图1为本发明实施例1所述的一种通信系统中节点的监控方法流程图;
[0042]图2为本发明实施例1所述的一种通信系统中节点的监控系统结构框图。
[0043]附图中,各标号所代表的部件列表如下:
[0044]1、监控模块,2、采集模块,3、判断告警模块。
【具体实施方式】
[0045]以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
[0046]如图1所示,为本发明实施例1所述的一种通信系统中节点的监控方法,具体包括以下步骤:
[0047]步骤1:对通信系统中由多个通信节点构成的多个通信链路进行监控;
[0048]步骤2:定时采集所有通信节点中积压线程的数量;
[0049]步骤3:当出现一个或多个通信节点中的积压线程的数量达到或超出预设阀值时,发出告警,所述积压线程数量达到或超出预设阀值的通信节点对应的通信链路停止工作,结束。
[0050]本发明实施例2所述的一种通信系统中节点的监控方法,在实施例1的基础上,所述3具体包括以下步骤:
[0051 ]步骤3.1:选取一个通信链路作为当前通信链路;
[0052]步骤3.2:判断当前通信链路中的所有通信节点中线程积压的数量是否都小于预设阀值,如果是,执行步骤3.4;否则,执行步骤3.3;
[0053]步骤3.3:发出告警,当前通信链路停止工作,执行步骤3.4;
[0054]步骤3.4:判断是否还存在未判断通信链路,如果是,执行步骤3.1;否则,结束。
[0055]本发明实施例3所述的一种通信系统中节点的监控方法,在实施例1或2的基础上,还包括步骤4:将监控过程及告警信息生成监控日志,并将监控日志进行保存。
[0056]本发明实施例4所述的一种通信系统中节点的监控方法,在实施例3的基础上,所述阀值通过预设固定值结合监控日志进行设置。
[0057]如图2所示,为本发明实施例1所述的一种通信系统中节点的监控系统,包括监控模块1、采集模块2和判断告警模块3;
[0058]所述监控模块I用于对通信系统中由多个通信节点构成的多个通信链路进行监控;
[0059]所述采集模块2用于定时采集所有通信节点中积压线程的数量;
[0060]所述判断告警模块3当出现一个或多个通信节点中的积压线程的数量达到或超出预设阀值时,发出告警,所述积压线程数量达到或超出预设阀值的通信节点对应的通信链路停止工作,结束。
[0061]本发明实施例2所述的一种通信系统中节点的监控系统,在实施例1的基础上,所述判断告警模块3包括选取模块、判断模块和结束模块;
[0062]所述选取模块用于选取一个通信链路作为当前通信链路;
[0063]所述判断模块用于判断当前通信链路中的所有通信节点中线程积压的数量是否都小于预设阀值,如果是,触发结束模块;否则,发出告警,当前通信链路停止工作,触发结束模块;
[0064]所述结束模用于判断是否还存在未判断通信链路,如果是,触发选取模块选取其他通信链路为当前通信链路;否则,结束。
[0065]本发明实施例3所述的一种通信系统中节点的监控系统,在实施例1或2的基础上,还包括日志模块,所述日志模块用于将监控过程及告警信息生成监控日志,并将监控日志进行保存。
[0066]本发明实施例4所述的一种通信系统中节点的监控系统,在实施例3的基础上,所述阀值通过预设固定值结合监控日志进行设置。
[0067]具体实现方案及步骤:
[0068]1、编写线程监控脚本,后台获取总线程数ThreadTotal,空闲线程数ThreadIdle,并打印到指定目录文件中;
[0069]idleThreadCount = cm0.getExecuteThreadIdleCount( ) +cm0.getStandbyThreadCount()
[0070]threadTotalCount = cm0.getExecuteThreadTotalCount();
[0071]2、增加监控脚本,监控文件中记录的线程数,并计算排队线程数tail-1/onebosslog/tsnboss/threadlog/95tsnswitch$DATE.log|grep95tsnswitch|tail-11awk’{print$10}' read Idle95switch tail-1/onebosslog/tsnboss/threadlog/95tsnswitch$DATE.log Igrep95tsnswitch|tail-11awk,{print$14},|read Total95switch
[0072]thread_busy95 = $( ($Total95switch-$Idle95switch));
[0073]3、监控脚本监控云化节点下的各个应用;
[0074]4、根据设置的阀值,如果达到阀值通知前端应用停止发送交易,阀值设置大小可以根据日常系统运行情况根据经验判断,根据一般经验,积压阀值超过100时,系统压力已经过载,可作为参考值。
[0075]以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【主权项】
1.一种通信系统中节点的监控方法,其特征在于,具体包括以下步骤: 步骤1:对通信系统中由多个通信节点构成的多个通信链路进行监控; 步骤2:定时采集所有通信节点中积压线程的数量; 步骤3:当出现一个或多个通信节点中的积压线程的数量达到或超出预设阀值时,发出告警,所述积压线程数量达到或超出预设阀值的通信节点对应的通信链路停止工作,结束。2.根据权利要求1所述的一种通信系统中节点的监控方法,其特征在于,所述3具体包括以下步骤: 步骤3.1:选取一个通信链路作为当前通信链路; 步骤3.2:判断当前通信链路中的所有通信节点中线程积压的数量是否都小于预设阀值,如果是,执行步骤3.4;否则,执行步骤3.3; 步骤3.3:发出告警,当前通信链路停止工作,执行步骤3.4; 步骤3.4:判断是否还存在未判断通信链路,如果是,执行步骤3.1;否则,结束。3.根据权利要求1或2所述的一种通信系统中节点的监控方法,其特征在于,还包括步骤4:将监控过程及告警信息生成监控日志,并将监控日志进行保存。4.根据权利要求3所述的一种通信系统中节点的监控方法,其特征在于,所述阀值通过预设固定值结合监控日志进行设置。5.—种通信系统中节点的监控系统,其特征在于,包括监控模块、采集模块和判断告警模块; 所述监控模块用于对通信系统中由多个通信节点构成的多个通信链路进行监控; 所述采集模块用于定时采集所有通信节点中积压线程的数量; 所述判断告警模块当出现一个或多个通信节点中的积压线程的数量达到或超出预设阀值时,发出告警,所述积压线程数量达到或超出预设阀值的通信节点对应的通信链路停止工作。6.根据权利要求5所述的一种通信系统中节点的监控系统,其特征在于,所述判断告警模块包括选取模块、判断模块和结束模块; 所述选取模块用于选取一个通信链路作为当前通信链路; 所述判断模块用于判断当前通信链路中的所有通信节点中线程积压的数量是否都小于预设阀值,如果是,触发结束模块;否则,发出告警,当前通信链路停止工作,触发结束模块; 所述结束模用于判断是否还存在未判断通信链路,如果是,触发选取模块选取其他通信链路为当前通信链路;否则,结束。7.根据权利要求5或6所述的一种通信系统中节点的监控系统,其特征在于,还包括日志模块,所述日志模块用于将监控过程及告警信息生成监控日志,并将监控日志进行保存。8.根据权利要求7所述的一种通信系统中节点的监控系统,其特征在于,所述阀值通过预设固定值结合监控日志进行设置。
【文档编号】H04L12/24GK106027286SQ201610293018
【公开日】2016年10月12日
【申请日】2016年5月5日
【发明人】朱建光
【申请人】北京思特奇信息技术股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1