It运维服务器的运行状态检测方法_4

文档序号:9827997阅读:来源:国知局
密码以及协议获取目标机脚本执行结果
[0115] 当前采集器支持ssh、telnet、snmp三种协议,通过配置好的协议访问到目标机(目 标运维服务器),执行指标脚本返回xml结果(主要监控信息和次要监控信息)。
[0116] 4校验结果
[0117] 通过xml规范,配置了相应的xsd文件检验返回结果是否有效。无效结果记录错误 日志,待后续查看处理,有效结果放到队列中由预警分析服务进行分析以及告警。
[0118] 本申请实施例还提供了 IT运维服务器的运行状态检测装置,包括:
[0119] 获取模块,用于获取目标运维服务器中的多种主要监控信息,主要监控信息包括 以下三种:服务器性能、服务器容量和服务器状态;
[0120] 比较模块,用于分别比较每种主要监控信息是否超过相应的阈值;
[0121] 报警模块,用于若一种主要监控信息超过预定的阈值,则触发第一报警动作。
[0122] 所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、 装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0123] 所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以 存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说 对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计 算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个 人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。 而前述的存储介质包括:U盘、移动硬盘、只读存储器(R0M,Read-0nly Memory)、随机存取存 储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0124] 以上所述,仅为本发明的【具体实施方式】,但本发明的保护范围并不局限于此,任何 熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵 盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
【主权项】
1. IT运维服务器的运行状态检测方法,其特征在于,包括: 获取目标运维服务器中的多种主要监控信息,所述主要监控信息包括以下三种:服务 器性能、服务器容量和服务器状态; 分别比较每种主要监控信息是否超过相应的阈值; 若一种主要监控信息超过预定的阈值,则触发第一报警动作。2. 根据权利要求1所述的IT运维服务器的运行状态检测方法,其特征在于,还包括: 获取目标运维服务器中的多种次要监控信息,所述次要监控信息包括以下一种或多 种:服务器配置、服务器进程、服务器温度和服务器服务; 分别判断每种次要监控信息是否符合预设的要求; 若一种次要监控信息不符合预设的要求,则触发第二报警动作。3. 根据权利要求2所述的IT运维服务器的运行状态检测方法,其特征在于,所述分别比 较每种主要监控信息是否超过相应的阈值包括: 分别比较服务器性能中,每种服务器子性能是否超过预定的阈值,所述服务器子性能 包括CPU性能、内存性能、进程性能、磁盘性能、网口性能和风扇性能; 若多种所述服务器子性能中的一种超过预定的阈值,则执行步骤所述触发第一报警动 作。4. 根据权利要求3所述的IT运维服务器的运行状态检测方法,其特征在于,所述分别比 较每种主要监控信息是否超过相应的阈值包括: 分别比较服务器容量中,每种服务器子容量是否超过预定的阈值,所述服务器子容量 包括文件系统当前使用百分比和文件系统当前使用大小; 若多种所述服务器子容量中的一种超过预定的阈值,则执行步骤所述触发第一报警动 作。5. 根据权利要求4所述的IT运维服务器的运行状态检测方法,其特征在于,所述分别比 较每种主要监控信息是否超过相应的阈值包括: 分别比较服务器状态中,每种服务器子状态是否超过预定的阈值,所述服务器子状态 包括内存状态、光纤网卡状态、在线用户数状态、风扇运行状态、路由运行状态、系统板卡工 作状态、硬盘状态灯、硬盘状态、电源工作状态、文件系统运行状态、VIDEO卡运行状态、CPU 运行状态、DVD卡运行状态和FCHBA卡运行状态; 若多种所述服务器子状态中的一种超过预定的阈值,则执行步骤所述触发第一报警动 作。6. 根据权利要求2所述的IT运维服务器的运行状态检测方法,其特征在于,所述分别比 较每种次要监控信息是否符合预设的要求包括: 分别判断服务器进程中,每种服务器子进程是否符合预设的要求,所述服务器子进程 包括进程状态、进程父ID、进程名、进程实际调用时间、进程占用的虚拟内存的大小和进程 占用的核心内存; 若多种所述服务器子进程中的一种不符合预设的要求,则执行步骤所述触发第二报警 动作; 和/或,分别判断服务器温度中,每种服务器子温度是否符合预设的要求,所述服务器 子温度包括系统温度、CPU温度和内存温度; 若多种所述服务器子温度中的一种不符合预设的要求,则执行步骤所述触发第二报警 动作; 和/或,分别判断服务器服务中,每种服务器子服务是否符合预设的要求,所述服务器 子服务包括服务状态、服务所拥有的组、服务启动时间、服务名称、服务Pid; 若多种所述服务器子服务中的一种不符合预设的要求,则执行步骤所述触发第二报警 动作。7. 根据权利要求1所述的IT运维服务器的运行状态检测方法,其特征在于,还包括: 获取目标运维服务器的服务器类型; 从多个不同类型的脚本中,选择与所述服务器类型相对应的目标脚本,所述目标脚本 中携带有获取所述主要监控信息的代码; 将所述目标脚本写入所述目标运维服务器中; 通过调用所述写入目标运维服务器中的目标脚本,以执行步骤所述获取目标运维服务 器中的多种主要监控信息。8. 根据权利要求5所述的IT运维服务器的运行状态检测方法,其特征在于,所述若一种 主要监控信息超过预定的阈值,则触发第一报警动作包括: 若所述主要监控信息的数值位于第一阈值范围,则触发第一子报警动作; 若所述主要监控信息的数值位于第二阈值范围,则触发第二子报警动作;所述第一阈 值范围和所述第二阈值范围数值上相邻。9. 根据权利要求7所述的IT运维服务器的运行状态检测方法,其特征在于,还包括:在 步骤所述通过调用所述写入目标运维服务器中的目标脚本,以执行步骤所述获取目标运维 服务器中的多种主要监控信息前,还包括: 获取所述写入目标运维服务器中的目标脚本; 根据所述目标运维服务器的故障记录,调整所述目标脚本中所携带的代码; 将所述调整后的目标脚本写入所述目标运维服务器中。
【专利摘要】本发明提供了IT运维服务器的运行状态检测方法,涉及电子信息领域。该IT运维服务器的运行状态检测方法,采用系统监控的方式,通过同时获取了服务器性能、服务器容量和服务器状态这三个方面的参数,使得本地能够同时依据这三个参数对服务器的整体状态进行评价,当某一方面出问题的时候,则采用报警的方式来告知用户,进而使得用户可以对服务器的是否正常得到直观的提醒,进而采取相应的措施,以保证服务器能够正常的提供服务。
【IPC分类】H04L12/24, H04L12/26
【公开号】CN105591816
【申请号】CN201510902028
【发明人】刘水, 胡佳龙
【申请人】北京合力思腾科技股份有限公司
【公开日】2016年5月18日
【申请日】2015年12月10日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1