高性能平台监控运维系统及方法与流程

文档序号:31533325发布日期:2022-09-16 21:26阅读:103来源:国知局
高性能平台监控运维系统及方法与流程

1.本发明属于监控运维技术领域,具体涉及高性能平台监控运维系统及方 法。


背景技术:

2.各行各业对it信息系统的应用广泛性和规模性越来越大,为了有效管理 这些it系统,都会根据自己的实际情况建立系统运维管理平台,以便系统在 出现异常时,帮助运维管理人员快速、准确的定位系统存在的故障。
3.现有的高性能平台监控运维系统及方法还存在一些问题:不方便自动对 故障进行巡检,降低了运维效率;不方便对服务器故障和实时监控的结果的 故障进行分别管理和维护,为此我们提出高性能平台监控运维系统及方法。


技术实现要素:

4.本发明的目的在于提供高性能平台监控运维系统及方法,以解决上述背 景技术中提出的问题。
5.为实现上述目的,本发明提供如下技术方案:高性能平台监控运维系统, 包括自动巡视模块、报警模块、服务器运维模块、监控故障管理维护模块和 数据处理模块;
6.所述自动巡视模块用于自动检测服务器故障和监控结果故障;
7.所述报警模块用于在所述自动巡视模块检测到故障时,进行提醒工作, 及时进行运维工作;
8.所述服务器运维模块用于通过平台建立多个应急通道对服务器故障进行 处理;
9.所述监控故障管理维护模块用于获取系统的监控指标数据,并对监控指 标数据进行实时处理,对实时监控的结果进行故障管理和维护;
10.以及所述数据处理模块用于平台内的设备进行数据处理,实现创建一体 化的运维和监控。
11.优选的,所述自动巡视模块采用通信协议完成网络探测,通过对视频流 进行采集、分解、分析,完成自动巡视和故障原因上报。
12.优选的,所述服务器运维模块包括平台构建单元、应急通道构建单元、 故障分类单元和故障处理单元,所述平台构建单元用于基于云系统架构建设 平台;所述应急通道构建单元用于在建设的平台上预定义用于处理服务器故 障的多种应急通道;所述故障分类单元用于通过平台采集云系统的运行数据, 并从采集的运行数据获得服务器故障信息,再进行服务器故障信息的故障类 型评估;所述故障处理单元用于调动平台,针对不同类型的服务器故障,选 择预定义的应用通道来处理服务器故障。
13.优选的,所述监控故障管理维护模块包括监控数据采集单元、实时处理 单元、异常监控单元和故障管理单元;所述监控数据采集单元用于获取平台 的监控指标数据;所述监控指标数据为影响平台稳定运行的面向用户或业务 视角的指标数据;所述实时处理单元用于对获取的所述监控指标数据进行实 时处理,生成针对各监控指标随时间实时变动
的动态趋势线;所述异常监控 单元用于对所述动态趋势线进行实时监控,根据动态趋势线与参考区间的关 系,确定平台处于正常状态或面向用户或业务视角系统异常状态;所述故障 管理单元用于根据对动态趋势线进行实时监控的结果进行系统故障管理和维 护。
14.优选的,所述数据处理模块包括接入单元、数据单元、服务单元和应用 单元;所述接入单元用于接入系统中不同的物联网设备;所述数据单元用于 接收接入的物联网设备的设备数据,并按照数据系统的需求,对设备数据进 行处理;所述服务单元根据所述数据单元提供的数据,向所述应用单元中各 个对象提供服务,每个对象对应一数据系统。
15.本发明还提供了高性能平台监控运维方法,包括以下步骤:
16.s1.通过自动巡视模块自动检测服务器故障和监控结果故障;
17.s2.通过报警模块在所述自动巡视模块检测到故障时,进行提醒工作,及 时进行运维工作;
18.s3.通过服务器运维模块建立多个应急通道对服务器故障进行处理;
19.s4.通过监控故障管理维护模块获取系统的监控指标数据,并对监控指标 数据进行实时处理,对实时监控的结果进行故障管理和维护;
20.s5.通过数据处理模块对平台内的设备进行数据处理,实现创建一体化的 运维和监控。
21.优选的,所述s3中的具体方法包括以下步骤:
22.s301.基于云系统架构建设平台;
23.s302.在建设的平台上预定义用于处理服务器故障的多种应急通道;
24.s303.通过平台采集云系统的运行数据,并从采集的运行数据获得服务器 故障信息,再进行服务器故障信息的故障类型评估;
25.s304.调动平台,针对不同类型的服务器故障,选择预定义的应用通道来 处理服务器故障。
26.优选的,所述s4的具体方法包括以下步骤:
27.s401.获取平台的监控指标数据;
28.s402.对获取的所述监控指标数据进行实时处理,生成针对各监控指标随 时间实时变动的动态趋势线;
29.s403.对所述动态趋势线进行实时监控,根据动态趋势线与参考区间的关 系,确定平台处于正常状态或面向用户或业务视角系统异常状态;
30.s404.根据对动态趋势线进行实时监控的结果进行系统故障管理和维护。
31.优选的,所述s5的具体方法包括以下步骤:
32.s501.接入系统中不同的物联网设备;
33.s502.接收接入的物联网设备的设备数据,并按照数据系统的需求,对设 备数据进行处理;
34.s503.根据提供的数据,向各个对象提供服务,使每个对象对应一数据系 统。
35.优选的,所述数据处理模块采用二阶滤波器算法进行,当前的滤波输出 时刻,设置为n,压力滤波数据输出为y(n)由下列公式递推得到:
36.y(n)=b(0)x(n)+b(1)x(n-1)+b(2)x(n-2)+...+b(m)x(n-m)-a(1)y(n-1)
‑ꢀ
a(2)y(n-2)-a(m)y(n-m);
37.其中,a序列和b序列表示一组系列,m为整数,表示需要调用的相关的 数据池长度;
38.对进入数据池的数据进行分析,需要如下两个序列:
39.dy(n)=y(n)-y(n-1);
40.dx(n)=x(n)-x(n-1);
41.其中,x序列为补偿值x序列,表示进行压力补偿之后的第二补偿压力值;
42.y序列为滤波值y序列,表示进行滤波补偿之后的第二补偿压力值。
43.与现有技术相比,本发明的有益效果是:
44.(1)本发明通过设置自动巡视模块能够自动检测服务器故障和监控结果 故障,实现了自动地检测出故障,并通过设置的报警模块启动运维工作,从 而提高了运维效率。
45.(2)本发明通过设置服务器运维模块,能够对服务器故障进行处理,通 过设置监控故障管理维护模块,能够对实时监控的结果进行故障管理和维护, 从而方便对服务器故障和实时监控的结果故障进行分别处理,增加了处理效 果;
46.(3)本发明通过设置数据处理模块,能够对平台内的设备进行数据处理, 实现了创建一体化的运维和监控。
附图说明
47.图1为本发明的结构框图;
48.图2为本发明的流程图之一;图3为本发明的流程图之二。
具体实施方式
49.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行 清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而 不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做 出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
50.请参阅图1-图2,本发明提供一种技术方案:高性能平台监控运维系统, 包括自动巡视模块、报警模块、服务器运维模块、监控故障管理维护模块和 数据处理模块;
51.所述自动巡视模块用于自动检测服务器故障和监控结果故障;
52.所述报警模块用于在所述自动巡视模块检测到故障时,进行提醒工作, 及时进行运维工作;
53.所述服务器运维模块用于通过平台建立多个应急通道对服务器故障进行 处理;
54.所述监控故障管理维护模块用于获取系统的监控指标数据,并对监控指 标数据进行实时处理,对实时监控的结果进行故障管理和维护;
55.以及所述数据处理模块用于平台内的设备进行数据处理,实现创建一体 化的运维和监控。
56.本实施例中,优选的,所述自动巡视模块采用通信协议完成网络探测, 通过对视频流进行采集、分解、分析,完成自动巡视和故障原因上报。
57.本实施例中,优选的,所述服务器运维模块包括平台构建单元、应急通 道构建单
元、故障分类单元和故障处理单元,所述平台构建单元用于基于云 系统架构建设平台;所述应急通道构建单元用于在建设的平台上预定义用于 处理服务器故障的多种应急通道;所述故障分类单元用于通过平台采集云系 统的运行数据,并从采集的运行数据获得服务器故障信息,再进行服务器故 障信息的故障类型评估;所述故障处理单元用于调动平台,针对不同类型的 服务器故障,选择预定义的应用通道来处理服务器故障。
58.本实施例中,优选的,所述监控故障管理维护模块包括监控数据采集单 元、实时处理单元、异常监控单元和故障管理单元;所述监控数据采集单元 用于获取平台的监控指标数据;所述监控指标数据为影响平台稳定运行的面 向用户或业务视角的指标数据;所述实时处理单元用于对获取的所述监控指 标数据进行实时处理,生成针对各监控指标随时间实时变动的动态趋势线; 所述异常监控单元用于对所述动态趋势线进行实时监控,根据动态趋势线与 参考区间的关系,确定平台处于正常状态或面向用户或业务视角系统异常状 态;所述故障管理单元用于根据对动态趋势线进行实时监控的结果进行系统 故障管理和维护。
59.本实施例中,优选的,所述数据处理模块包括接入单元、数据单元、服 务单元和应用单元;所述接入单元用于接入系统中不同的物联网设备;所述 数据单元用于接收接入的物联网设备的设备数据,并按照数据系统的需求, 对设备数据进行处理;所述服务单元根据所述数据单元提供的数据,向所述 应用单元中各个对象提供服务,每个对象对应一数据系统。
60.高性能平台监控运维方法,其特征在于:包括以下步骤:
61.s1.通过自动巡视模块自动检测服务器故障和监控结果故障;
62.s2.通过报警模块在所述自动巡视模块检测到故障时,进行提醒工作,及 时进行运维工作;
63.s3.通过服务器运维模块建立多个应急通道对服务器故障进行处理;
64.s4.通过监控故障管理维护模块获取系统的监控指标数据,并对监控指标 数据进行实时处理,对实时监控的结果进行故障管理和维护;
65.s5.通过数据处理模块对平台内的设备进行数据处理,实现创建一体化的 运维和监控。
66.本实施例中,优选的,所述s3中的具体方法包括以下步骤:
67.s301.基于云系统架构建设平台;
68.s302.在建设的平台上预定义用于处理服务器故障的多种应急通道;
69.s303.通过平台采集云系统的运行数据,并从采集的运行数据获得服务器 故障信息,再进行服务器故障信息的故障类型评估;
70.s304.调动平台,针对不同类型的服务器故障,选择预定义的应用通道来 处理服务器故障。
71.本实施例中,优选的,所述s4的具体方法包括以下步骤:
72.s401.获取平台的监控指标数据;
73.s402.对获取的所述监控指标数据进行实时处理,生成针对各监控指标随 时间实时变动的动态趋势线;
74.s403.对所述动态趋势线进行实时监控,根据动态趋势线与参考区间的关 系,确
定平台处于正常状态或面向用户或业务视角系统异常状态;
75.s404.根据对动态趋势线进行实时监控的结果进行系统故障管理和维护。
76.本实施例中,优选的,所述s5的具体方法包括以下步骤:
77.s501.接入系统中不同的物联网设备;
78.s502.接收接入的物联网设备的设备数据,并按照数据系统的需求,对设 备数据进行处理;
79.s503.根据提供的数据,向各个对象提供服务,使每个对象对应一数据系 统。
80.本实施例中,优选的,所述数据处理模块采用二阶滤波器算法进行,当 前的滤波输出时刻,设置为n,压力滤波数据输出为y(n)由下列公式递推得 到:
81.y(n)=b(0)x(n)+b(1)x(n-1)+b(2)x(n-2)+...+b(m)x(n-m)-a(1)y(n-1)
‑ꢀ
a(2)y(n-2)-a(m)y(n-m);
82.其中,a序列和b序列表示一组系列,m为整数,表示需要调用的相关的 数据池长度;
83.对进入数据池的数据进行分析,需要如下两个序列:
84.dy(n)=y(n)-y(n-1);
85.dx(n)=x(n)-x(n-1);
86.其中,x序列为补偿值x序列,表示进行压力补偿之后的第二补偿压力值;
87.y序列为滤波值y序列,表示进行滤波补偿之后的第二补偿压力值。
88.本发明的原理及优点:本发明通过设置自动巡视模块能够自动检测服务 器故障和监控结果故障,实现了自动地检测出故障,并通过设置的报警模块 启动运维工作,从而提高了运维效率;通过设置服务器运维模块,能够对服 务器故障进行处理,通过设置监控故障管理维护模块,能够对实时监控的结 果进行故障管理和维护,从而方便对服务器故障和实时监控的结果故障进行 分别处理,增加了处理效果;通过设置数据处理模块,能够对平台内的设备 进行数据处理,实现了创建一体化的运维和监控。
89.尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而 言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行 多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限 定。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1