一种资源池的监控方法、装置、平台和存储介质与流程

文档序号:33359150发布日期:2023-03-07 20:11阅读:25来源:国知局
一种资源池的监控方法、装置、平台和存储介质与流程

1.本技术涉及云计算技术领域,尤其是涉及一种资源池的监控方法、资源池的监控装置、监控平台和存储介质。


背景技术:

2.在云计算技术日趋成熟以及业务量迅速增多的推动下,云计算服务平台中部署了多种不同的虚拟化技术架构如kvm、vmware、xen、hyper-v的云资源池,且不同云资源池位于不同区域,以支持复杂多样的业务场景。
3.相关技术中,云计算服务平台对异构且分散的云资源池进行监控时,通过设置多种监控平台的方式以实现对每一架构的资源池的管理。然而,该方法至少存在无法对多个异构云资源池进行统一管理,导致监控成本高、监控效率低的问题。


技术实现要素:

4.本技术提供一种资源池的监控方法、资源池的监控装置、监控平台和存储介质,解决相关技术中存在无法对多个异构云资源池进行统一管理,导致监控成本高、监控效率低的问题。
5.本技术的技术方案是这样实现的:
6.本技术提供一种资源池的监控方法,所述方法包括:
7.获取监控平台监控的资源池n中,前置采集集群n上报的被监控对象对所述资源池n中的资源进行利用所产生的监控数据;其中,所述监控平台用于监控n个资源池,不同资源池对应的被监控对象的网络架构不同;所述n大于等于1,且小于等于所述n;
8.通过机器学习模型对所述被监控对象的所述监控数据进行深度分析,得到第一分析结果;
9.向所述被监控对象发送所述第一分析结果,以使所述被监控对象处理所述第一分析结果。
10.本技术提供一种资源池的监控装置,所述装置包括:
11.获取模块,用于获取监控平台监控的资源池n中,前置采集集群n上报的被监控对象对所述资源池n中的资源进行利用所产生的监控数据;其中,所述监控平台用于监控n个资源池,不同资源池对应的被监控对象的网络架构不同;所述n大于等于1,且小于等于所述n;
12.处理模块,用于通过机器学习模型对所述被监控对象的所述监控数据进行深度分析,得到第一分析结果;
13.发送模块,用于向所述被监控对象发送所述第一分析结果,以使所述被监控对象处理所述第一分析结果。
14.本技术提供一种监控平台,所述监控平台包括:
15.存储器,用于存储可执行指令;
16.处理器,用于执行所述存储器中存储的可执行指令,以实现上述所述的资源池的监控方法。
17.本技术提供一种计算机存储介质,所述计算机存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述所述的资源池的监控方法。
18.本技术提供一种资源池的监控方法、资源池的监控装置、监控平台和存储介质,通过获取监控平台监控的资源池n中,前置采集集群n上报的被监控对象对资源池n中的资源进行利用所产生的监控数据;其中,监控平台用于监控n个资源池,不同资源池对应的被监控对象的网络架构不同;n大于等于1,且小于等于n;通过机器学习模型对被监控对象的监控数据进行深度分析,得到第一分析结果;向被监控对象发送第一分析结果,以使被监控对象处理第一分析结果;也就是说,监控平台通过机器学习模型,对资源池n中,前置采集集群n上报的被监控对象对资源池n中的资源进行利用所产生的监控数据进行深度分析,得到分析结果,以使被监控对象处理分析结果,如此,实现了对异构资源池的全自动化监控以及跨资源池区域的异地监控,有效降低监控成本,提高监控与决策效率。
附图说明
19.图1为本技术实施例提供的一种可选的资源池的监控方法的流程示意图;
20.图2为本技术实施例提供的一种可选的资源池的监控平台的架构示意图;
21.图3为本技术实施例提供的一种可选的资源池的监控方法的流程示意图;
22.图4为本技术实施例提供的一种可选的硬盘运行寿命监测的架构示意图;
23.图5为本技术实施例提供的一种可选的资源池的监控方法的监控系统的架构示意图;
24.图6为本技术实施例提供的一种可选的资源池的监控方法的流程示意图;
25.图7为本技术实施例提供的一种可选的资源池的监控方法的流程示意图;
26.图8为本技术实施例提供的一种资源池的监控装置的结构示意图;
27.图9为本技术实施例提供的一种监控平台的结构示意图。
具体实施方式
28.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
29.本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
30.在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同
的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
31.参见图1,图1是本技术实施例提供的资源池的监控方法的一个实现流程示意图,该资源池的监控方法应用于监控平台,该资源池的监控方法包括以下步骤:
32.步骤101、获取监控平台监控的资源池n中,前置采集集群n上报的被监控对象对资源池n中的资源进行利用所产生的监控数据。
33.其中,监控平台用于监控n个资源池,不同资源池对应的被监控对象的网络架构不同;n大于等于1,且小于等于n。
34.本技术实施例中,资源用于执行一个应用程序所需要的全部硬件设备、软件设施和数据,资源池中的资源包括软件资源和硬件资源,其中,硬件资源包括计算资源和存储资源,硬件资源还包括网络资源。
35.本技术实施例中,被监控对象包括但不限于物理硬件、操作系统、网络流量和数据库。示例性的,被监控对象为磁盘、中央处理器(central processing unit,cpu)、风扇等。
36.本技术实施例中,监控数据包括cpu温度、风扇转速、cpu利用率,已用磁盘利用率、未用磁盘利用率、磁盘读写速率、磁盘每秒读写操作的词数(input/output operations per second,iops)和主机宕机状态;监控数据还包括网卡入口速率、网卡出口速率、网卡入口包速率和网卡出口包速率。本技术对此不做具体限制。
37.本技术实施例中,每一资源池中均设置有一个前置采集集群,前置采集集群用于将采集的被监控对象对资源池中的资源进行利用所产生的监控数据上报至监控平台。
38.本技术实施例中,每一资源池通过不同虚拟化网络架构来构建,虚拟化网络架构包括:kvm虚拟化架构、vmware虚拟化架构、xen虚拟化架构、hyper-v虚拟化架构;需要说明的是,不同的资源池采用的虚拟化网络架构(也可以为虚拟化技术)受限于服务商能力,用户偏好以及政策导向等因素,因此存在不同的虚拟化架构。不同的架构所构建的资源池中有不同的接口以及数据模型,且不同的架构构建的资源池所涉及的配置参数也不同,但采用同一架构所构建的资源池包含的被监控对象的网络架构相同,即接口相同、数据模型相同、所涉及的配置参数也相同。
39.本技术实施例中,监控平台监控n个资源池,并获取监控平台监控的资源池n中,通过前置采集集群n上报的被监控对象对资源池n中的资源进行利用所产生的监控数据。
40.步骤102、通过机器学习模型对被监控对象的监控数据进行深度分析,得到第一分析结果。
41.本技术实施例中,第一分析结果用于被监控对象基于分析结果进行处理操作。第一分析结果可以是监控平台基于被监控对象的监控数据进行深度分析后,对资源池未来一段时间内的运行状态进行预测性判断的结果。
42.本技术实施例中,监控平台获取到监控平台监控的资源池n中,前置采集集群n上报的被监控对象对资源池n中的资源进行利用所产生的监控数据之后,将监控数据输入至机器学习模型中,通过机器学习模型对被监控对象的监控数据进行深度分析,得到第一分析结果。需要说明的是,机器学习模型包括线性模型、决策树模型、神经网路模型和深度学习模型。本技术对于机器学习模型所采用的算法模型不做具体限制。
43.步骤103、向被监控对象发送第一分析结果,以使被监控对象处理第一分析结果。
44.本技术实施例中,被监控对象处理第一分析结果可以是被监控对象基于监控平台对资源池未来一段时间内的运行状态的预判结果生成处理指令,并基于处理指令调整被监控对象当前的运行状态,或者基于处理指令生成告警信息。
45.本技术实施例中,监控平台通过机器学习模型对被监控对象的监控数据进行深度分析,得到第一分析结果的情况下,发送第一分析结果至被监控对象,以使被监控对象基于监控平台对资源池未来一段时间内的运行状态的预判结果生成处理指令,并基于处理指令调整被监控对象当前的运行状态,或者基于处理指令生成告警信息。
46.在一种可实现的应用场景中,参见图2所示,图2示出的是某公司的资源池的监控平台的架构示意图。监控平台中包括多种不同虚拟化架构的资源池,如vmware资源池、kvm资源池以及xen资源池,每一资源池中都有完整的iaas资源,并承载有公有云业务,且这三个资源池分布在不同城市。其中,监控平台可以建设在任一架构的资源池中,监控平台还可以建设在资源池之外的其他位置。本技术不做具有限制。在该应用场景中,示例性的,公司总部所在位置设置了kvm资源池,因此,需要在kvm资源池所在位置,建设了一套监控平台,参见图2所示,kvm资源池中所设置的前置采集集群b将被监控对象a、被监控对象b、被监控对象c的监控数据直接传输给监控平台。vmware资源池和xen资源池中各自的被监控对象a、被监控对象b、被监控对象c的监控数据,通过各自对应的前置采集集群通过专线传输给监控平台。进而监控平台对各资源池中,前置采集集群上报的被监控对象对资源池中的资源进行利用所产生的监控数据,通过机器学习模型进行深度分析,得到第一分析结果。最后,监控平台向被监控对象发送第一分析结果,以使被监控对象处理第一分析结果。
47.本技术提供一种资源池的监控方法,通过获取监控平台监控的资源池n中,前置采集集群n上报的被监控对象对资源池n中的资源进行利用所产生的监控数据;其中,监控平台用于监控n个资源池,不同资源池对应的被监控对象的网络架构不同;n大于等于1,且小于等于n;通过机器学习模型对被监控对象的监控数据进行深度分析,得到第一分析结果;向被监控对象发送第一分析结果,以使被监控对象处理第一分析结果;也就是说,监控平台通过机器学习模型,对资源池n中,前置采集集群n上报的被监控对象对资源池n中的资源进行利用所产生的监控数据进行深度分析,得到分析结果,以使被监控对象处理分析结果,如此,实现了对异构资源池的全自动化监控以及跨资源池区域的异地监控,有效降低监控成本,提高监控与决策效率。
48.参见图3,图3是本技术实施例提供的资源池的监控方法的一个实现流程示意图,该资源池的监控方法应用于监控平台,该资源池的监控方法包括以下步骤:
49.步骤201、获取监控平台监控的资源池n中,前置采集集群n按照筛选时长和数据差异筛选条件,对被监控对象对资源池n中的资源进行利用所产生的监控数据进行筛选后的监控数据。
50.其中,监控平台用于监控n个资源池,不同资源池对应的被监控对象的网络架构不同;n大于等于1,且小于等于n。
51.本技术实施例中,监控平台监控的资源池n中,通过资源池中的数据采集代理采集被监控对象对资源池n中的资源进行利用所产生的监控数据,此时数据采集代理所采集的监控为初始监控数据。
52.本技术实施例中,数据差异筛选条件包括在筛选时长内所采集的初始监控数据中
存在数据偏差较大的数据,或者未采集到被监控对象的数据。
53.在一种可实现的应用场景中,资源池中的数据采集代理在筛选时长内如十分钟内,按照预设的采集时长间隔如一分钟,采集被监控对象对资源池n中的资源进行利用所产生的初始监控数据,初始监控数据的数量为十个,若十个数据中存在数据偏差较大的数据,前置采集集群n按照筛选时长和数据差异筛选条件,对初始监控数据中数据偏差较大或者空数据进行筛选,得到筛选后的监控数据。进而基于筛选后的数据,得到前置采集集群n上报的监控数据。
54.本技术其他实施例中,数据采集代理在采集数据的过程中,可以使用代理模式进行采集,也可以使用无代理模式进行采集,无代理模式又称探针模式。代理模式可以理解为在被采集的对象如服务器上安装一个小程序去采集,数据搜集的逻辑是预先定义的;无代理模式可以理解为直接调用被采集对象如服务器的数据接口获取数据。
55.本技术实施例中,步骤201获取监控平台监控的资源池n中,前置采集集群n按照筛选时长和数据差异筛选条件,对被监控对象对资源池n中的资源进行利用所产生的监控数据进行筛选后的监控数据,还可以通过如下方式实现:
56.获取前置采集集群n上报的,前置采集集群n调用数据转换插件,将筛选后的监控数据进行格式转换,得到满足监控平台的格式要求的监控数据。
57.本技术实施例中,由于不同的技术架构采用不同的接口、数据模型和配置参数,因此,前置采集集群n调用数据转换插件,将筛选后的监控数据进行格式转换,得到满足监控平台的格式要求的监控数据。
58.在一种可实现的应用场景中,参见图2所示,每一资源池中设置有数据采集代理对被监控对象a、被监控对象b、被监控对象c的初始监控数据进行数据采集。在每个资源池中,所有数据采集代理都将采集到的初始监控数据汇总到各自资源池里的前置采集集群。其中,三个资源池中的前置采集集群所部署的软件是完全一致的、接受的数据格式也是统一的,区别在于不同的前置采集集群,通过不同的数据转换插件(vmware-监控,kvm-监控,xen-监控)将不同技术架构的资源池数据进行转换并上报监控平台。如此,实现不同技术架构的资源池中的数据的统一。进一步地,若对应资源池进行了技术架构升级,只需要更新数据转换插件,简单高效。
59.步骤202、将监控数据中用于标识被监控对象的属性的数据,输入机器学习模型包含的机理模型中,得到机理模型输出的第一结果。
60.本技术实施例中,被监控对象的属性包括被监控对象的品牌型号、序列号。
61.本技术实施例中,机理模型可以理解为被监控对象的性能参数的情况。性能参数包括磁盘的容量、转速、磁盘的温度和iops。示例性的,被监控对象为磁盘,不同品牌型号的磁盘,有不同的性能参数,即有不同的机理模型。
62.本技术实施例中,第一结果可以理解为被监控对象在理想状态下即不受应用环境的影响所得到的分析结果。
63.本技术实施例中,监控平台获取到资源池n中,前置采集集群n上报的被监控对象的资源池n中的资源进行利用产生的监控数据进行处理后,得到的满足监控平台的格式要求的监控数据的情况下,获取监控数据中用于标识被监控对象的属性的数据,并将标识被监控对象的属性的数据输入机器学习模型包含的机理模型中,得到机理模型输出的被监控
对象在理想状态下的第一结果,
64.步骤203、将监控数据中用于指示被监控对象的运行状态的数据,输入至机器学习模型包含的机器学习算法模型中,得到机器学习算法模型输出的第二结果。
65.本技术实施例中,第二结果为被监控对象在实际应用环境下采集到的实时数据所得到的分析结果。
66.本技术实施例中,监控平台获取到资源池n中,前置采集集群n上报的被监控对象的资源池n中的资源进行利用产生的监控数据进行处理后,得到的满足监控平台的格式要求的监控数据的情况下,获取监控数据中用于指示被监控对象的运行状态的数据,并将指示被监控对象的运行状态的数据输入机器学习模型包含的机器学习算法模型中,得到机器学习算法模型输出的被监控对象在实际应用环境中的第二结果。
67.步骤204、基于第一结果和第二结果,对被监控对象进行故障预测,得到第一分析结果。
68.本技术实施例中,监控平台结合被监控对象的数据在理想状态下即不受应用环境的影响所得到的第一结果,以及被监控对象在实际应用环境下采集到的实时数据所得到的第二结果,对被监控对象进行故障预测,得到第一分析结果。
69.本技术实施例中,步骤204基于第一结果和第二结果,对被监控对象进行故障预测,得到第一分析结果之后,还可以执行如下步骤:
70.step1、输出第一分析结果至被监控对象的生产厂商设备。
71.step2、获取生产厂商设备反馈的更新后的机理模型,并将机器学习模型包含的机理模型替换为更新后的机理模型。
72.本技术实施例中,监控平台获取第一分析结果后,输出第一分析结果至被监控对象的生产厂商设备。并获取生产厂商设备反馈的更新后的机理模型,替换机器学习模型包含的机理模型为更新后的机理模型。如此,能够实现对机器学习的越用越好的效果。
73.在一种可实现的应用场景中,关于机器学习的运作机制,参见图4所示,图4示出的是本技术实施例提供的硬盘运行寿命监测的架构示意图。在准备阶段,由硬盘厂商提供各品牌型号的硬盘工作机理模型。机器学习功能基于基础算法库通过组态编程的方式构建,并支持反复迭代构建与优化算法。当监控进行时,采集各硬盘运行状态数据,基于机器学习算法与机理模型,可以智能预测硬盘未来的故障趋势,并将结果以可视化等多种形式对用户呈现。同时,对于平台的分析结果,专家可以进行人工抽检,并将有益的数据向硬盘生产厂商反馈,改进硬盘设计,更新机理模型。基于机器学习的运作机制,能够达到机器学习越用越好的效果。
74.步骤205、向被监控对象发送第一分析结果,以使被监控对象处理第一分析结果。
75.步骤206、在监控平台的展示界面中呈现第一分析结果;和/或,接收前置采集集群n上报的被监控对象处理第一分析结果得到的反馈信息,并在监控平台的展示界面上呈现反馈信息。
76.本技术实施例中,监控平台中设置有展示界面,也称可视化界面。监控平台获取到第一分析结果后,一种情况下,在监控平台的展示界面中直接呈现第一分析结果。另一种情况下,监控平台向被监控对象发送第一分析结果,监控对象处理第一分析结果后,生成处理第一分析结果得到的反馈信息。被监控对象将反馈信息发送至监控平台,监控平台接收前
置采集集群n上报的被监控对象的反馈信息,并在监控平台的展示界面上呈现反馈信息。
77.在一种可实现的应用场景中,参见图5所示,图5为本技术提供的实施资源池的监控方法的监控系统的架构示意图,该监控系统500至少包括监控平台100、前置采集集群200、数据采集代理300和被监控对象400。需要说明的是,监控系统500包括的被监控对象400的数量可以根据实际需求进行灵活设置,本技术对此不做具体限定。
78.上述数据采集代理300,用于采集被监控对象100对资源池n中的资源进行利用所产生的初始监控数据并发送至前置采集集群200。初始监控数据又称仿真数据源。
79.上述前置采集集群200,包括数据清洗模块、状态识别模块、架构兼容模块。前置采集集群200中的数据清洗模块,用于对汇总的监控数据进行数据清洗。前置监控集群200中的状态识别模块,用于将清洗后的数据进行初步分析,得到初步分析结果,对于置信度较高的监控数据初步分析结果,可以直接反馈给资源池中的被监控对象。初步分析,包括两种分析形式:一种为阈值告警,一种为智能告警;其中告警的阈值可以依据专家经验进行人工设置,也可以通过程序自主学习并微调;智能告警则通过使用监控平台下发的成熟识别模型对监控数据进行初步判断。架构兼容模块,用于通过插件化设计兼容不同技术架构的资源池。
80.上述监控平台100,包括机器学习模块、趋势预测模块、报表中心模块、探针模块、自动化运维模块、qos模块。监控平台100用于对前置监控集群上报的监控数据进行机器学习,训练监控识别模型,且监控平台能够基于训练的监控识别模型对资源池运行状态进行预测性判断。其中,机器学习模块,用于训练采集到的监控数据;趋势预测模块,预测故障何时发生;探针模块,可以理解为小程序或者代理、采集模块;用于管理采集代理程序;自动化运维模块,根据采集到的监控数据采取执行操作,自动诊断故障并执行修复操作,比如cpu温度过高起火,进行服务器关机;qos模块,控制网络传输质量。如此,通过上述方案,克服了相关技术中通过传感器把物理设备的各种物理量、化学量、生物量转化为可测量的电信号,以及物联网平台仅能够被动接收传感器发送的电信号的问题,实现了云资源池通过监控探针主动获取资源池中被监控设备的各类监控数据;物联网平台自动化运维终端传感器,且还实现了云资源池高带宽的通信环境,以及对监控数据的有效管理,通过网络传输控制保证数据传输的高效与稳定,极大提升了数据传输的安全性。
81.需要说明的是,本实施例中与其它实施例中相同步骤和相同内容的说明,可以参照其它实施例中的描述,此处不再赘述。
82.参见图6,图6是本技术实施例提供的资源池的监控方法的一个实现流程示意图,该资源池的监控方法应用于监控平台,该资源池的监控方法包括以下步骤:
83.步骤301、获取监控平台监控的资源池n中,前置采集集群n上报的被监控对象对资源池n中的资源进行利用所产生的监控数据。
84.其中,监控平台用于监控n个资源池,不同资源池对应的被监控对象的网络架构不同;n大于等于1,且小于等于n。
85.步骤302、获取前置采集集群n通过监控识别模型对监控数据进行分析,得到的第二分析结果。
86.本技术实施例中,监控识别模型是监控平台将训练好的监控识别模型下发至前置采集集群中的模型,监控识别模型用于对监控数据进行初步分析,得到初步分析结果。
87.本技术实施例中,第二分析结果包括初步分析结果。
88.本技术其他实施例中,监控平台获取到获置采集集群n通过监控识别模型对监控数据进行分析,得到的初步分析结果之后,还可以获取前置采集集群对初始监控数据进行数据汇总后得到的汇总后的监控数据;监控终端将汇总后的监控数据和基于监控识别模型对监控数据进行分析得到的初步分析结果,再次通过机器学习模型进行深度分析,得到第二分析结果。
89.步骤303、向被监控对象发送第二分析结果,以使被监控对象处理第二分析结果。
90.本技术实施例中,被监控对象处理第二分析结果可以是被监控对象基于监控平台对资源池未来一段时间内的运行状态的预判结果生成处理指令,并基于处理指令调整被监控对象当前的运行状态或者基于处理指令生成告警信息。
91.在一种可实现的应用场景中,参见图2所示,示例性的,被监控对象为存储资源,数据采集代理采集的初始监控数据为存储资源的使用率。当vmware资源池中的存储资源使用率超过53.9%,并且是在短时间内由40%上升到53.9%,数据采集代理将初始监控数据发送至前置采集集群。前置采集集群对初始监控数据进行清洗和汇总后,得到汇总后的监控数据。前置采集集群通过监控识别模型对汇总后的监控数据进行分析,确定初步分析结果为不正常。此时,前置采集集群将初步分析结果与汇总后的监控数据发送到监控平台。监控平台进行基于机器学习的深度分析,结合历史数据、历史趋势判断,存储资源可能很快就会被耗尽,因此判定状态不正常,并及时发出磁盘容量扩容预警。运维人员收到告警后,就可以进行扩容。
92.在另一种可实现的应用场景中,参见图2所示,示例性的,被监控对象为cpu,数据采集代理采集的初始监控数据为cpu温度。xen资源池中某一台服务器正常工作时,cpu温度约为65摄氏度;在某一时刻,cpu温度突然上升到93摄氏度,cpu温度监控数据被采集并上报到前置采集集群。此时,前置采集机群加载有监控平台依据大数据及前期服务器工作机理训练出来的机器学习识别模型,通过机器学习识别模型的识别,前置采集集群判定该服务器cpu很快会温度过高造成线路短路,有很高的概率发生自燃,在已经获得预先授权的前提下,通过带外管理直接将该服务器下电,避免了可能发生的火灾。
93.需要说明的是,本实施例中与其它实施例中相同步骤和相同内容的说明,可以参照其它实施例中的描述,此处不再赘述。
94.参见图7,图7是本技术实施例提供的资源池的监控方法的一个实现流程示意图,该资源池的监控方法应用于由被监控对象、数据采集代理、前置采集集群和监控平台组成的监控系统,该资源池的监控方法包括以下步骤:
95.s1、数据采集代理按照预设的采集频率,获取被监控对象对资源池n中的资源进行利用所产生的初始监控数据。
96.s2、数据采集代理以一定的频率异步上报所采集到的初始监控数据至前置采集集群。
97.s3、前置采集集群接收初始监控数据,依据资源池的技术架构对初始监控数据进行数据清洗汇总,通过成熟的监控识别模型对清洗汇总后的监控数据进行初步分析,得到初步分析结果。
98.s4、若初步分析结果表征用于调整被监控对象的运行状态,前置采集集群将初步
分析结果发送给被监控对象,以使被监控对象在接收到初步分析结果后,调整自身的运行状态。
99.s5、将一段时间内清洗汇总后的监控数据和初步分析结果上报至监控平台。
100.s6、监控平台通过机器学习模型对被监控对象的清洗汇总后的监控数据进行深度分析,得到第一分析结果,并将第一分析结果呈现在监控平台的可视化界面。
101.s7、监控平台通过前置采集集群将第一分析结果反馈给被监控对象,以使被监控对象处理第一分析结果。
102.由上述可知,通过前置采集集群对初始监控数据进行汇总、清洗与分析,极大减小网络传输压力,同时,实现了边缘计算及云边协同,被监控对象也能根据收到的信息反馈及时调整自身的工作状态,真正实现精细化控制。
103.基于前述实施例,本技术提供一种资源池的监控装置,该资源池的监控装置可以用于实施图1、图3、图6对应提供的一种资源池的监控方法,参见图8所示,该资源池的监控装置8包括:
104.获取模块81,用于获取监控平台监控的资源池n中,前置采集集群n上报的被监控对象对资源池n中的资源进行利用所产生的监控数据;其中,监控平台用于监控n个资源池,不同资源池对应的被监控对象的网络架构不同;n大于等于1,且小于等于n;
105.处理模块82,用于通过机器学习模型对被监控对象的监控数据进行深度分析,得到第一分析结果;
106.发送模块83,用于向被监控对象发送第一分析结果,以使被监控对象处理第一分析结果。
107.在本技术其他实施例中,获取模块81,还用于获取前置采集集群n上报的,前置采集集群n按照筛选时长和数据差异筛选条件,对被监控对象对资源池n中的资源进行利用所产生的监控数据进行筛选后的监控数据。
108.在本技术其他实施例中,处理模块82,还用于将监控数据中用于标识被监控对象的属性的数据,输入机器学习模型包含的机理模型中,得到机理模型输出的第一结果;将监控数据中用于指示被监控对象的运行状态的数据,输入至机器学习模型包含的机器学习算法模型中,得到机器学习算法模型输出的第二结果;基于第一结果和第二结果,对被监控对象进行故障预测,得到第一分析结果。
109.在本技术其他实施例中,输出模块,用于输出第一分析结果至被监控对象的生产厂商设备;获取模块81,还用于获取生产厂商设备反馈的更新后的机理模型,并将机器学习模型包含的机理模型替换为更新后的机理模型。
110.在本技术其他实施例中,获取模块81,还用于获取前置采集集群n通过监控识别模型对监控数据进行分析,得到的第二分析结果;发送模块83,还用于向被监控对象发送第二分析结果,以使被监控对象处理第二分析结果。
111.在本技术其他实施例中,获取模块81,还用于获取前置采集集群n上报的,前置采集集群n调用数据转换插件,将筛选后的监控数据进行格式转换,得到满足监控平台的格式要求的监控数据。
112.在本技术其他实施例中,输出模块,还用于在监控平台的展示界面中呈现第一分析结果;和/或,接收前置采集集群n上报的被监控对象处理第一分析结果得到的反馈信息,
并在监控平台的展示界面上呈现反馈信息。
113.基于前述实施例,本技术提供一种监控平台,该监控平台可以用于实施图1、图3、图6对应提供的一种资源池的监控方法,参见图9所示,该监控平台100(图9中的监控平台100对应图8中的资源池的监控装置8)包括:存储器901和处理器902,其中;处理器902用于执行存储器901中存储的资源池的监控程序,监控平台100通过处理器902以实现以下步骤:
114.获取监控平台监控的资源池n中,前置采集集群n上报的被监控对象对资源池n中的资源进行利用所产生的监控数据;其中,监控平台用于监控n个资源池,不同资源池对应的被监控对象的网络架构不同;n大于等于1,且小于等于n;
115.通过机器学习模型对被监控对象的监控数据进行深度分析,得到第一分析结果;
116.向被监控对象发送第一分析结果,以使被监控对象处理第一分析结果。
117.在本技术其他实施例中,处理器902用于执行存储器901中存储的资源池的监控程序,以实现以下步骤:
118.获取前置采集集群n上报的,前置采集集群n按照筛选时长和数据差异筛选条件,对被监控对象对资源池n中的资源进行利用所产生的监控数据进行筛选后的监控数据。
119.在本技术其他实施例中,处理器902用于执行存储器901中存储的资源池的监控程序,以实现以下步骤:
120.将监控数据中用于标识被监控对象的属性的数据,输入机器学习模型包含的机理模型中,得到机理模型输出的第一结果;将监控数据中用于指示被监控对象的运行状态的数据,输入至机器学习模型包含的机器学习算法模型中,得到机器学习算法模型输出的第二结果;基于第一结果和第二结果,对被监控对象进行故障预测,得到第一分析结果。
121.在本技术其他实施例中,处理器902用于执行存储器901中存储的资源池的监控程序,以实现以下步骤:
122.输出第一分析结果至被监控对象的生产厂商设备;获取生产厂商设备反馈的更新后的机理模型,并将机器学习模型包含的机理模型替换为更新后的机理模型。
123.在本技术其他实施例中,处理器902用于执行存储器901中存储的资源池的监控程序,以实现以下步骤:
124.获取前置采集集群n通过监控识别模型对监控数据进行分析,得到的第二分析结果;向被监控对象发送第二分析结果,以使被监控对象处理第二分析结果。
125.在本技术其他实施例中,处理器902用于执行存储器901中存储的资源池的监控程序,以实现以下步骤:
126.获取前置采集集群n上报的,前置采集集群n调用数据转换插件,将筛选后的监控数据进行格式转换,得到满足监控平台的格式要求的监控数据。
127.在本技术其他实施例中,处理器902用于执行存储器901中存储的资源池的监控程序,以实现以下步骤:
128.在监控平台的展示界面中呈现第一分析结果;和/或,接收前置采集集群n上报的被监控对象处理第一分析结果得到的反馈信息,并在监控平台的展示界面上呈现反馈信息。
129.本技术提供一种计算机可读存储介质,该计算机可读存储介质存储有一个或者多个程序,该一个或者多个程序可被一个或者多个处理器执行,以实现如下步骤:
130.获取监控平台监控的资源池n中,前置采集集群n上报的被监控对象对资源池n中的资源进行利用所产生的监控数据;其中,监控平台用于监控n个资源池,不同资源池对应的被监控对象的网络架构不同;n大于等于1,且小于等于n;
131.通过机器学习模型对被监控对象的监控数据进行深度分析,得到第一分析结果;
132.向被监控对象发送第一分析结果,以使被监控对象处理第一分析结果。
133.在本技术其他实施例中,该一个或者多个程序可被一个或者多个处理器执行,还可实现以下步骤:
134.获取前置采集集群n上报的,前置采集集群n按照筛选时长和数据差异筛选条件,对被监控对象对资源池n中的资源进行利用所产生的监控数据进行筛选后的监控数据。
135.在本技术其他实施例中,该一个或者多个程序可被一个或者多个处理器执行,还可实现以下步骤:
136.将监控数据中用于标识被监控对象的属性的数据,输入机器学习模型包含的机理模型中,得到机理模型输出的第一结果;
137.将监控数据中用于指示被监控对象的运行状态的数据,输入至机器学习模型包含的机器学习算法模型中,得到机器学习算法模型输出的第二结果;
138.基于第一结果和第二结果,对被监控对象进行故障预测,得到第一分析结果。
139.在本技术其他实施例中,该一个或者多个程序可被一个或者多个处理器执行,还可实现以下步骤:
140.输出第一分析结果至被监控对象的生产厂商设备;
141.获取生产厂商设备反馈的更新后的机理模型,并将机器学习模型包含的机理模型替换为更新后的机理模型。
142.在本技术其他实施例中,该一个或者多个程序可被一个或者多个处理器执行,还可实现以下步骤:
143.获取前置采集集群n通过监控识别模型对监控数据进行分析,得到的第二分析结果;
144.向被监控对象发送第二分析结果,以使被监控对象处理第二分析结果。
145.在本技术其他实施例中,该一个或者多个程序可被一个或者多个处理器执行,还可实现以下步骤:
146.获取前置采集集群n上报的,前置采集集群n调用数据转换插件,将筛选后的监控数据进行格式转换,得到满足监控平台的格式要求的监控数据。
147.在本技术其他实施例中,该一个或者多个程序可被一个或者多个处理器执行,还可实现以下步骤:
148.在监控平台的展示界面中呈现第一分析结果;和/或,
149.接收前置采集集群n上报的被监控对象处理第一分析结果得到的反馈信息,并在监控平台的展示界面上呈现反馈信息。
150.需要说明的是,上述计算机存储介质/存储器可以是只读存储器(read only memory,rom)、可编程只读存储器(programmable read-only memory,prom)、可擦除可编程只读存储器(erasable programmable read-only memory,eprom)、电可擦除可编程只读存储器(electrically erasable programmable read-only memory,eeprom)、磁性随机存取
存储器(ferromagnetic random access memory,fram)、快闪存储器(flash memory)、磁表面存储器、光盘、或只读光盘(compact disc read-only memory,cd-rom)等存储器;也可以是包括上述存储器之一或任意组合的各种终端,如移动电话、计算机、平板设备、个人数字助理等。
151.在本技术所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
152.上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
153.另外,在本技术各实施例中的各功能单元可以全部集成在一个处理模块中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
154.本技术所提供的几个方法实施例中所揭露的方法,在不冲突的情况下可以任意组合,得到新的方法实施例。
155.本技术所提供的几个产品实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的产品实施例。
156.本技术所提供的几个方法或设备实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的方法实施例或设备实施例。
157.以上所述,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以所述权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1