一种系统资源的管理方法、装置、设备及介质与流程

文档序号:31765916发布日期:2022-10-12 04:29阅读:32来源:国知局
1.本公开涉及计算机
技术领域
:,尤其涉及一种系统资源的管理方法、装置、设备及介质。
背景技术
::2.处理机管理是操作系统的四大资源管理功能之一。在系统资源的管理的一种传统方案中,可以在计算机终端输入指令,并由代理服务器转发到服务器端,服务器端的图形界面通过代理服务器返回给计算机终端,由此实现服务器的远程管理。然而,该方案对资源管理粒度粗放,管理效果差,影响系统安全性和稳定性。技术实现要素:3.为了解决上述技术问题,本公开提供了一种系统资源的管理方法、装置、设备及介质。4.本公开提供了一种系统资源的管理方法,包括:5.获取目标设备的系统资源类别;6.获取系统管理指令集,所述系统管理指令集包括多个与所述系统资源类别对应的管理指令;7.接收所述目标设备根据所述系统资源类别上报的系统资源状态信息;8.在基于所述系统资源状态信息确定设备状态异常的情况下,从所述系统管理指令集中确定目标管理指令;9.将所述目标管理指令发送给所述目标设备,以使所述目标设备根据所述目标管理指令对设备状态进行控制。10.可选的,所述方法还包括:11.对所述目标设备的系统资源进行类别划分,得到第一资源类别;其中,所述第一资源类别包括:硬件资源、系统管理和用户管理;12.对各所述第一资源类别进行类别划分,得到各所述第一资源类别下的第二资源类别;13.将所述第一资源类别和所述第二资源类别作为所述系统资源类别。14.可选的,所述方法还包括:根据所述目标设备的设备信息,建立与所述系统资源类别对应的管理指令。15.可选的,所述管理指令中包括:设备标识id、系统服务pid、指令类型和指令动作。16.可选的,所述根据所述目标管理指令对设备状态进行控制,包括:17.将所述目标管理指令转换为系统命令,通过执行所述系统命令对设备状态进行控制。18.可选的,所述方法还包括:将所述目标管理指令发送给多个设备,所述多个设备是与所述目标设备属于同一运维服务器的设备。19.可选的,所述系统资源状态信息包括:设备标识id、系统服务pid、数据类型和数据。20.本公开提供了一种系统资源的管理装置,包括:21.类别获取模块,用于获取目标设备的系统资源类别;22.指令获取模块,用于获取系统管理指令集,所述系统管理指令集包括多个与所述系统资源类别对应的管理指令;23.信息接收模块,用于接收所述目标设备根据所述系统资源类别上报的系统资源状态信息;24.异常确定模块,用于在基于所述系统资源状态信息确定设备状态异常的情况下,从所述系统管理指令集中确定目标管理指令;25.指令下发模块,用于将所述目标管理指令发送给所述目标设备,以使所述目标设备根据所述目标管理指令对设备状态进行控制。26.本公开还提供了一种电子设备,所述电子设备包括:27.处理器;28.用于存储所述处理器可执行指令的存储器;29.所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述方法。30.本公开还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述方法。31.本公开实施例提供的技术方案与现有技术相比具有如下优点:32.本公开提供的系统资源的管理方法、装置、设备及介质,包括:获取目标设备的系统资源类别;获取系统管理指令集,系统管理指令集包括多个与系统资源类别对应的管理指令;接收目标设备根据系统资源类别上报的系统资源状态信息;在基于系统资源状态信息确定设备状态异常的情况下,从系统管理指令集中确定目标管理指令;将目标管理指令发送给目标设备,以使目标设备根据目标管理指令对设备状态进行控制。本公开能够对系统资源进行细粒度控制,增加系统的稳定性,及时响应系统安全性问题,较好地实现对系统资源的动态管理。附图说明33.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。34.为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。35.图1为本公开实施例所述系统资源的管理方法流程图;36.图2为本公开实施例所述系统资源的管理场景示意图;37.图3为本公开实施例所述系统资源的管理装置的结构框图;38.图4为本公开实施例所述电子设备的结构示意图。具体实施方式39.为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。40.在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。41.目前在系统资源的管理中,对资源管理粒度粗放,无法构成对设备资源进行细粒度的、动态的管理闭环,管理效果差,影响系统安全性和稳定性。尤其是随着云计算与虚拟化技术的快速发展,在线主机数量激增,造成网络安全事件频发。针对这情况,目前主要是基于静态策略的被动防御,无法进行以点带面的全网快速反应,且平均响应时间较长造成安全空窗风险。42.示例性的,在一种通过服务器实现远程管理的方案中,对资源管理粒度粗放,没有根据系统资源的不同类别制定相对应的指令集,因此无法细粒度的管理系统状态。例如当cpu占用资源升高时,无法通过精确指令对cpu使用进行调优。考虑到可以建立设备与指令集的对应关系,并根据设备类型下发对应的指令;然而,指令是运维设备本身自带的功能体系,它并没有建立设备资源类别与控制指令的完全对应关系,也没有根据设备资源类别上报设备信息,因而无法构成对设备资源进行细粒度的,动态的管理闭环。43.在此情况下,本公开实施例提供了一种系统资源的管理方法、装置、设备及介质;为便于理解,以下对本公开展开描述。44.图1为本公开实施例提供的一种系统资源的管理方法的流程图,该方法适用的场景架构可以包括:运维服务器以及运维服务器下的多个设备。本实施例提供的系统资源的管理方法可应用于运维服务器,该方法包括如下步骤:45.步骤s102,获取目标设备的系统资源类别。上述目标设备可以为运维服务器下的任一设备。46.在本实施例中,系统资源类别是通过对设备的系统资源进行细粒度分类得到的,可以包括第一资源类别和第一资源类别下划分的第二资源类别。在一种方式中,系统资源类别的得到方法可以包括:47.对目标设备的系统资源进行类别划分,得到第一资源类别。具体可基于系统资源特性对目标设备的系统资源进行类别细分,得到的第一资源类别包括:硬件资源、系统管理和用户管理等。而后再对各第一资源类别进行类别划分,得到各第一资源类别下的第二资源类别;于是,将第一资源类别和第二资源类别作为系统资源类别。48.关于第一资源类别下的第二资源类别,硬件资源对应的第二资源类别可以包括:cpu、磁盘、内存、缓存和网卡等。系统管理对应的第二资源类别可以包括:处理机管理、内存管理、磁盘管理和网络管理等;其中处理机管理包含cpu负载、进程调度、进程资源占用等方面;内存管理包含内存容量、内存负载、内存分配等方面;磁盘管理包含磁盘容量、磁盘临时存储区、磁盘持久化存储区等方面;网络管理包含网卡io、带宽管理、iptables管理、路由管理等方面。用户管理对应的第二资源类别可以包括:用户进程、用户资源分配、用户权限等。49.步骤s104,获取系统管理指令集,系统管理指令集包括多个与系统资源类别对应的管理指令。50.本实施例给出一种建立管理指令的示例,即:根据目标设备的设备信息,建立与系统资源类别对应的管理指令;多个系统资源类别对应的多个管理指令形成系统管理指令集。上述设备信息例如设备名称、表示设备唯一性的设备标识id、系统服务pid(processidentification,进程识别号)等。通过上述方式建立的管理指令中包括:设备标识id、系统服务pid、指令类型和指令动作。管理指令示例如下:51.{设备标识id,系统服务pid,指令类型:处理机管理,指令动作:优先级降低};52.{设备标识id,系统服务pid,指令类型:网络管理,指令动作:限流指令}。53.在本实施例中,通过对细分系统资源类别,创建基于系统资源类别的系统管理指令集,进而能够对设备运行时的状态进行多维度和细粒度管理。54.步骤s106,接收目标设备根据系统资源类别上报的系统资源状态信息。55.在目标设备运行时,目标设备根据系统资源类别向运维服务器定时上报系统资源状态信息,系统资源状态信息包括:设备标识id、系统服务pid、数据类型和数据。系统资源状态信息示例如下:56.{设备标识id,系统服务pid,数据类型:cpu,数据:xxx};57.{设备标识id,系统服务pid,数据类型:网络流量,数据:xxx}。58.步骤s108,在基于系统资源状态信息确定设备状态异常的情况下,从系统管理指令集中确定目标管理指令。59.运维服务器对系统资源状态信息进行处理,以确定目标设备的状态是否发生异常。如果设备状态异常,则根据设备状态异常对应的系统资源状态信息确定目标系统资源类别,进而从系统管理指令集中确定目标系统资源类别对应的目标管理指令。将目标管理指令下发给目标设备。60.在本实施例中,设备状态异常例如:cpu(centralprocessingunit,中央处理器)负载过大、内存负载过大、网络流量异常、用户越权等方面。相应地,对系统资源状态信息进行处理例如为:将系统资源状态信息中的数据与预设的阈值进行比对,对系统资源状态信息的数据所表示的用户权限进行审核等。61.假设设备状态异常为网络流量异常,则目标管理指令为:{设备标识id,系统服务pid,指令类型:网络管理,指令动作:限流指令}。62.步骤s110,将目标管理指令发送给目标设备,以使目标设备根据目标管理指令对设备状态进行控制。63.具体的,目标设备将目标管理指令转换为系统命令,通过执行系统命令对设备状态进行控制。64.此后,目标设备可以继续根据系统资源类别上报系统资源状态信息到运维服务器。基于此,通过上述步骤实现了单台设备的资源动态管理。65.在实际应用中,操作系统本身包含大量的系统状态控制命令,如taskset、iptables等;同时,本实施例还可以根据业务的特殊性,自定义系统控制命令,以方便对设备的业务状态进行更好的管理。66.本实施例按照系统资源类别定时上报系统资源状态信息,对处于异常状态的系统资源下发目标管理指令,目标设备执行目标管理指令后继续上报系统资源状态信息,最终形成系统资源的动态管理体系。67.本实施例提供的方法还可以进一步包括:将目标管理指令发送给多个设备,多个设备是与目标设备属于同一运维服务器的设备。通过该方式可以将目标管理指令快速推广到全网设备,形成全网设备的资源动态管理,提升面对设备异常的解决速度。本实施例按照系统资源的动态管理体系,及时响应单台设备异常状态,并把解决方案快速同步到多台设备中,实现解决方案的快速应用。基于系统资源动态管理的架构体系,实现单机解决方案到全网设备的推广,实现全网动态管理和防御。68.上述实施例在系统远程管理领域,基于细颗粒度的系统资源类别与系统管理指令集的建立,通过对系统资源状态信息进行监控,实现对系统资源的动态管理,增强系统的安全性与稳定性。69.参照图2,系统资源的管理方法的应用场景可以包括:运维服务器、设备123456(作为目标设备)、设备i。设备123456对应有细颗粒度的系统资源类别;每个系统资源类别建立有对应的管理指令,并形成系统管理指令集。70.在一种具体示例中,针对基于全自主定义安全防护系统产品,通过本实施例提供的系统资源的管理方法对cpu异常服务进行管理,以提升系统的稳定性。具体参照如下:71.运维服务器获取系统服务cpu异常的管理指令:{设备标识id,系统服务pid,指令类型:处理机管理,指令动作:{降低优先级,调整cpu核绑定,服务挂起,服务恢复,服务停止,服务开启}}。72.设备(id:123456)向运维服务器上报系统资源状态信息,具体为如下cpu运行信息:{设备标识id:123456,系统服务pid:1378,数据类型:cpu,数据:负载60%}。73.在运维服务器判断设备(id:123456)系统服务(pid:1378)的cpu使用状态异常的情况下,确定降低服务(pid:1378)的cpu占用率。下发的目标管理指令为:{设备标识id:123456,系统服务pid:1378,指令类型:处理机管理,指令动作:降低优先级}。74.运维服务器下发上述目标管理指令到设备(id:123456),并在设备端转换为cpulimit命令,对系统服务(pid:1378)cpu使用率进行限制。75.设备(id:123456)继续上报cpu运行信息:{设备标识id:123456,系统服务pid:1378,数据类型:cpu,数据:负载15%};运维服务器判断设备(id:123456)系统服务(pid:1378)的cpu使用恢复正常。76.在另一种具体示例中,针对基于全自主定义安全防护系统产品,通过本实施例提供的系统资源的管理方法对系统异常网络流量服务进行管理,以实现系统安全性的提升。具体参照如下:77.运维服务器获取系统网络异常的管理指令:{设备标识id,系统服务pid,指令类型:网络管理,指令动作:{黑白名单、网络限流、增加带宽、限制带宽、封堵端口、…}}。78.设备(id:123456)向运维服务器上报系统资源状态信息,具体为如下系统网络流量信息:{设备标识id:123456,数据类型:网络流量,数据:xxx}。当上报系统数据时,系统服务pid可缺省。79.在运维服务器判断设备(id:123456)系统外发流量的情况下,确定限制snmp(simplenetworkmanagementprotocol,简单网络管理协议)外发服务。当对系统整体资源进行动态管理时,系统服务pid可缺省。下发的目标管理指令为:{设备标识id:123456,指令类型:网络流量,指令动作:禁止snmp协议外发}。80.运维服务器下发上述目标管理指令到设备(id:123456),并在设备端转换为iptables命令,禁止snmp协议进行外发。81.设备(id:123456)继续上报系统网络流量信息:{设备标识id:123456,数据类型:网络流量,数据:xxx}。当上报系统数据时,系统服务pid可缺省;运维服务器收到设备(id:123456)系统网络流量信息,确定snmp协议外发已被禁止。82.在又一种具体示例中,针对基于全自主定义安全防护系统产品,通过本实施例提供的系统资源的管理方法,对安全事件快速响应,并在全网快速实施的解决方案,实现以点带面,减少设备安全空窗风险。具体参照如下:83.运维服务器获取系统网络异常的管理指令:{设备标识id,系统服务pid,指令类型:网络管理,指令动作:{黑白名单、网络限流、增加带宽、限制带宽、封堵端口、…}}。84.设备(id:123456)向运维服务器上报系统资源状态信息,具体为如下系统网络流量信息:{设备标识id:123456,数据类型:网络流量,数据:xxx}。当上报系统数据时,系统服务pid可缺省。85.运维服务器判断设备(id:123456)系统被境外ip(223.223.1.2)进行sql注入攻击,并决定禁止此ip对设备的访问。下发的目标管理指令为:{设备标识id:123456,指令类型:网络流量,指令动作:禁止ip(223.223.1.2)访问}。86.运维服务器下发上述目标管理指令到设备(id:123456),并在设备端转换为iptables命令,禁止ip(223.223.1.2)访问。87.设备(id:123456)继续上报系统网络流量信息:{设备标识id:123456,数据类型:网络流量,数据:xxx};运维服务器收到设备(id:123456)系统网络流量信息,确定sql注入攻击已消失。88.运维服务器把禁止ip(223.223.1.2)的指令快速下发到所有设备,实现全网安全防御。89.综上,本公开实施例提供的系统资源的管理方法,根据系统资源特性对系统资源进行细颗粒度分类,并根据不同的系统资源类别建立对应的管理指令,能够对系统资源进行细粒度控制,增加系统的稳定性,及时响应系统安全性问题。目标设备按照系统资源类别上报系统资源状态信息,运维服务器根据系统资源状态信息,下发对应的目标管理指令,从而对系统状态进行管理;简言之,通过设备上报信息、运维服务器下发指令、设备执行指令、设备继续上报信息的流程的循环,实现对系统资源的动态管理。通过对单台设备的管理,推广解决方案到更多的设备,提高运维效率,减少安全事件的空窗时间,增强系统安全性和稳定性。90.图3为本公开实施例提供的一种系统资源的管理装置的结构框图,该装置可用于实现上述实施例提供的系统资源的管理方法。如图3所示,该装置包括如下模块:91.类别获取模块302,用于获取目标设备的系统资源类别;92.指令获取模块304,用于获取系统管理指令集,系统管理指令集包括多个与系统资源类别对应的管理指令;93.信息接收模块306,用于接收目标设备根据系统资源类别上报的系统资源状态信息;94.异常确定模块308,用于在基于系统资源状态信息确定设备状态异常的情况下,从系统管理指令集中确定目标管理指令;95.指令下发模块310,用于将目标管理指令发送给目标设备,以使目标设备根据目标管理指令对设备状态进行控制。96.本实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。97.图4为本公开实施例提供的一种电子设备的结构示意图。如图4所示,电子设备400包括一个或多个处理器401和存储器402。98.处理器401可以是中央处理单元(cpu)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备400中的其他组件以执行期望的功能。99.存储器402可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(ram)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(rom)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器401可以运行所述程序指令,以实现上文所述的本公开的实施例的系统资源的管理方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如输入信号、信号分量、噪声分量等各种内容。100.在一个示例中,电子设备400还可以包括:输入装置403和输出装置404,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。101.此外,该输入装置403还可以包括例如键盘、鼠标等等。102.该输出装置404可以向外部输出各种信息,包括确定出的距离信息、方向信息等。该输出装置404可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。103.当然,为了简化,图4中仅示出了该电子设备400中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备400还可以包括任何其他适当的组件。104.进一步,本实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述系统资源的管理方法。105.本公开实施例所提供的一种系统资源的管理方法、装置、电子设备及介质的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。106.需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。107.以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1