基于电流量的计算机软件运行监测方法及装置的制造方法_3

文档序号:9288369阅读:来源:国知局
动态变化关系 为F6 ;
[0089] 当电流变化量占空比不变即K2= 0,电流变化量均值减小即Ki< 0,动态变化关系 为F7 ;
[0090] 当电流变化量占空比不变即K2= 0,电流变化量均值增大即Ki> 0,动态变化关系 为F8 ;
[0091] 当电流变化量均值不变即K1= 0,电流变化量占空比不变即K2= 0,动态变化关系 为F9 ;
[0092] S2052、根据二维状态变量(i,P)的取值区域及动态变化关系F判断计算机软件 运行状态是否正常;
[0093] 基于上述各项参数,计算机系统软件运行及运行故障可以根据二维状态变量 (i,P)取值范围以及运行变化轨迹区域并结合动态变化关系F1-F9即可完成依据CPU使用 率的软件运行故障监测。进一步地,根据二维状态变量(i,P)变化轨迹规律还可建立特定 功能计算机运行故障特征库,实现运行故障特征匹配分析,实现基于电流量测量的系统故 障预警、报警工作。
[0094] 参照图8所示,在本发明的一个实施例中,当二维状态变量(i,P)取值及动态变 化关系满足如下判断条件时,则判断为计算机软件运行异常:
[0095] 计算机软件运行异常判断条件:((i,P)GS1)&(F1//F6//F8);
[0096] 其中,\为二维状态变量极值区域。
[0097] 也就是,当(i,P)的取值在\范围内,而且电流变化量均值与电流变化量占空 比的动态变化关系为Fl、F6、F8中的任意一种时,则判断计算机软件运行处于异常状态。
[0098] 当二维状态变量(i,P)取值及动态变化关系满足如下判断条件时,则判断为计 算机软件停止或死机:
[0099] 计算机软件停止或死机判断条件:(P= 100) & (F9)。
[0100] 也就是,当电流量占空比P为100,且电流变化量均值与电流变化量占空比的动 态变化关系为F9时,则判断计算机软件处于停止或死机状态。
[0101] 可以理解的是,计算机软件运行异常、停机或死机的判断条件还可以根据特定故 障特征进行设置,以上仅作示例说明,并不作为对本发明的限制。
[0102] 在实际应用中,除了测量电流量以外,还可以测量整机的功率、电压等参数,根据 电流量、电压及功率参数的检测,可以完成计算机的硬件故障监测,如主板损坏、电源老化/ 损坏、以及双电源匹配能力不均衡等故障。如此,可以统一计算机系统硬件与软件运行监测 平台,也就是,在硬件电气性能参数检测的基础上,结合本发明的基于电流量的计算机软件 运行监测方法,即可实现在同一检测架构上的运行监测系统。
[0103] S206、在计算机软件运行不正常时,发出预警或报警提示。
[0104] 在本发明的一个实施例中,当计算机软件运行异常时发出预警提示,当计算机软 件停止或死机时发出报警提示。
[0105] 具体的,可以设定一个常见故障监测策略库,策略库是包含计算机系统软件和硬 件运行监测所需要的报警、预警计算方法集合,用户可以根据自身需求选择相应的检测项, 例如:
[0106] 预警:□运行异常□运行缓慢□运行错误□系统老化等;
[0107] 报警:□程序死机□程序退出□过流□欠流□宕机等。
[0108] 本发明的方法特别适合于较大规模机房的运行维护管理。信息安全随着信息化时 代的来临已成为我们工作核心组成部分,当我们忙于部署各式信息服务设备以满足越来越 多的数据信息应用需求时,对各式计算机系统的运行维护、系统故障报警/预警的重要性 则显得越来越重要。在今天信息化高速发展的时代,计算服务设备作为计算云的核心部件, 其运行管理处于一个相对较低效率状态显然是与时代前进步伐不相匹配的。
[0109] 本发明的方法可以在机房实现节能用电联网管理基础上,进一步实现对于机房内 计算设备软件运行故障监测的应用,扩大机柜配电单元roU(PowerDistributionUnit)的 应用内涵(见图9),在一定程度上统一了硬件与软件监测管理平台。典型应用特点如下:
[0110] ⑴实现了安全运维管理:
[0111] 如前所述,一个程序的运行管理通常需要一个平行的检测软件来侦听、检测,以保 证其功能的正常作用。也就是说监测软件同样需要占用CPU资源,而且第三方监测软件的 应用本身也会降低系统的安全性,尤其是在一些重要政府部门的运行维护管理工作中。本 发明基于电流量检测方法实现软件运维管理,确保了系统原有安全性能!
[0112] (2)统一了软件与硬件故障监测的措施方法:
[0113] 通过对系统电流、电压、功率的监测是判断系统硬件故障的基本方法。本发明基于 电流量的软件运行故障监测措施,统一了系统硬件、软件运行故障监测的手段,为实现机房 运维管理系统软件与硬件维护的统一大平台提供了技术基础,为维护管理工作提供更大方 便。
[0114] (3)统一了不同计算机平台系统软件运行故障监测方法:
[0115] 本发明仅通过整机外部电气参数监测实现对系统软件运行故障的检测,跨越了各 种不同系统平台的软件运行故障监测,也就是说本发明不论计算机应用何种操作系统,对 系统软件运行故障的监测方法不变。
[0116] (4)统一了不同厂商应用软件的运行故障监测方法:
[0117] 在很多应用场合,尤其是较大型规模机房的维护管理,由于参与研发、集成厂商众 多,导致各式故障检测软件应用需要不同厂商各自提供的运行故障检测软件。这些不同软 件的存在加剧了系统运行代价,且各式不同的管理平台也加剧了维护管理工作的复杂性。 本发明不论何种应用软件,对于软件运行故障的监测方法不变。
[0118] (5)统一了不同机型设备的软件运行故障监测方法:
[0119] 本发明提供了软件运行故障的外部监测方法,不论对于何种机型,不论是工作站、 服务器、小型机等,对于其软件运行故障监测方法不变。
[0120] (6)实现了软件运行管理的独立监测方法:
[0121] 本发明利用电流监测完成软件运行故障的报警/预警功能,检测数据的采集和传 输可以不参入主机数据网络交换系统,监测系统是一套独立于主机及主机网络本身的检测 网络系统(见图9),提高了故障监测的可靠性。
[0122] (7)开辟了机房运维管理智能化时代:
[0123] 本发明实现了系统运行故障的报警、预警功能,克服了人工抽检的随机性。故障预 警功能给予了人工抽检工作带来更强的针对性,有效避免系统故障发生,使可能产生的损 失降到最低。
[0124] 根据本发明实施例提供的基于电流量的计算机软件运行监测方法,是以设备运行 的电流量作为基本检测量,计算周期时间段内的电流变化量均值及电流变化量占空比,再 根据电流变化量均值及电流变化量占空比判断计算机软件运行状态,并根据软件运行状态 发出预警或报警提示。如此,实现了软件运行监测同硬件监测一样都是采用外部电流测量 方法,为软件运行监测提供了一条更加安全的监测管理途径,也为硬件、软件监测提供了一 个运维监测管理的统一系统平台,有效提高机房运维管理效率,开创了由传统机房维护方 式迈向安全智慧型统一平台机房管理方式的新纪元。
[0125] 参照图10所示,图10示出了本发明实施例基于电流量的计算机软件运行监测装 置300,包括获取单元301、计算单元302及判断单元303。
[0126] 获取单元301,用于获取周期时间段内计算机电流量采样数据,所述周期时间段内 包括多个采样时间点,所述电流量采样数据包括每个采样时间点的实时电流量,每个实时 电流量相对于计算机CPU使用率处于0时电流量的增量为电流变化量,所述电流变化量与 计算机CPU使用率呈近似线性关系.
[0127] 计算单元302,用于根据所述电流量采样数据计算周期时间段内电流变化量均值 及电流变化量占空比,所述电流变化量均值为周期时间段内各个电流变化量的平均值,所 述电流变化量占空比为电流变化量超过预设水平值的占有时间长度与周期时间段长度之 比.
[0128] 判断单元303,用于根据所述电流变化量均值及电流变化量占空比判断计算机软 件运行状态,并根据软件运行状态发出预警或报警提示。
[0129] CPU使用率代表了计算机系统运行状况,CPU使用率也是判断计算机软件运行的 一个重要特征参数。如前所述软件运行故障如运行异常、CPU高热状态、程序退出、死机等 都会导致计算机的CPU使用率处于一个不合理水平或不合理变化状态。因此,根据电流变 化量与CPU使用率所呈现的近似线性关系,以及电流变化量占空比所反应的电流变化量持 续时间长度,不仅表明了电流变化量的数值代表了一定水平的CPU使用率,而且电流变化 量占空比也代表了一定水平的CPU使用率的持续时间长度。所以,电流变化量均值及电流 变化量占空比数值体现了计算机软件运行状态,亦即可以通过电流变化量均值及电流变化 量占空比判断计算机当前软件运行状态是否正常。在不正常的状态下,可以发出预警或报 警提示。
[0130] 需要说明的是,本发明实施例的基于电流量的计算机软件运行监测装置,可以用 于实现上述方法实施例中的全部技术方案,其各个功能单元的功能可以根据上述方法实施 例中的方法具体实现,其具体实现过程可参照上述方法实施例中的相关描述,此外,该监测 装置具有上述方法的典型特点等,具体可参见上述方法实施例的相关描述,在此处不再赘 述。
[0131] 根据本发
当前第3页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1