一种自动判别服务器故障的方法

文档序号:9551094阅读:320来源:国知局
一种自动判别服务器故障的方法
【技术领域】
[0001] 本申请涉及服务器故障检测技术,具体地说,涉及一种自动判别服务器故障的方 法。
【背景技术】
[0002] 当前,在服务器故障预测上,多数技术在采集服务器数据后,判别故障需要根据预 先设置参数模版来进行故障判别,这对预测带来很多麻烦。
[0003] 例如,公布号为CN103746829A的专利文献公开了一种基于集群的故障感知,该包 括:多个运行于集群中不同服务器的前端检测模块、后端服务器模块和检测通信模板模块, 前端检测模块用于收集和处理与操作或应用程序相关的前端故障检测数据,并根据前端故 障检测数据对故障情况进行初次判断,得到前端故障检测信息,并向后端服务器模块上传 前端故障检测信息或前端故障检测数据;后端服务器模块用于根据接收到的前端故障检测 数据对故障情况进行再次判断得到后端故障检测信息,最终对外汇总输出前端故障检测信 息和后端故障检测信息,检测通信模板模块用于多个前检测模块和后端服务器模块间的通 信的接口标准。该专利就是根据预先设置参数模版来进行服务器的故障判别。

【发明内容】

[0004] 有鉴于此,本申请所要解决的技术问题是提供了一种分自动判别服务器故障的方 法,解决了现有技术中在采集服务器数据后,判别故障需要根据预先设置参数模版来进行 故障判别的问题。
[0005] 为了解决上述技术问题,本申请有如下技术方案:
[0006] -种自动判别服务器故障的方法,其特征在于,包括:将集群服务器中的多种运行 信息实时传输汇总到计算服务器;所述计算服务器从运行信息集合RN选取K个初始聚类 中心;根据所述初始聚类中心,计算每个数据对象与聚类中心对象的距离;根据每个点距K 个聚类中心的最小距离重新对每个点所属聚类簇进行划分;重新计算有变化的聚类簇的中 心;计算标准测度函数;若所述标准测度函数满足预设条件,则算法终止;其中,所述K个初 始聚类中心选取过程如下所示:对所述运行信息集合#进行采样得到样本数为Μ的样本数 据集SM;选取所述样本数据集SM所有数据记录的质心作为第一个聚类中心,所述质心的计 算公式如下:
[0007]
[0008] 对于每个后继K-1个聚类中心,选择距已经选取过的初始聚类中心最远的点,所 述质心与数据记录间距离计算公式如下:
[0009]
[0010] 其中,η种运行信息,记为μDμ2, .
. .,yn;RNS全部运行信息集合,N为数据记录 总数;X为每条数据记录,每条数据记录包含此前搜集的η种运行信息,将每条数据记录看 做欧几里得空间中一个点Κ为聚类分析计算中所期望的簇的个数;所述数 据对象为所述运行信息集合rn中的一条数据记录;所述聚类中心对象为所述聚类中心;ci表示第i个簇,也即第i个簇中所有点的集合;Cl表示簇C啲质心。
[0011] 与现有技术相比,本申请所述的方法和,达到了如下效果:
[0012] 本发明通过基于大数据的数据将服务器指标进行分析,从中发现故障类别,从而 实现对海量集群的服务器故障的自动预测判定。
【附图说明】
[0013] 此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申 请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0014] 图1为本发明的所述一种自动判别服务器故障的方法流程图;
[0015] 图2为本发明的所述一种自动判别服务器故障的方法的另一流程图;
【具体实施方式】
[0016] 如在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员 应可理解,硬件制造商可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以 名称的差异来作为区分组件的方式,而是以组件在功能上的差异来作为区分的准则。如在 通篇说明书及权利要求当中所提及的"包含"为一开放式用语,故应解释成"包含但不限定 于"。"大致"是指在可接收的误差范围内,本领域技术人员能够在一定误差范围内解决所 述技术问题,基本达到所述技术效果。此外,"耦接"一词在此包含任何直接及间接的电性 耦接手段。因此,若文中描述一第一装置耦接于一第二装置,则代表所述第一装置可直接电 性耦接于所述第二装置,或通过其他装置或耦接手段间接地电性耦接至所述第二装置。说 明书后续描述为实施本申请的较佳实施方式,然所述描述乃以说明本申请的一般原则为目 的,并非用以限定本申请的范围。本申请的保护范围当视所附权利要求所界定者为准。
[0017] 实施例1
[0018] 参见图1所示为本申请所述自动判别服务器故障的方法的具体实施例,本实施例 中所述方法包括以下步骤:
[0019] 步骤101 :将集群服务器中的多种运行信息实时传输汇总到计算服务器;
[0020] 步骤102 :所述计算服务器从运行信息集合RN选取K个初始聚类中心;
[0021] 步骤103 :根据所述初始聚类中心,计算每个数据对象与聚类中心对象的距离;
[0022] 步骤104 :根据每个点距K个聚类中心的最小距离重新对每个点所属聚类簇进行 划分;
[0023] 步骤105 :重新计算有变化的聚类簇的中心;
[0024] 步骤106 :计算标准测度函数;
[0025] 步骤107 :判断所述标准测度函数是否满足预设条件,若所述标准测度函数满足 预设条件,则转入步骤108 ;若所述标准测度函数不满足预设条件,则转入步骤103 ;
[0026] 步骤108 :终止。
[0027] 其中,所述K个初始聚类中心选取过程如下所示:
[0028] 对所述运行信息集合#进行采样得到样本数为Μ的样本数据集SΜ;
[0029] 选取所述样本数据集SM所有数据记录的质心作为第一个聚类中心,所述质心的计 算公式如下:
[0030]
[0031] 对于每个后继K-1个聚类中心,选择距已经选取过的初始聚类中心最远的点;这 样确保K个聚类中心是随机的,而且是散开的。且此K个初始聚类中心是从样本数据集中 选取的,因此能表征整体数据集特性。在本发明中采用欧几里得距离来量化考虑数据记录 的"距离"概念。所述质心与数据记录间距离计算公式如下:
[0032]
[0033] 其中,η种运行信息,记为μuμ2, . . .,μη;
[0034] #为全部运行信息集合,Ν为数据记录总数;
[0035] X为每条数据记录,每条数据记录包含此前搜集的η种运行信息,将每条数据记录 看做欧几里得空间中一个点鄭…心…,凡);
[0036] Κ为聚类分析计算中所期望的簇的个数;
[0037] 所述数据对象为所述运行信息集合RN中的一条数据记录;
[0038] 所述聚类中心对象为所述聚类中心;
[0039] Q表示第i个簇,也即第i个簇中所有点的集合;
[0040] q表示簇(^的质心。
[0041] 实施例2
[0042] 为更详细说明本发明,请参见图2所示为本申请所述自动判别服务器故障的方法 的另一具体实施例,本实施例中所述方法包括以下步骤:
[0043] 步骤201 :将集群服务器中的多种运行信息实时传输汇总到计算服务器,,所述 多类运行信息数据包括但不现定于每台服务器的cpu、负载(load)、内存(mem)、输入输出 (i〇)运行信息数据;
[0044] 步骤202 :所述计算服务器从运行信息集合RN选取K个初始聚类中心;步骤203 : 根据所述初始聚类中心,计算每个数据对象与聚类中心对象的距离;
[0045] 步骤204 :根据每个点距K个聚类中心的最小距离重新对每个点所属聚类簇进行 划分;
[0046] 步骤205 :重新计算有变化的聚类簇的中心;
[0047] 步骤206 :计算标准测度函数;
[0048] 步骤207 :判断所述标准测度函数是否收敛,若所述标准测度函数收敛,则转入步 骤208 ;若所述标准测度函数不收敛,则转入步骤203 ;
[0049] 步骤2〇8:终止
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1