故障信息系统的服务和服务器智能自治的实现方法

文档序号:7756062阅读:196来源:国知局
专利名称:故障信息系统的服务和服务器智能自治的实现方法
技术领域
本发明主要应用于电力自动化、智能电网支持系统、电网故障信息系统以及故障 分析等领域,尤其是应用在IEC61850相关的信息系统、智能电网支持系统等多服务器协同 工作领域。
背景技术
继电保护及安全自动装置(即继电保护)是电力系统安全稳定运行的重要保障, 是电力系统的重要组成部分。故障信息系统是以继电保护装置的故障信息为主要对象的数 据建模、采集、存储、分析以及应用的平台。目前,故障信息系统的部署以及管理借鉴计算机 信息系统,主要采用多服务器系统协同的方式进行,其中“单一服务器单一作用”是一种成 熟且应用较广的方式,通讯上则采用多机互联互通“一机调度,双机热备”的常规部署调度 方式。传统的系统服务器部署和管理方式在资源和自动化上还存在较大完善的空间,其 中,系统中通讯关键点采用“双机热备”来保证系统通讯的稳定和安全是一种比较简单粗犷 的方式。随着硬件技术不断提高,在大多数情况下,热备机器长期处在空置备用的状态,当 系统资源紧张之时也无法得到有效利用。同时,由于系统采用“单一服务器单一作用”的方 式来部署各服务器,也常常无法发挥多服务器的资源优势,整个系统的运行往往受制于单 一服务器的工作效率。本发明提供了一种适合在多服务器系统中,自动协调各服务器间工作,同时对系 统所提供的服务进行合理化调度的方法。本方法采用系统服务器自我选举的方式,保证通 讯关键节点的稳定和安全运行,避免了单独配置热备机来保证系统运行稳定,同时大幅减 少系统内通讯负载;采用服务智能迁移法,在多服务器间科学的调度和迁移服务,有效的利 用整个系统服务器资源,避免全系统运行受制于单一服务器的执行效率。

发明内容
本发明的目的是为了在故障信息系统中提供一种服务器集群自治管理,服务部署 自我调度的方法,以提高系统的智能化和自动化水平。本发明具体采用以下技术方案—种故障信息系统的服务和服务器智能自治的实现方法,所述方法用于服务器集 群自治管理和服务部署自我调度;其特征在于,所述方法包括以下步骤(1)定义自治域,即以自治域划分故障信息系统中服务器,在同一个自治域内的 服务器,通过自治域标识符来标识自身所属自治域,在同一自治域内的服务器可以交互沟 通;(2)确认自治域内的服务器成员以及成员的专属职责,自治域内服务器包括主服 务器和专用服务器,所述主服务器充当服务受理以及服务调度协调者角色,所述专用服务 器充当完成某一具体功能的服务器;
(3)在自治域内,主服务器受理服务,根据服务器列表信息,从专用服务器角色中 选择对应服务的服务器,将服务拆分成服务数据元语,传递给相应的专用服务器运算并执 行;(4)所述专用服务器运算后向所述主服务器返回运算结果。在上述步骤(2)中,还进一步包括当主服务器无法正常工作、即心跳报文异常 时,在所述自治域内进行主服务器选举,所述选举遵循以原则确认选举范围是在同一个自治域内部进行;根据管理需求初始化配置服务器参数,(包括对服务器权重值的设置),自治域内 只有预设权重值大于0的服务器才能进入候选名单;服务器间以心跳报文的方式进行权重值通知;在所有服务器都达成共识的情况下,选出权重值最高的服务器作为主服务器。在 上述步骤(3)中,还进一步包括所述主服务器通过心跳报文获取各专用服务器的状态信 息,当相应专用服务器状态不正常时,所述主服务器通过服务器列表中各服务器的状态参 数进行比较,根据权重值和CPU综合平均使用率参数(即服务优先值),选取次优服务器完 成服务。另外,在主服务器选举产生之后,非主服务器只与主服务器间保持心跳报文交互, 而不与其他非主服务器进行心跳报文交互,此举主要目的是减少通讯过程中不必要的通讯 流量。只有在选举主服务器的过程中,非主服务器间才通过心跳报文来进行投票。以上步骤即实现服务器集群自治管理,服务自我调度。本方法与传统的服务器集群管理以及服务调度方法相比有如下优点(1)实现服务器集群内部的高度自治管理,避免了大量的不必要的人为干预,提高 系统的自动化水平;(2)避免传统双机热备来保证系统中关键节点的稳定运行,本方法通过选举的方 式利用系统内现有资源,防止因通讯关键节点异常导致全系统通讯瘫痪;(3)采用智能服务迁移法,科学高效的利用系统资源,提高系统的智能化水平;(4)具有扩展性的服务器部署方法,为兼容和扩展留有灵活的空间;(5)通过本方法提供的部署策略和管理方式,不但提高了系统的性能同时有效的 降低了系统的购置和维护成本;


图1是自治域内主服务器调度服务的主要流程示意图;图2是自治域内主服务器选举过程的流程示意图;图3是自治域的部署图。
具体实施例方式下面参考图1 2,具体说明本发明的实现方法。本发明的故障信息系统的服务和服务器智能自治的实现方法,具体如下首先,如图3所示,定义系统运行的自治域,在同一个自治域内的服务器,通过自 治域标识符来标识自身所属自治域,在同一自治域内的服务器可以交互沟通,自行协同分工。其次,确认自治域内的服务器成员以及成员的专属职责。自治域内服务器主要有 两种成员角色主服务器和专用服务器。主服务器充当服务受理以及服务调度等协调者角 色;专用服务器则主要充当完成某一具体功能的服务器;主服务器与专用服务器间是管理 和被管理的关系,主服务器可以是单独的一台服务器也可以是某台权重值较高的专用服务 器兼任;选举自治域中的主服务器,区分定义其他专用服务器,采用以下算法实现(1)确认选举范围是在同一个自治域内部进行,即部署在同一自治域内的服务器 拥有同一识符;(2)根据初始化配置的服务器参数,选择权重值大于0的服务器进入候选名单;(3)服务器间以心跳报文的方式进行权重值通知;(4)在所有服务器都达成共识的情况下,选出权重值最高的服务器作为主服务 器;(5)主服务器一旦选出,出于通讯稳定考虑,不轻易更换主服务器角色,即使自治 域内出现权重值更高的服务器;(6)只有当主服务器无法正常工作(心跳报文异常),自治域内才再进行主服务器 选举(即使有权重值更高的服务器加入自治域);(7)主服务器与专用服务器周期性交互自身运行状态信息;(8)根据预先人为配置,主服务器记录每台专用服务器的专用功能;(9)所有自治域内服务器都维护同一张服务器描述列表,其中包括服务器的名称、 IP地址信息和角色信息等;(10)新服务器加入自治域后,通过心跳广播的方式告知域内所有服务器其存在, 但只有主服务器回复心跳报文的方式,告知其域内的主服务器地址。第三,主服务器受理服务,并将服务拆分成服务数据元语(即,根据系统所提供的 功能集将服务请求与数据分解成类似CPU指令的短小功能指令,通过主服务器的调度由不 同服务器共同协作完成这些功能,服务和数据分解粒度的粗细则根据系统所能提供的功能 集大小来进行)。主服务根据服务器描述列表以及专用服务器的状态信息,判断是否将服务 请求发送到专用服务器。如果专用服务器状态不佳则选择其他次优服务器来完成该服务, 即将服务从专用服务器迁移至其他次优服务器。这里有必要说明,主服务器如何进行调度 迁移决策以及次优服务器的选择(1)主服务器被选举出来之后,其他服务器都会通过心跳报告周期性的向主服务 器发送自身的信息,包括CPU综合平均使用率、剩余磁盘空间、内存容量、权重值以及自身 角色等;(2)主服务器根据服务器列表信息,从专用服务器角色中选择对应服务的服务 器;(3)主服务器判断专用服务器的CPU综合平均使用率,若专用服务器的CPU综合 平均使用率> 90%,则选择其他次优服务器来替代专用服务器提供服务。服务器的选择算 法如下权重值在选择过程中占有主导地位,权重值的系数Kw设置为10,CPU的使用率的 系数Kcpu设置为-0. 1 (多核CPU采用综合平均使用率进行计算),磁盘容量以GB为单位, 考虑到磁盘容量对于服务器运算能力影响并不明显,作为辅助计算参数,该系数Km设置为0. 001,通过以上系数与实际变量结合的计算如下Weight 权重值,服务器预设参数之一(每台域内服务器保存一张配置参数表)。 该值在自治域创建之初,根据服务器性能以及管理需求对各个域内服务器进行设置,取值 范围0_100,该数值越大则服务器拥有的优先级越高(权重值最大的服务器将在系统运行 之后担任主服务器角色);如果在自治域建成之后,有新服务器加入,则根据管理需求配置 权重值;CPURate =CPU使用率(或CPU综合平均使用率),计算方式如下CPURate =Σ CPUnRate/ Σ η (η = 1...η);Memo 磁盘容量;服务优先值(ServicePriVal)计算式如下ServicePriVal = Kw*ffeight+Kcpu*CPURate+Km*Memo 胃 ψ, Kw = 10, Kcpu =-0. 1,Km = 0. 001。主服务器根据服务优先值高低来判断次优服务器的选择,服务优先值最高的服务 器作为次优服务器来完成服务;(4)如若多台服务器拥有相等的最高服务优先值,那么优先比较权重值大小,权重 值大的选为次优服务器;权重如若依然相等,则继续比较CPU综合平均使用率,CPU综合平 均使用率低的为次优服务器。如出现极限情况,即权重值和CPU综合平均使用率以及磁盘 容量皆相同,那么将使用主服务器本身提供服务。第四,根据主服务的调度,主服务将服务数据元语发送到相应服务器上运算并执 行。最后,返回服务结果。如图1所示,是系统服务自我调度的流程示意图。在图1中包括以下步骤①确定系统的自治域范围,即该自治域内的成员,属于同一个自治域的服务器拥 有相同的自治域标识符。自治域的成员有主服务器和专用服务器;②采用权重值优先算法选举出该自治域内的主服务器,主服务器的主要职责是进 行系统服务智能调度;③主服务器受理服务请求,并检查相应的专用服务器状态,如果专用服务器状态 正常,即可以完成服务,则主服务器将拆分后的服务数据元语发送到专用服务器由专用服 务器来完成服务;④如专用服务器状态不正常,主服务器选择次优服务器,即通过服务器列表中各 服务器的状态参数进行比较,选出服务优先值最高的服务器进行服务运算。当选出次优服 务器之后,服务器传送服务数据元语,由次优服务器来完成服务(次优服务器可包括主服 务器本身);⑤进入服务受理状态轮询,重复③ ④;如果②中的主服务器状态发生变化,则重 新进行主服务器选举,主服务器选举的过程参见图2 ;如图2所示,是自治域内主服务器选举过程的流程示意图。参照图2,按照上述方 法所进行自治域内主服务器选举的应用步骤如下①在自治域内,主服务器与非主服务器间通过心跳报文来保持通讯状态。域内所 有服务器都保持有全域服务器描述列表,并标示出主服务器与非主服务器等角色关系(非
6主服务器只与主服务器保持心跳关系);②当发现主服务器心跳报文异常,即无心跳报文或者心跳报文发送间隔超标,则 重新进行自治域内主服务器选举(全系统重新上电也需要进行主服务器选举);③登记候选服务器,即只有权重值大于0的服务器才有权进行主服务器的竞选, 而对于权重值为0的服务器,则不得参选;④所有域内服务器通过心跳报文的方式进行竞选通知,当前自治域内权重值最大 的服务器将当选为主服务器,并通过心跳报文的方式告知域内所有服务器(包括权重值为 0的服务器)。当主服务器选举产生之后,所有非主服务器都需要记录新的主服务器状态, 并接受主服务器的调度数据,开始接收并发送心跳报告到主服务器;⑤考虑到通讯和应用的稳定,除非主服务器出现异常,否则即使有更高权重值的 服务器加入自治域,也不进行选举。新服务器进入域后将向域内所有服务器广播心跳,通知 其他服务器其存在,但只有主服务器回复其心跳报文告知其域内的主服务器地址。综上所述,本发明旨在为故障信息系统提供一种服务器集群自治管理,服务部署 智能调度的方法,其方法的具体技术方案由本发明的权利要求所限定。
权利要求
一种故障信息系统的服务和服务器智能自治的实现方法,所述方法用于服务器集群自治管理和服务部署自我调度;其特征在于,所述方法包括以下步骤(1)定义自治域,即以自治域划分故障信息系统中服务器,在同一个自治域内的服务器,通过自治域标识符来标识自身所属自治域,在同一自治域内的服务器可以交互沟通;(2)确认自治域内的服务器成员以及成员的专属职责,自治域内服务器包括主服务器和专用服务器,所述主服务器充当服务受理以及服务调度协调者角色,所述专用服务器充当完成某一具体功能的服务器;(3)在自治域内,主服务器受理服务,根据服务器列表信息,从专用服务器角色中选择对应服务的服务器,将服务拆分成服务数据元语,传递给相应的专用服务器运算并执行;(4)所述专用服务器运算后向所述主服务器返回运算结果。
2.根据权利要求1所述的方法,其特征在于,在上述步骤(2)中,还进一步包括当主服务器无法正常工作、即心跳报文异常时,在所述自治域内进行主服务器选举,所 述选举遵循以原则(1)确认选举范围是在同一个自治域内部进行;(2)根据管理需求以及服务器硬件参数初始化服务器配置参数,所述参数包括对服务 器权重值的设置,自治域内只有预设权重值大于0的服务器才能进入候选名单;(3)服务器间以心跳报文的方式进行权重值通知;(4)在所有服务器都达成共识的情况下,选出权重值最高的服务器作为主服务器。
3.根据权利要求2所述的方法,其特征在于,自治域内服务器间通讯保持采用“星型” 逻辑拓扑方式,即所有非主服务器都只与主服务器进行心跳报文交互,而不与其他服务器 进行心跳报文交互,只有当域内重新进行主服务器选举之时,服务器间才通过心跳报文进 行选举。
4.根据权利要求2所述的方法,其特征在于,当主服务器的选举结束后,即使原主服务 器恢复正常或者新加入的服务器权重值更高也不会更换主服务器。
5.根据权利要求2所述的方法,其特征在于,新服务器加入自治域后,通过心跳广播的 方式告知域内所有服务器该新服务器的存在,但只有主服务器通过回复心跳报文的方式, 告知该新服务器所述自治域内的主服务器地址。
6.根据权利要求1所述的方法,其特征在于,在上述步骤(3)中,还进一步包括所述 主服务器通过心跳报文获取各专用服务器的状态信息,当某专用服务器状态不正常时,所 述主服务器通过服务器列表中各服务器的状态参数进行比较,根据权重值和CPU综合平均 使用率参数、即服务优先值,选取次优服务器完成服务。
7.根据权利要求6所述的方法,其特征在于,主服务器通过心跳报文获取各专用服务 器的状态信息,包括专用服务器的功能作用、权重值、CPU综合平均使用率、磁盘空间以及内 存容量。
8.根据权利要求1所述的方法,其特征在于,所述方法可以扩展到多个自治域内,自治 域内的成员保持有自治域信息并自动区分与不同自治域内的成员通信。
全文摘要
本发明公开了一种故障信息系统的服务和服务器智能自治的实现方法,主要应用于电力自动化、故障信息和智能电网支持系统以及故障分析等领域。本方法旨在简化多服务器间协同工作的复杂性,减低系统建造和维护成本,避免使用双机热备来解决多机系统中通讯关键节点的脆弱性问题。此外,本方法采用智能服务迁移法解决多机系统的资源利用不均问题,避免了传统“单一服务器单一作用”的方式。本方法包括以下主要技术特征对多服务器采用自治域定义;自治域内高效稳定的主服务器选举算法;系统内的服务智能化调度,有效利用系统内各服务器资源;采用服务数据元语和简单、稳定的通讯方式相结合,减轻系统内通讯负载。
文档编号H04L12/56GK101924650SQ201010244718
公开日2010年12月22日 申请日期2010年8月4日 优先权日2010年8月4日
发明者刘军, 姜健宁, 戴寅, 朱炳铨, 杨常府, 王勇, 翁磊, 钱建国, 闫振义 申请人:浙江省电力公司;北京四方继保自动化股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1