自适应总控灾备切换装置、系统及信号发生方法

文档序号:9811114阅读:625来源:国知局
自适应总控灾备切换装置、系统及信号发生方法
【技术领域】
[0001]本发明涉及数据中心灾难备份与智能控制领域,特别涉及一种自适应总控灾备切换装置、系统及信号发生方法。
【背景技术】
[0002]在数据大集中的趋势下,很多企业机构建设了自己的数据中心。数据集中后,在带来巨大好处的同时,也带来了风险集中,因此数据中心的安全可靠性也就显得尤为重要。为保证可靠性,数据中心的冗余机制是解决这一问题的重要途径。但冗余机制也导致了数据中心建设的复杂性,及时准确的检测数据中心故障,并给出合理的专家建议,无缝切换到备用中心是数据中心提供业务连续运行的关键。
[0003]传统的灾备方案有“同城灾备”、“异地灾备”以及“同城-异地灾备”三种模式,其中,同城灾备模式主要是指灾备中心与生产中心处于同一城市内,可同时采用同步备份或异步备份,其具有最低的投资成本,最快的灾难恢复速度,极高地数据保障,但无法应对区域性数据灾难;异地灾备模式主要是指灾备中心与生产中心在不同的城市,一般只能实现异步备份,投资成本较高,灾难恢复速度与数据保障能力略低,优势是可应对区域性灾难风险;同城-异地灾备模式是上面两种模式的结合,投资成本最高,但具有前两者的优点,此种模式又分为两种实现方式,一种是先建立同城灾备中心,再建立异地灾备对同城灾备进行备份,一种是同城中心与异地中心分别独立为生产中心进行备份。但以上三种模式或者没有考虑遇到区域性不可抗拒的因素(火灾、断电、地震),或者采用单一简单的切换方式,仅仅从生产中心切换到备用中心,忽视备用中心的安全性。这样一旦灾难发生,将很难满足高可靠、高可用数据中心的容灾备份和切换的要求。
[0004]—种新的多生产中心的灾备方案中,各中心间可以相互备份,并独立承担业务,极大的提高了灾备等级。在以往多生产中心切换的研究中,研究者更多的是关注多生产中心发生灾难后,生产中心间切换步骤的实施,而很少考虑应用智能技术准确而快速的产生切换信号,实现系统的自适应切换。
[0005]监控系统在民航信息系统的系统安全、系统维护方面得到了广泛的应用。监控系统应用的告警信息中包含了大量有用的信息,但是这些信息只有经过深入分析后才能被挖掘出来。目前的大多数监控平台,只是侧重于告警信息的统一采集、存储,告警信息的处理分析能力比较弱,并且不能支持多个应用系统报警数据的同时采集,面对庞大的报警数据,无法准确定位故障源,造成维护人员所关注的信息往往淹没在大量普通的信息中,对系统维护无法起到提前判断甚至及时处理,这使得维护工作繁重而且艰巨。

【发明内容】

[0006]为解决现有存在的技术问题,本发明实施例提供一种自适应总控灾备切换装置、系统及信号发生方法。
[0007]为达到上述目的,本发明实施例的技术方案是这样实现的:
[0008]一种自适应总控灾备切换装置,所述装置包括:故障数据处理单元、故障推理判断单元和切换信号发出单元,其中,
[0009]故障数据处理单元,用于采集各生产中心的故障数据,对所述故障数据进行分类存储、分析,得到故障特征数据;
[0010]故障推理判断单元,用于将所述故障特征数据通过知识库推理得到故障切换意见;
[0011]切换信号发出单元,用于根据所述故障切换意见和人工指令,发出切换控制指令给各生广中七、。
[0012]其中,所述故障数据处理单元包括:故障数据收集模块,用于收集各生产中心的故障数据并进行故障数据的分类存储。
[0013]其中,所述故障数据收集模块,具体用于通过安装在各生产中心的代理Agent程序获得生产中心的故障数据,以及通过心跳检测设备监控其它生产中心运行状态,并收集其它生产中心的故障数据。
[0014]其中,所述故障数据收集模块,具体用于按所属的不同应用子系统进行故障数据的分类存储。
[0015]其中,所述故障数据处理单元还包括:故障分析模块,用于根据存储在不同应用子系统的故障数据分别进行故障分析,并对各应用子系统进行故障的关联分析,得到故障特征数据。
[0016]其中,所述故障分析模块包括单系统故障分析子模块;单系统故障分析子模块用于根据存储在不同应用子系统的故障数据分别进行故障分析,得到故障特征数据。
[0017]其中,所述故障分析模块还包括关联系统故障分析子模块;所述关联系统故障分析子模块,用于对各应用子系统进行故障的关联分析,得到故障特征数据。
[0018]其中,所述故障数据处理单元还包括故障特征数据库,用于保存所述故障特征数据。
[0019]其中,所述故障推理判断单元包括知识库、知识库推理模块;所述知识库描述了知识处理求解逻辑;所述知识库推理模块用于以所述知识库为后台数据对所述故障特征数据进行知识库推理,结合预设的切换策略得到故障切换意见,并发送给所述切换信号发出单
J L ο
[0020]其中,所述切换信号发出单元,包括:转移切换控制模块,用于在所述故障切换意见通过人工干预和确认后,发出切换控制指令给各生产中心。
[0021]—种自适应总控灾备切换系统,所述系统包括至少两个生产中心、心跳检测设备和如权利要求1至11任一项所述的自适应总控灾备切换装置,各所述生产中心分别与所述自适应总控灾备切换装置连接,各所述生产中心之间连接有所述心跳检测设备。
[0022]其中,所述生成中心包括:状态监控服务器和接入服务器;
[0023]所述状态监控服务器,用于通过代理Agent程序实时对生产中心的运行状态进行监测,并将生成中心的故障数据发送给所述自适应总控灾备切换装置;
[0024]所述接入服务器,用于等待所述自适应总控灾备切换装置发出的切换控制指令并进行相应的故障转移操作。
[0025]其中,所述生成中心还包括:WEB集群、数据库DB集群和中心节点。
[0026]其中,所述心跳检测设备,用于实时对生产中心的运行状态进行监测,并将生成中心的故障数据发送给所述自适应总控灾备切换装置。
[0027]—种自适应总控灾备切换信号产生方法,所述方法包括:
[0028]故障数据处理单元采集各生产中心的故障数据,对所述故障数据进行分类存储、分析,得到故障特征数据;
[0029]故障推理判断单元将所述故障特征数据通过知识库推理得到故障切换意见;
[0030]切换信号发出单元根据所述故障切换意见和人工指令,发出切换控制指令给各生产中心。
[0031 ]其中,所述故障数据处理单元的故障数据收集模块收集各生产中心的故障数据并进行故障数据的分类存储。
[0032]其中,所述故障数据收集模块通过设置在各生产中心的状态监控服务器获得生产中心的运行状态数据,以及通过心跳检测设备获得其它生产中心的运行状态数据。
[0033]其中,所述故障数据收集模块按所属的不同应用子系统进行故障数据的分类存储。
[0034]其中,所述故障数据处理单元的故障分析模块根据不同应用子系统的故障数据分别进行故障分析,并对各应用子系统进行故障的关联分析,得到故障特征数据。
[0035]其中,所述故障分析模块根据不同应用子系统的故障数据分别进行故障分析,得到故障特征数据,包括:所述故障分析模块的单系统故障分析子模块根据存储在不同应用子系统的故障数据分别进行故障分析,得到故障特征数据。
[0036]其中,所述故障分析模块对各应用子系统进行故障的关联分析,得到故障特征数据,为:所述故障分析模块的关联系统故障分析子模块对各应用子系统进行故障的关联分析,得到故障特征数据。
[0037]其中,所述方法还包括:将所述故障特征数据保存到所述故障数据处理单元的故障特征数据库。
[0038]其中,以知识库为后台数据对所述故障特征数据进行知识库推理,结合预设的切换策略得到故障切换意见,并发送给所述切换信号发出单元;所述知识库描述了知识处理求解逻辑。
[0039]其中,在所述故障切换意见通过人工干预和确认后,发出切换控制指令给各生产中心。
[0040]本发明实施例的自适应总控灾备切换装置、系统及信号发生方法,当有生产中心出现异常时,自适应总控灾备切换系统将自动启动,产生切换控制指令控制生产中心执行故障转移,以使得正常的生产中心能够自适应的接管异常的生产中心的用户,从而应用智能技术准确而快速的产生切换信号,实现系统的自适应切换,减轻了人工参与的程度,借助机器智能,实现人类专家的智能处理,及时给出专家切换意见。并且,
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1