一种确定数据库生产系统容灾切换的方法和装置的制作方法

文档序号:6584762阅读:205来源:国知局
专利名称:一种确定数据库生产系统容灾切换的方法和装置的制作方法
技术领域
本发明涉及数据库生产系统容灾切换技术领域,尤其涉及一种确定数据库生产系 统容灾切换的方法和装置。
背景技术
在当前电信级别的数据库生产系统中,随着客户的增加,业务的增长以及时间的 累积,系统单位时间在线交易数以及每笔交易的复杂度均有大规模的提升,这样也导致了 数据库生产系统上的数据变更更为频繁。数据库生产系统承受的压力越大,则发生故障的 可能性也越大。在数据库生产系统的处理过程中有时可能出现大范围的中断,无法正常提供服 务,并且无法在一定的时间内解决,这种情况称为数据灾难,典型的例子有火灾、爆炸事件、 地震、水灾等自然原因,以及电源、机器故障、人为因素等非自然原因引起的灾难。电信运营 商的数据库生产系统中保存有大量的数据资源,一旦发生数据灾难,设备中止运行,将导致 大面积的用户无法正常使用业务,对电信运营商来说,也会造成大量的经济损失。为了减少由于发生数据灾难而导致数据库生产系统不能正常提供服务的时间,一 般在数据库生产系统(以下简称为生产系统)之外搭建数据库容灾系统(以下简称容灾系 统),这样在生产系统发生数据灾难的时候可以切换到容灾系统,从而能够保证业务的连续 性、高可用性。目前,生产系统维护人员一般采用以下三种方式来搭建容灾系统1)采用oracle数据库的data guard技术搭建容灾系统Oracle数据库中比较成熟的data guard技术对于交易量较小且对实时性要求不 高的系统,是一种比较行之有效的方法,但其对于生产系统以及容灾系统的运行状态无法 监测,需要人工分析是否需要切换容灾,并且在切换容灾的时候,需要人工进行容灾切换, 并且绝大部分应用需要重启以配合容灾切换;2)采用第三方工具抓取oracle数据库的redo日志等信息搭建容灾系统第三方厂商依据各自的实现机制,借助其开发的软件,通过挖掘oracle数据库的 redo日志中的内容,应用到容灾系统上,但由于其实现机制需要借助oracle数据库的redo 日志的传输以及在容灾系统上应用redo日志,并不能解决对生产系统以及容灾系统的运 行情况的监测,仍然需要人工分析是否需要切换容灾,并且在切换容灾的时候,需要人工进 行容灾切换,并且绝大部分应用需要重启以配合容灾切换;3)采用第三方工具搭建硬件镜像的容灾系统和前面两种方式完全不同,采用硬件镜像的方式,主要对生产系统的存储改动进 行同步复制,一定程度上降低了生产系统和容灾系统对于oracle数据库技术的依赖以及 耦合度,但是该方式完全基于底层硬件机制来实现,仍然无法监测生产系统以及容灾系统 的运行状况,仍然需要人工分析是否需要切换容灾。在以上三种方式中,由于对于生产系统以及容灾系统的运行状态无法监测,需要人工分析是否需要容灾切换,并且在容灾切换的时候,需要人工进行容灾切换,切换到容灾 系统需要的时间一般都以小时为单位,同时,由于故障检测的延后以及切换操作中很多需 要手工完成,导致切换过程中对人的依赖性过大,切换时间长短很大程度上取决于参与切 换的人的个人能力以及对系统的熟练程度,并且由于切换数据库后,应用需要部分或者全 部重启,因此参与切换的人员也较多,对于电信级别的生产系统,例如业务运营支撑系统 (BOSS)来说,长时间停机给业务带来巨大的损失,同时也严重影响了客户对电信企业服务 质量的感知。

发明内容
有鉴于此,本发明的主要目的在于提供一种确定数据库生产系统容灾切换的方 法,应用该方法能够避免在生产系统发生一般故障时的不必要容灾切换,并且可以在生产 系统发生严重故障时立即切换容灾。本发明的另一主要目的在于提供一种确定数据库生产系统容灾切换的装置,应用 该装置能够避免在生产系统发生一般故障时的不必要容灾切换,并且可以在生产系统发生 严重故障时立即切换容灾。为达到上述目的,本发明的技术方案具体是这样实现的一种确定数据库生产系统容灾切换的方法,包括A、监测生产系统和容灾系统中软硬件的健康度;B、根据监测到的生产系统和容灾系统中软硬件的健康度确定生产系统是否需要 切换到容灾系统。生产系统或容灾系统中的硬件分为关键硬件、一般硬件和其他硬件,所述步骤B 具体包括Bi、分别计算监测到的生产系统和容灾系统中发生故障的关键硬件、一般硬件、其 他硬件以及软件的总数;B2、根据生产系统中发生故障的关键硬件、一般硬件、其他硬件以及软件的总数计
算生产系统容灾切换概率Ppradurt ;B3、根据容灾系统中发生故障的关键硬件、一般硬件、其他硬件以及软件的总数计
算容灾系统可接受容灾切换概率pt。lCTate ;B4、根据计算得到的生产系统容灾切换概率和容灾系统可接受容灾切换概率确定 生产系统是否需要切换到容灾系统。步骤B2中,所述计算生产系统容灾切换概率的方式为Pproduct = MIN[ 1,MAX (aXNP_key,b XNP_n。rmal,c XNP_。ther,dXNP_s。ft碰e) ]X100%其中,NP_key代表生产系统中发生故障的关键硬件总数,NP_normal代表生产系统中发 生故障的一般硬件总数,NP_other代表生产系统中发生故障的其他硬件总数,NP_software代表生 产系统中发生故障的软件总数;a代表生产系统中发生故障的关键硬件的影响因子,b代表 生产系统中发生故障的一般硬件的影响因子,c代表生产系统中发生故障的其他硬件的影 响因子,d代表生产系统中发生故障的软件的影响因子。步骤B3中,所述计算容灾系统可接受容灾切换概率的方式为Ptolerate = {1-MIN[1,MAX (aXNT_key,b XNT_n。rmal,cXNT_other, dXNT_s。ftware) ]} X 100%
其中,NT_key代表容灾系统中发生故障的关键硬件总数,NT__al代表容灾系统中发 生故障的一般硬件总数,NT_other代表容灾系统中发生故障的其他硬件总数,NT_software代表容 灾系统中发生故障的软件总数;a代表容灾系统中发生故障的关键硬件的影响因子,b代表 容灾系统中发生故障的一般硬件的影响因子,c代表容灾系统中发生故障的其他硬件的影 响因子,d代表容灾系统中发生故障的软件的影响因子。步骤B4中,所述根据计算得到的生产系统容灾切换概率和容灾系统可接受容灾 切换概率确定生产系统是否需要切换到容灾系统的方法具体为当Ppraduet 等于 100% 且 Pt。lerate 大于等于 50%,以及 Pt。lerate 等于 100% 且 Ppradurt 大 于等于80%的时候进行容灾切换;当Ppraduet大于等于50%并小于80%且Ptolerate大于等于50%,以及Pt。lerate大于等 于50%并小于100%且Ppraduet大于等于80%并小于100%的时候进行容灾切换或不进行容 灾切换;当Ppraduet小于50%或Pt。lCTate小于50%的时候不进行容灾切换。步骤B之后,该方法进一步包括C、当确定生产系统需要切换到容灾系统时,将生产系统切换到容灾系统。所述步骤C具体包括Cl、停止生产系统数据库;C2、停止硬件镜像;C3、启动容灾系统的数据库;C4、将容灾系统的域名修改为生产系统的域名。步骤A之前,该方法进一步包括当生产系统的软件配置发生修改时,对容灾系统 的软件配置进行同步修改。所述当生产系统的软件配置发生修改时,对容灾系统的软件配置进行同步修改具 体包括A01、定时监测生产系统软件配置修改;A02、根据监测到的生产系统的软件配置修改对容灾系统进行相应的配置修改。步骤A之前,将容灾系统中用于记录数据库初始化参数的spfile文件从数据文件 的卷组VG中剥离出来,放入单独的一个VG中,并且将容灾系统数据库启动到nomoimt状 态。步骤A中所述监测生产系统和容灾系统中软硬件的健康度是通过采集或上报的 方式进行的;所述监测是定时进行的。一种确定数据库生产系统容灾切换的装置,包括生产系统监控模块、容灾系统监 控模块和容灾切换控制模块,生产系统监控模块和容灾系统监控模块分别连接到容灾切换 控制模块;其中,生产系统监控模块,用于监测生产系统中软硬件的健康度,并将监测到的生产系 统中软硬件的健康度发送到容灾切换控制模块;容灾系统监控模块,用于监测容灾系统中软硬件的健康度,并将监测到的容灾系 统中软硬件的健康度发送到容灾切换控制模块;容灾切换控制模块,用于根据接收到的生产系统和容灾系统中软硬件的健康度确
8定生产系统是否需要切换到容灾系统。生产系统或容灾系统中的硬件分为关键硬件、一般硬件和其他硬件,所述容灾切 换控制模块包括分类故障总数计算单元、生产系统容灾切换概率计算单元、容灾系统可接 受容灾切换概率计算单元和容灾切换确定单元,生产系统容灾切换概率计算单元和容灾系 统可接受容灾切换概率计算单元分别与分类故障总数计算单元和容灾切换确定单元相连 接,分类故障总数计算单元与所述的生产系统监控模块和容灾系统监控模块连接;其中,分类故障总数计算单元,用于根据生产系统监控模块发送的生产系统中软硬件的 健康度,分别计算生产系统中发生故障的关键硬件、一般硬件、其他硬件以及软件的总数, 并将计算得到的生产系统中发生故障的关键硬件、一般硬件、其他硬件以及软件的总数发 送给生产系统容灾切换概率计算单元;根据容灾系统监控模块发送的容灾系统中软硬件的 健康度,分别计算容灾系统中发生故障的关键硬件、一般硬件、其他硬件以及软件的总数, 并将计算得到的容灾系统中发生故障的关键硬件、一般硬件、其他硬件以及软件的总数发 送给容灾系统可接受容灾切换概率计算单元;生产系统容灾切换概率计算单元,用于根据分类故障总数计算单元发送来的生产 系统中发生故障的关键硬件、一般硬件、其他硬件以及软件的总数计算生产系统容灾切换 概率,并将计算得到的生产系统容灾切换概率发送给容灾切换确定单元;容灾系统可接受容灾切换概率计算单元,用于根据分类故障总数计算单元发送来 的容灾系统中发生故障的关键硬件、一般硬件、其他硬件以及软件的总数计算容灾系统可 接受容灾切换概率,并将计算得到的容灾系统可接受容灾切换概率发送给容灾切换确定单 元;容灾切换确定单元,用于根据生产系统容灾切换概率计算单元发送来的生产系统 容灾切换概率和容灾系统可接受容灾切换概率计算单元发送来的容灾系统可接受容灾切 换概率确定生产系统是否需要切换到容灾系统。所述容灾切换控制模块进一步包括容灾切换控制单元,容灾切换控制单元与所述 的生产系统监控模块和容灾系统监控模块连接;其中,容灾切换控制单元,用于当确定生产系统需要切换到容灾系统时,向生产系统监 控模块发送停止生产系统数据库指令;接收到生产系统监控模块发送的停止生产系统数据 库完成的消息后,向生产系统监控模块发送停止硬件镜像的指令;接收到生产系统监控模 块发送的停止硬件镜像完成的消息后,向容灾系统监控模块发送启动容灾系统数据库的指 令;接收到容灾系统监控模块发送的启动容灾系统数据库完成的消息后,向生产系统监控 模块发送域名切换的指令;接收到生产系统监控模块发送的生产系统的域名后,将生产系 统的域名和域名切换的指令发送给容灾系统监控模块;生产系统监控模块,进一步用于接收到容灾切换控制单元下发的停止生产系统数 据库指令后,停止生产系统数据库,并将停止生产系统数据库完成的消息返回给容灾切换 控制单元;接收到容灾切换控制单元下发的停止硬件镜像的指令后,停止生产系统的硬件 镜像,并将停止生产系统的硬件镜像完成的消息返回给容灾切换控制单元;接收容灾切换 控制单元下发的域名切换指令后,将生产系统的域名发送给容灾切换控制单元;容灾系统监控模块,进一步用于接收到容灾切换控制单元下发的启动容灾系统数 据库的指令后,启动容灾系统的数据库,并将启动容灾系统数据库完成的消息返回给容灾切换控制单元;接收容灾切换控制单元下发的域名切换指令和生产系统的域名后,将容灾 系统的域名修改为生产系统的域名,并将域名切换完成的消息返回给容灾切换控制单元。所述容灾切换控制模块进一步包括同步修改控制单元,同步修改控制单元与所述 的生产系统监控模块和容灾系统监控模块连接;其中,同步修改控制单元,用于接收到生产系统监控模块发送的生产系统中软件配置修 改的消息后,生成软件配置修改指令并下发到容灾系统监控模块;生产系统监控模块,进一步用于定时监测生产系统中软件配置是否发生了修改, 如果监测到生产系统中软件配置发生了修改,则将监测到的生产系统中软件配置修改的消 息发送给同步修改控制单元;容灾系统监控模块,进一步用于接收到同步修改控制单元下发的软件配置修改指 令后,修改容灾系统中的软件配置,并将容灾系统中软件配置完成的消息返回给同步修改 控制单元。由上述的技术方案可见,本发明所提供的一种确定数据库生产系统容灾切换的方 法,通过定时监测生产系统和容灾系统中关键硬件、一般硬件、其他硬件和软件的健康度, 根据监测到的生产系统和容灾系统中关键硬件、一般硬件、其他硬件和软件的健康度计算 得到容灾切换、可容灾切换、无需切换和不能切换四种结果,如果是容灾切换则进行容灾切 换,如果是可容灾切换则可以进行容灾切换或不进行容灾切换,如果是无需切换或不能切 换则不进行容灾切换,避免了在生产系统发生一般故障时的不必要容灾切换,并且可以在 生产系统发生严重故障时立即切换容灾,降低了人为决策是否进行容灾切换的时间,提高 了整个数据库系统运行的稳定性。另外,本发明所提供的一种确定数据库生产系统容灾切换的装置,通过定时监测 生产系统和容灾系统中关键硬件、一般硬件、其他硬件和软件的健康度,根据监测到的生产 系统和容灾系统中关键硬件、一般硬件、其他硬件和软件的健康度计算得到容灾切换、可容 灾切换、无需切换和不能切换四种结果,如果是容灾切换则进行容灾切换,如果是可容灾切 换则可以进行容灾切换或不进行容灾切换,如果是无需切换或不能切换则不进行容灾切 换,避免了在生产系统发生一般故障时的不必要容灾切换,并且可以在生产系统发生严重 故障时立即切换容灾,降低了人为决策是否进行容灾切换的时间,提高了整个数据库系统 运行的稳定性。


图1为本发明中所述确定数据库生产系统容灾切换的方法流程图。图2为本发明中所述确定生产系统是否需要切换到容灾系统的方法流程图。图3为本发明中所述将生产系统切换到容灾系统的方法流程图。图4为本发明中所述确定数据库生产系统容灾切换的装置结构示意图。图5为本发明中所述容灾切换控制模块的结构示意图。
具体实施例方式为使本发明的目的、技术方案、及优点更加清楚明白,以下参照附图并举实施例, 对本发明进一步详细说明。
本发明的主要思想为监测生产系统和容灾系统中软硬件的健康度;根据监测到 的生产系统和容灾系统中软硬件的健康度确定生产系统是否需要切换到容灾系统;如果确 定需要进行容灾切换则将生产系统切换到容灾系统;同时还可以保持生产系统和容灾系统 中软件配置的一致性。众所周知,硬件镜像的容灾系统与生产系统具有一致性的软硬件配置,生产系统 包括多个生产主机以及生产存储设备,对应地,容灾系统也包括同样个数的容灾主机以及 容灾存储设备,而且生产系统和容灾系统也具有相同的软件配置。下面以oracle数据库为 例进行说明。在本发明中,为了缩短生产系统向容灾系统的切换时间,将容灾系统中用于记录 数据库初始化参数的spfile文件从数据文件的卷组(VG)中剥离出来,放入单独的一个 VG中,这样对数据文件的修改就不会影响到spfile文件,并且将容灾系统数据库启动到 nomount状态,该状态下只是启动了 oracle实例而没有启动数据库,不影响生产系统的硬 件镜像,这样当容灾切换发生时容灾系统可以迅速启动数据库,大大节约容灾切换时间,例 如,电信级别的容灾切换可以节省大约10分钟的时间,有利于生产系统迅速完成容灾切 换。在本发明中为了使容灾系统能够更好地替代生产系统提供数据库服务,当运行中 的生产系统的软件配置,例如数据库参数配置,发生修改时,那么需要及时对容灾系统的软 件配置进行同步修改。所述当生产系统的软件配置发生修改时,对容灾系统的软件配置进行同步修改的 方法主要包括以下步骤A01、监测生产系统软件配置修改;在本步骤中,主要是对处于运行中的生产系统的软件配置进行定时监测,例如间 隔1分钟,可以通过监控,例如软件的配置日志,来判断生产系统的软件配置是否进行了修 改,如果发生了修改,则可以通过,例如以报告的形式上报生产系统的软件配置修改信息。A02、根据监测到的生产系统的软件配置修改对容灾系统进行相应的配置修改。在本步骤中,主要是根据生产系统的软件配置修改信息对容灾系统进行相应的配 置修改,具体的监测和修改方法为现有技术,这里就不再赘述。图1为本发明中所述确定数据库生产系统容灾切换的方法流程图。如图1所示, 本发明所述方法主要包括以下步骤A、监测生产系统和容灾系统中软硬件的健康度。在本步骤中,主要是对生产系统和容灾系统中软硬件的健康度进行定时监测,例 如每次监测间隔5分钟,由于生产系统或容灾系统中的各种硬件的健康度对于生产系统或 容灾系统能否正常工作的影响不同,因此,按照对生产系统或容灾系统的重要性,将生产系 统或容灾系统中的硬件分为关键硬件、一般硬件和其他硬件;关键硬件包括生产主机或容 灾主机的电源、生产主机或容灾主机的网络、生产存储设备或容灾存储设备的电源以及生 产存储设备或容灾存储设备的存储介质等,任一关键硬件发生故障将导致整个生产系统或 容灾系统不能正常工作;一般硬件包括生产主机或容灾主机中的中央处理器(CPU)、内存 和磁盘等,某个一般硬件故障并不会直接导致生产系统或容灾系统不能正常工作,但会影 响生产系统或容灾系统的性能;其他硬件包括生产主机或容灾主机上除关键硬件和一般硬件之外的其他硬件,其他硬件故障只会影响生产系统或容灾系统的性能。生产系统或容灾 系统的软件包括操作系统(OS)以及数据库软件。以上各种软硬件的健康度包括正常和故 障两种,可以通过多种手段对以上硬软件的健康度进行监测,例如通过电信机房的监控软 件或其他第三方工具从生产主机和容灾主机的工作日志、生产存储设备或容灾存储设备的 工作日志中采集以上各种软硬件的健康度或生产系统和容灾系统通过例如列表或报告等 方式上报以上各种软硬件的健康度。B、根据监测到的生产系统和容灾系统中软硬件的健康度确定生产系统是否需要 切换到容灾系统。在本步骤中,主要是根据监测到的生产系统和容灾系统中的软硬件的健康度来计 算生产系统容灾切换概率以及容灾系统可接受容灾切换概率;一般来说,生产系统容灾切 换概率越高并且容灾系统可接受容灾切换概率越高,则最终确定进行容灾切换的概率也越
尚ο图2为本发明中所述确定生产系统是否需要切换到容灾系统的方法流程图。如图 2所示,本发明所述方法主要包括以下步骤Bi、分别计算监测到的生产系统和容灾系统中发生故障的关键硬件、一般硬件、其 他硬件以及软件的总数。在本步骤中,为了方便说明,我们假设生产系统中发生故障的关键硬件总数为 NP_tey,发生故障的一般硬件总数为NP_n。 al,发生故障的其他硬件总数为NP_。thCT,发生故障的 软件总数为NP_s。ftw_ ;容灾系统中发生故障的关键硬件总数为NT_key,发生故障的一般硬件 总数为NT_n。 al,发生故障的其他硬件总数为NT_。thCT,发生故障的软件总数为NT_s。ftw_。具体 计算方法为将生产系统或容灾系统中所有发生故障的同类硬件或软件的个数相加得到发 生故障的相应类别硬件或软件的总数,例如将生产系统中发生故障的关键硬件个数相加得 到生产系统中发生故障的关键硬件总数NP_tey。B2、根据生产系统中发生故障的关键硬件、一般硬件、其他硬件以及软件的总数计 算生产系统容灾切换概率。在本步骤中,为了方便说明,我们假设生产系统容灾切换概率为Ppradurt,生产系统 中发生故障的关键硬件的影响因子为a,发生故障的一般硬件的影响因子为b,发生故障的 其他硬件的影响因子为c,发生故障的软件的影响因子为d。则生产系统容灾切换概率的计算公式如下所示Pproduct = MIN[1,MAX(aXNp_key,bXNp_normal, cXNP_other, dXNP_s。ftware) ] X 100% (1)其中a、b、c禾Π d为小于等于1的正实数。例如,a为1,b为0. 5,c为0. 2,d为 0. 5,可以根据工程实践进行设置或修改。B3、根据容灾系统中发生故障的关键硬件、一般硬件、其他硬件以及软件的总数计 算容灾系统可接受容灾切换概率。在本步骤中,为了方便说明,我们假设容灾系统可接受容灾切换概率为Pt。lCTate,容 灾系统中发生故障的关键硬件的影响因子为a,发生故障的一般硬件的影响因子为b,发生 故障的其他硬件的影响因子为c,发生故障的软件的影响因子为d。则容灾系统可接受容灾切换概率的计算公式如下所示Ptolerate = {1-MIN[1,MAX (a X NT_key,bXNT_n。rmal,cXNT_other, dXNT_software) ]} X 100%(2)其中a、b、c禾Π d为小于等于1的正实数。例如,a为1,b为0. 5,c为0. 2,d为
0. 5,可以根据工程实践进行设置或修改。以上步骤B2和B3的顺序可以互换,即可以先执行计算容灾系统可接受容灾切换 概率的步骤B3然后执行计算生产系统容灾切换概率的步骤B2。B4、根据计算得到的生产系统容灾切换概率和容灾系统可接受容灾切换概率确定 生产系统是否需要切换到容灾系统。在本步骤中,主要是将步骤B2计算得到的生产系统容灾切换概率和步骤B3计算 得到的容灾系统可接受容灾切换概率与预先确定的容灾切换确定表相比较,从而确定生产 系统是否需要切换到容灾系统。所述的容灾切换确定表如下所示
权利要求
1.一种确定数据库生产系统容灾切换的方法,其特征在于,包括A、监测生产系统和容灾系统中软硬件的健康度;B、根据监测到的生产系统和容灾系统中软硬件的健康度确定生产系统是否需要切换 到容灾系统。
2.根据权利要求1所述的方法,其特征在于,生产系统或容灾系统中的硬件分为关键 硬件、一般硬件和其他硬件,所述步骤B具体包括B 1、分别计算监测到的生产系统和容灾系统中发生故障的关键硬件、一般硬件、其他 硬件以及软件的总数;B2、根据生产系统中发生故障的关键硬件、一般硬件、其他硬件以及软件的总数计算生 产系统容灾切换概率PpMdu。t ;B3、根据容灾系统中发生故障的关键硬件、一般硬件、其他硬件以及软件的总数计算容 灾系统可接受容灾切换概率P tolerate ‘B4、根据计算得到的生产系统容灾切换概率和容灾系统可接受容灾切换概率确定生产 系统是否需要切换到容灾系统。
3.根据权利要求2所述的方法,其特征在于,步骤B2中,所述计算生产系统容灾切换概 率的方式为Pproduct = MIN[1,MAX(aXNP_key, bXNP_n。rmal,cXNP_。ther,dXNP_s。ft耐e) ] X 100%其中,表生产系统中发生故障的关键硬件总数,NP_n。 al代表生产系统中发生故 障的一般硬件总数,NP_other代表生产系统中发生故障的其他硬件总数,NP_software代表生产系 统中发生故障的软件总数;a代表生产系统中发生故障的关键硬件的影响因子,b代表生产 系统中发生故障的一般硬件的影响因子,c代表生产系统中发生故障的其他硬件的影响因 子,d代表生产系统中发生故障的软件的影响因子。
4.根据权利要求2所述的方法,其特征在于,步骤B3中,所述计算容灾系统可接受容灾 切换概率的方式为Ptoierate = {1—MIN [ 1,MAX (a X NT_key,b X NT_normal,CXNT_other,dXNT_software)]}X100%其中,NT_key代表容灾系统中发生故障的关键硬件总数,NT_n。 alR表容灾系统中发生故 障的一般硬件总数,NT_other代表容灾系统中发生故障的其他硬件总数,NT_software代表容灾系 统中发生故障的软件总数;a代表容灾系统中发生故障的关键硬件的影响因子,b代表容灾 系统中发生故障的一般硬件的影响因子,c代表容灾系统中发生故障的其他硬件的影响因 子,d代表容灾系统中发生故障的软件的影响因子。
5.根据权利要求2所述的方法,其特征在于,步骤B4中,所述根据计算得到的生产系统 容灾切换概率和容灾系统可接受容灾切换概率确定生产系统是否需要切换到容灾系统的 方法具体为当PPMdu。t等于100%且Ptolerate大于等于50%,以及Pt。lerate等于100%且Ppraduet大于等 于80%的时候进行容灾切换;当Ppraduet大于等于50%并小于80%且Ptolerate大于等于50%,以及Ptolerate大于等于 50%并小于100%且Ppraduet大于等于80%并小于100%的时候进行容灾切换或不进行容灾 切换;当PPMdu。t小于50%或Pt。lCTate小于50%的时候不进行容灾切换。
6.根据权利要求1-5中任一项所述的方法,其特征在于,步骤B之后,该方法进一步包括C、当确定生产系统需要切换到容灾系统时,将生产系统切换到容灾系统。
7.根据权利要求6所述的方法,其特征在于,所述步骤C具体包括Cl、停止生产系统数据库;C2、停止硬件镜像;C3、启动容灾系统的数据库;C4、将容灾系统的域名修改为生产系统的域名。
8.根据权利要求1-5中任一项所述的方法,其特征在于,步骤A之前,该方法进一步包 括当生产系统的软件配置发生修改时,对容灾系统的软件配置进行同步修改。
9.根据权利要求8所述的方法,其特征在于,所述当生产系统的软件配置发生修改时, 对容灾系统的软件配置进行同步修改具体包括A01、定时监测生产系统的软件配置修改;A02、根据监测到的生产系统的软件配置修改对容灾系统进行相应的配置修改。
10.根据权利要求1-5中任一项所述的方法,其特征在于,步骤A之前,将容灾系统中用 于记录数据库初始化参数的spfile文件从数据文件的卷组VG中剥离出来,放入单独的一 个VG中,并且将容灾系统数据库启动到nomount状态。
11.根据权利要求1-5中任一项所述的方法,其特征在于,步骤A中所述监测生产系统 和容灾系统中软硬件的健康度是通过采集或上报的方式进行的;所述监测是定时进行的。
12.一种确定数据库生产系统容灾切换的装置,其特征在于,包括生产系统监控模 块、容灾系统监控模块和容灾切换控制模块,生产系统监控模块和容灾系统监控模块分别 连接到容灾切换控制模块;其中,生产系统监控模块,用于监测生产系统中软硬件的健康度,并将监测到的生产系统中 软硬件的健康度发送到容灾切换控制模块;容灾系统监控模块,用于监测容灾系统中软硬件的健康度,并将监测到的容灾系统中 软硬件的健康度发送到容灾切换控制模块;容灾切换控制模块,用于根据接收到的生产系统和容灾系统中软硬件的健康度确定生 产系统是否需要切换到容灾系统。
13.根据权利要求12所述的装置,其特征在于,生产系统或容灾系统中的硬件分为关 键硬件、一般硬件和其他硬件,所述容灾切换控制模块包括分类故障总数计算单元、生产 系统容灾切换概率计算单元、容灾系统可接受容灾切换概率计算单元和容灾切换确定单 元,生产系统容灾切换概率计算单元和容灾系统可接受容灾切换概率计算单元分别与分类 故障总数计算单元和容灾切换确定单元相连接,分类故障总数计算单元与所述的生产系统 监控模块和容灾系统监控模块连接;其中,分类故障总数计算单元,用于根据生产系统监控模块发送的生产系统中软硬件的健康 度,分别计算生产系统中发生故障的关键硬件、一般硬件、其他硬件以及软件的总数,并将 计算得到的生产系统中发生故障的关键硬件、一般硬件、其他硬件以及软件的总数发送给 生产系统容灾切换概率计算单元;根据容灾系统监控模块发送的容灾系统中软硬件的健康 度,分别计算容灾系统中发生故障的关键硬件、一般硬件、其他硬件以及软件的总数,并将计算得到的容灾系统中发生故障的关键硬件、一般硬件、其他硬件以及软件的总数发送给 容灾系统可接受容灾切换概率计算单元;生产系统容灾切换概率计算单元,用于根据分类故障总数计算单元发送来的生产系统 中发生故障的关键硬件、一般硬件、其他硬件以及软件的总数计算生产系统容灾切换概率, 并将计算得到的生产系统容灾切换概率发送给容灾切换确定单元;容灾系统可接受容灾切换概率计算单元,用于根据分类故障总数计算单元发送来的容 灾系统中发生故障的关键硬件、一般硬件、其他硬件以及软件的总数计算容灾系统可接受 容灾切换概率,并将计算得到的容灾系统可接受容灾切换概率发送给容灾切换确定单元;容灾切换确定单元,用于根据生产系统容灾切换概率计算单元发送来的生产系统容灾 切换概率和容灾系统可接受容灾切换概率计算单元发送来的容灾系统可接受容灾切换概 率确定生产系统是否需要切换到容灾系统。
14.根据权利要求12或13所述的装置,其特征在于,所述容灾切换控制模块进一步包 括容灾切换控制单元,容灾切换控制单元与所述的生产系统监控模块和容灾系统监控模块 连接;其中,容灾切换控制单元,用于当确定生产系统需要切换到容灾系统时,向生产系统监控模 块发送停止生产系统数据库指令;接收到生产系统监控模块发送的停止生产系统数据库完 成的消息后,向生产系统监控模块发送停止硬件镜像的指令;接收到生产系统监控模块发 送的停止硬件镜像完成的消息后,向容灾系统监控模块发送启动容灾系统数据库的指令; 接收到容灾系统监控模块发送的启动容灾系统数据库完成的消息后,向生产系统监控模块 发送域名切换的指令;接收到生产系统监控模块发送的生产系统的域名后,将生产系统的 域名和域名切换的指令发送给容灾系统监控模块;生产系统监控模块,进一步用于接收到容灾切换控制单元下发的停止生产系统数据库 指令后,停止生产系统数据库,并将停止生产系统数据库完成的消息返回给容灾切换控制 单元;接收到容灾切换控制单元下发的停止硬件镜像的指令后,停止生产系统的硬件镜像, 并将停止生产系统的硬件镜像完成的消息返回给容灾切换控制单元;接收容灾切换控制单 元下发的域名切换指令后,将生产系统的域名发送给容灾切换控制单元;容灾系统监控模块,进一步用于接收到容灾切换控制单元下发的启动容灾系统数据库 的指令后,启动容灾系统的数据库,并将启动容灾系统数据库完成的消息返回给容灾切换 控制单元;接收容灾切换控制单元下发的域名切换指令和生产系统的域名后,将容灾系统 的域名修改为生产系统的域名,并将域名切换完成的消息返回给容灾切换控制单元。
15.根据权利要求12或13所述的装置,其特征在于,所述容灾切换控制模块进一步包 括同步修改控制单元,同步修改控制单元与所述的生产系统监控模块和容灾系统监控模块 连接;其中,同步修改控制单元,用于接收到生产系统监控模块发送的生产系统中软件配置修改的 消息后,生成软件配置修改指令并下发到容灾系统监控模块;生产系统监控模块,进一步用于定时监测生产系统中软件配置是否发生了修改,如果 监测到生产系统中软件配置发生了修改,则将监测到的生产系统中软件配置修改的消息发 送给同步修改控制单元;容灾系统监控模块,进一步用于接收到同步修改控制单元下发的软件配置修改指令后,修改容灾系统中的软件配置,并将容灾系统中软件配置完成的消息返回给同步修改控 制单元。
全文摘要
本发明公开了一种确定数据库生产系统容灾切换的方法和装置。该方法包括A、监测生产系统和容灾系统中软硬件的健康度;B、根据监测到的生产系统和容灾系统中软硬件的健康度确定生产系统是否需要切换到容灾系统。应用本发明所述的方法和装置,通过监测生产系统和容灾系统中软硬件的健康度,根据监测到的生产系统和容灾系统中软硬件的健康度确定生产系统是否需要切换到容灾系统,避免了在生产系统发生一般故障时的不必要容灾切换,并且可以在生产系统发生严重故障时立即切换容灾,降低了人为决策是否进行容灾切换的时间,提高了整个数据库系统运行的稳定性。
文档编号G06F17/30GK102081621SQ200910238600
公开日2011年6月1日 申请日期2009年11月27日 优先权日2009年11月27日
发明者李杰毅, 王晓征, 肖爱元 申请人:中国移动通信集团浙江有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1