一种集群化系统的评测方法和装置与流程

文档序号:14197112阅读:140来源:国知局
一种集群化系统的评测方法和装置与流程

本发明涉及计算机网络技术领域,尤其涉及一种集群化系统的评测方法和装置。



背景技术:

随着互联网的发展,网民对于网络访问的质量要求越来越高,对于网络访问故障或者服务故障0容忍。当前许多网络业务系统为了实现高可用性,常常采用集群化结构搭建,使得单服务器故障、单节点故障时仍然可以保障系统服务的可用性。但在有些很多情况下,这样的集群化系统会因为集群调用程序配置不当或调用方式错误而导致无法实现故障切换,导致单服务器/节点故障时,无法成功利用系统集群化特性,引起服务故障。

例如,系统甲有两台服务器a和b,该服务器a和b可提供等价服务,系统乙调用系统甲的数据作为服务的数据源。正常情况下,当系统甲的服务器a出现单台故障时,服务器b可正常提供服务。但现实中,可能出现系统乙配置调用程序时只配置了服务器a,或者虽然配置了服务器a和b,但是由于系统乙的切换程序问题,当服务器a故障时,无法切换至服务器b获取数据,导致出现服务故障,从而降低了业务系统的可靠性。

因此,需要对集群化系统进行评测,以便及时发现集群化系统中存在的上述异常情况。



技术实现要素:

为了解决上述技术问题,本发明提供了一种集群化系统的评测方法和装置,能对集群化系统的调用策略和性能进行评测。

本发明提供了一种集群化系统的评测方法,包括:

步骤1,获取中央服务器的集群调用程序信息表,所述集群调用程序信息表中包含:调用目标地址、配置文件路径、容灾切换时限;

步骤2,a根据所述配置文件路径读取配置文件,根据配置文件内容判定所述调用目标地址是否配置合理;当判定为不合理时,生成第一告警信息,生成包含所述第一告警信息的评测报告;和/或b通过模拟测试,判断所述集群化系统是否在所述容灾切换时限内完成容灾切换;当所述集群化系统未在所述容灾切换时限内完成容灾切换时,生成第二告警信息,生成包含所述第二告警信息的评测报告;

步骤3,输出评测报告。

进一步的,上述方案中,所述方法还包括:

根据所述集群化系统的访问日志,判断所述集群调用程序表是否完整;

当所述集群调用程序表完整时,执行所述步骤2;

当所述集群调用程序表不完整时,生成第三告警信息,生成包含所述第三告警信息的评测报告并执行所述步骤3。

进一步的,上述方案中,所述集群调用程序信息表中还包含:第一调用来源地址、第一应用服务名称;所述根据所述集群化系统的访问日志判断所述集群调用程序表是否完整包括:

提取预设时间内所述集群化系统的访问日志中的第二调用来源地址和第二应用服务名称;

当所述第一调用来源地址与所述第二调用来源地址一致并且所述第一应用服务名称与所述第二应用服务名称一致时,判断所述集群调用程序表是完整的;

否则,判断所述集群调用程序表是不完整的。

进一步的,上述方案中,所述根据配置文件内容判定所述调用目标地址是否配置合理包括:

根据所述配置文件,获取被调用服务器地址和预设的调用配置策略;

当所述调用目标地址与所述被调用服务器地址不相同时,判定所述调用目标地址不合理;和/或

当所述调用目标地址不符合预设的调用配置策略时,判定所述调用目标地址不合理。

进一步的,上述方案中,所述通过模拟测试判断所述集群化系统是否在所述容灾切换时限内完成容灾切换包括:

分别指定所述调用目标地址中任一个地址所指向的服务器主动屏蔽所述调用来源地址发来的请求;

观察集群化系统是否将所述请求切换至所述调用目标地址中其它地址所指向服务器;

当所述集群化系统将所述请求切换至所述调用目标地址中其它地址所指向服务器时,记录该切换过程所用的切换时间;

当所述调用目标地址中所有地址所指向的服务器均被指定过,每一次请求都被切换且对应的切换时间小于或等于所述容灾切换时限时,判断所述集群化系统在所述容灾切换时限内完成容灾切换;

否则,所述集群化系统未在所述容灾切换时限内完成容灾切换。

本发明还提供一种集群化系统的评测装置,所述装置包括:信息表获取模块、配置判定模块和/或容灾测试模块、以及报告输出模块;其中,

信息表获取模块,用于获取中央服务器的集群调用程序信息表,所述集群调用程序信息表中包含:调用目标地址、配置文件路径、容灾切换时限;

配置判定模块,用于根据所述配置文件路径读取配置文件,根据配置文件内容判定所述调用目标地址是否配置合理;当判定为不合理时,生成第一告警信息;

容灾测试模块,用于通过模拟测试,判断所述集群化系统是否在所述容灾切换时限内完成容灾切换;当所述集群化系统未在所述容灾切换时限内完成容灾切换时,生成第二告警信息;

报告输出模块,用于输出评测报告,所述评测报告包含所述第一告警信息和/或所述第二告警信息。

进一步的,上述方案中,所述装置还包括信息表检查模块,所述信息表检查模块包括:

判断完整单元,用于在获取中央服务器的集群调用程序信息表后,根据所述集群化系统的访问日志,判断所述集群调用程序表是否完整;

第一跳转单元,用于当所述集群调用程序表完整时,跳转至所述配置判定模块和/或容灾测试模块;

第二跳转单元,当所述集群调用程序表不完整时,生成第三告警信息,生成包含所述第三告警信息的评测报告并跳转至所述报告输出模块。

进一步的,上述方案中,所述集群调用程序信息表中还包含:第一调用来源地址、第一应用服务名称;所述判断完整单元包括:

提取子单元,用于提取预设时间内所述集群化系统的访问日志中的第二调用来源地址和第二应用服务名称;

判断子单元,用于当所述第一调用来源地址与所述第二调用来源地址一致并且所述第一应用服务名称与所述第二应用服务名称一致时,判断所述集群调用程序表是完整的;否则,判断所述集群调用程序表是不完整的。

进一步的,上述方案中,所述配置判定模块包括:

获取单元,用于根据所述配置文件,获取被调用服务器地址和预设的调用配置策略;

服务器判断单元,用于当所述调用目标地址与所述被调用服务器地址不相同时,判定所述调用目标地址不合理;和/或

策略判断单元,用于当所述调用目标地址不符合预设的调用配置策略时,判定所述调用目标地址不合理。

进一步的,上述方案中,所述容灾测试模块包括:

屏蔽单元,用于分别指定所述调用目标地址中任一个地址所指向的服务器主动屏蔽所述调用来源地址发来的请求;

观察单元,用于观察集群化系统是否将所述请求切换至所述调用目标地址中其它地址所指向服务器;

记录单元,用于当所述集群化系统将所述请求切换至所述调用目标地址中其它地址所指向服务器时,记录该切换过程所用的切换时间;

容灾判断单元,用于当所述调用目标地址中所有地址所指向的服务器均被指定过,每一次请求都被切换且对应的切换时间小于或等于所述容灾切换时限时,判断所述集群化系统在所述容灾切换时限内完成容灾切换;否则,所述集群化系统未在所述容灾切换时限内完成容灾切换。

附图说明

构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1为本发明实施例提供的集群化系统的评测方法的实现流程示意图;

图2为本发明实施例提供的集群化系统的评测装置的组成结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。

本发明提供一种评测装置,用于实施本发明提供的集群化系统的评测方法。

图1为本发明实施例提供的集群化系统的评测方法的实现流程示意图,如图1所示,该方法包括:

步骤1,获取中央服务器的集群调用程序信息表,所述集群调用程序信息表中包含:调用目标地址、配置文件路径、容灾切换时限;

具体的,评测装置获取中央服务器的集群调用程序信息表,通常,该集群调用程序信息表中包含:第一调用来源地址、第一应用服务名称、集群化系统名称、第一访问资源、调用目标地址、配置文件路径、容灾切换时限等信息;

这里,集群调用程序指集群服务的系统、模块、接口的统称。

表1为一个实施例中集群调用程序信息表示例。

表1

评测装置获取到集群调用程序信息表,就能够得到用于评测集群化系统是否具有高可靠性的许多关键信息,包括:第一调用来源地址、第一应用服务名称、调用目标地址、配置文件路径、容灾切换时限等。

因此,集群调用程序信息表的内容是否完整正确,将直接影响评测装置对集群化系统的评测结果的可靠性。故而,在一些实施例中,上述评测方法还包括:

在获取中央服务器的集群调用程序信息表后,根据所述集群化系统的访问日志,判断所述集群调用程序表是否完整;

当所述集群调用程序表完整时,执行下述步骤2;

当所述集群调用程序表不完整时,生成第三告警信息并执行下述步骤3,生成包含所述第三告警信息的评测报告。

具体的,上述根据所述集群化系统的访问日志判断所述集群调用程序表是否完整包括:

提取预设时间内所述集群化系统的访问日志中的第二调用来源地址和第二应用服务名称;

当所述第一调用来源地址与所述第二调用来源地址一致并且所述第一应用服务名称与所述第二应用服务名称一致时,判断所述集群调用程序表是完整的;

否则,判断所述集群调用程序表是不完整的。

由于,集群调用程序访问集群化系统时,会将服务器ip地址(即第一调用来源地址)和第一应用服务名称放到请求信息里,集群化系统受到调用请求,记录将调用时间、访问资源、调用来源ip地址、调用来源应用服务等信息到访问日志中,从而,集群化系统的访问日志中通常包含:调用时间、第二访问资源、第二调用来源地址、第二应用服务名称等信息。

例如,评测装置获取到的中央服务器的集群调用程序信息表如表1所示,其访问集群1时,将1.1.1.1、应用1和2.2.2.1、应用2携带给集群1;集群1打印访问日志,包涵1.1.1.1、应用1和2.2.2.1、应用2这两条;此信息即为两条第二调用来源地址和第二应用服务名称信息;将它们分别与从集群调用程序信息表(表1)获取的第一调用来源地址和第一应用服务名称进行对比,对比一致性,则判定该集群调用程序信息表完整;假设日志中存在3.3.3.3、应用3的访问,或者只有1.1.1.1、应用1或只有2.2.2.1应用2,则判定集群调用程序信息表不完整。

进一步的,在一些实施例中,当评测装置发现集群调用程序信息表不完整时,不仅生成第三告警信息,还将生成包含所述第三告警信息的评测报告跳转至下述步骤3,退出本次对集群化系统的评测进程。

步骤2,a根据所述配置文件路径读取配置文件,根据配置文件内容判定所述调用目标地址是否配置合理;当判定为不合理时,生成第一告警信息,生成包含所述第一告警信息的评测报告;

具体的,评测装置根据所述配置文件路径读取配置文件,根据配置文件内容判定所述调用目标地址是否配置合理;当判定为不合理时,生成第一告警信息,生成包含所述第一告警信息的评测报告;

上述方案中,所述根据配置文件内容判定所述调用目标地址是否配置合理包括:

根据所述配置文件,获取被调用服务器地址和预设的调用配置策略;

当所述调用目标地址与所述被调用服务器地址不相同时,判定所述调用目标地址不合理;和/或

当所述调用目标地址不符合预设的调用配置策略时,判定所述调用目标地址不合理。

这里,所述预设的调用配置策略包括但不限于“配置集群化服务器ip最小个数”、“不同机房服务器”、“不同网络区域服务器”、“不同isp服务器”等。通常,预设的调用配置策略一定包含在配置文件中,配置策略有唯一性标识做key,如果配置文件中特别说明调用配置策略,则缺省认为“配置集群化服务器ip最小个数”为0。例如:“server_ip:1.1.1.1,2.2.2.2”,其中server_ip为配置文件中预设的调用配置策略的唯一标识。

例如:评测装置获取到的中央服务器的集群调用程序信息表如表1所示,现针对表1中的第一条判断其调用目标地址是否配置合理。评测装置读取config1中集群服务器ip数据,判定与调用目标地址“4.4.4.1、4.4.4.2”是否一致,一致则判定合理,不一致则判定不合理;如果一致则认定调用目标地址配置为4.4.4.1、4.4.4.2;

此时,预先设置的评估策略为最小ip为n个,关系为不同机房。而实际调用目标地址中有2个ip,因此,如果n大于2,则实际的调用目标地址个数未满足预设评估策略要求,则判定不合理;如果n小于或等于2,则实际的调用目标地址个数满足预设评估策略要求,则判定合理。接着,评测装置判断ip地址4.4.4.1、4.4.4.2是否在相同的机房中,如果在相同机房中,则判定为不合理,否则,判定为合理。

由此,评测装置可以完成集群化系统对集群调用程序配置合理性的检查。

进一步的,为了更完善的评测集群化系统的可靠性,上述评测方法还可以包括:

步骤2,b通过模拟测试,判断所述集群化系统是否在所述容灾切换时限内完成容灾切换;当所述集群化系统未在所述容灾切换时限内完成容灾切换时,生成第二告警信息,生成包含所述第二告警信息的评测报告;

具体的,评测装置可通过实际的测试过程,判断所述集群化系统是否在所述容灾切换时限内完成容灾切换;当所述集群化系统未在所述容灾切换时限内完成容灾切换时,生成第二告警信息,生成包含所述第二告警信息的评测报告;

其中,所述通过模拟测试判断所述集群化系统是否在所述容灾切换时限内完成容灾切换包括:

分别指定所述调用目标地址中任一个地址所指向的服务器主动屏蔽所述调用来源地址发来的请求;

观察集群化系统是否将所述请求切换至所述调用目标地址中其它地址所指向服务器;

当所述集群化系统将所述请求切换至所述调用目标地址中其它地址所指向服务器时,记录该切换过程所用的切换时间;

当所述调用目标地址中所有地址所指向的服务器均被指定过,每一次请求都被切换且对应的切换时间小于或等于所述容灾切换时限时,判断所述集群化系统在所述容灾切换时限内完成容灾切换;

否则,所述集群化系统未在所述容灾切换时限内完成容灾切换。

例如,评测装置获取到的中央服务器的集群调用程序信息表如表1所示,现针对表1中的第一条进行测试判断。评测装置在ip地址为4.4.4.1的服务器上屏蔽来自ip地址为1.1.1.1、应用服务名称为应用1的调用请求访问,并记录时间;监听ip地址为4.4.4.2的服务器上的访问日志,确认上述访问请求到达备份服务器4.4.4.2处的时间;计算本次切换时间,对比集群调用程序信息表中的容灾切换时限,如果小于或等于该容灾切换时限,则认定本次容灾切换在设定时限内完成,如果超过该容灾切换时限没有切换,则判定切换失败,认定容灾切换异常;然后,评测装置在ip地址为4.4.4.2的服务器上屏蔽来自ip地址为1.1.1.1、应用服务名称为应用1的调用请求访问,并记录时间;监听ip地址为4.4.4.1的服务器上的访问日志,确认上述访问请求到达备份服务器4.4.4.1处的时间;计算本次切换时间,对比集群调用程序信息表中的容灾切换时限,如果小于或等于该容灾切换时限,则认定本次容灾切换在设定时限内完成,如果超过该容灾切换时限没有切换,则判定切换失败,认定容灾切换异常;如果两次切换均在设定时限内完成,则判定集群化系统容灾能力正常。

特别的,本步骤2b可以完成对集群化系统容灾能力的测评,并不依赖于步骤2a,故在一些实施例中,评测装置可跳过步骤2a,直接执行步骤2b;当然,在一些实施例中,评测装置可仅执行步骤2a,跳过步骤2b。

步骤3,输出评测报告。

具体的,评测装置根据评测的情况,输出已生成的评测报告。

例如,评测装置按照上述方案检测到异常即得到告警信息,则输出告警信息,而当其未检测到异常时,评测报告可以为每个环节正常的评测结果及评测过程的数据。

使用上述实施例提供的集群化系统的评测方法,可以及时发现集群化系统对于集群调用程序存在哪些配置错漏,同时,可实际检测集群化系统的容灾能力,及时发现容灾能力的不足;从而故障未发生时,提前预防,降低故障发生的风险,提高集群化系统的可靠性。

图2是本发明实施例提供的集群化系统的评测装置的组成结构示意图,如图2所示,该评测装置包括:信息表获取模块201、配置判定模块202和/或容灾测试模块203、以及报告输出模块204;其中,

信息表获取模块201,用于获取中央服务器的集群调用程序信息表,所述集群调用程序信息表中包含:第一调用来源地址、第一应用服务名称、调用目标地址、配置文件路径、容灾切换时限;

配置判定模块202,用于根据所述配置文件路径读取配置文件,根据配置文件内容判定所述调用目标地址是否配置合理;当判定为不合理时,生成第一告警信息,生成包含所述第一告警信息的评测报告;

容灾测试模块203,用于通过模拟测试,判断所述集群化系统是否在所述容灾切换时限内完成容灾切换;当所述集群化系统未在所述容灾切换时限内完成容灾切换时,生成第二告警信息,生成包含所述第二告警信息的评测报告;

报告输出模块204,用于输出评测报告,所述评测报告包含所述第一告警信息和/或所述第二告警信息。

进一步的,上述评测装置还包括信息表检查模块,所述信息表检查模块包括:

判断完整单元,用于在获取中央服务器的集群调用程序信息表后,根据所述集群化系统的访问日志,判断所述集群调用程序表是否完整;

第一跳转单元,用于当所述集群调用程序表完整时,跳转至所述配置判定模块202和/或容灾测试模块203;

第二跳转单元,当所述集群调用程序表不完整时,生成第三告警信息,生成包含所述第三告警信息的评测报告并跳转至所述报告输出模块204。。

更进一步的,上述方案中,所述判断完整单元包括:

提取子单元,用于提取预设时间内所述集群化系统的访问日志中的第二调用来源地址和第二应用服务名称;

判断子单元,用于当所述第一调用来源地址与所述第二调用来源地址一致并且所述第一应用服务名称与所述第二应用服务名称一致时,判断所述集群调用程序表是完整的;否则,判断所述集群调用程序表是不完整的。

上述方案中,上述配置判定模块202包括:

获取单元,用于根据所述配置文件,获取被调用服务器地址和预设的调用配置策略;

服务器判断单元,用于当所述调用目标地址与所述被调用服务器地址不相同时,判定所述调用目标地址不合理;和/或

策略判断单元,用于当所述调用目标地址不符合预设的调用配置策略时,判定所述调用目标地址不合理。

上述方案中,上述容灾测试模块203包括:

屏蔽单元,用于分别指定所述调用目标地址中任一个地址所指向的服务器主动屏蔽所述调用来源地址发来的请求;

观察单元,用于观察集群化系统是否将所述请求切换至所述调用目标地址中其它地址所指向服务器;

记录单元,用于当所述集群化系统将所述请求切换至所述调用目标地址中其它地址所指向服务器时,记录该切换过程所用的切换时间;

容灾判断单元,用于当所述调用目标地址中所有地址所指向的服务器均被指定过,每一次请求都被切换且对应的切换时间小于或等于所述容灾切换时限时,判断所述集群化系统在所述容灾切换时限内完成容灾切换;否则,所述集群化系统未在所述容灾切换时限内完成容灾切换。

上述各个模块及各个单元在实际应用中,均可由位于评测装置中的中央处理器(cpu)、微处理器(mpu)、数字信号处理器(dsp)、或现场可编程门阵列(fpga)实现。

上面描述的内容可以单独地或者以各种方式组合起来实施,而这些变型方式都在本发明的保护范围之内。

本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成,所述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现,相应地,上述实施例中的各模块/单元可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。本发明不限制于任何特定形式的硬件和软件的结合。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的物品或者设备中还存在另外的相同要素。

以上实施例仅用以说明本发明的技术方案而非限制,仅仅参照较佳实施例对本发明进行了详细说明。本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,均应涵盖在本发明的权利要求范围当中。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1