一种服务器状态检测方法及装置的制作方法

文档序号:7895838阅读:432来源:国知局
专利名称:一种服务器状态检测方法及装置的制作方法
技术领域
本发明涉及通信技术领域,尤其涉及一种服务器状态检测方法及装置。
背景技术
在CDMA2000-EVD0移动通讯系统中,当用户的接入终端(AT)初次接入接入网络 (AN)时,AN通常会对用户完成接入鉴权,即根据用户的帐户信息(包括用户名和密码)构 造鉴权请求消息(A12 Access Request),并发送给接入网认证、鉴权、计费(AN-AAA)服务 器,AN-AAA服务器收到鉴权请求消息后,根据用户账户合法性,反馈接入接受(A12 Access Accept)或接入拒绝(A12 Access Reject)的响应消息。如果AN-AAA服务器运行异常或所 在主机故障,那么,AN在发送鉴权请求消息后,将收不到响应消息。为了确定AN-AAA服务器的运行状态,现有技术中常用的方案是采用ping检测机 制,即定期向AN-AAA服务器发送ping请求,根据应答情况确定服务器状态,但这种方案只 能反应服务器主机的运行状态,不能反应服务器业务是否正常。另一种方案可采取构造检 测用户的方式,定期发送鉴权请求消息进行AN-AAA服务器状态的检测,但这样需要避免构 造的检测用户与实际商用用户重复,另外这种方法可能对AN-AAA服务器的统计带来一定 的干扰,实现和运维具有一定复杂度。另外,AN-AAA服务器故障检测还需要避免链路闪断而造成的误判,即在链路闪断 期间,AN-AAA服务器运行正常,但链路不通可能造成大量的鉴权失败,但链路可能很快又恢 复,在这种情况下如果认为AN-AAA服务器故障并上报告警,对于经常发生闪断的网络,则 会给运维带来不必要的麻烦。

发明内容
本发明实施例提供了 一种服务器状态检测方法及装置,用以实现利用实际业务对 服务器状态进行检测,在及时有效地确定服务器状态的前提下,使得检测到的服务器状态 更准确,避免链路闪断导致的误判。本发明实施例提供的一种服务器状态检测方法包括确定当前鉴权请求消息需要发往的处于正常状态的服务器,并向该服务器发送鉴 权请求,当该鉴权请求失败时,启动该服务器对应的故障检测定时器,并通过该服务器对应的鉴权失败计数器统 计向该服务器发送鉴权请求连续失败的次数,其中,当收到该服务器反馈的响应消息时,将 所述鉴权失败计数器清零;当故障检测定时器超时时,若所述鉴权失败计数器的计数值超过预设的第一阈 值,则将该服务器的状态更新为故障状态。本发明实施例提供的一种服务器状态检测装置包括服务器确定单元,用于确定当前鉴权请求消息需要发往的处于正常状态的服务 器;
鉴权处理单元,用于向所述服务器确定单元确定的处于正常状态的服务器发送鉴 权请求,当该鉴权请求失败时,启动该服务器对应的故障检测定时器,并通过该服务器对应 的鉴权失败计数器统计向该服务器发送鉴权请求连续失败的次数,其中,当收到该服务器 反馈的响应消息时,将所述鉴权失败计数器清零;当故障检测定时器超时时,若所述鉴权失 败计数器的计数值超过预设的第一阈值,则将该服务器的状态更新为故障状态。本发明实施例,确定当前鉴权请求消息需要发往的处于正常状态的服务器,并向 该服务器发送鉴权请求,当该鉴权请求失败时,启动该服务器对应的故障检测定时器,并通 过该服务器对应的鉴权失败计数器统计向该服务器发送鉴权请求连续失败的次数,其中, 当收到该服务器反馈的响应消息时,将所述鉴权失败计数器清零;当故障检测定时器超时 时,若所述鉴权失败计数器的计数值超过预设的第一阈值,则将该服务器的状态更新为故 障状态,从而实现了基于正常的业务处理,完成对AN-AAA等服务器实体的状态检测,既保 证及时有效的发现故障,还可以避免链路闪断导致的服务器状态的误判。


图1为本发明实施例提供的一种服务器状态检测方法的流程示意图;图2为本发明实施例提供的服务器列表示意图;图3为本发明实施例提供的当用户接入鉴权时,将可用的AN-AAA服务器加入可用 服务器集合的处理流程示意图;图4为本发明实施例提供的用户鉴权失败时的处理流程示意图;图5为本发明实施例提供的用户鉴权成功时的处理流程示意图;图6为本发明实施例提供的故障检测定时器超时时的处理流程示意图;图7为本发明实施例提供的故障恢复定时器超时时的处理流程示意图;图8为本发明实施例提供的一种服务器状态检测装置的结构示意图。
具体实施例方式本发明实施例提供了 一种服务器状态检测方法及装置,用以实现利用实际业务对 服务器状态进行检测,在及时有效地确定服务器状态的前提下,使得检测到的服务器状态 更准确,避免链路闪断导致的误判。下面结合附图对本发明实施例提供的技术方案进行说明。参见图1,本发明实施例提供的一种服务器状态检测方法包括步骤S101、确定当前鉴权请求消息需要发往的处于正常状态的服务器,并向该服务器 发送鉴权请求,当该鉴权请求失败时,启动该服务器对应的故障检测定时器,并通过该服务 器对应的鉴权失败计数器统计向该服务器发送鉴权请求连续失败的次数,其中,当收到该 服务器反馈的响应消息时,将所述鉴权失败计数器清零。S102、当故障检测定时器超时时,若所述鉴权失败计数器的计数值超过预设的第 一阈值,则将该服务器的状态更新为故障状态。较佳地,当在设定时间内,向同一处于正常状态的服务器发送鉴权请求消息的次 数超过预设的第一阈值,而没有收到该服务器反馈的响应消息时,将该服务器的状态更新 为故障状态,包括
当向一正常状态的服务器发送鉴权请求消息后,在预设的等待时间内没有收到该 服务器反馈的响应消息时,启动故障检测定时器,并开始统计向该服务器发送鉴权请求消 息的次数,直到故障检测定时器超时。若统计的向该服务器发送鉴权请求消息的次数超过 预设的第一阈值,并且,从故障检测定时器开始启动到故障检测定时器超时的时间内,没有 收到该服务器反馈的响应消息,则将该服务器的状态更新为故障状态。较佳地,该方法还包括当确定服务器的状态处于故障状态时,启动该服务器对应的故障恢复定时器,当 该故障恢复定时器超时时,将该服务器的状态更新为故障恢复状态。较佳地,该方法还包括当向处于故障恢复状态的服务器发送鉴权请求消息,并得到了该服务器反馈的响 应消息时,将该服务器的状态更新为正常状态。较佳地,该方法还包括确定当前鉴权请求消息需要发往的处于故障恢复状态的服务器,并向该服务器发 送鉴权请求,当该鉴权请求失败时,启动该服务器对应的故障检测定时器,并通过该服务器 对应的鉴权失败计数器统计向该服务器发送鉴权请求连续失败的次数,其中,当收到该服 务器反馈的响应消息时,将该服务器对应的鉴权失败计数器清零;当该服务器对应的故障检测定时器超时时,若该服务器对应的鉴权失败计数器的 计数值超过预设的第二阈值,则将该服务器的状态更新为故障状态。较佳地,根据当前维护的服务器列表中包含的服务器信息,选取当前鉴权请求消 息需要发往的服务器;其中,所述服务器信息,包括服务器的标识和状态。具体地,所述确定当前鉴权请求消息需要发往的处于正常状态的服务器,包括根 据当前维护的服务器列表中包含的服务器的标识和状态,选取当前鉴权请求消息需要发往 的处于正常状态的服务器;所述确定当前鉴权请求消息需要发往的处于故障恢复状态的服务器,包括根据 当前维护的服务器列表中包含的服务器的标识和状态,选取当前鉴权请求消息需要发往的 处于故障恢复状态的服务器。较佳地,当针对同一用户向处于正常状态或处于故障恢复状态的服务器发送鉴权 请求消息后,在预设时间内没有收到该服务器反馈的响应消息时,向另一处于正常状态或 故障恢复状态的服务器发送鉴权请求消息。较佳地,所述可用服务器列表中包含的每一服务器的信息包括服务器的IP地址、状态标志、告警上报标志、鉴权失败次数。本发明实施例中,以基于CDMA2000 EVDO系统中对AN-AAA服务器状态检测为例进 行说明,当然,本发明实施例提供的技术方案还可以应用到其他的基于请求/应答模式的 应用系统中的服务器状态的检测。一个AN可能与一个或多个AN-AAA服务器相连,如何确定当前AN-AAA服务器的运 行状态,以及如何在出现故障或故障恢复时及时反馈给运维人员,当需要发送鉴权请求消 息时,如何选择向可用的服务器发送,这些都是本发明实施例提供的技术方案可以解决的 问题。
本发明实施例中,对于向AN-AAA服务器发送一次或多次鉴权请求消息(A12 Access Request)后,并收到AN-AAA服务器反馈的响应消息的情况,称为一次鉴权成功,无 论反馈的响应消息中的信息是接受鉴权还是拒绝鉴权;对于向AN-AAA服务器发送一次或 多次鉴权请求消息(A12 Access Request)后,没有收到AN-AAA服务器反馈的响应消息的 情况,称为一次鉴权失败。本发明实施例中,基于实际业务对AN-AAA服务器服务状态进行检测。主要通过在 一定时间内AN-AAA服务器对A12鉴权连续失败的次数达到阈值时,则认为该AN-AAA服务 器为故障状态,并可以进一步提示告警。其中,当需要进行鉴权时,总是从非故障状态(即 正常状态和故障恢复状态)的AN-AAA服务器中进行选择,除非只有一个AN-AAA服务器。并 且,定期将故障状态的服务器设置为故障恢复状态,以使其重新获得被选择的机会,以保证 AN AAA服务器的故障消除后,AN能检测到该AN AAA服务器故障恢复。对于同一用户进行鉴权时,如果一次鉴权失败,则试图选择其他非故障状态的 AN-AAA服务器重新发送鉴权请求,以避免以下两种情况对于鉴权业务的影响正常状态的AN-AAA服务器可能发生故障;被置为故障恢复状态的AN-AAA服务器实际可能并未恢复。下面从七个方面详细描述本发明实施例的具体内容一、本发明实施例为AN-AAA服务器定义了三种状态正常状态-M-kkk服务器运行正常,可以正常地处理A12鉴权请求。故障状态=AN-AAA服务器运行异常、AN与该AN-AAA服务器的通信链路中断或 AN-AAA服务器所在的主机故障,该AN-AAA服务器已经不能处理A12鉴权请求。故障恢复状态=AN-AAA服务器发生故障已经过去一段时间,该AN-AAA服务器有可 能已经恢复正常,在此种状态下,可把A12鉴权消息发送给该AN-AAA服务器,以检测其是否 已经恢复正常。二、本发明实施例定义了两种最大检测失败次数阈值第一阈值为AN-AAA服务器处于正常状态条件下,使用的最大检测失败次数阈 值。如果在故障检测定时范围内,发往AN-AAA服务器的鉴权请求连续失败次数达到此阈 值,则认为该AN-AAA服务器故障。第二阈值为AN-AAA服务器处于故障恢复状态条件下,使用的最大检测失败次数 阈值。如果在故障检测定时范围内,发往AN-AAA服务器的鉴权请求连续失败次数达到此阈 值,则认为该AN-AAA服务器故障。因为对于处于故障恢复状态的AN-AAA服务器来说,再次鉴权失败的情况下, AN-AAA服务器仍然处于故障状态的可能性大,所以第二阈值应该小于或等于第一阈值,例 如第一阈值设置为10 (次),第二阈值设置为5 (次)。三、本发明实施例提供了两种定时器故障检测定时器为每个AN-AAA服务器配置一个对应的故障检测定时器。当一次 发往AN-AAA服务器的用户鉴权失败时,启动该AN-AAA服务器对应的故障检测定时器,当该 定时器超时时,如果鉴权请求连续失败次数达到第一阈值,则将该AN-AAA服务器置于故障 状态。故障恢复定时器为每个AN-AAA服务器配置一个对应的故障恢复定时器。当确定AN-AAA服务器处于故障状态时,启动该AN-AAA服务器对应的故障恢复定时器,当该定时器 超时时,将对应的AN-AAA服务器置于故障恢复状态,以使该AN-AAA服务器重新得到鉴权选 择。故障检测定时器和故障恢复定时器这两种定时器具有不同的定时时长,故障恢复 定时器的定时时长应该远大于故障检测定时器的定时时长。例如,故障检测定时器的定时 时长配置为20分钟,故障恢复定时器的定时时长配置为2小时。四、本发明实施例提供了 AN-AAA服务器三种状态的转换条件1、正常状态转换到故障状态在AN-AAA服务器正常状态下,出现一次鉴权失败 时,即启动故障检测定时器,在定时器超时时,如果连续鉴权失败次数达到第一阈值,则将 该AN-AAA服务器的状态转到故障状态。2、故障状态转换到故障恢复状态在AN-AAA服务器转入故障状态时,启动故障恢 复定时器,在故障恢复定时器超时时,将该AN-AAA服务器的状态置为故障恢复状态。3、故障恢复状状态转换到正常状态在AN-AAA服务器处于故障恢复状态下,成功 完成一次鉴权请求,则置该AN-AAA服务器的状态为正常状态。4、故障恢复状态转换到故障状态在AN-AAA服务器处于故障恢复状态下,若启动 了故障检测定时器,则在该定时器超时时,若鉴权请求连续失败次数达到第二阈值,则置该 AN-AAA服务器的状态为故障状态。五、本发明实施例提供了 一种AN-AAA服务器列表,每个AN-AAA服务器在该列表中 对应了一条记录,每条记录的内容包括IP地址用于记录AN-AAA服务器的IP地址。状态标志用于记录AN-AAA服务器的运行状态为“故障状态”、“故障恢复状态”或 “正常状态”,该标志初始化为“正常状态”;告警上报标志用于记录是否上报过AN-AAA服务器处于“故障状态”的告警信息。 告警上报标志初始化为“未上报”,当检测到AN-AAA服务器处于故障状态时,则向告警装置 上报告警信息,并置此标志“已上报”。鉴权失败计数器用于记录发往AN-AAA服务器的鉴权请求连续失败的次数。每当 发生一次鉴权失败,则计数器加1,每当发生一次鉴权成功,则计数器复位为0。例如,设检测周期是1小时(即故障检测定时器的定时时长是1小时),第一阀值 是20。如果在这1小时内发送了 30次的鉴权请求消息,前5次成功,后25次均没有响应, 即鉴权请求连续失败的次数为25次,则认为服务器故障;但如果前25次发送的鉴权请求消 息均没有响应,后5次发送的鉴权请求消息有响应,虽然鉴权请求连续失败的次数也为25 次,但仍然认为这个服务器是正常的。在具体算法实现上,每一次鉴权失败,鉴权失败计数 器加1,而每收到一次响应,就会把鉴权失败计数器清0,重新开始计数,在故障检测定时器 超时的那一刻,读取该鉴权失败计数器的计数值,并将该值与第一阈值进行比较,以判断服 务器是否故障。其中,若向服务器发送了一次鉴权请求消息,在规定时间内没有收到该服务器反 馈的响应消息,则确定发生了一次的鉴权失败。同理,若向服务器发送了一次鉴权请求消 息,在规定时间内收到了该服务器反馈的响应消息,则确定发生了一次的鉴权成功。六、本发明实施例提供了接入鉴权时,选择AN-AAA服务器可用集合的原则
如果AN-AAA服务器列表中只有一个AN-AAA服务器的信息,则无论其状态标志如 何,都将选择该AN-AAA服务器加入AN-AAA服务器可用集合;否则,将AN-AAA服务器列表中所有状态标志为“正常状态”或“故障恢复状态”的AN-AAA 服务器加入AN-AAA服务器可用集合。在确定当前鉴权请求消息需要发往的服务器时,从AN-AAA服务器可用集合中选 择服务器。当从AN-AAA服务器可用集合中选择服务器时,具体地,可以采用负荷分担的方 式,根据AN-AAA服务器可用集合中的AN-AAA服务器的权重,选择服务器,其中,每个AN-AAA 服务器的权重,可以根据AN-AAA服务器的负荷分担情况实时地进行调整。综上,基于以上定义,本发明实施例提供的方案流程如下当选择一个AN-AAA服务器处理某一用户的一次鉴权失败时,在AN-AAA服务器列 表中,将该AN-AAA服务器对应的鉴权失败计数器加1 ;检查是否已经启动该AN-AAA服务 器对应的故障检测定时器,如果还没有启动,则启动该故障检测定时器;重新从除去当前 AN-AAA服务器之外的AN-AAA服务器可用集合中选择一个AN-AAA服务器,处理该用户的鉴 权请求。当AN-AAA服务器成功完成一次鉴权请求(收到了 AN-AAA服务器的响应)时,则 将该AN-AAA服务器的鉴权失败计数嚣清0,并检查是否启动了该AN-AAA服务器对应的故障 检测定时器,如果启动了,则停止它;判断该AN-AAA服务器当前状态如果是故障恢复状态, 则置该AN-AAA服务器的状态标志为正常状态;检查该AN-AAA服务器的告警上报标志,如果 是“已上报”,则通知告警装置该AN-AAA服务器故障已经恢复,并复位该标志为“未上报”。当AN-AAA服务器的故障检测定时器超时,当前状态标志如果为正常状态,则判断 鉴权失败计数嚣计数值是否大于第一阈值,如果是,则置对应的AN-AAA服务器状态标志为 “故障状态”,通知告警装置该AN-AAA服务器处于故障状态,置告警上报标志为“已上报”,并 启动故障恢复定时器,鉴权失败计数嚣清0 ;否则,仅执行鉴权失败计数嚣清0,保持当前正 常状态。当前状态标志如果是“故障恢复状态”,则判断鉴权失败计数嚣计数值是否大于第 二阈值,如果是,则置对应的AN-AAA服务器状态标志为“故障状态”,并启动故障恢复定时 器,鉴权失败计数嚣清0 ;否则,仅执行鉴权失败计数嚣清0,保持当前故障恢复状态。当AN-AAA服务器的故障恢复定时器超时,将对应AN-AAA服务器当前的状态标志 置为“故障恢复状态”。参见图2,是本发明实施例提供的AN-AAA服务器列表的示意图。如图2所示,当 前系统中配置了 4个AN-AAA服务器,其中,第一个AN-AAA服务器处于正常状态;第二个 AN-AAA服务器,已经连续5次用户鉴权失败,但因为没有达到最大检测失败次数的第一阈 值(例如10次),而没有置为故障状态;第三个AN-AAA服务器则因为在规定时间内连续失 败达到10次,达到了最大检测失败次数的第一阈值,而置为“故障状态”,并通知告警装置 显示告警;第四个AN-AAA服务器,在故障检测发生两小时后,被恢复为故障恢复状态。图3示出了接入鉴权时选择AN-AAA服务器加入AN-AAA服务器可用集合的处理流 程,具体包括步骤S201、判断AN-AAA服务器列表中是否只有1条记录,如果是,则执行步骤S202,否 则执行步骤S203 ;S202、把这唯一的AN-AAA服务器加入AN-AAA服务器可用集合中;
S203、遍历整个AN-AAA服务器列表,把所有状态为“正常状态”或“故障恢复状态 “的AN-AAA服务器加入AN-AAA服务器可用集合中。图4示出了用户鉴权失败时的处理流程,包括步骤S301 确定在设定时间内,发送给AN-AAA服务器的规定次数的鉴权请求消息均无 响应(收到鉴权失败的通知); S302 将AN-AAA服务器列表中该AN-AAA服务器对应的鉴权失败计数器加1。S303 判断该AN-AAA服务器对应的故障检测定时器是否已经启动,如果是,则执 行步骤S304,否则结束流程。S304 启动该AN-AAA服务器对应的故障检测定时器。图5描述了用户鉴权成功时的处理流程,具体包括步骤S401 向AN-AAA服务器发送鉴权请求后,收到该AN-AAA服务器的响应消息(收到 用户鉴权成功通知);S402 将AN-AAA服务器列表中该AN-AAA服务器对应的鉴权失败计数器清0。S403 判断该AN-AAA服务器对应的故障检测定时器是否已经启动,如果是,则执 行步骤S404,否则转到步骤S405。S404 停止该AN-AAA服务器对应的故障检测定时器;S405 判断AN-AAA服务器列表中该AN-AAA服务器对应的状态标志是否是“故障 恢复状态”,如果是,则执行步骤S406-S407的处理;否则结束流程。S406 判断AN-AAA服务器列表中该AN-AAA服务器对应的告警上报标志是否为“已 上报”,如果是,则执行步骤S407,否则结束流程。S407 通知告警装置,该AN-AAA服务器故障已经恢复,并将该AN-AAA服务器对应 的告警上报标志恢复为“未上报”。图6描述了故障检测定时器超时时的处理流程,具体包括步骤S501 =AN-AAA服务器对应的故障检测定时器超时。S502 判断该AN-AAA服务器对应的状态标志是否是正常状态,如果是则进行步骤 S503-S505、S508的处理;否则(处于故障恢复状态),进行步骤S506-S508的处理。S503 判断该AN-AAA服务器对应的鉴权失败计数器计数值是否大于最大检测失 败次数的第一阈值,如果是,则继续执行步骤S504,否则转到执行步骤S508。S504 置该AN-AAA服务器对应的状态标志为“故障状态”,并启动该AN-AAA服务器 对应的故障恢复定时器。S505 通知告警装置,该AN-AAA服务器处于“故障状态”,将该AN-AAA服务器对应 的告警上报标志置为“已上报”。S506 判断该AN-AAA服务器对应的鉴权失败计数器计数值是否大于最大检测失 败次数的第二阈值,如果是则继续执行步骤S507,否则转为执行步骤S508。S507 置该AN-AAA服务器对应的状态标志为“故障状态”,并启动该AN-AAA服务器 对应的故障恢复定时器。S508 将该AN-AAA服务器对应的鉴权失败计数器清0。图7描述了故障恢复定时器超时时的处理流程,具体包括步骤;S601 =AN-AAA服务器对应的故障恢复定时器超时。
S602 将AN-AAA服务器列表中该AN-AAA服务器对应的状态标志由“故障状态”改 为“故障恢复状态”。参见图8,本发明实施例提供的一种服务器状态检测装置包括服务器确定单元101,用于确定当前鉴权请求消息需要发往的处于正常状态的服 务器。鉴权处理单元102,用于向所述服务器确定单元确定的处于正常状态的服务器发 送鉴权请求,当该鉴权请求失败时,启动该服务器对应的故障检测定时器,并通过该服务器 对应的鉴权失败计数器统计向该服务器发送鉴权请求连续失败的次数,其中,当收到该服 务器反馈的响应消息时,将所述鉴权失败计数器清零;当故障检测定时器超时时,若所述鉴 权失败计数器的计数值超过预设的第一阈值,则将该服务器的状态更新为故障状态。较佳地,所述鉴权处理单元102,当确定服务器的状态处于故障状态时,启动该服 务器对应的故障恢复定时器,当该故障恢复定时器超时时,将该服务器的状态更新为故障 恢复状态。较佳地,所述鉴权处理单元102,当向处于故障恢复状态的服务器发送鉴权请求消 息,并得到了该服务器反馈的响应消息时,将该服务器的状态更新为正常状态。较佳地,所述服务器确定单元101,还用于确定当前鉴权请求消息需要发往的处于 故障恢复状态的服务器;所述鉴权处理单元102,还用于向所述服务器确定单元确定的处于故障恢复状态 的服务器发送鉴权请求,当该鉴权请求失败时,启动该服务器对应的故障检测定时器,并通 过该服务器对应的鉴权失败计数器统计向该服务器发送鉴权请求连续失败的次数,其中, 当收到该服务器反馈的响应消息时,将该服务器对应的鉴权失败计数器清零;当该服务器 对应的故障检测定时器超时时,若该服务器对应的鉴权失败计数器的计数值超过预设的第 二阈值,则将该服务器的状态更新为故障状态。较佳地,所述服务器确定单元101,根据当前维护的服务器列表中包含的服务器信 息,选取当前鉴权请求消息需要发往的处于正常状态或处于故障恢复状态的服务器;其中, 所述服务器信息,包括服务器的标识和状态。较佳地,所述鉴权处理单元102,当针对同一用户向处于正常状态或处于故障恢复 状态的服务器发送鉴权请求消息后,在预设时间内没有收到该服务器反馈的响应消息时, 向另一处于正常状态或故障恢复状态的服务器发送鉴权请求消息。较佳地,本发明实施例中所述的服务器状态检测装置,可以为AN,或设置在AN中。综上所述,本发明实施例提供的技术方案,可以基于正常的业务处理,完成对 AN-AAA服务器实体的故障与故障恢复的检测,既保证及时有效的发现AN-AAA服务器故障 及故障恢复,同时通过设置合理的最大检测失败次数的阈值和故障检测定时器的时长,避 免链路闪断带来的误判;并通过鉴权失败情况下AN-AAA服务器的再次选择和鉴权请求,最 大程度地降低故障和故障恢复检测可能对正常鉴权业务本身的影响。本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序 产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实 施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机 可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程 图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一 流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算 机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理 器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生 用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能 的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特 定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指 令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或 多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计 算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或 其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图 一个方框或多个方框中指定的功能的步骤。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精 神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围 之内,则本发明也意图包含这些改动和变型在内。
权利要求
1.一种服务器状态检测方法,其特征在于,该方法包括确定当前鉴权请求消息需要发往的处于正常状态的服务器,并向该服务器发送鉴权请 求,当该鉴权请求失败时,启动该服务器对应的故障检测定时器,并通过该服务器对应的鉴权失败计数器统计向 该服务器发送鉴权请求连续失败的次数,其中,当收到该服务器反馈的响应消息时,将所述 鉴权失败计数器清零;当故障检测定时器超时时,若所述鉴权失败计数器的计数值超过预设的第一阈值,则 将该服务器的状态更新为故障状态。
2.根据权利要求1所述的方法,其特征在于,该方法还包括当确定服务器的状态处于故障状态时,启动该服务器对应的故障恢复定时器,当该故 障恢复定时器超时时,将该服务器的状态更新为故障恢复状态。
3.根据权利要求2所述的方法,其特征在于,该方法还包括当向处于故障恢复状态的服务器发送鉴权请求消息,并得到了该服务器反馈的响应消 息时,将该服务器的状态更新为正常状态。
4.根据权利要求1、2或3所述的方法,其特征在于,该方法还包括确定当前鉴权请求消息需要发往的处于故障恢复状态的服务器,并向该服务器发送鉴 权请求,当该鉴权请求失败时,启动该服务器对应的故障检测定时器,并通过该服务器对应的鉴权失败计数器统计向 该服务器发送鉴权请求连续失败的次数,其中,当收到该服务器反馈的响应消息时,将该服 务器对应的鉴权失败计数器清零;当该服务器对应的故障检测定时器超时时,若该服务器对应的鉴权失败计数器的计数 值超过预设的第二阈值,则将该服务器的状态更新为故障状态。
5.根据权利要求4所述的方法,其特征在于,所述确定当前鉴权请求消息需要发往的 处于正常状态的服务器,包括根据当前维护的服务器列表中包含的服务器的标识和状态, 选取当前鉴权请求消息需要发往的处于正常状态的服务器;所述确定当前鉴权请求消息需要发往的处于故障恢复状态的服务器,包括根据当前 维护的服务器列表中包含的服务器的标识和状态,选取当前鉴权请求消息需要发往的处于 故障恢复状态的服务器。
6.根据权利要求5所述的方法,其特征在于,当针对同一用户向处于正常状态或处于 故障恢复状态的服务器发送鉴权请求消息后,在预设时间内没有收到该服务器反馈的响应 消息时,向另一处于正常状态或故障恢复状态的服务器发送鉴权请求消息。
7.一种服务器状态检测装置,其特征在于,该装置包括服务器确定单元,用于确定当前鉴权请求消息需要发往的处于正常状态的服务器;鉴权处理单元,用于向所述服务器确定单元确定的处于正常状态的服务器发送鉴权请 求,当该鉴权请求失败时,启动该服务器对应的故障检测定时器,并通过该服务器对应的鉴 权失败计数器统计向该服务器发送鉴权请求连续失败的次数,其中,当收到该服务器反馈 的响应消息时,将所述鉴权失败计数器清零;当故障检测定时器超时时,若所述鉴权失败计 数器的计数值超过预设的第一阈值,则将该服务器的状态更新为故障状态。
8.根据权利要求7所述的装置,其特征在于,所述鉴权处理单元,当确定服务器的状态处于故障状态时,启动该服务器对应的故障恢复定时器,当该故障恢复定时器超时时,将该 服务器的状态更新为故障恢复状态。
9.根据权利要求8所述的装置,其特征在于,所述鉴权处理单元,当向处于故障恢复状 态的服务器发送鉴权请求消息,并得到了该服务器反馈的响应消息时,将该服务器的状态 更新为正常状态。
10.根据权利要求7、8或9所述的装置,其特征在于,所述服务器确定单元,还用于确定当前鉴权请求消息需要发往的处于故障恢复状态的 服务器;所述鉴权处理单元,还用于向所述服务器确定单元确定的处于故障恢复状态的服务器 发送鉴权请求,当该鉴权请求失败时,启动该服务器对应的故障检测定时器,并通过该服务 器对应的鉴权失败计数器统计向该服务器发送鉴权请求连续失败的次数,其中,当收到该 服务器反馈的响应消息时,将该服务器对应的鉴权失败计数器清零;当该服务器对应的故 障检测定时器超时时,若该服务器对应的鉴权失败计数器的计数值超过预设的第二阈值, 则将该服务器的状态更新为故障状态。
11.根据权利要求10所述的装置,其特征在于,所述服务器确定单元,根据当前维护的 服务器列表中包含的服务器信息,选取当前鉴权请求消息需要发往的处于正常状态或处于 故障恢复状态的服务器;其中,所述服务器信息,包括服务器的标识和状态。
12.根据权利要求11所述的装置,其特征在于,所述鉴权处理单元,当针对同一用户向 处于正常状态或处于故障恢复状态的服务器发送鉴权请求消息后,在预设时间内没有收到 该服务器反馈的响应消息时,向另一处于正常状态或故障恢复状态的服务器发送鉴权请求 消息。
全文摘要
本发明公开了一种服务器状态检测方法及装置,用以实现利用实际业务对服务器状态进行检测,在及时有效地确定服务器状态的前提下,使得检测到的服务器状态更准确,避免链路闪断导致的误判。本发明提供的一种服务器状态检测方法包括确定当前鉴权请求消息需要发往的处于正常状态的服务器,并向该服务器发送鉴权请求,当该鉴权请求失败时,启动该服务器对应的故障检测定时器,并通过该服务器对应的鉴权失败计数器统计向该服务器发送鉴权请求连续失败的次数,其中,当收到该服务器反馈的响应消息时,将所述鉴权失败计数器清零;当故障检测定时器超时时,若所述鉴权失败计数器的计数值超过预设的第一阈值,则将该服务器的状态更新为故障状态。
文档编号H04L29/06GK102075380SQ201010592669
公开日2011年5月25日 申请日期2010年12月16日 优先权日2010年12月16日
发明者佟志新, 喻磊, 王成, 翟来国, 魏铮 申请人:中兴通讯股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1