提高通信设备可靠性的方法及装置的制作方法

文档序号:7685332阅读:233来源:国知局
专利名称:提高通信设备可靠性的方法及装置的制作方法
技术领域
本发明涉及通信技术领域,尤其涉及提高通信设备可靠性的方法及装置。
技术背景无线系统中,基站的安装地点大部分都在比较偏远的地方,在升级或更 改配置数据的情况下,可能出现瘫机、频繁复位的情况,此时需要工作人员 到近端处理,因此耗费较大的人力成本,且影响到问题解决的及时性,影响 运营商的网络运行。此种情况在软件版本升级时尤其容易出现,目前不少系 统中采用了死机、异常日志的记录功能,但是没有对应的自动处理功能。在对现有技术的研究和实践过程中,发明人发现现有技术至少存在以下问题基站升级复位后出现异常情况或者在初始态、运行态出现异常情况时, 不能自动尝试恢复,需要工作人员去近端处理。发明内容本发明实施例要解决的技术问题是提供提高通信设备可靠性的方法及装 置,能够使通信设备在出现异常情况、远端失去联系时,自动尝试恢复业务 或远端维护通道,尽可能减少维护的人力成本。为解决上述技术问题,本发明实施例是通过以下技术方案实现的本发明实施例提供了一种提高通信设备可靠性的方法,包括 获取通信设备出现异常的原因;所述原因为升级复位后出现的异常情况,若当前运行的配置基线尚未确 认,启动定时器,若定时器到达前恢复正常,则中止定时器,否则定时器到 达后触发配置基线自动回退至保存的有效配置基线;所述原因为单板连续异常复位,统计连续异常复位的次数,根据所述次 数是否超过预设值选择软件版本并加载。本发明实施例还提供了一种提高通信设备可靠性的获取装置,包括获取单元,用于获取通信设备出现异常的原因;升级复位处理单元,用于从所述获取单元接收的异常原因为升级复位后 出现的异常情况时,若当前运行的配置基线尚未确认,则启动定时器,若定 时器到达前恢复正常,则中止定时器,否则定时器到达后触发配置基线自动回退至保存的有效配置基线;连续复位处理单元,用于从所述获取单元接收的复位原因为单板连续异 常复位,统计连续异常复位的次数,根据若所述次数是否超过预设值选择软 件版本并加载。以上技术方案可以看出,当通信设备出现异常情况、远端失去联系时,通 信设备能够自动回退,尝试恢复业务或远端维护通道,方便维护人员远端处 理、尽可能减少工程人员去近端的维护人力成本。


图1为本发明实施例一提供的方法流程图; 图2为本发明实施例二提供的方法流程图; 图3为本发明实施例三提供的方法流程图; 图4为本发明实施例四提供的方法流程图; 图5为本发明实施例五提供的方法流程图; 图6为本发明实施例六提供的装置示意图。
具体实施方式
本发明实施例提供了 一种提高通信设备可靠性的方法及装置,用于通信 设备升级后无法维护、通信设备配置数据更改等引起通信设备连续异常复位 使得远端失去联系时,通信设备能自动尝试恢复业务或远端维护通道,方便 维护人员远程处理,尽可能减少工程人员去近端的维护人力成本。上述通信 设备包括但不限于远端通信设备,如基站、无线小基站或其他类似设备。为了使本发明的技术方案更加清楚明白,下面以通信设备为基站为例进 4亍详细i兌明场景一、基站升级复位的异常处理。参见图1,为本发明实施例一提供的方法流程图。S101:基站升级复位后发生异常情况,例如基站和网管中心失去联系, 此时若基站保存有已经确认的有效CB ( Configuration Base Line,配置基线), 且当前运行的CB尚未确认,则启动定时器。S102:在定时器到达之前,判断是否满足下述条件中任意一个定时器中 止触发条件,如是,执行S104,否则,进入S103。(1 )远端维护通道能连通,该连通性可通过PING (Packet Internet Groper, 包因特网探索程序)命令来检测,包括检测配置OMIP ( Operation and Maintenance IP Address"才喿作维护IPi也址)或BootP ( Bootstrap Protocol,加 载协议)服务器获取的IP。(2) 维护台登陆成功时中止定时器,包括从近端或远端维护通道登陆。(3) 业务通道建立成功。例如NCP (Network Core Protocol,网络核心 协议)可用。S103:在定时器到达后,触发CB (Configuration Baseline,配置基线) 自动回退至保存的有效配置基线,具体包括(1) 上报CB回退告警;(2) 记录当前运行的CB为回退前临时CB,用于后续定位问题;(3) 自动回退到最近的有效CB,如果当前运行的CB已经是最近一个 有效CB则不再回退。可选的,也可以自动回退到保存的任意一个 配置基线。S104:中止定时器。本实施例中,所述定时器的启动时间大于BootP尝试启动一次的时间。通过该实施例,可实现在基站升级后异常复位时尝试自动恢复远端维护 通道,方便维护。场景二、初始化连续异常复位。初始化阶段涉及到芯片初始化、芯片加 载以及高层模块自身的初始化。此过程中有的高层模块需要读取数据配置文件中配置数据,这些读取操作都是从配置文件读取信息保存到内存的操作, 导致死机的概率很低。但是由于模块初始化没有完成,监控模块很可能不能 记录下异常复位原因,甚至监控模块本身就异常了。这种场景下的异常复位 不包括软件内部处理调用的复位、升级、外部因素引起的掉电复位、主备倒 换、按复位键等引起的复位。
参见图2,为本发明实施例二提供的方法流程图。
S201:引导程序Booter对非主控板的高层应用软件版本(通常称为Flash 版本)初始化复位次数进行累计,不超过预设的次数, 一般情况下该预设次 数为3次,则直接加载Flash版本,流程结束;否则,累计次数超过预设次数 时,认为Flash版本出现异常复位情况,清零该计数,并加载安全版本。加载 安全版本时,单板复位重启,将进入Flash版本,并重新开始计数,执行S201。
其中,安全版本为保证单板能正常启动以及通讯等基本功能的软件版本, 一般写在BOOTROM中,Flash版本是包含所有高层应用软件的高层软件版 本,是完整功能的软件版本,因此Flash版本中包含了安全版本中的功能。
S202:进行版本校验,根据版本校验结果判断是否需要更新Flash版本, 如果是,执行S203;否则,进入步骤S206。例如当版本校验结果为当前Flash 版本和基站Flash主区版本不一致时,需要更新Flash版本,如果一致,则不 需要更新Flash版本。
S203:更新并重新启动,进入S204。
S204: Flash版本高层软件在初始化完成前,单板是否复位重启,如果 是,返回S201;否则,执行S205。
S205:高层模块初始化完成后、清零该计数,结束流程。 S206:进入安全版本,结束流程;或者返回S202。
通过该实施例可实现非主控板初始化异常复位时,尝试恢复业务,尽可 能避免工作人员去近端维护。
实施例三、可参见图3,为本发明实施例三提供的方法流程图。S301: Booter对主控板的Flash版本初始化复位次数进行累计,不超过预 设次数例如3次,认为该复位为正常复位,则加载Flash版'本,流程结束;否贝'J, 认为Flash版本出现异常复位情况,清零该计数,并加载安全版本。加载安全 版本时,单板复位重启,将进入Flash版本,并重新开始计数,执行S301。
S302:进行版本校验,根据版本校验结果判断是否需要更新Flash版本。 如果是,进入S303;否则,进入S306。例如,判断主控板Flash版本和基站 主区Flash版本是否一致,若一致,则不需要更新Flash版本,若不一致,需 要更新Flash版本。
S303:更新并重新启动,进入S304。
S304: Flash版本高层软件在初始化完成前,单板是否复位重启,若是, 返回S301;否则,执行S305。
S305:高层模块全部初始化完成后,清零该计数,结束流程。
S306:置基站的主区Flash版本不可用,以基站备区Flash版本启动,也就 是激活基站备区Flash版本;如果基站备区Flash版本也不可用或者主控板的版 本和基站备区版本相同,则清零初始化异常计数,加载当前的Flash版本,让 其继续异常复位,或者,停留在安全版本。
本实施例中,考虑到高层模块初始化读取数据配置文件到内存发生异常 复位的可能性比较小,因此主要是针对底层芯片初始化或底层软件启动导致 的异常复位,采取使用备区版本的方式尝试尽快恢复业务。
对于初始化过程中外部引起的复位的情况,如掉电复位、按复位按钮 复位、串口CTRX复位,考虑到这种情况反复出现的可能性几乎没有,因此情 况仍然当作初始化异常处理。
通过该实施例可实现主控板初始化异常复位时,尝试恢复业务,尽可能 避免工作人员去近端维护。
场景三、运行态异常复位。此时模块已经完成初始化,开始接受消息并 进行处理,加载数据配置文件中的配置数据,特别是对底层进行数据配置。 在此阶段发生的异常复位,监控模块基本都能记录异常复位原因。这种场景下的异常复位可以不包括软件内部处理调用的复位、升级、外部因素引起的 掉电复位、主备倒無、按复位键等引起的复位。
参见图4,为本发明实施例四提供的方法流程图。
S401: Booter判断主控单板连续运行态异常复位的次数是否超过预设的 次数。若是,执行步骤S405,否则,执行S402。
主控单板连续运行预设的时间后,例如l小时,异常复位次数清零。
S402:进入Flash版本,转入S403。
S403:如果当前CB没有确i人且存在最近一个确认的有效CB,则仅启动 公共通信、监控模块、及BSP (Board Support package,板级支持包),该BSP 主要提供包括单板启动、设备驱动等方面的功能。调用函数回退CB到最近一 个确认的有效CB,异常复位次数清零,回退启动后上报CB回退告警。否则, 若没有确认的有效CB, ^执行S404 。
S404:没有确认的有效CB,则不加载配置文件启动,异常复位次数清零, 流程结束。
S405:将运行态异常复位次数清零,进入Flash版本,继续运行。由于此 时处于运行态,说明Flash版本是可用的,连续异常复位可能是因为代码的错 "i吴
本实施例中,(i)软件内部处理调用的复位、升级、外部因素引起的掉
电复位、主备倒换、按复位键引起的复位,异常复位次数将被清零。(2)异常 复位次数由监控模块起来后根据复位原因累计,只累计除"软件内部处理调用 的复位、升级、外部因素引起的掉电复位、主备倒换、按复位键引起的复位 之外的异常复位次数。(3)如果CB未确认,包括下载新的数据配置文件、用 户在线修改数据配置、版本升级三种情况,则要求上报CB未确认告警,设置 定时器,若逻辑小区可用且连续运行至定时期到达,则系统自动调用函数将 该未确认的CB回退到最近一个确认的有效CB,从而实现系统自动确认CB。
通过该实施例可实现主控单板运行态异常复位时,尝试自动恢复业务, 尽可能避免工作人员去近端维护。参见图5,为本发明实施例五提供的方法流程图。
S501:统计非主控板运行态连续异常复位次数,若该次数超过预设的次 数,则执行S502。
S502:切换到安全版本,例如切换到BOOTROM版本并停留在安全版本。 本实施例中,(1 )软件内部处理调用的复位、升级、外部因素引起的掉 电复位,主备倒换、复位键复位异常复位次数将被清0。 (2)异常复位次数由 监控模块起来后根据复位原因累计,只累计除"软件内部调用处理的复位、升 级、外部因素引起的掉电复位、主备倒换、复位键复位,,之外的异常复位次数。
本实施例可实现在非主控板在异常复位时,尝试自动恢复业务,尽可能 避免工作人员去近端维护。
以上实施例描述了在不同场景下,本发明的方法流程图,下面对本发明 实施例提供的系统示意图进行详细描述。
参见图6,为本发明实施例六提供的装置示意图,包括
获取单元601,用于获取基站出现异常的原因。
升级复位处理单元602,用于从所述获取单元601获取的所述原因为升级 复位后出现的异常情况,若基站保存有已经确认的有效配置基线,且当前运 行的配置基线尚未确认,则启动定时器,若定时器到达前恢复正常,则中止 定时器,否则定时器到达后触发配置基线自动回退。例如,升级复位处理单 元602上报CB回退告警;记录当前运行的CB为回退前临时CB,用于后续 定位问题;自动回退到最近的有效CB,当前运行的已经是最近一个有效CB 则不再回退。
连续复位处理单元603,用于从所述获取单元601获取的复位原因为单板 连续异常复位时,统计连续异常复位的次数,根据若所述次数是否超过预设 值选择软件版本并加载。网络发生基站异常复位,根据软件模块的设计和当 前网络发生异常的实际情况,可将连续异常复位分为初始化阶段异常复位和 运行态异常复位。初始化阶段异常复位可分为初始化主控板异常复位和初始 化非主控板异常复位;相应的,运行态异常复位也可分为运行态主控板异常复位和运行态非主控板异常复位。
因此,本实施例中,根据异常复位的单板的状态,可将连续复位处理单
元603分为初始化主控板异常复位处理单元、初始化非主控板异常复位处 理单元、运行态主控板异常复位处理单元、运行态非主控板异常复位处理单 元。就各自的功能下面分别进行描述
初始化主控板异常复位处理单元,用于对Flash版本初始化异常复位次数 进行累计,不超过预设的次数,则加载Flash版本,否则清零该计数,并加载 安全版本;如果需要更新Flash版本则更新并重新启动,否则,置基站的主区 Flash版本不可用,以基站备区Flash版本启动,也就是激活基站备区Flash版 本,如果基站备区Flash版本也不可用或者主控板的版本和基站备区版本相 同,则清零初始化异常计数,加载当前的Flash版本,让其继续异常复位。
初始化非主控板异常复位处理单元,用于对Flash版本初始化异常复位次 数进行累计,不超过预设的次数,则加载Flash版本,否则清零该计数,并加 载安全版本;如果需要更新Flash版本则更新并重新启动,否则,停在安全版 本,初始化完成后,清零该计数。
运行态主控板异常复位处理单元,用于统计运行态异常复位的次数,当 所述次数不超过预设的次数时,进入Flash版本,当前CB没有确认且存在最 近一个确认的有效CB时,仅启动BSP、公共通信、监控模块,调用函数回退 CB到最近一个确认的可用版本,异常复位次数清零,回退启动后上才艮CB回 退告警。当没有确认的有效CB时,不加载配置文件启动,异常复位次数清零。 运行态异常复位的次数大于预设的次数时,将运行态异常复位的次数清零, 并进入Flash版本。
运行态非主控板异常复位处理单元,用于统计运行态非主控板连续异常 复位次数,若所述复位次数超过预设的次数,则切换到安全版本,并停留在 安全版本。
其中,上述各实施例中所述的安全版本是一个最小功能集,保存在 BOOTROM中。以上实施例可以看出,当通信设备尤其是远端通信设备如基站在升级或 更改配置后,反复异常复位、远端失去联系时,通信设备能够自动尝试恢复 业务或远端维护通道,方便维护人员远端处理、尽可能减少工程人员去近端 的维护人力成本。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤 是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机 可读存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上对本发明所提供的提高通信设备可靠性的方法及装置进行了详细介 绍,对于本领域的一般技术人员,依据本发明实施例的思想,在具体实施方 式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本 发明的限制。
权利要求
1、一种提高通信设备可靠性的方法,其特征在于,包括获取出现异常的原因;所述原因为升级复位后出现的异常情况,若当前运行的配置基线尚未确认,启动定时器,若定时器到达前恢复正常,则中止定时器,否则定时器到达后触发配置基线自动回退至保存的有效配置基线;所述原因为单板连续异常复位,统计连续异常复位的次数,根据所述次数是否超过预设值选择软件版本并加载。
2、 根据权利要求1所述的提高通信设备可靠性的方法,其特征在于,所 述若定时器到达前恢复正常,包括远端维护通道能连通;或者维护台登陆成功;或者业务通道建立成功。
3、 根据权利要求1所述的提高通信设备可靠性的方法,其特征在于,所 述定时器到达后触发配置基线自动回退至保存的有效配置基线,包括上报配置基线回退告警;记录当前运行的配置基线为回退前临时配置基线; 自动回退到保存的最近的有效配置基线。
4、 根据权利要求1所述的提高通信设备可靠性的方法,其特征在于,所 述定时器的时间大于加载协议尝试启动一次的时间。
5、 根据权利要求1所述的提高通信设备可靠性的方法,其特征在于,统 计连续异常复位的次数,根据所述次数是否超过预设值选择软件版本并加载, 包括非主控板初始化异常复位时,对高层应用软件版本初始化异常复位次数 进行累计,不超过预设的次数,则加载高层应用软件版本,否则清零该计数 并加载安全版本;进行版本校验,如果需要更新高层应用软件版本,则更新并重新启动, 否则,停在安全版本;完成初始化后,清零初始化异常复位的计数。
6、 根据权利要求1所述的提高通信设备可靠性的方法,其特征在于,统 计连续异常复位的次数,根据所述次数是否超过预设值选择软件版本并加载,包括主控板初始化异常复位时,对高层应用软件版本初始化异常复位次数进 行累计,不超过预设的次数,则加载高层应用软件版本,否则清零该计数并 加载安全版本;进行版本校验,如果需要更新高层应用软件版本,则更新并重新启动, 否则,激活通信设备备区高层应用软件版本,如果通信设备备区高层应用软 件版本也不可用或者主控板的高层应用软件版本与通信设备备区高层应用软 件版本相同,则清零初始化异常计数,加载当前的高层应用软件版本;完成初始化后,清零初始化异常复位的计数。
7、 根据权利要求5或6所述的提高通信设备可靠性的方法,其特征在于, 所述加载安全版本之后,包括若单板复位重新启动,则进入高层应用软件 版本,并重新开始计数。
8、 根据权利要求1所述的提高通信设备可靠性的方法,其特征在于,所 述统计连续异常复位的次数,根据所述次数是否超过预设值选择软件版本并 加载,包括非主控板运行态异常复位时,统计连续异常复位的次数,若该次数大于 预设值,则切换到安全版本。
9、 根据权利要求1所述的提高通信设备可靠性的方法,其特征在于,所 述统计连续异常复位的次数,根据所述次数是否超过预设值选择软件版本并 加载,包括主控板运行态异常复位时,统计连续异常复位的次数,若该次数大于预 设值,将统计的次数清零,进入高层应用软件版本;若连续异常复位的次数不超过预设值,则进入高层应用软件版本,当前 配置基线没有确认且存在最近一个确认的有效配置基线时,调用函数回退配 置基线到最近一个确认的可用版本,异常复位次数清零;或者,进入高层应用软件版本后,没有确认的有效配置基线,则不加载配置文件启动,异常复 位次数清零。
10、 一种提高通信设备可靠性的装置,其特征在于,包括 获取单元,用于获取通信设备出现异常的原因;升级复位处理单元,用于从所述获取单元接收的异常原因为升级复位后 出现的异常情况时,若当前运行的配置基线尚未确认,则启动定时器,若定 时器到达前恢复正常,则中止定时器,否则定时器到达后触发配置基线自动 回退至保存的有效配置基线;连续复位处理单元,用于从所述获取单元接收的复位原因为单板连续异 常复位时,统计连续异常复位的次数,根据所述次数是否超过预设值选择软 件版本并加载。
11、 根据权利要求IO所述的提高通信设备可靠性的装置,其特征在于, 所述连续复位处理单元包括初始化主控板异常复位处理单元,用于对主控板的高层应用软件版本初 始化异常复位次数进行累计,不超过预设的次数,则加载高层应用软件版本, 否则清零该计数,并加载安全版本;当检测到需要更新高层应用软件版本时 进行更新并重新启动,否则,激活通信设备备区高层应用软件版本,如果通 信设备备区高层应用软件版本不可用或者与主控板的版本相同,清零异常复 位计数,加载当前的高层应用软件版本,让其继续异常复位;初始化非主控板异常复位处理单元,用于对非主控板的版本初始化异常 复位次数进行累计,不超过预设的次数,则加载版本,否则清零该计数,并 加载安全版本;如果需要更新版本则更新并重新启动,否则,停在安全版本, 初始化完成后,立即清零该计数;运行态主控板异常复位处理单元,用于统计运行态主控板异常复位的次 数,当所述次数不超过预设的次数时,进入高层应用软件版本,若当前配置 基线没有确认,则回退到保存的最近的有效版本;当所述次数超过预设的次 数时,将运行态异常复位的次数清零,并进入高层应用软件版本;运行态非主控板异常复位处理单元,用于统计运行态非主控板连续异常 复位次数,若所述复位次数大于预设的次数,则切换到安全版本,并停留在 安全版本。
全文摘要
本发明公开了提高通信设备可靠性的方法及装置。提高通信设备可靠性的方法包括获取出现异常的原因;所述原因为升级复位后出现的异常情况,若当前运行的配置基线尚未确认,启动定时器,若定时器到达前恢复正常,则中止定时器,否则定时器到达后触发配置基线自动回退至保存的有效配置基线;所述原因为单板连续异常复位,统计连续异常复位的次数,根据所述次数是否超过预设值选择软件版本并加载。通过本发明实施例中提供的方法及装置能够在通信设备出现异常情况时,自动尝试恢复业务或远端维护通道,减少了近端维护的人力成本。
文档编号H04Q7/34GK101247615SQ20081003443
公开日2008年8月20日 申请日期2008年3月7日 优先权日2008年3月7日
发明者盛 汪, 云 王 申请人:上海华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1