一种故障处理方法及装置与流程

文档序号:16198483发布日期:2018-12-08 06:22阅读:307来源:国知局
一种故障处理方法及装置与流程

本发明涉及通信技术领域,特别涉及一种故障处理方法及装置。

背景技术

超级小区由一个逻辑小区和多个物理小区(以下称为cp,cellportion)组成,物理小区包括rru(remoteradiounit,远端射频模块)、连接rru到基带单板的光纤及处理物理小区的基带单板。位于不同基带单板的cp之间通过交换板连接并相互协作处理,由enodeb负责选定的主cp用来集中调度超级小区和完成mac(mediaaccesscontrol,媒体访问控制)的处理,各个cp完成phy(physicalinterfacetransceiver,物理接口收发器)过程及射频信号的收发。

由此可见,超级小区的发生故障的可能点有:rru设备掉电和光纤不可达故障、交换板和基带单板之间数据不可达故障、主cp所在基带单板无法工作故障和辅cp所在基带单板无法工作故障四种。以上不同的故障对提供服务的ue产生不同程度的影响,在操作维护上有不同的处理策略:

rru设备掉电和光纤不可达故障:当设备掉电或光纤不可达时无法通过配置来调整,需要人工排除故障,只有当前cp的网络覆盖和可服务性有一定的影响;

辅cp所在的基带单板发生故障:与该单板连接的phy部分处理缺失,辅cp的信号丢失,当前辅cp的网络覆盖和可服务性局部受到影响;

交换板和基带单板之间数据不可达故障:导致协同cp之间的协作数据异常,无法完成mac和phy流程,需要跨基带单板协作处理的cp的网络覆盖和可服务性受到较大程度的影响;

主cp所在的基带单板发生故障:小区的mac部分处理缺失,整个小区的流程失败,所有cp的信号丢失,整个小区的所有的cp的网络覆盖和可服务性受到严重影响。

以上的故障处理都严重依赖于网络维护人员及时发现系统故障告警的及时性,通过物理修复消除影响或人工调整其他策略的配置方法的持续时间来减少影响。



技术实现要素:

根据本发明实施例提供的方案解决的技术问题是人工修复的持续时间长导致的网络不可服务。

根据本发明实施例提供的一种故障处理方法,包括:

在第一预定时间内进行各个基带单板故障检测消息的接收;

根据所述故障检测消息的接收结果确定故障类型;

根据所述故障类型执行对应的自愈处理。

优选地,所述故障检测消息至少包括:辅小区所在基带单板与主小区所在基带单板之间的时延侦测结果。

优选地,所述根据所述故障检测消息的接收结果确定故障类型包括:

未接收到第一基带单板故障检测消息时确定故障类型为第一基带单板故障。

优选地,所述执行对应的自愈处理包括,启动第一基带单板的软复位流程。

优选地,当所述第一基带单板为主小区所在基带单板时,所述方法还包括执行主小区重选流程。

优选地,所述根据所述故障检测消息的接收结果确定故障类型包括:

接收到的所述时延侦测结果大于预设值时确定故障类型为基带单板与交换板不可达故障。

优选地,所述执行对应的自愈处理包括,启动交换板的软复位流程。

优选地,所述方法还包括,执行超级小区拆分普通小区流程。

优选地,所述方法还包括,当所述基带单板与交换板不可达故障恢复后,执行超级小区配置恢复流程。

根据本发明实施例提供的一种故障处理装置,包括:

接收模块,用于在第一预定时间内进行各个基带单板故障检测消息的接收;

确定故障类型模块,用于根据所述故障检测消息的接收结果确定故障类型;

自愈处理模块,用于根据所述故障类型执行对应的自愈处理。

根据本发明实施例提供的方案,实时检测基站设备的超级小区的rru或主服务小区的基带板或辅服务小区的基带板或交换板是否产生了故障;针对以上不同的故障点和后台配置策略故障自愈决策模块启动若干种故障决策机制;故障自愈执行模块组织其他相关子系统完成自愈执行动作。

附图说明

图1是本发明实施例提供的一种故障处理方法流程图;

图2是本发明实施例提供的一种故障处理装置示意图;

图3是本发明实施例提供的超级小区相关的rru、交换板和基带单板之间的关系示意图。

具体实施方式

以下结合附图对本发明的优选实施例进行详细说明,应当理解,以下所说明的优选实施例仅用于说明和解释本发明,并不用于限定本发明。

图1是本发明实施例提供的一种故障处理方法流程图,如图1所示,包括:

步骤s101:在第一预定时间内进行各个基带单板故障检测消息的接收;

步骤s102:根据所述故障检测消息的接收结果确定故障类型;

步骤s103:根据所述故障类型执行对应的自愈处理。

其中,所述故障检测消息至少包括:辅小区所在基带单板与主小区所在基带单板之间的时延侦测结果。

具体地说,所述根据所述故障检测消息的接收结果确定故障类型包括:未接收到第一基带单板故障检测消息时确定故障类型为第一基带单板故障。

具体地说,所述执行对应的自愈处理包括,启动第一基带单板的软复位流程。

其中,当所述第一基带单板为主小区所在基带单板时,所述方法还包括执行主小区重选流程。

具体地说,所述根据所述故障检测消息的接收结果确定故障类型包括:接收到的所述时延侦测结果大于预设值时确定故障类型为基带单板与交换板不可达故障。

具体地说,所述执行对应的自愈处理包括,启动交换板的软复位流程。

本发明实施例所述方法还包括,执行超级小区拆分普通小区流程。

本发明实施例所述方法还包括,当所述基带单板与交换板不可达故障恢复后,执行超级小区配置恢复流程。

图2是本发明实施例提供的一种故障处理装置示意图,如图2所示,包括:接收模块201,用于在第一预定时间内进行各个基带单板故障检测消息的接收;确定故障类型模块202,用于根据所述故障检测消息的接收结果确定故障类型;自愈处理模块203,用于根据所述故障类型执行对应的自愈处理。

图3是本发明实施例提供的超级小区相关的rru、交换板和基带单板之间的关系示意图,如图3所示,超级小区与普通小区不同,是由若干个位置不同的基带单板上的cp之间通过交换板相互协作和数据联合处理的方式来解决若干个普通小区之间的同频干扰及密集布网时的切换频繁导致用户流量不稳定问题。当超级小区的一个辅cp的基带单板和rru发生故障时,并不会对整体产生直接影响。当超级小区的主cp的基带单板故障或交换板和基带单板之间不可达时,超级小区的全部信号丢失。本发明实施例用于解决超级小区的交换板和基带单板之间不可达故障和主cp的基带单板故障,包括以下模块:

故障检测模块:故障检测模块位于主控板上,基带单板上部署了链路检测的oam(operationadministrationandmaintenance,操作维护管理)agent,正常上电完成时各个基带单板的oamagent给故障检测模块报送正常上电标识;正常运行状态时各个基带单板的oamagent之间互相发送心跳消息并侦测时延,基带单板的oamagent的定时报送侦测结果及自身状态信息给主控板的故障检测模块。主控板的故障检测模块在定时器t0内未收到基带单板的oamagent的消息,记为基带板故障;主控板收到基带单板的oamagent的消息,其中携带的基带单板之间的时延侦测结果超过既定值,记为交换板与基带单板之间不可达故障。主控板将以上检测的两种故障类型详细信息通知给故障自愈模块并重新检测状态,如果单板状态恢复则通知故障自愈模块取消自愈。

其中,图2中的接收模块201和确定故障类型模块202均设置在主控板上的故障检测模块中。

故障自愈模块:故障自愈模块分为两部分,位于主控板上的为站点故障自愈模块,其中,图2中的自愈处理模块203设置在主控板上的站点故障自愈模块中;位于网管服务器的为网管故障自愈模块。站点故障自愈模块收到故障检测模块的故障详细信息:

详细信息中故障类型为基带板故障,设置并启动定时器t1并继续监听当前基带单板的故障检测模块消息,故障检测模块上报故障恢复消息则取消t1定时器,t1超时后发起故障基带单板的软复位流程并启动等待复位定时器t1_delta并等待故障基带板的上电成功标识,如果上电成功,则取消定时t1_delta并取消基带单板故障自愈流程;当在t1_delta超时之后故障基带板仍未上电成功,进入超级小区的主cp基带单板重选流程。如果后续故障基带单板已经修复(收到故障检测模块的取消自愈消息),不再执行主cp基带单板重选流程。

详细信息中故障类型为交换板与基带单板之间不可达故障,设置定时器t2并继续监听当前单板的故障检测模块消息,故障检测模块上报故障恢复消息则取消t2定时器,t2超时后发起故障交换板的软复位流程并启动等待复位定时器t2_delta并等待故障交换板的上电成功标识,如果上电成功,则取消定时t2_delta并取消交换板故障自愈流程;当在t2_delta超时之后故障交换板仍未上电成功,进入超级小区拆分普通小区流程。如果后续故障交换板已经修复(收到故障检测模块的取消自愈消息),进入超级小区配置恢复流程。

其中,故障类型为基带板故障的主cp基带单板重选流程:在剩余可用的基带单板中选择合适的基带单板作为主cp的驻留单板,重新发起小区建立流程。主cp基带单板选择算法为:

设超级小区s由m块基带单板组成,每块基带单板已部署的主cp数(基带单板可以部署多个超级小区的主cp,将主cp数求和)为mpcz,辅cp数为cf,普通小区数为cn。主cp的基准负荷记为pmplz,ms辅cp的基准负荷记为pmslf,普通小区的基准负荷记为pmnln。小区的带宽以5m为基准设权重为w,带宽设为w。每块单板的负荷为

对每块单板的负荷按照从小到大的顺序排列,取超级小区s的m块基带板中负荷最小的单板作为主cp单板。如果有多个超级小区都需要选择主cp,则再次执行以上流程,直到所有的超级小区都选择了主cp。

其中,故障类型为交换板与基带单板之间不可达故障的超级小区拆分普通小区流程:站点故障自愈模块分析并列出故障交换板影响的超级小区列表,向网管故障自愈模块发起超级小区拆分为普通小区的消息,消息携带了故障交换板标识、超级小区列表和超级小区的主辅cp的组合关系。网管故障自愈模块收到消息后,保存故障交换板标识、超级小区列表中的小区的规划参数、超级小区的主辅cp的组合关系到备份区。然后使用超级小区的标识从备份区查找组合超级小区之前的普通小区无线参数通知配置管理生成普通小区无线参数。如果在备份区没有找到,则复制超级小区的无线参数自动生成规划数据并通知配置管理生成普通小区无线参数。完成以上动作后,自动同步更新配置管理数据库表到前台,触发普通小区建立流程。

其中,故障类型为交换板与基带单板之间不可达故障的超级小区配置恢复流程:站点故障自愈模块收到故障检测模块发送的取消自愈消息,向网管故障自愈模块发起超级小区组合恢复的消息,消息携带了故障交换板的标识。网管故障自愈模块收到消息后,使用故障交换板标识在备份区查找超级小区列表中的小区的规划参数、超级小区的主辅cp的组合关系,使用超级小区标识备份普通小区无线参数到备份区。然后通知配置管理按照超级小区列表中的小区的规划参数、超级小区的主辅cp的组合关系,生成超级小区无线参数。完成以上动作后,自动同步更新配置管理数据表到前台,触发超级小区建立流程。如果在备份区没有找到,超级小区配置恢复流程终止。

下面以具体的实施例来说明本发明实施例的技术内容:

实施方式一(主cp的基带单板故障)

步骤101:超级小区s由3cp组成,主cp(cp1)位于基带单板a,辅cp(cp2和cp3)位于基带单板b和c,a、b和c之间通过交换板x连接,其中基带板b上同时部署一个普通小区。基带单板a、b和c的oamagent分别在定时器t0超时后向位于主控板的故障检测模块上报基带单板a和b、a和c之间的时延侦测结果及自身状态信息并重置定时器t0。

步骤102:a发生故障,主控板的故障检测模块在定时器t0内未收到基带单板a的oamagent的消息。

步骤103:故障检测模块判断为a故障,将故障的a信息通知站点故障自愈模块,故障类型为基带单板故障。

步骤104:站点故障自愈模块收到故障检测模块的基带单板a故障消息,启动t1定时器等待故障检测模块的故障自愈取消消息。

步骤105:t1定时器超时,启动故障基带单板a的软复位流程并启动等待复位定时器t1_delta并等待故障基带板的上电成功标识。

步骤106:t1_delta定时器超时,故障基带板a仍未上电成功,进入超级小区的主cp基带单板重选流程。

步骤107:在剩余可用的基带单板b和c中选择了单板负荷最轻的c作为主cp的驻留单板,重新发起小区建立流程。

实施方式二(交换板故障触发的超级小区拆分为普通小区流程)

步骤201:超级小区s由3cp组成,主cp(cp1)位于基带单板a,辅cp(cp2和cp3)位于基带单板b和c,a、b和c之间通过交换板x连接,其中基带板b上同时部署一个普通小区。基带单板a、b和c的oamagent分别在定时器t0超时后向位于主控板的故障检测模块上报基带单板a和b、a和c之间的时延侦测结果及自身状态信息并重置定时器t0。

步骤202:主控板的故障检测模块收到基带单板a的oamagent的消息,其中携带的a和b、a和c之间的时延侦测结果超过既定值。

步骤203:故障检测模块判断为x故障,将故障的x信息通知站点故障自愈模块,故障类型为基带单板之间不可达故障。

步骤204:t2定时器超时,启动故障交换板x的软复位流程并启动等待复位定时器t2_delta并等待故障交换板的上电成功标识。

步骤205:t2_delta定时器超时,故障交换板x仍未上电成功,进入超级小区拆分普通小区流程。

步骤206:站点故障自愈模块分析并列出故障交换板x影响的超级小区列表s,向网管故障自愈模块发起超级小区拆分为普通小区的消息,消息携带了故障交换板标识x、超级小区列表s和超级小区的主辅cp的组合关系(其中cp1为主cp,cp2和cp3为辅cp)。

步骤207:网管故障自愈模块收到消息后,保存故障交换板标识x、超级小区列表s中的小区的规划参数、超级小区的主辅cp的组合关系(cp1为主cp、cp2和cp3为辅cp)到备份区。

步骤208:网管故障自愈模块使用超级小区的标识从备份区查找组合超级小区之前的普通小区(cell1、cell2和cell3)规划参数通知配置管理生成普通小区无线参数。

步骤209:如果在备份区没有找到,则复制超级小区的无线参数自动生成规划数据并通知配置管理生成普通小区(cell1、cell2和cell3)无线参数。

步骤210:完成以上动作后,自动同步更新配置管理数据库表到前台,触发普通小区(cell1、cell2和cell3)建立流程。

实施方式三(故障交换板恢复后的超级小区配置恢复流程)

步骤301~310的流程与实施方式二中的201~210相同。

步骤311:故障交换板x被修复,站点故障自愈模块收到故障检测模块发送的交换板x取消自愈消息。

步骤312:站点故障自愈模块向网管故障自愈模块发起超级小区组合恢复的消息,消息携带了故障交换板x的标识。

步骤313:网管故障自愈模块收到消息后,使用故障交换板x的标识在备份区查找超级小区列表(其中包含了s)中的小区的规划参数、超级小区的主辅cp的组合关系(cp1为主cp、cp2和cp3为辅cp),使用超级小区标识s备份普通小区(cell1、cell2和cell3)规划参数到备份区。

步骤314:网管自愈模块通知配置管理按照超级小区列表(其中包含了s)中的小区的规划参数、超级小区的主辅cp的组合关系(cp1为主cp、cp2和cp3为辅cp),生成超级小区无线参数。

步骤315:完成以上动作后,自动同步更新配置管理数据表到前台,触发超级小区建立流程。

步骤316:如果在备份区没有找到,超级小区配置恢复流程终止。

根据本发明实施例提供的方案,可以解决大规模同频组网场景中超级小区的硬件故障修复的持续时间长导致的网络不可服务问题,提高了无线网络覆盖的稳定性,节省了大量运维人力,大大提高了解决效率。

尽管上文对本发明进行了详细说明,但是本发明不限于此,本技术领域技术人员可以根据本发明的原理进行各种修改。因此,凡按照本发明原理所作的修改,都应当理解为落入本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1