信令切换失败的故障排查方法和装置与流程

文档序号:15743514发布日期:2018-10-23 22:41阅读:992来源:国知局

本发明涉及通信技术领域,尤其涉及一种信令切换失败的故障排查方法和装置。



背景技术:

随着通信技术的快速发展,通信质量要求也随之提高。人们设置了代表通信质量的切换成功率KPI(Key Performance Indicator,关键绩效指标)。为了达到KPI,维护人员致力于分析信令切换失败的故障定位和排查工作。

现有技术中,维护人员将历史维护工单进行分类,并从主服务小区问题、链路问题、邻区问题三方面进行切换类问题的定位及排查。例如,维护人员需要依次排查源eNB(evolved Node B,演进型基站)、目标eNB、MME(Mobility Management Entity,移动管理实体)、S1/X2链路、UE(终端)终端以及空口信道等。现有的信令切换失败的故障定位和排查的方法比较繁琐、耗时较长。

如何提高信令切换失败的故障排查效率成为业界亟待解决的问题。



技术实现要素:

为了提高信令切换失败的故障排查效率,本发明实施例提供了一种信令切换失败的故障排查方法和装置。

第一方面,提供了一种信令切换失败的故障排查方法。该方法包括以下步骤:

接收信令切换失败的告警,核查信令切换失败的源小区和信令切换失败的目标小区;

提取由源小区切换至目标小区的信令切换数据;

分析信令切换数据,确认信令切换失败的阶段;

基于信令切换失败的阶段,排查源小区和目标小区中引起信令切换失败的故障。

第二方面,提供了一种信令切换失败的故障排查装置。该装置包括:

小区核查单元,用于接收信令切换失败的告警,核查信令切换失败的源小区和信令切换失败的目标小区;

数据提取单元,用于提取由源小区切换至目标小区的信令切换数据;

阶段确认单元,用于分析信令切换数据,确认信令切换失败的阶段;

故障排查单元,用于基于信令切换失败的阶段,排查源小区和目标小区中引起信令切换失败的故障。

由此,本发明实施例通过分析导致切换流程失败的切换阶段,在准确确认导致切换流程失败的切换阶段的基础上,可以有针对性地从无线、传输、设备和核心网层面有条不紊分析切换性能差的具体原因,可以减少故障排查的时间,提高切换类问题工单处理的效率,减少切换类工单数量,有效解决切换性能差指标问题。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明一实施例的信令切换失败的故障排查应用系统架构示意图;

图2是本发明一实施例的信令切换失败的故障排查方法的流程示意图;

图3是图2中的子流程示意图;

图4是本发明一实施例的信令切换失败的故障排查装置的结构示意图;

图5是本发明一实施例的信令切换失败的故障排查装置的框架示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

图1是本发明一实施例的信令切换失败的故障排查应用系统架构示意图。

如图1所示,该系统架构可以包括:UE101、UE102、eNB103、eNB104、MME105和网络106。

其中,UE101、UE102可以是用于通信的各种电子设备。这些电子设备包括但不限于智能手机、个人电脑、智能手表等。这些电子设备可以安装有各种通讯客户端应用,例如即时通信工具、邮箱客户端、社交平台软件、音频视频软件等。UE101与eNB103以及UE102与eNB104之间的接口可以为UU口。eNB103与eNB104之间的接口可以为X2接口。eNB103与MME105以及eNB104与MME105之间的接口可以为S1接口。网络106用以在各种电子设备之间提供通信链路的介质。具体的,网络可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等。

应该理解,图1中的设备的数目仅仅是示意性的。根据实现需要,该系统架构可以具有任意数目的UE、eNB、MME和网络。下面各实施例均可以应用本发明实施例的系统架构进行信息交互。本发明实施例的系统可以作为下面各个实施例的执行主体,具体执行信令切换失败的故障排查操作。

图2是本发明一实施例的信令切换失败的故障排查方法的流程示意图。

如图2所示,该方法包括以下步骤:S210,接收信令切换失败的告警,核查信令切换失败的源小区和信令切换失败的目标小区;S220,提取由源小区切换至目标小区的信令切换数据;S230,分析信令切换数据,确认信令切换失败的阶段;S240,基于信令切换失败的阶段,排查源小区和目标小区中引起信令切换失败的故障。

在步骤S210中,信令切换失败的告警可以从UE上报的MR中获取。源小区例如可以是一个UE所在小区。目标小区例如可以是另一个UE所在小区。

在步骤S220中,信令切换数据例如可以是切换准备失败次数、切换尝试次数、切换执行次数、切换执行失败次数和切换成功次数等数据。

在步骤S230中,信令切换过程从流程上来说分为两个阶段,切换准备阶段和切换执行阶段,且两个阶段存在先后顺序。任何一个过程失败,都会导致切换流程失败。

切换准备阶段是指源eNB收到UE的测量报告并判决完成后,向目标eNB发送切换请求HANDOVER REQUEST,目标eNB作出应答回复切换准备结果(例如,成功or失败)的过程。该过程参与的网元有源eNB、目标eNB、MME以及S1/X2链路,每个环节出问题都会导致切换失败。这些环节均可以排查。X2链路可以不用排查,因为X2是eNB自动建立的,一般不会有问题。

切换执行阶段是指切换准备完成后,eNB向UE发送切换命令RRC_CONN_RECFG,UE收到命令后向目标小区发起切换,在目标小区成功接入后,目标小区向源小区发送上下文释放消息UE_CONTEXT_RELEASR通知源小区释放UE的空口资源,完成信令切换。该过程参与的网元有源eNB、目标eNB、UE终端以及空口信道,因此执行失败可以排查目标eNB、UE和空口信道这些环节。

图3是图2中的子流程示意图。

如图3所示,图2中步骤S230(分析信令切换数据,确认信令切换失败的阶段)可以包括以下步骤:S231,分析信令切换数据,获取切换准备失败次数、切换尝试次数、切换执行次数、切换执行失败次数和切换成功次数;S232,切换尝试次数与切换执行次数的差值等于切换准备失败次数,确认信令切换失败的阶段为切换准备阶段;S233,切换执行次数与切换成功次数的差值等于切换执行失败次数,确认信令切换失败的阶段为切换执行阶段。

在本发明实施例中,可以通过告警核查源小区和目标小区,排除小区因故障导致的切换成功率差问题,提取切换的COUNTER,判断切换准备失败还是切换执行失败。因此分析切换时首先需要判断哪个环节出问题,判断方法如下:

切换准备失败次数=切换尝试次数-切换执行次数 (公式1)

切换执行失败次数=切换执行次数-切换成功次数 (公式2)

利用以上公式1和公式2,根据切换尝试、执行、成功次数话统,可以初步判断出切换失败的阶段。

在步骤S140中,不同的阶段,排查方法和解决措施均不一样。第一种故障排查方式可以是针对在切换准备阶段发生信令切换失败的方式。第二种故障排查方式可以是针对在切换执行阶段发生信令切换失败的方式。

第一种故障排查方式可以排查以下问题的至少一种:排查流量控制传输协议SCTP链路中是否存在漏配问题;排查跨共享池POOL跨移动管理实体MME切换信令时,是否存在漏配或者错配目标小区的跟踪区域码TAC的问题;排查目标小区是否存在用于指示演进型基站eNB故障的影响通信业务的预设告警。

例如,针对链路问题SCTP链路漏配问题,包括目标小区漏配SCTP链路或S1接口被闭塞,导致MME到目标eNB的路径不可达(在MME看来不存在此eNB),无法向目标eNB转发切换请求消息,切换准备失败。对于切换流程,只要是跨eNB切换,不管是经S1切换还是经X2切换,在S1口均有信令交互:在经X2接口切换时,S1接口仅有两条信令:S1AP PATH SWITCH REQ、S1AP PATH SWITCH REQ ACK;在经S1接口切换时,S1接口信令会在源eNB和目标eNB有较多的交互。对于S1口消息交互出现异常,通常是传输失败或网络设备内部处理出错,设备内部处理出错的概率较小,传输失败的可能性较大,但比较难以定位,需要在传输的两端抓数据包确认。

例如,针对MME问题,漏配或错配目标小区的TAC(Tracking area code,跟踪区域码),主要是漏配或错配目标小区的TAC,导致核心网侧DNS(Domain Name System,域名系统)解析时无法找到目标eNB,也就无法向eNB转发消息,切换准备失败。TAC漏配或错配无法在无线侧直接查询,只能在核心网侧进行查询,看MME或DNS是否配置该TAC。但是,无线侧也可以通过信令分析来判断某个或某几个MME是否存在漏配。判断的方法可以是将所有切换流程所走的MME筛选出来,看切换成功与切换失败流程所走的MME是否一致,如果不一致,则说明切换失败所走的MME存在漏配。如有漏配,可以在核心网进行添加或修改。跨pool跨MME切换类,UE上报RRC_MEAS_RPRT测量报告,eNodeB进行切换判决后需要进行切换,需进行切换,源侧eNodeB向MME发送S1AP_HANDOVER_REQUIRED切换请求,经过一段时间(例如17S)后收到MME下发的S1AP_HANDOVER_PREPARATION_FAIL切换准备失败,携带的原因为ho-failure-in-target-EPC-eNB-or-target-system,同时目标侧并未收到MME的切换请求消息。此外,正常的切换流程,eNB从发送切换请求到收到MME的切换命令的间隔只有100MS左右。分析站点的分布情况发现,若源站和目标站这两个站点归属不同的POOL(共享池),例如,源站是POOL8站点,目标站是POOL7站点,即本次切换是跨POOL跨MME的切换。此时,可怀疑由于核心网的问题导致指标劣化,并转T3(根据不同的问题,可以由不同的处理方式,例如T3、T0等)处理。

例如,针对eNB问题,主要是目标小区存在严重告警,如小区不可用告警、小区服务能力下降告警等,导致收到源小区的切换请求后,无法完成准入和资源准备,导致切换准备失败。MML命令LST ALMLOG查询指标劣化时间内是否存在严重告警,如有告警,需联系T0进行处理。常见的影响切换准备阶段的告警有小区不可用告警、小区服务能力下降告警等。

第二种故障排查方式可以排查以下问题的至少一种:排查目标小区是否存在用于指示演进型基站eNB故障的影响通信业务的预设告警;排查S1、X2、UU口信令,过滤出S1、X2、UU口信令中重建请求消息,并筛选用于指示终端故障的切换失败的原因值;排查是否存在由于覆盖、干扰、邻区、参数中至少一种而引起的空口问题。

例如,针对eNB问题,主要是目标小区存在影响业务的告警,如射频单元驻波告警、射频IR光接口故障告警。通过MML命令LST ALMLOG查询指标劣化时段是否存在影响业务的告警,如有告警,可以联系T0处理。

例如,针对终端问题,一般是指终端设计不符合协议规定,导致不响应eNB的某些消息,导致网络侧定时器超时后发起释放,流程失败。跟踪S1/X2/UU口信令,过滤出切换失败流程的TMSI(Temporary Mobile Subscriber Identity,临时识别码)/FGI(FeatureGroup Indicators,功能组指示),分析是否存在TOP TMSI或FGI,如果存在TOP,可以转T3处理。具体方法如下:过滤出所有的重建请求消息RRC_REESTAB_REQ,筛选出原因值为切换失败handover failure的消息。

例如,针对最为常见的空口问题,其形成主要原因有覆盖、干扰、邻区、参数等。

例如,针对覆盖问题(是指弱覆盖、重叠覆盖、过覆盖等问题),排查方法不再赘述。覆盖类问题一般导致的是切换过早和切换过晚,可通过调整CIO(小区个性偏移)或RF(Radio Freqency,射频)优化来解决。

在一些实施例中,在上述实施例的基础上,还可以增加如下步骤:基于信令切换的次数,调整小区个性偏移CIO参数的取值范围;或,基于无线环境,优化射频RF参数;或,将步长参数设置为预设步长。其中,上述步骤可以增加在排查是否存在由于覆盖、干扰、邻区、参数中至少一种而引起的空口问题的步骤之后。

在一些实施例中,基于信令切换的次数,调整小区个性偏移CIO参数的取值范围可以包括:信令切换的次数小于300次,将CIO参数的值调整为-4dBm;信令切换的次数在300至500次之间,将CIO参数的值调整为-6dBm。

在一些实施例中,预设步长可以为:2dB。

例如,CIO的修改值可根据切换次数进行调整。例如,切换次数为0~300次时,可以将CIO调整为-4dBm。例如,切换次数为300~500次时,可以将CIO调整为-6dBm。例如,切换次数为500~1000次时,可以将CIO调整为-8dBm。如果指标改善不明显,可以2dB为步长进行调整。

针对两两小区切换对问题,若根据切换counter判断是特定的两小区间切换失败原因导致切换成功率低,判断切换失败发生在执行阶段还是切换准备阶段,处理流程参照小区级切换工单的分析流程。对于两两小区的切换COUNTER,主要关注特定两小区间切换出过晚次数、特定两小区间切换出过早次数、特定两两小区间用户乒乓切换次数、特定两小区间通过重建回源小区的切换出执行成功次数等COUNTER。特定两小区间切换出尝试次数减去特定两小区间切换出成功次数,再加上特定两小区间通过重建回源小区的切换出执行成功次数,可以等于切换失败总次数。若服务小区、邻区和链路问题都一一排除后,可判断切换过早、切换过晚还是乒乓切换等问题。

若是TOP切换对造成的切换失败、切换尝试次数和切换执行次数很接近,而切换成功次数比切换执行次数少,就可以判断为切换失败发生在切换执行阶段。若切换执行次数比切换尝试次数少很多,而切换成功次数和切换执行次数相近,可判断切换失败发生在切换准备阶段。

需要说明的是,在不冲突的情况下,本领域的技术人员可以按实际需要将上述的操作步骤的顺序进行灵活调整,或者将上述步骤进行灵活组合等操作。为了简明,不再赘述各种实现方式。另外,各实施例的内容可以相互参考引用。

本发明实施例可以在切换准备失败阶段,对SCTP链路漏配和跨POOL跨MME分析;在切换执行失败阶段,对终端原因和UU空口质量分析。可以有针对性地从无线、传输、设备和核心网层面有条不紊分析切换性能差的具体原因,可以减少故障排查的时间,提高切换类问题工单处理的效率,减少切换类工单数量,有效解决切换性能差指标问题。

图4是本发明一实施例的信令切换失败的故障排查装置的结构示意图。

如图4所示,信令切换失败的故障排查装置400可以包括:小区核查单元410、数据提取单元420、阶段确认单元430和故障排查单元440。

其中,小区核查单元410可以用于接收信令切换失败的告警,核查信令切换失败的源小区和信令切换失败的目标小区;数据提取单元420可以用于提取由源小区切换至目标小区的信令切换数据;阶段确认单元430可以用于分析信令切换数据,确认信令切换失败的阶段;故障排查单元440可以用于基于信令切换失败的阶段,排查源小区和目标小区中引起信令切换失败的故障。

由此,本发明实施例通过分析导致切换流程失败的切换阶段,在准确确认导致切换流程失败的切换阶段的基础上,可以有针对性地从无线、传输、设备和核心网层面有条不紊分析切换性能差的具体原因,可以减少故障排查的时间,提高切换类问题工单处理的效率,减少切换类工单数量,有效解决切换性能差指标问题。

在一些实施例中,阶段确认单元430可以包括:切换数据分析模块、准备阶段确认模块和执行阶段确认模块。其中,切换数据分析模块可以用于分析信令切换数据,获取切换准备失败次数、切换尝试次数、切换执行次数、切换执行失败次数和切换成功次数;准备阶段确认模块可以用于切换尝试次数与切换执行次数的差值等于切换准备失败次数,确认信令切换失败的阶段为切换准备阶段;执行阶段确认模块可以用于切换执行次数与切换成功次数的差值等于切换执行失败次数,确认信令切换失败的阶段为切换执行阶段。

在一些实施例中,故障排查单元440还可以用于在信令切换失败的阶段为切换准备阶段,排查以下问题的至少一种:排查SCTP链路中是否存在漏配问题;排查跨POOL跨MME切换信令时,是否存在漏配或者错配目标小区的TAC的问题;排查目标小区是否存在用于指示eNB故障的影响通信业务的预设告警。

在一些实施例中,故障排查单元440还可以用于在信令切换失败的阶段为切换执行阶段,排查以下问题的至少一种:排查目标小区是否存在用于指示eNB故障的影响通信业务的预设告警;排查S1、X2、UU口信令,过滤出S1、X2、UU口信令中重建请求消息,并筛选用于指示终端故障的切换失败的原因值;排查是否存在由于覆盖、干扰、邻区、参数中至少一种而引起的空口问题。

在上述实施例的基础上,还可以增加故障处理单元。

在一些实施例中,故障处理单元可以用于基于信令切换的次数,调整CIO参数的取值范围;或用于基于无线环境,优化RF参数;或用于将步长参数设置为预设步长。

在一些实施例中,故障处理单元还可以用于:信令切换的次数小于300次,将CIO参数的值调整为-4dBm;信令切换的次数在300至500次之间,将CIO参数的值调整为-6dBm。

在一些实施例中,预设步长为:2dB。

需要说明的是,上述各实施例的装置可作为上述各实施例的用于各实施例的方法中的执行主体,可以实现各个方法中的相应流程,为了简洁,此方面内容不再赘述。

图5是本发明一实施例的信令切换失败的故障排查装置的框架示意图。

如图5所示,信令切换失败的故障排查装置可以包括:中央处理单元(CPU)401,其可以根据存储在只读存储器(ROM)402中的程序或者从存储部分708加载到随机访问存储器(RAM)403中的程序而执行如下操作:接收信令切换失败的告警,核查信令切换失败的源小区和信令切换失败的目标小区;提取由源小区切换至目标小区的信令切换数据;分析信令切换数据,确认信令切换失败的阶段;基于信令切换失败的阶段,排查源小区和目标小区中引起信令切换失败的故障。

在RAM503中,还存储有该装置操作所需的各种程序和数据。CPU501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。

以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。

特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1