一种故障定位方法及装置与流程

文档序号:12134580阅读:332来源:国知局
一种故障定位方法及装置与流程

本发明涉及无线通信领域,特别涉及一种故障定位方法及装置。



背景技术:

移动通信经历了第一代的模拟语音业务、第二代的数字语音业务、第三代的数字语音与数据业务,以及第三代之后的宽带和多功能集成业务的迅速发展,网络架构扁平化,基站的功能越来越多,基站的复杂度不断增加,基站的各种信息量不断增长,基站运营维护中的信息分析难度不断提高。

在基站运营维护过程中,若出现设备问题或者客户投诉问题,就需要采集基站的性能数据、信令信息、日志信息等信息进行分析,以便通过一系列分析找到可能的故障原因。

目前,在进行信息采集时,运营商的运维人员不能准确采集所需要的所有信息,从而需要反复复现待分析问题,即待分析故障,以进一步采集信息。进一步地,运营商的运维人员不能完成对所采集的大量信息的分析,需要设备商的相关专家一起参与。

因此,利用现有的基站信息分析技术进行故障分析和定位处理时,存在处理效率低的问题,导致用户的满意度下降。



技术实现要素:

本发明的目的在于提供一种故障定位方法及装置,能更好地解决待分析故障处理效率低的问题。

根据本发明的一个方面,提供了一种故障定位方法,包括:

根据待分析故障的类型,生成信息采集模板,并将所述信息采集模板发送给网管;

接收所述网管根据所述信息采集模版采集的基站信息;

对所接收的基站信息进行分析,得到所述待分析故障的故障定位结果。

优选地,所述根据待分析故障的类型,生成信息采集模板的步骤包括:

利用问题分析库,查找所述待分析故障的类型所关联的信息采集说明,并生成包含所述信息采集说明的信息采集模版。

优选地,所述对所接收的基站信息进行分析,得到所述待分析故障的故障定位结果的步骤包括:

利用信息解析库对所述基站信息进行解析,生成信息字典;

利用所述问题分析库和所述信息字典对所述待分析故障进行故障定位,得到所述待分析故障的故障定位结果。

优选地,所述基站信息包括性能数据、信令信息和日志信息中的至少一个,所述信息字典包括性能数据字典、信令信息字典和日志信息字典中的至少一个。

优选地,所述利用所述问题分析库和所述信息字典对所述待分析故障进行故障定位的步骤包括:

利用所述问题分析库,查找所述待分析故障的故障分析流程;

根据所找到的待分析故障的故障分析流程,确定对所述基站信息的分析顺序;

根据所确定的分析顺序,通过遍历相应的信息字典,查找并发现异常信息;

根据所发现的异常信息以及关联的原因,得到所述待分析故障的故障定位结果。

优选地,所述根据所确定的分析顺序,通过遍历相应的信息字典,查找并发现异常信息的步骤包括:

当根据所述待分析故障的故障分析流程,确定对所述基站信息的分析顺序为性能数据、日志信息和信令信息时,通过遍历性能数据字典,依次得到所述待分析故障对应的性能数据、所述性能数据对应的计数器、所述计数器的关联模块,并通过遍历日志信息字典,分析所述计数器的关联模块对应的日志信息,发现异常信息;和/或

所述问题分析库通过遍历信令信息字典,得到所述性能数据指示的信令及其关联信息,并通过遍历日志信息字典,分析所述信令的关联信息对应的日志信息,发现异常信息。

优选地,所述根据所确定的分析顺序,通过遍历相应的信息字典,查找并发 现异常信息的步骤包括:

当根据所述待分析故障的故障分析流程,确定对所述基站信息的顺序为日志信息和信令信息时,所述问题分析库通过遍历信令信息字典,找到与所述待分析故障相关的信令及其关联模块;

所述问题分析库通过遍历日志信息字典,分析所述信令的关联模块对应的日志信息,发现异常信息。

根据本发明的另一方面,提供了一种故障定位装置,包括:

文件管理模块,用于根据待分析故障的类型,生成信息采集模板;

通信模块,用于将所述信息采集模板发送给网管,并接收所述网管根据所述信息采集模版采集的基站信息;

定位模块,用于对所接收的基站信息进行分析,得到所述待分析故障的故障定位结果。

优选地,所述文件管理模块利用问题分析库,查找所述待分析故障的类型所关联的信息采集说明,并生成包含所述信息采集说明的信息采集模版。

优选地,所述定位模块包括:

信息解析子模块,用于利用信息解析库对所述基站信息进行解析,生成信息字典;

信息分析子模块,用于利用所述问题分析库和所述信息字典对所述待分析故障进行故障定位,得到所述待分析故障的故障定位结果。

与现有技术相比较,本发明的有益效果在于:

本发明利用信息采集模板进行基站信息采集,使运维人员能够轻松快速的采集所需要的基站信息,并在采集所需要的基站信息后及时进行分析,达到快速有效定位和处理故障的目的,提高了故障定位和处理效率,提升了网络服务质量,同时提升了用户的满意度。

附图说明

图1是本发明实施例提供的故障定位方法框图;

图2是本发明实施例提供的日志头信息示意图;

图3是本发明实施例提供的基站系统各部分关系示意图;

图4是本发明实施例提供的分析系统的主要模块结构示意图;

图5是本发明实施例提供的问题分析库的关键信息模型示意图;

图6是本发明实施例提供的基站系统各部分交互流程图;

图7是本发明实施例提供的性能故障分析处理流程图;

图8是本发明实施例提供的系统故障分析处理流程图。

具体实施方式

以下结合附图对本发明的优选实施例进行详细说明,应当理解,以下所说明的优选实施例仅用于说明和解释本发明,并不用于限定本发明。

图1是本发明实施例提供的基站信息分析方法框图,如图1所示,步骤包括:

步骤S101:根据待分析故障的类型,生成信息采集模板,并将所述信息采集模板发送给网管。

其中,待分析故障的类型包括操作系统平台类故障、操作维护类故障、传输类故障、业务类故障、基带类故障、射频类故障。在问题分析库中,预先设置故障类型与信息采集说明之间的对应关系,一旦待分析故障的类型确定后,就可以利用问题分析库,查找所述待分析故障的类型所关联的信息采集说明,并生成包含所述信息采集说明的信息采集模版。

其中,网管根据所述信息采集模板中指定的信息采集说明,采集基站信息,并将采集到的基站信息发送给所述分析系统。也就是说,网管根据对应于待分析故障类型的信息采集模板进行基站信息的采集。

具体地说,为了减少每次采集的信息量,在待分析故障的类型确定时,利用问题分析库生成信息采集模板,信息采集模板中明确了需要采集的基站信息,并通过文件传输协议(File Transfer Protocol,FTP)方式将信息采集模板发送给网管,并通知网管采集信息。网管加载信息采集模板,启动信息采集任务,并在信息采集任务完成后,将采集的基站信息打包生成文件包,通过FTP方式反馈文件包。

步骤S102:接收所述网管根据所述信息采集模版采集的基站信息,所述基站信息包括但不限于性能数据和/或信令信息和/或日志信息。

步骤S103:对所接收的基站信息进行分析,得到所述待分析故障的故障定 位结果。

具体地说,首先利用信息解析库对网管采集的基站信息进行解析,生成信息字典,所述信息字典包括但不限于通过对性能数据解析而生成的性能数据字典和/或通过对信令信息解析而生成的信令信息字典和/或通过对日志信息解析而生成的日志信息字典。然后利用所述问题分析库和所述信息字典对所述待分析故障进行故障定位,得到待分析故障的故障定位结果。

进一步说,在收到网管自动采集并返回的数据文件(即文件包)之后,利用信息解析库对该数据文件进行解析并生成包含时间数据的信息字典,然后调用问题分析库进行信息的分析,并给出分析报告或说明。也就是说,接收网管通过FTP方式发送的信息文件(即数据文件,文件包),通过调用各类信息的信息解析库,比如日志信息解析库、信令信息解析库、性能数据解析库等,解析采集到的各类信息并生成相应的信息字典,信息字典是各类信息的数据库,每类信息均包括时间数据,例如日志信息字典是以模块号和时间为关键索引的数据库,信令信息字典是以小区号、终端编号和时间数据为索引的数据库,性能数据是以性能指标和时间数据为索引的数据库。通过调用问题分析库进行信息的分析处理,以进行故障定位,其中,问题分析库包括问题(即故障)关联的信息类型,故障的分析流程和信息关联模块,例如,假设性能故障关联的信息类型包括性能数据、信令信息和日志信息,故障的分析流程给出先分析性能数据,此时,根据性能指标快速检索并获得待分析故障的发生时间和对应的计数器,对相应计数器进行对比分析找出影响性能指标的主要原因,根据计数器信息的关联模块来分析对应关联模块的日志,并根据故障的发生时间段快速检索到对应时间段的日志并进行分析。最后,根据问题分析库给出的分析流程结合信息的关联模块,完成对应故障的分析并给出报告说明。

可见,在基站运营维护过程中,本发明通过选择故障类型导出相应的信息采集模板,并由网管根据信息采集模板一键采集所有需要的基站信息,以便后续对网管采集的基站信息进行分析,并输出分析报告。

目前基站的日志信息是没有标准规范的,很多日志信息只有研发人员才可以进行分析,因此在需要通过分析日志信息来对待分析故障进行彻底定位时必须有研发人员参与,不仅影响问题处理效率,还增加了运维成本。针对该问题,本发 明对日志信息进行统一规范化处理,以进一步提高问题处理效率,并节省运维成本。

日志信息包括系统日志、研发内部日志和命令日志等。日志信息的规范化处理主要包括:

1.日志头信息的规范统一,所述日志头信息主要包括模块号、时间信息、级别和信息码等信息。

2.根据模块号和级别对信息码进行统一规划,以便将统一规划的信息码配置文件导入分析系统。

图2是本发明实施例提供的日志头信息示意图,如图2所示,具体内容如下:

1.用8位(即1个字节)表示模块号,用来区分用户面、控制面、调度、信道或者操作维护等模块;

2.用48位(即6个字节)表示时间信息(即时间数据),时间数据可以精确到毫秒;

3.用8位(即1个字节)表示日志的级别,用来区分错误、警告或是提示等信息;

4.用32位(即4个字节)表示信息码,信息码通过日志信息解析库导入分析系统。

图3是本发明实施例提供的基站系统各部分关系示意图,如图3所示,包括分析系统1、网管2、包含射频单元31和基带单元32的基站3。

在图3所示的系统架构中,所述分析系统1是新增系统,其可以独立部署,也可以和网管2一起部署,其实现了故障定位装置的功能,也就是说,分析系统1可以根据待分析故障的类型生成信息采集模板,并将所述信息采集模板发送给网管,进一步地,还可以接收所述网管根据所述信息采集模版采集的基站信息,并通过对所接收的基站信息进行分析,得到所述待分析故障的故障定位结果。

在分析系统1和网管2之间可以建立传输链接,也可以相互独立。当分析系统1和网管2之间建立传输链接时,分析系统1和网管2可以直接交互。分析系统1会检测和网管之间的链路,链路正常时可以直接通过分析系统一键完成信息采集和分析,并输出报告。

图4是本发明实施例提供的分析系统的主要模块结构示意图,如图4所示, 包括文件管理模块11、通信模块12、包括信息解析子模块13和信息分析子模块14的定位模块。

文件管理模块11根据待分析故障的类型,生成信息采集模板,进一步说,文件管理模块11完成各种输入信息文件的管理,例如信息采集模板,信息解析库和问题分析库等文件的管理,并且信息解析库和问题分析库可以独立更新升级。

通信模块12将所述信息采集模板发送给网管,并接收所述网管根据所述信息采集模版采集的基站信息,也就是说,通信模块12用于处理分析系统和和网管之间的信息交互。其中,所述基站信息包括但不限于性能数据、信令信息和日志信息。

定位模块对所接收的基站信息进行分析,得到所述待分析故障的故障定位结果。具体地说,信息解析子模块13利用信息解析库对网管采集的基站信息进行解析,生成信息字典,即,信息解析子模块13由信息的类型调用对应的信息解析库来完成信息的解析,其中信息解析库主要描述各类信息的数据结构信息,包括日志信息解析库、信令信息解析库、性能数据解析库等,信息解析子模块13解析各类信息并生成信息字典,信息字典是各类信息的数据库,每类信息均包括时间数据,例如日志信息字典是以模块号和时间为关键索引的数据库,信令信息字典是以小区号、终端编号和时间数据为索引的数据库,性能数据是以性能指标和时间数据为索引的数据库。信息分析子模块14利用所述问题分析库和信息字典对所述待分析故障进行故障定位,得到所述待分析故障的故障定位结果,并输出故障分析报告或说明,即,信息分析子模块14调用问题分析库,根据所述待分析故障的问题分析流程,确定对所述基站信息的分析顺序,根据所确定的分析顺序,通过遍历相应的信息字典,查找并发现异常信息,并根据发现的异常信息以及关联的原因,整理出所述问题分析报告或说明。也就是说,信息分析子模块14通过调用问题分析库来完成信息分析、故障定位和报告输出。

其中,根据所确定的分析顺序,通过遍历相应的信息字典,查找并发现异常信息的处理步骤包括以下几种方式:

方式1:当根据所述待分析故障的故障分析流程,确定分析所述基站信息的顺序为性能数据、日志信息和信令信息时,遍历性能数据字典,依次得到所述待 分析故障对应的性能数据、所述性能数据对应的计数器、所述计数器的关联模块,并通过遍历日志信息字典,分析所述计数器的关联模块对应的日志信息,发现异常信息。

方式2:在通过方式1处理后未发现异常信息的情况下,通过遍历信令信息字典,得到所述性能数据指示的信令及其关联信息,并通过遍历日志信息字典,分析所述信令的关联信息对应的日志信息,发现异常信息。

方式3:当根据所述待分析故障的故障分析流程,确定分析所述基站信息的顺序为日志信息和信令信息时,所述问题分析库通过遍历信令信息字典,找到与所述待分析故障相关的信令及其关联模块,并通过遍历日志信息字典,分析所述信令的关联模块对应的日志信息,发现异常信息。

图5是本发明实施例提供的问题分析库的关键信息模型示意图,如图5所示,具体描述如下:

1.问题分析库首先给出某类故障所关联的信息,例如,图5中的问题类型(即故障类型)关联的信息包括性能数据和日志信息等;

2.问题分析库描述了某类故障对信息的分析流程,例如,图5中虚线表示分析流程为,首先分析性能数据,然后根据性能数据的分析结果分析日志信息以及其他信息;

3.在关键信息模型中描述了各类信息中的关键数据,以及这些数据的关联模块,例如,图5中的性能数据对应的计数器的关联模块。

4.在信息分析时,除了根据问题分析库给出分析流程来进行分析,还要结合关键数据关联的模块来进行对应模块的信息分析。

图6是本发明实施例提供的基站系统各部分交互流程图,如图6所示,步骤包括:

步骤201:在基站的运维过程中,当发现某个站点出现故障时,在分析系统设置待分析故障的类型(即问题类型)和对应的站点编号,然后启动分析任务。

步骤202:分析系统结合待分析故障的类型,调用问题分析库,生成信息采集模板。

步骤203:分析系统向网管发送消息,以通知网管采集出现问题的站点的信息,并通过FTP把信息采集模板传递给网管。

步骤204:网管根据收到的信息采集模板,启动信息采集任务,并采集最近一天的数据。

步骤205:如果采集的信息需要从基站获取,网管自动发送通知消息以通知基站进行信息采集,例如日志信息。

步骤206:如果需要采集的信息可以在网管获取,则直接从网管导出,例如性能数据。

步骤207:基站把网管在通知消息中请求采集的数据收集完成后,根据通知消息中所带的FTP地址上传采集完成的信息数据,并发送信息通知网管。

步骤208:网管在采集所需要的信息之后,通过FTP方式将采集到的信息传递给分析系统,并发送消息以通知分析系统。

步骤209:分析系统收到消息后,调用信息解析库来完成信息的解析并生成信息字典。

步骤210:分析系统调用问题分析库来完成对信息的分析,得到故障定位结果,并生成相应的问题分析报告或说明。

步骤S211:分析系统输出所得到的分析报告或说明。

图7是本发明实施例提供的性能故障分析处理流程图,如图7所示,步骤包括:

步骤S301:选择故障类型,本实施例以终端接通率低的业务类故障为例,并按照所选择的故障类型采集基站信息。

步骤S302:分析系统结合故障类型,调用问题分析库,生成信息采集模板,该信息采集模板给出网管需要采集的数据包括性能数据(例如计数器数据)、信令跟踪数据和基带调度日志信息,并通过FTP把信息采集模板传递给网管。

步骤S303:网管按照信息采集模版中的上述信息采集说明,启动采集任务。

网管从性能数据库中导出最近一天的性能数据,启动信令跟踪任务跟踪信令数据,并通知基站上传日志信息。

步骤S304:网管将采集的数据通过FTP方式发送给分析系统,并通知分析系统已经完成信息采集。

步骤S305:分析系统调用信息解析库完成信息解析,生成信息字典,所述信息字典包括性能数据字典、信令信息字典和日志信息字典。

步骤S306:分析系统根据问题分析库中的分析流程进行信息分析和故障定位。

分析系统调用问题分析库启动分析。首先分析性能数据,快速遍历性能数据信息字典,找到终端接通率低的性能指标,通过对比分析该性能指标对应的计数器,发现导致终端接通率低的主要原因指向用来指示某条信令处理超时的计数器,分析系统从问题分析库中获取该计数器关联的模块,例如控制面,分析系统进一步分析控制面在故障发生的时间段内的日志信息,如果未发现异常,则得到对性能数据的分析结果,即通过性能数据以及关联的日志分析得到控制面没有异常,但是某条信令处理超时。

根据问题分析库的分析流程,进一步分析信令,分析系统遍历信令信息字典找到该超时的信令,遍历所有终端对应的信令均发现都存在该信令的超时现象,此时,进一步分析发现,超时信令的发生时间与终端接通率低的发生时间一致。

根据问题分析库中信令的关联信息,发现该超时信令由控制面发给基带,分析系统在前分析控制面时未异常,因此需要进一步分析基带关联的日志信息。此时,分析系统根据故障出现的时间段,对比分析基带调度日志信息,发现调度处理异常,由问题分析库给出该异常信息关联的原因并给出说明。

步骤S307:分析系统通过上述分析发现,由于基带调度处理异常引起某条信令处理超时,从而导致终端接通率低,结合问题分析库关联的具体原因给出分析说明和处理方法。

图8是本发明实施例提供的系统故障分析处理流程图,如图8所示,步骤包括:

步骤S401:选择故障类型并采集信息,本实施例以小区建立失败为例,设置故障类型和站点编号,并启动分析任务。

步骤S402:由图6给出的交互流程图,分析系统和网管自动交互,并完成信令信息和日志信息的采集。

步骤S403:首先,分析系统调用信息解析库完成信令信息和日志信息解析,并生成信令信息字典和日志信息字典。然后,分析系统调用问题分析库,分析信令跟踪,找到导致小区建立失败的信令所关联的模块和发生的时间。最后,分析系统进一步分析导致小区建立失败的模块的日志信息,根据故障发生的时间,快 速找到对应的异常日志。

步骤S404:分析系统调用问题分析库找到异常关联的原因,发现某个参数配置错误导致,结合分析过程中发现的原因以及关联处理方法给出分析说明。

综上所述,本发明具有以下技术效果:

本发明能够实现对基站信息的分析,提高故障定位和处理效率,改善设备服务水平,降低运维成本。

尽管上文对本发明进行了详细说明,但是本发明不限于此,本技术领域技术人员可以根据本发明的原理进行各种修改。因此,凡按照本发明原理所作的修改,都应当理解为落入本发明的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1