故障处理方法及装置与流程

文档序号:15171159发布日期:2018-08-14 17:58阅读:490来源:国知局

本申请涉及通信领域,尤其涉及一种故障处理方法及装置。



背景技术:

随着接入网技术的高速发展,宽带、语音和交互式网络电视(internetprotocoltelevision,iptv)等接入网业务功能便捷、内容丰富,并且能够满足用户对于人机交互的需求,因此,使用上述接入网业务的用户也急剧增长,随之而来的是部署上述接入网业务的运营商设备越来越多。由于运营商设备需要运维人员进行维护,而运维人员数量有限,且维护支撑手段不足,导致运营商设备的维护周期长。

此外,由于接入网业务往往涉及数据、平台和线路等多个方面,且每个方面的网管设备较离散,这给运维人员采集数据带来极大困难,耗费了大量时间。并且,一旦用户侧出现故障,运维人员需要对上述数据进行分析以得到故障位置,因数据量大,运维人员分析数据时也需要耗费大量,使得接入网业务的故障处理时间长,运维效率低。



技术实现要素:

本申请提供一种故障处理方法及装置,能够解决接入网业务故障处理时间长,运维效率低的问题。

为达到上述目的,本申请采用如下技术方案:

第一方面,本申请提供一种故障处理方法,所述故障处理方法应用于一种网络设备,所述网络设备与运营商设备连接以从所述运营商设备获取设备运行数据,所述运营商设备包括网管设备,所述方法包括:接收用户上报的故障信息,所述故障信息包括故障名称和账户信息;根据所述设备运行数据判断与所述故障信息对应的故障是否为群障;如果所述故障不是群障,则根据所述账户信息,从所述设备运行数据中筛选为所述用户提供服务的设备运行数据;对所述为用户提供服务的设备运行数据对应的设备进行测试,得到测试数据;根据所述测试数据中与标准数据不匹配的异常数据确定故障位置。

第二方面,本申请提供一种故障处理装置,该故障处理装置与运营商设备连接以从所述运营商设备获取设备运行数据,所述运营商设备包括网管设备,该故障处理装置包括:接收模块,用于接收用户上报的故障信息,所述故障信息包括故障名称和账户信息;判断模块,用于根据所述接收模块接收的所述设备运行数据判断与所述故障信息对应的故障是否为群障;筛选模块,用于如果所述判断模块判断所述故障不是群障,则根据所述账户信息,从所述设备运行数据中筛选为所述用户提供服务的设备运行数据;测试模块,用于对所述筛选模块筛选出的所述为用户提供服务的设备运行数据对应的设备进行测试,得到测试数据;确定模块,用于根据所述测试模块测试得到的所述测试数据中与标准数据不匹配的异常数据确定故障位置。

第三方面,本申请提供一种网络设备,该网络设备包括:存储器、通信接口和处理器,所述存储器和所述通信接口耦合至所述处理器,所述存储器用于存储计算机执行代码,所述处理器用于执行所述计算机执行代码控制网络设备执行上述第一方面及其各种可选的实现方式中任意之一所述的故障处理方法,所述通信接口用于所述网络设备与外部设备的数据传输。

第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在网络设备上运行时,使得所述网络设备执行上述第一方面及其各种可选的实现方式中任意之一所述的故障处理方法。

第五方面,本申请提供一种包含指令的计算机程序产品,当所述计算机程序产品在网络设备上运行时,使得所述网络设备执行上述第一方面及其各种可选的实现方式中任意之一所述的故障处理方法。

本申请提供了一种故障处理方法及装置,相比较于现有技术中由运维人员人工采集并分析数据得到故障位置,采集与分析数据过程中需要耗费大量时间,本申请能够自动获取包括设备运行数据,并初步判断该用户上报的故障是否为群障;如果用户上报的故障不是群障,则对上述故障再次进行测试,以确定故障位置。在上述确定故障位置的过程中,采集数据和分析数据均自动完成,减少了人工参与,从而减少了故障处理时间,提升了运维效率。

附图说明

图1为本申请实施例提供的一种网络设备的结构示意图;

图2为本申请实施例提供的一种故障处理方法的流程图;

图3为本申请实施例提供的另一种网络设备的结构示意图;

图4为本申请实施例提供的另一种故障处理方法的流程图;

图5为本申请实施例提供的一种故障处理装置的结构示意图;

图6为本申请实施例提供的另一种故障处理装置的结构示意图;

图7为本申请实施例提供的另一种网络设备的结构示意图。

具体实施方式

下面结合附图对本申请实施例提供的故障处理方法及装置进行详细地描述。

本申请的说明书以及附图中的术语“第一”和“第二”等是用于区别不同的对象,或者用于区别对同一对象的不同处理,而不是用于描述对象的特定顺序。

此外,本申请的描述中所提到的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括其他没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

需要说明的是,本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。

在本申请的描述中,除非另有说明,“多个”的含义是指两个或两个以上。

本申请实施例提供一种故障处理方法,参考图1,该方法可以应用于网络设备100中。网络设备100属于运行支撑系统(operationsupportsystem,oss)系统域,可以提供全面的接入网故障处理功能,以及对承载网的端到端网络状态和平台的服务能力进行监测,从而迅速辅助运维人员确定故障位置以及解决故障。

网络设备100包括展示层101、应用层102、逻辑层103、数据层104和接口层105。其中,展示层101包括显示模块1011,显示模块1011用于为不同使用者提供相应的操作界面,例如,为客服人员提供信息查询与故障预处理界面,为运维人员提供信息查询、故障诊断界面和设备状态监控界面等;应用层包括查询模块1021和故障诊断模块1022,查询模块1021用于实现数据查询功能,故障诊断模块用于构建实现故障诊断、故障修复和故障统计分析等功能的应用软件;逻辑层103用于接收来自应用层的各类请求信息,并根据请求信息形成对应的查询逻辑、诊断逻辑,之后通知接口层105获取数据,并将上述数据统一传递到数据层104进行存储,同时利用数据关联与分析模块1032对数据进行关联、分析与处理,之后将数据处理结果响应给应用层102构建的应用,其中,查询逻辑位于数据关联与分析模块1032,用于实现查询功能,诊断逻辑位于测试模块,用于实现测试功能;数据层104包括存储模块1041、获取模块1042和管理模块1043,用于获取、存储以及管理逻辑层103路由的数据以及所有与该网络设备100连接的运营商设备的数据;接口层105包括数据解析模块1051和数据封装模块1052,负责接收和下发各类指令或请求信息,以及接收各个与网络设备100连接的运营商设备反馈的数据,其中,指令或请求信息包括查询类和配置类。

参阅图1,接口层105与运营商设备,如第一运营商设备1061、第二运营商设备1062等连接,该运营商设备可以为网络设备和业务平台等,对于运营商设备的种类,在此不做限定。

可选的,该网络设备100的使用者,如客服人员、运维人员等,需要使用账户登录该网络设备以使用该网络设备提供的各种功能。针对登录的不同账户,网络设备100可为账户设置不同的功能权限以及操作界面,如客服人员具有查询信息的权限,运维人员具有查询信息、故障处理、监控网络设备状态的权限等。不同账户的权限可由运营商根据实际情况自行设置,在此不做限定。

需要说明的是,存在于逻辑层103中的诊断逻辑可作为专家知识数据库,此外,专家知识数据库中还可包括预设故障信息,即根据经验等获取的各种故障名称、导致该故障的原因以及故障的解决方案等。可选的,运营商各个岗位的工作人员可向专家知识数据库中添加接入网故障的处理流程,该处理流程也可作为专家知识数据库中的信息为该网络设备的用户提供。

可选的,在依据诊断逻辑进行故障诊断的过程中,需要建立用户设备网络,即明确各个设备与设备之间的连接关系,通过该用户设备网络,运维人员可以清楚所有为该用户提供服务的设备。该用户设备网络还可称为资源树。

本申请实施例提供一种故障处理方法,应用于如图1所示的网络设备,该网络设备与运营商设备连接以从运营商设备获取设备运行数据,其中,运营商设备包括网管设备。如图2所示,该方法可以包括:

步骤201、接收用户上报的故障信息。

其中,故障信息包括故障名称和账户信息。

示例性的,用户上报的故障包括宽带及语音业务认证故障、设备故障、链路质量、iptv认证故障、epg菜单无响应、视频无法点播、播放质量差、播放时直播节目黑屏点播节目正常、播放时直播节目正常点播节目黑屏、播放时点播直播节目都黑屏、开机黑屏等视频业务质量故障。

可选的,设备运行数据的来源可以分为五类:第一类为来自接入网网管的数据,该部分数据包括告警数据、性能数据、流量数据和拓扑数据等;第二类为来自网络互连协议(internetprotocol,ip)网管的设备性能和流量等数据,上述数据主要为宽带接入服务器(broadbandaccessserver,bas)或全业务路由器(servicerouter,sr)的自身性能和流量数据;第三类为来自业务平台的认证信息和业务信息,主要包括用户在业务平台认证的过程中生成的日志信息和平台能力信息,上述信息用于判断用户在认证类错误中的具体原因和业务平台当前的运行状态;第四类为来自客户关系管理(customerrelationshipmanagement,crm)、号线、动态主机配置协议(dynamichostconfigurationprotocol,dhcp)、远程管理系统(remotemanagementsystem,rms)等多个支撑系统的资源、认证和资费等数据;第五类为来自于iptv业务平台、电子节目单(electronicprogrammerguide,epg)服务器、内容分发网络(contentdeliverynetwork,cdn)平台等平台中涉及用户对于业务质量感知的数据,以及通过软硬探针等探测得到的用户对于业务质量感知的数据。

上述五类数据均可以通过网络设备与各个网管、平台或系统之间的接口获取。

可选的,参考图3,在申请实施例中,网络设备与网管、平台或系统之间的接口如下表一所示:

表一

需要说明的是,上述表一中仅介绍了与本申请实施例提供的网络设备连接的12类设备,以及当这12类设备与该网络设备连接时,该网络设备可获取的数据或实现的功能,并未限定仅有这12类设备,也并未限制与这12类设备连接的网络设备仅能获取表一中给出的数据,或者实现表一中介绍的功能。

可选的,用户还可以使用该网络设备自行进行故障处理。具体的,用户向该网络设备提供的查找故障原因界面中输入故障名称,即可从该网络设备的预设故障信息中查找并显示与故障对应的故障原因,之后用户可以根据上述故障原因自行排查故障位置。其中,预设故障信息包括故障及对应的故障原因。

可选的,用户可以通过与该网络设备配套的应用程序(application,app),或者其他对接该网络设备的app使用该网络设备,对于可使用的app种类,在此不做限定。

步骤202、根据设备运行数据判断与故障信息对应的故障是否为群障。

其中,群障为大面积故障,即由于连接大量用户的一个或多个设备损坏而导致大量用户都无法正常进行业务的故障。示例性的,群障包括光线路终端(opticallineterminal,olt)设备故障、olt板卡故障、olt脱网等。

步骤203、如果故障不是群障,则根据账户信息,从设备运行数据中筛选为用户提供服务的设备运行数据。

可选的,如果资源树已经建立,则可直接从资源树中获取为用户提供服务的设备信息,之后根据上述设备信息,从网络设备获取的目标数据中筛选为用户提供服务的设备运行数据,其中,目标数据用于表示网络设备从运营商部署的网管、平台或系统中获取的数据。

可选的,如果故障是群障,则可以直接告知用户,无需进行步骤203及后续步骤。

步骤204、对为用户提供服务的设备运行数据对应的设备进行测试,得到测试数据。

具体的,可以先使用探针对为用户提供服务的设备进行拨测,得到第一测试数据;再使用预设测试功能进行测试,得到第二测试数据;其中,第一测试数据和第二测试数据组成测试数据,预设测试功能即为诊断逻辑。

其中,上述使用探针进行拨测为初步诊断。初步诊断是不连接oss,只依靠探针来进行故障处理的方式。初步诊断主要应用于障碍受理测试。障碍受理台接到iptv用户的故障申告后,受理员将用户iptv账号输入网络设备,网络设备按一定的流程自动调用各测试功能,经综合判断后给出该用户的故障位置。初步诊断不需要用户参与、测试过程相对比较简单、故障定位较粗,能满足分专业或分区域派单即可,通常只需区分出平台、核心网、接入网和用户侧(主要针对接入终端和应用终端)的故障。

上述使用测试功能进行测试的过程属于精确诊断,精确诊断是需要连接oss来获得设备运行数据,从而实现精确定位的故障处理方式。精确诊断可以自动和综合地实现端到端的故障自动定位,精确定位至设备、板卡、端口等,它主要应用于接入网、城域网和业务平台的维修人员。障碍受理系统派单出去后,维修人员需要获取该用户更详细的障碍信息,或需要对障碍进行更精确定位。通过精确诊断功能,维修人员可调用各类测试功能进行交互性的详细测试(有些场景还需要用户的配合),在结合维修人员经验和专家知识数据库等的基础上,分析障碍的具体原因。

可选的,在使用探针对设备进行拨测,得到第一测试数据之后,还可以根据第一测试数据中与标准数据不匹配的异常数据确定故障发生区域,其中,故障发生区域的范围较大,覆盖故障位置,也就是说,通过探针拨测确定故障的大概范围。由于每个区域均有对应的运维人员,当确定故障的大概范围之后,就能够生成工单,并将上述工单下发至与故障发生区域对应的运维人员,以便于接收到工单的运维人员进行故障维修。

可选的,网络设备还可以接收运维人员完成工单的情况,并根据上述运维人员完成工单的情况统计工单一次成功率、每个区域故障数量、排障成功率、空闲端口率、终端数量等,并分类显示上述数据。可选的,可以使用表格、图像显示上述数据,并以颜色区分属于不同区域的数据。

步骤205、根据测试数据中与标准数据不匹配的异常数据确定故障位置。

需要说明的是,标准数据需要运营商根据设备情况自行设置。

可选的,除故障处理之外,网络设备还可为运维人员提供查询功能,该查询功能包括用户信息查询、用户认证信息查询、用户关联网络设备查询、用户终端设备查询、测速质量查询、线路质量查询、机顶盒基本信息查询、机顶盒业务质量信息查询、iptv认证信息查询等。

相比较于现有技术中由运维人员人工采集并分析数据得到故障位置,采集与分析数据过程中需要耗费大量时间,本申请实施例能够自动获取包括设备运行数据,并初步判断该用户上报的故障是否为群障;如果用户上报的故障不是群障,则对上述故障再次进行测试,以确定故障位置。在上述确定故障位置的过程中,采集数据和分析数据均自动完成,减少了人工参与,从而减少了故障处理时间,提升了运维效率。

为了提高故障处理效率,在本申请实施例的一个实现方式中,需要对从网管、平台等获取的数据进行初步分析,以实现故障预警。因此,在如图2所示的实现方式中,还可以实现为如图4所示的实现方式,即步骤401至步骤402:

步骤401、根据设备告警信息,通过测试判断上报设备告警信息的设备是否出现故障。

步骤402、如果上报设备告警信息的设备故障,则生成故障提示。

在本申请实施例中,在接收到其他设备上报的数据之后,网络设备可以对上述数据进行初步测试,以实现故障提示,之后运维人员可以及时对故障进行排查,从而减少由用户发现的故障,提高用户体验。

本申请实施例可以根据上述方法示例对网络设备进行功能模块或者功能单元的划分,例如,可以对应各个功能划分各个功能模块或者功能单元,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块或者功能单元的形式实现。其中,本申请实施例中对模块或者单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

如图5所示,本申请实施例提供一种故障处理装置,该故障处理装置500与运营商设备连接以从运营商设备获取设备运行数据,运营商设备包括网管设备,该故障处理装置500包括接收模块、判断模块、筛选模块、测试模块和确定模块。

其中,接收模块501,用于接收用户上报的故障信息,故障信息包括故障名称和账户信息。

判断模块502,用于根据接收模块501接收的设备运行数据判断与故障信息对应的故障是否为群障。

筛选模块503,用于如果判断模块502判断故障不是群障,则根据账户信息,从设备运行数据中筛选为用户提供服务的设备运行数据。

测试模块504,用于对筛选模块503筛选出的为用户提供服务的设备运行数据对应的设备进行测试,得到测试数据。

确定模块504,用于根据测试模块504测试得到的测试数据中与标准数据不匹配的异常数据确定故障位置。

可选的,测试模块504,用于:

使用探针对为用户提供服务的设备进行拨测,得到第一测试数据;

使用预设测试功能进行测试,得到第二测试数据;

其中,第一测试数据和第二测试数据组成测试数据。

可选的,确定模块505,还用于根据第一测试数据中与标准数据不匹配的异常数据确定故障发生区域,故障发生区域覆盖故障位置。

该故障处理装置500还包括:

工单模块506,用于向与确定模块505确定的故障发生区域对应的运维人员下发工单,以供运维人员根据工单维修故障。

可选的,该故障处理装置500还包括:

查询模块507,用于从预设故障信息中查找并显示与故障对应的故障原因,以供用户自行排查故障位置,预设故障信息包括故障及对应的故障原因。

可选的,设备运行数据包括设备告警信息,

判断模块502,还用于根据设备告警信息,通过测试判断上报设备告警信息的设备是否出现故障。

该故障处理装置500还包括:

生成模块508,用于如果判断模块502判断上报设备告警信息的设备故障,则生成故障提示。

本申请提供的故障处理装置,相比较于现有技术中由运维人员人工采集并分析数据得到故障位置,采集与分析数据过程中需要耗费大量时间,本申请能够自动获取包括设备运行数据,并初步判断该用户上报的故障是否为群障;如果用户上报的故障不是群障,则对上述故障再次进行测试,以确定故障位置。在上述确定故障位置的过程中,采集数据和分析数据均自动完成,减少了人工参与,从而减少了故障处理时间,提升了运维效率。

图6示出了上述实施例中所涉及的故障处理装置的又一种可能的结构示意图。该故障处理装置600包括:处理单元601和通信单元602。处理单元601用于对故障处理装置600的动作进行控制管理,例如,执行上述判断模块502、筛选模块503执行的步骤,和/或用于执行本文所描述的技术的其它过程。通信单元602用于支持故障处理装置600与其他网络实体的通信,例如,执行上述接收模块501执行的步骤。故障处理装置600还可以包括存储单元603,存储单元603用于存储故障处理装置600的程序代码和数据。

其中,参阅图7所示,上述处理单元601可以是网络设备700中的处理器701或控制器,该处理器701或控制器可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。该处理器701或控制器可以是中央处理器,通用处理器,数字信号处理器,专用集成电路,现场可编程门阵列或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。所述处理器701也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,数字信号处理(digitalsignalprocessing,dsp)和微处理器的组合等。

通信单元602可以是网络设备700中的收发器、收发电路或通信接口702等。

存储单元603可以是网络设备700中的存储器703等,该存储器703可以包括易失性存储器,例如随机存取存储器;该存储器703也可以包括非易失性存储器,例如只读存储器,快闪存储器,硬盘或固态硬盘;该存储器还可以包括上述种类的存储器的组合。

总线704可以是扩展工业标准结构(extendedindustrystandardarchitecture,eisa)总线等。总线704可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质中存储有指令,当网络设备执行该指令时,该网络设备执行上述方法实施例所示的方法流程中网络设备执行的各个步骤。

其中,计算机可读存储介质,例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(randomaccessmemory,ram)、只读存储器(read-onlymemory,rom)、可擦式可编程只读存储器(erasableprogrammablereadonlymemory,eprom)、寄存器、硬盘、光纤、便携式紧凑磁盘只读存储器(compactdiscread-onlymemory,cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合、或者本领域熟知的任何其它形式的计算机可读存储介质。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于特定用途集成电路(applicationspecificintegratedcircuit,asic)中。在本申请实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何在本申请揭露的技术范围内的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1