一种在无线局域网中定位故障的方法和装置与流程

文档序号:16886884发布日期:2019-02-15 22:43阅读:200来源:国知局
一种在无线局域网中定位故障的方法和装置与流程

本发明涉及数据通信领域,尤其是一种在无线局域网中定位故障的方法和装置。



背景技术:

无线局域网(wirelesslocalareanetwork)简称wlan,是以无线信道作为传输媒介的计算机局域网,是有线联网方式的重要补充和延伸,广泛应用于需要可移动数据处理或难以进行物理传输介质布线的领域。

wlan主要由站(station,无线终端sta)、无线接入点(accesspoint,ap)、无线介质(wirelessmedium,wm)和分布式系统(dis-tributionsystem,ds)组成。

sta在wlan中一般为客户端,可以是装有无线网卡的计算机,也可以是有无线保真wifi模块的智能手机。sta可以是移动的,也可以是固定的,是无线局域网的最基本组成单元。

无线局域网在运行过程中可能因无线接入点ap故障、网络参数配置错误或网络攻击等因素发生故障,导致网络通信受到影响,直接影响用户的上网体验,甚至给用户带来直接的经济损失。

无线接入点ap在运行过程中会打印一些系统日志(syslog),和无线终端sta上线日志。

自动实时地采集设备syslog,sta上线日志,从这些数据中及时诊断出无线网络可能存在的故障,并通告给网络管理人员,最终及时解决故障,恢复网络正常运行是网络运维的迫切需要解决的问题。

现有的wlan故障通常只能采用传统的人工路测方法对wlan网络性能及其覆盖情况进行监测,这种监测方法需要工程人员携带各种监测仪器、仪表等到各个wlan接入点实地采集网络质量参数和进行数据业务测试,然后对采集的网络质量采集参数和数据业务测试结果进行统计和定位分析,评估出各个wlan接入点的网络质量。由于人工操作存在即时性、主观性,这种监测方法无法实现全面、连续的网络监测,从而也很难做到防范于未然的网络故障监测,对wlan网络故障定位等各种网络异常监测操作也相当复杂。而且,目前用于监测的仪器仪表设备昂贵,需要耗费大量的人力、物力和资金,检测成本高,给企业wlan用户的wlan建设规划及优化带来很大的困难。



技术实现要素:

为了解决上述技术问题,本发明的实施例采用如下技术方案:

一种在无线局域网中定位故障的方法,包括:

获取n个无线接入点ap各自的在第一周期中的第一运行日志,其中,n为大于等于1的正整数;

将所有第一运行日志汇总为第二运行日志;

生成以所述第二运行日志中的无线终端sta的标识为主键,以与所述主键对应的ap的标识、与所述主键对应的运行日志的内容以及与所述主键对应的运行日志的生成时间戳为内容的记录;

对sta的标识相同且ap的标识相同的记录根据所述生成时间戳进行排序;

根据与所述主键对应的运行日志的内容确定所述记录匹配的报文类型;

根据所述报文类型和根据所述时间戳排序的结果确定每个sta在每个ap上对应的sta的运行过程,所述运行过程至少包括sta的标识、ap的标识、sta的状态变化时间和sta当前状态;

根据所述记录的关键字对所述记录的集合进行分组;

对每一分组根据所述状态变化时间对所述每一分组包含的记录进行排序;

根据对所述每一分组包含的记录进行排序的结果统计在第二周期中sta的运行过程对应的当前状态为失败的出现频率;

根据统计的频率确定所述每个分组中网络故障的种类。

可选的,所述状态变化时间为认证时间,或者上线时间或者下线时间。

可选的,所述报文类型为sta认证报文,sta关联报文,ip地址分配报文,ip地址切换报文或sta下线报文之一。

可选的,所述运行过程还包括:sta认证时间,sta关联时间,ip地址分配时间,sta上线时间和sta下线时间中的一个或者多个。

可选的,所述关键字为sta的标识,

所述根据统计的频率确定所述每个分组中网络故障的种类的步骤具体包括:

当所述分组为根据sta的标识划分的分组时,在连续m时间单位内所有sta的运行过程对应的当前状态都为失败,则确定所述根据sta的标识划分的分组中的网络故障为整个网络的故障;

当所述分组为根据sta的标识划分的分组,且在连续m时间单位内的sta的运行过程对应的当前状态为失败的sta数量小于第一阈值时,则根据所述sta的运行过程确定状态失败的sta的标识,根据所述状态失败的sta的标识确定所述根据sta的标识划分的分组中的网络故障为所述状态失败的sta的故障。

可选的,所述关键字为ap的标识,

所述根据统计的频率确定所述每个分组中网络故障的种类的步骤具体包括:

当所述分组为根据ap的标识划分的分组,且在连续m时间单位内的sta的运行过程对应的当前状态为失败的sta数量小于第一阈值时,则根据所述sta的运行过程确定状态失败的sta对应的ap的标识,根据状态失败的sta对应的ap的标识确定所述根据ap的标识划分的分组中的网络故障为所述状态失败的sta对应的ap的故障。

可选的,所述方法还包括:

获取无线局域网中sta各自的在第一周期中的第三运行日志;

将所有第三运行日志汇总为第四运行日志;

根据所述第四运行日志中的ap的标识、sta的状态变化时间与所述sta的运行过程中的ap的标识、sta的状态变化时间进行匹配,如果匹配,则将所述第四运行日志中的ssid添加到所述sta的运行过程中。

可选的,所述关键字为ssid的标识;

所述根据统计的频率确定所述每个分组中网络故障的种类的步骤具体包括:

当所述分组为根据ssid的标识划分的分组,且在连续m时间单位内的sta的运行过程对应的当前状态为失败的sta数量小于第一阈值时,则根据所述sta的运行过程确定状态失败的sta对应的ssid,根据状态失败的sta对应的ssid确定所述根据ssid划分的分组中的网络故障为所述状态失败的sta对应的ssid的故障。

可选的,所述sta当前状态由如下步骤确定:

当sta一次上线成功所需具备的报文类型都在一次上线所对应的时间戳排序结果中按标准规定的顺序出现时,则确定sta当前状态为成功;

当sta一次上线成功所需具备的报文类型中至少一个报文类型没有在一次上线所对应的时间戳排序结果中按标准规定的顺序出现时,则确定sta当前状态为失败。

本发明实施例的另一方面在于,提供一种在无线局域网中定位故障的装置,包括:

第一获取模块,用于获取n个无线接入点ap各自的在第一周期中的第一运行日志,其中,n为大于等于1的正整数;

第一汇总模块,用于将所有第一运行日志汇总为第二运行日志;

第一生成模块,用于生成以所述第二运行日志中的无线终端sta的标识为主键,以与所述主键对应的ap的标识、与所述主键对应的运行日志的内容以及与所述主键对应的运行日志的生成时间戳为内容的记录;

第一排序模块,用于对sta的标识相同且ap的标识相同的记录根据所述生成时间戳进行排序;

第一确定模块,用于根据与所述主键对应的运行日志的内容确定所述记录匹配的报文类型;

第二确定模块,用于根据所述报文类型和根据所述时间戳排序的结果确定每个sta在每个ap上对应的sta的运行过程,所述运行过程至少包括sta的标识、ap的标识、sta的状态变化时间和sta当前状态;

分组模块,用于根据所述记录的关键字对所述记录的集合进行分组;

第二排序模块,用于对每一分组根据所述状态变化时间对所述每一分组包含的记录进行排序;

统计模块,用于根据对所述每一分组包含的记录进行排序的结果统计在第二周期中sta的运行过程对应的当前状态为失败的出现频率;

第三确定模块,用于根据统计的频率确定所述每个分组中网络故障的种类。

可选的,所述状态变化时间为认证时间,或者上线时间或者下线时间。

可选的,所述报文类型为sta认证报文,sta关联报文,ip地址分配报文,ip地址切换报文或sta下线报文之一。

可选的,所述运行过程还包括:sta认证时间,sta关联时间,ip地址分配时间,sta上线时间和sta下线时间中的一个或者多个。

可选的,所述关键字为sta的标识,

所述第三确定模块具体用于:

当所述分组为根据sta的标识划分的分组时,在连续m时间单位内所有sta的运行过程对应的当前状态都为失败,则确定所述根据sta的标识划分的分组中的网络故障为整个网络的故障;

当所述分组为根据sta的标识划分的分组,且在连续m时间单位内的sta的运行过程对应的当前状态为失败的sta数量小于第一阈值时,则根据所述sta的运行过程确定状态失败的sta的标识,根据所述状态失败的sta的标识确定所述根据sta的标识划分的分组中的网络故障为所述状态失败的sta的故障。

可选的,所述关键字为ap的标识,

所述第三确定模块具体用于:

当所述分组为根据ap的标识划分的分组,且在连续m时间单位内的sta的运行过程对应的当前状态为失败的sta数量小于第一阈值时,则根据所述sta的运行过程确定状态失败的sta对应的ap的标识,根据状态失败的sta对应的ap的标识确定所述根据ap的标识划分的分组中的网络故障为所述状态失败的sta对应的ap的故障。

可选的,所述装置还包括:

第二获取模块,用于获取无线局域网中sta各自的在第一周期中的第三运行日志;

第二汇总模块,用于将所有第三运行日志汇总为第四运行日志;

匹配模块,用于根据所述第四运行日志中的ap的标识、sta的状态变化时间与所述sta的运行过程中的ap的标识、sta的状态变化时间进行匹配,

添加模块,用于如果匹配,则将所述第四运行日志中的ssid添加到所述sta的运行过程中。

可选的,所述关键字为ssid的标识;

所述第三确定模块具体用于:

当所述分组为根据ssid的标识划分的分组,且在连续m时间单位内的sta的运行过程对应的当前状态为失败的sta数量小于第一阈值时,则根据所述sta的运行过程确定状态失败的sta对应的ssid,根据状态失败的sta对应的ssid确定所述根据ssid划分的分组中的网络故障为所述状态失败的sta对应的ssid的故障。

可选的,所述装置还包括:sta当前状态确定模块,用于当sta一次上线成功所需具备的报文类型都在一次上线所对应的时间戳排序结果中按标准规定的顺序出现时,则确定sta当前状态为成功;

当sta一次上线成功所需具备的报文类型中至少一个报文类型没有在一次上线所对应的时间戳排序结果中按标准规定的顺序出现时,则确定sta当前状态为失败。

本发明实施例的有益效果在于,全自动全天侯采集wlan网络下所有ap设备的syslog日志和sta日志,在无人值守的情况下自动发现wlan中的网络故障,并自动向运维人员发送告警信息,达到wlan网络全自动化故障发现和定位。并且采用大数据的分析统计方法,把syslog日志、sta日志等繁杂的数据通过与实际业务流程相关联和聚合的计算方法,与应用场景相结合,有效提高了故障预测结果的准确性,也提高了可用性。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例的一种方法流程图;

图2为本发明实施例的一种方法流程图;

图3为本发明实施例的一种方法流程图;

图4为本发明实施例的一种装置结构图;

图5为本发明实施例的一种装置结构图;

图6为本发明实施例的一种系统结构图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

首先,需要说明的是,sta接入过程指的是sta接入网络的过程,在sta接入过程中包括认证,关联这两个步骤。

sta过程指的是sta从接入网络到下线的过程,在sta过程中,从syslog报文上看,过程包括认证,关联,ip分配,因频段切换造成的ip切换,因漫游造成的重关联和ip分配,下线等信息。

本发明第一实施例提供一种在无线局域网中定位故障的方法,如图1所示,包括:

s101,获取n个无线接入点ap各自的在第一周期中的第一运行日志;

其中,n为大于等于1的正整数。

s103,将所有第一运行日志汇总为第二运行日志;

s105,生成以所述第二运行日志中的无线终端sta的标识为主键,以与所述主键对应的ap的标识、与所述主键对应的运行日志的内容以及与所述主键对应的运行日志的生成时间戳为内容的记录;

s107,对sta的标识相同且ap的标识相同的记录根据所述生成时间戳进行排序;

s109,根据与所述主键对应的运行日志的内容确定所述记录匹配的报文类型;

s111,根据所述报文类型和根据所述时间戳排序的结果确定每个sta在每个ap上对应的sta的运行过程,所述运行过程至少包括sta的标识、ap的标识、sta的状态变化时间和sta当前状态;

s113,根据所述记录的关键字对所述记录的集合进行分组;

s115,对每一分组根据所述状态变化时间对所述每一分组包含的记录进行排序;

s117,根据对所述每一分组包含的记录进行排序的结果统计在第二周期中sta的运行过程对应的当前状态为失败的出现频率;

s119,根据统计的频率确定所述每个分组中网络故障的种类。

可选的,所述状态变化时间为认证时间,或者上线时间或者下线时间。

可选的,所述报文类型为sta认证报文,sta关联报文,ip地址分配报文,ip地址切换报文或sta下线报文之一。

可选的,所述运行过程还包括:sta认证时间,sta关联时间,ip地址分配时间,sta上线时间和sta下线时间中的一个或者多个。

可选的,步骤s113中的关键字为sta的标识,

则,所述步骤s119具体包括:

当所述分组为根据sta的标识划分的分组时,在连续m时间单位内所有sta的运行过程对应的当前状态都为失败,则确定所述根据sta的标识划分的分组中的网络故障为整个网络的故障;

当所述分组为根据sta的标识划分的分组,且在连续m时间单位内的sta的运行过程对应的当前状态为失败的sta数量小于第一阈值时,则根据所述sta的运行过程确定状态失败的sta的标识,根据所述状态失败的sta的标识确定所述根据sta的标识划分的分组中的网络故障为所述状态失败的sta的故障。

其中,m可以为正整数,时间单位可以为时、分、秒,毫秒,微秒等。

可选的,步骤s113中的关键字为ap的标识,

则,所述步骤s119具体包括:

当所述分组为根据ap的标识划分的分组,且在连续m时间单位内的sta的运行过程对应的当前状态为失败的sta数量小于第一阈值时,则根据所述sta的运行过程确定状态失败的sta对应的ap的标识,根据状态失败的sta对应的ap的标识确定所述根据ap的标识划分的分组中的网络故障为所述状态失败的sta对应的ap的故障。

可选的,本发明第二实施例如图2所示,本发明第一实施例所述的方法还包括:

s201,获取无线局域网中sta各自的在第一周期中的第三运行日志;

s203,将所有第三运行日志汇总为第四运行日志;

s205,根据所述第四运行日志中的ap的标识、sta的状态变化时间与所述sta的运行过程中的ap的标识、sta的状态变化时间进行匹配,

s207,如果匹配,则将所述第四运行日志中的ssid添加到所述sta的运行过程中。

可选的,在本发明第二实施例中,步骤s113中的关键字为ssid(servicesetidentifier服务集标识)的标识;

则,在本发明第二实施例中,所述步骤s119具体包括:

当所述分组为根据ssid的标识划分的分组,且在连续m时间单位内的sta的运行过程对应的当前状态为失败的sta数量小于第一阈值时,则根据所述sta的运行过程确定状态失败的sta对应的ssid,根据状态失败的sta对应的ssid确定所述根据ssid划分的分组中的网络故障为所述状态失败的sta对应的ssid的故障。其中,m可以为正整数,时间单位可以为时、分、秒,毫秒,微秒等。

可选的,如图3所示,本发明第一实施例中的sta当前状态由如下步骤确定:

s301,当sta一次上线成功所需具备的报文类型都在一次上线所对应的时间戳排序结果中按标准规定的顺序出现时,则确定sta当前状态为成功;

s303,当sta一次上线成功所需具备的报文类型中至少一个报文类型没有在一次上线所对应的时间戳排序结果中按标准规定的顺序出现时,则确定sta当前状态为失败。

本发明实施例的有益效果在于,全自动全天侯采集wlan网络下所有ap设备的syslog日志和sta日志,在无人值守的情况下自动发现wlan中的网络故障,并自动向运维人员发送告警信息,达到wlan网络全自动化故障发现和定位。并且采用大数据的分析统计方法,把syslog日志、sta日志等繁杂的数据通过与实际业务流程相关联和聚合的计算方法,与应用场景相结合,有效提高了故障预测结果的准确性,也提高了可用性。

本发明第三实施例提供一种在无线局域网中定位故障的装置,如图4所示,包括:

第一获取模块401,用于获取n个无线接入点ap各自的在第一周期中的第一运行日志,其中,n为大于等于1的正整数;

第一汇总模块403,用于将所有第一运行日志汇总为第二运行日志;

第一生成模块405,用于生成以所述第二运行日志中的无线终端sta的标识为主键,以与所述主键对应的ap的标识、与所述主键对应的运行日志的内容以及与所述主键对应的运行日志的生成时间戳为内容的记录;

第一排序模块407,用于对sta的标识相同且ap的标识相同的记录根据所述生成时间戳进行排序;

第一确定模块409,用于根据与所述主键对应的运行日志的内容确定所述记录匹配的报文类型;

第二确定模块411,用于根据所述报文类型和根据所述时间戳排序的结果确定每个sta在每个ap上对应的sta的运行过程,所述运行过程至少包括sta的标识、ap的标识、sta的状态变化时间和sta当前状态;

分组模块413,用于根据所述记录的关键字对所述记录的集合进行分组;

第二排序模块415,用于对每一分组根据所述状态变化时间对所述每一分组包含的记录进行排序;

统计模块417,用于根据对所述每一分组包含的记录进行排序的结果统计在第二周期中sta的运行过程对应的当前状态为失败的出现频率;

第三确定模块419,用于根据统计的频率确定所述每个分组中网络故障的种类。

可选的,所述状态变化时间为认证时间,或者上线时间或者下线时间。

可选的,所述报文类型为sta认证报文,sta关联报文,ip地址分配报文,ip地址切换报文或sta下线报文之一。

可选的,所述运行过程还包括:sta认证时间,sta关联时间,ip地址分配时间,sta上线时间和sta下线时间中的一个或者多个。

可选的,所述关键字为sta的标识,

则,所述第三确定模块419具体用于:

当所述分组为根据sta的标识划分的分组时,在连续m时间单位内所有sta的运行过程对应的当前状态都为失败,则确定所述根据sta的标识划分的分组中的网络故障为整个网络的故障;

当所述分组为根据sta的标识划分的分组,且在连续m时间单位内的sta的运行过程对应的当前状态为失败的sta数量小于第一阈值时,则根据所述sta的运行过程确定状态失败的sta的标识,根据所述状态失败的sta的标识确定所述根据sta的标识划分的分组中的网络故障为所述状态失败的sta的故障。

可选的,所述关键字为ap的标识,

则,所述第三确定模块419具体用于:

当所述分组为根据ap的标识划分的分组,且在连续m时间单位内的sta的运行过程对应的当前状态为失败的sta数量小于第一阈值时,则根据所述sta的运行过程确定状态失败的sta对应的ap的标识,根据状态失败的sta对应的ap的标识确定所述根据ap的标识划分的分组中的网络故障为所述状态失败的sta对应的ap的故障。

可选的,在本发明第四实施例中,如图5所示,本发明第三实施例的装置还包括:

第二获取模块501,用于获取无线局域网中sta各自的在第一周期中的第三运行日志;

第二汇总模块503,用于将所有第三运行日志汇总为第四运行日志;

匹配模块505,用于根据所述第四运行日志中的ap的标识、sta的状态变化时间与所述sta的运行过程中的ap的标识、sta的状态变化时间进行匹配,

添加模块507,用于如果匹配,则将所述第四运行日志中的ssid添加到所述sta的运行过程中。

可选的,所述关键字为ssid的标识;

则,在本发明第四实施例中,所述第三确定模块419具体用于:

当所述分组为根据ssid的标识划分的分组,且在连续m时间单位内的sta的运行过程对应的当前状态为失败的sta数量小于第一阈值时,则根据所述sta的运行过程确定状态失败的sta对应的ssid,根据状态失败的sta对应的ssid确定所述根据ssid划分的分组中的网络故障为所述状态失败的sta对应的ssid的故障。

可选的,在本发明第三实施例中,所述装置还包括:sta当前状态确定模块,用于当sta一次上线成功所需具备的报文类型都在一次上线所对应的时间戳排序结果中按标准规定的顺序出现时,则确定sta当前状态为成功;

当sta一次上线成功所需具备的报文类型中至少一个报文类型没有在一次上线所对应的时间戳排序结果中按标准规定的顺序出现时,则确定sta当前状态为失败。

本发明实施例的有益效果在于,全自动全天侯采集wlan网络下所有ap设备的syslog日志和sta日志,在无人值守的情况下自动发现wlan中的网络故障,并自动向运维人员发送告警信息,达到wlan网络全自动化故障发现和定位。并且采用大数据的分析统计方法,把syslog日志、sta日志等繁杂的数据通过与实际业务流程相关联和聚合的计算方法,与应用场景相结合,有效提高了故障预测结果的准确性,也提高了可用性。

下面再结合具体的应用场景,对本发明实施例进行进一步阐述,图6是本发明实施例的系统结构图,如图6所示,包括:

运维管理系统:用于接收各ap(如图6中ap1到apn)通过syslogudp协议(userdatagramprotocol用户数据协议)和rest接口发送过来的日志,存入数据库集群中的elasticsearch数据库。在管理端呈现syslog数据内容,每小时(该时间间隔可根据具体场景修改,比如每两个小时等)自动将elasticsearch数据库中的新增数据导出到数据库集群中的hdfs文件系统,并向诊断服务单元发送诊断请求。显示诊断服务单元的诊断结果或发出故障告警。

数据库集群:包括elasticsearch数据库,hdfs分布式文件系统,关系型数据库mysql。elasticsearch数据库用来保存最近几天(比如7天)的syslog数据,每隔固定的时间单位(比如1小时)导出新增数据到hdfs文件系统中。hdfs文件系统用于永久保存syslog数据。mysql数据库用来存储结构化数据,主要包括运维管理系统的数据和诊断服务单元的诊断结果。

诊断服务单元:用于从hdfs文件系统中取出syslog数据文件,进行mapreduce计算,得出sta过程数据,对过程数据进行规则判断和统计计算,得出wlan网络中出现大范围sta失败的对象,以此定位故障,将相关信息存入数据库集群中的mysql数据库,供运维管理系统进行显现和故障告警。

其中,在mapreduce计算框架中,map和reduce函数是要执行的任务,由master实体分配任务给worker实体执行。map函数读取被分配的输入数据片段,输出中间key/valuepair值的集合,reduce函数收集具有相同中间key值的value值,合并这些value值,形成一个较小的value值的集合。

在本发明实施例中,数据收集的步骤和故障诊断定位的步骤可以相互独立。其中数据收集的步骤如下:

步骤a、运维管理系统获取n个无线接入点ap各自的在第一周期中的第一运行日志,且,获取无线局域网中sta各自的在第一周期中的第三运行日志,具体来说,即由ap通过syslog标准协议udp上送第一运行日志到运维管理系统,或者,ap通过调用rest接口向运维管理系统发送sta日志(即第三运行日志,可以包括sta上下线时间,接入的ssid信息,使用流量等情况)。

步骤b、将所有第一运行日志汇总为第二运行日志,且,将所有第三运行日志汇总为第四运行日志,即将步骤一中采集的数据保存入elasticsearch数据库。平常运维管理系统可以在elasticsearch数据库中查看syslog数据信息和做一些基本的统计。运维管理系统定时每小时自动将elasticsearch中的增量数据保存到hdfs文件系统。

在数据采集的基础上,故障诊断定位的步骤具体如下:

步骤一、定时从数据库集群中获取最新一小时的syslog增量数据文件。

步骤二、生成以所述第二运行日志中的无线终端sta的标识为主键,以与所述主键对应的ap的标识、与所述主键对应的运行日志的内容以及与所述主键对应的运行日志的生成时间戳为内容的记录。

具体的,可以由诊断服务单元对syslog数据文件进行mapreduce操作:

在mapper阶段,过滤出存在stamac(sta的mac地址,为sta标识的一种)数据域的报文,以stamac为主键,以ap标识(如:设备序列号sn码),syslog报文内容和syslog生成的时间戳合并的内容为数值,生成mapper记录。

在reducer阶段,以stamac为字典主键分类mapper数据,在每个stamac主键下又以ap设备sn码为字典主键分类syslog内容,对相同stamac,相同sn码的数据分组按syslog时间戳进行排序。

对每个sn码字典下的所有syslog进行匹配以判断报文类型,判断出是认证报文,关联报文,ip分配报文,ip切换报文,还是sta下线报文,并以此关联出sta在此ap下的所有sta过程,每个sta过程包括(stamac,sn码(sta连接的ap所具有的标识),认证时间,关联时间,ip分配时间,sta上线时间,sta下线时间,sta当前状态(标识成功或失败))。

步骤三、将上述sta过程与sta日志中的流量信息相关联,匹配关系是sta过程中的sn码,上线时间,下线时间,与sta日志中的sn码,上线时间,下线时间一致,然后在sta过程字典中增加sta日志中对应的ssid名称和流量信息。

步骤四、将与sta日志关联后的sta过程数据拷贝三份分别按stamac,sn,ssid进行分组,每个分组再按sta过程的认证时间进行排序。

步骤五、对步骤四中的stamac分组信息进行计算,统计计算所有10分钟内连续出现sta状态失败的sta过程,如果出现个别stamac失败点则认为是接入终端本身的故障,如果是所有stamac同时出现问题则认为是整个网络出现故障。

步骤六、对步骤四中的sn码分组信息进行计算,统计所有10分钟内连续出现sta状态失败的sta过程,如果出现个别sn失败点则认为是该ap出现故障,具体原因可以调用syslog失败内容呈现。

步骤七、对步骤四中的ssid分组信息进行计算,统计所有10分钟内连续出现sta状态失败的sta过程,如果出现个别ssid失败点则认为是该ssid出现故障,具体原因调用syslog失败内容呈现。

步骤八、将设备日志诊断结果写入关系型数据库mysql中。

步骤九、运维管理系统定时从mysql数据库中检测出存在新的网络故障,就向运维人员发送报警。

步骤十、运维人员在运维管理系统中可以查看网络出现的故障点,并通过syslog内容进行针对性解决。

本发明实施例的有益效果在于,全自动全天侯采集wlan网络下所有ap设备的syslog日志和sta日志,在无人值守的情况下自动发现wlan中的网络故障,并自动向运维人员发送告警信息,达到wlan网络全自动化故障发现和定位。并且采用大数据的分析统计方法,把syslog日志、sta日志等繁杂的数据通过与实际业务流程相关联和聚合的计算方法,与应用场景相结合,有效提高了故障预测结果的准确性,也提高了可用性。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1