本技术涉及通信,尤其涉及一种光模块、电子设备、通信系统及相关处理方法。
背景技术:
1、光路故障是光纤网络中常见的故障现象,故障原因可以包括电力故障、线路故障、模块故障、设备故障等。这些光路故障会导致光路中断(如设备收不到光)或者光路劣化(如设备收到的光功率低),从而影响网络服务质量。当出现光路故障时,如何快速并准确识别和定界这些故障点,对于减少网络业务的平均恢复时间(mean time to recovery,mttr)有非常重要的意义。
2、然而,在相关技术中,在通信系统出现光路故障时,需要光模块将采集到的采样数据上传至电子设备,再经电子设备将采样数据传输至网管设备,由网管设备对采样数据进行计算分析,来定位故障点。这就需要将网络系统中多个电子设备的多个光模块的采样数据传输到网管设备,需要传输的数据量非常大,受限于通信总线传输速率,将采样数据传输到网管设备需要很长的时间,导致产生光路故障后,无法及时识别或上报故障原因和故障点位置。
技术实现思路
1、本技术实施例提供了一种光模块、电子设备、通信系统及相关处理方法,用以解决通信系统出现光路故障后,无法及时识别或上报故障原因和故障点位置的问题。
2、第一方面,本技术实施例提供了一种光模块,光模块可以为光电转换模块、光放大模块、光交换模块或其他功能模块。
3、本技术实施例中的光模块可以包括:第一处理单元,以及分别与第一处理单元电连接的采样单元、采样信息存储单元和故障信息存储单元。
4、采样单元用于采集第一采样参数,并通过第一处理单元将第一采样参数存储于采样信息存储单元中。在一种可能的实现方式中,采样单元可以实时采集第一采样参数,并将采集到的第一采样参数实时传输至第一处理单元,第一处理单元将第一采样参数实时传输至采样信息存储单元,采样信息存储单元实时接收并存储第一采样参数。在具体实施时,采样单元采集的第一采样参数可以为微观粒度数据,微观粒度可以为采样间隔小于100毫秒。举例来说,第一采样参数可以包括:表征输入光信号光功率的光生电流。
5、第一处理单元用于在识别到告警信息时,读取采样信息存储单元中的第一采样参数,并根据第一采样参数确定告警信息对应的故障类型信息,将故障类型信息存储于故障信息存储单元中。
6、本技术实施例提供的光模块中,第一处理单元在识别到告警信息时,可以根据第一采样参数确定告警信息对应的故障类型信息,并将故障类型信息存储于故障信息存储单元中。这样,光模块内部可以实现第一采样参数的采集、存储和分析等功能,后续电子设备或网管设备读取光模块内存储的故障类型信息,并结合通信系统的网络拓扑关系,可以快速、准确地确定故障原因和故障点位置。因而,光模块不需要将大量的采样数据传输至电子设备,节省了数据传输时间,减小了光模块与电子设备之间的数据传输压力,因而,本技术实施例中的通信系统出现光路故障后,确定故障原因和故障点位置所需的延迟时间较短,能够及时定位故障原因和故障点位置。
7、在本技术实施例中,第一处理单元可以为中央处理器(central processingunit,cpu)或微处理器(microcontroller unit,mcu)等具有数据处理功能的器件。采样单元可以为包括模数转换器的采样电路,采样信息存储单元和故障信息存储单元可以是光模块中存储器的特定区域,也可以在光模块中设置至少一个独立的存储芯片,将存储芯片用作采样信息存储单元和/或故障信息存储单元,即采样信息存储单元与故障信息存储单元可以分别采用一个存储芯片,也可以共用同一个存储芯片,此处只是举例说明,不对采样信息存储单元和故障信息存储单元的具体实现方式进行限定。
8、为了便于后续电子设备或网管设备确定故障原因和故障点位置,故障信息存储单元除了用于存储故障类型信息外,故障信息存储单元还可以存储告警信息对应的故障产生时间信息。
9、在本技术的一些实施例中,光模块为光电转换模块、光放大模块或光交换模块等功能模块时,上述第一采样参数可以包括光生电流。在本技术的另一些实施例中,光模块为光电转换模块时,上述第一采样参数可以具有多种实现方式,光生电流、光信号幅度、纠前误码率、纠后误码率,电眼图幅度、光信号相位、光信号频谱等参数中的任一个均可以作为上述第一采样参数。其中,光生电流为输入光信号的直流分量,光信号幅度为输入光信号的高电平与低电平的差值,光生电流和光信号幅度均与输入光信号的光功率呈正相关的关系。当然,在一些情况下,光模块为其他功能模块时,也可以将其他参数作为上述第一采样参数,只要第一处理单元能够根据第一采样参数确定告警信息对应的故障类型信息即可,此处不对第一采样参数的具体实现方式进行限定。
10、本技术实施例中的光模块可以采用多种方式判断告警状态,以下对光模块的几种判断告警状态的方式进行举例说明。
11、判断方式一:
12、上述光模块还可以包括:告警信息生成单元,告警信息生成单元分别与采样单元和第一处理单元电连接。采样单元还用于将第一采样参数发送至告警信息生成单元,告警信息生成单元用于判断第一采样参数是否位于预设阈值范围,当第一采样参数超出阈值范围时,生成告警信息,并将告警信息发送至第一处理单元。告警信息生成单元可以实时接收采样单元输出的多个第一采样参数,并将接收到的各第一采样参数逐个与预设阈值范围的端值进行比较,当第一采样参数大于预设阈值范围的最大值或小于预设阈值范围的最小值时,生成告警信息。
13、举例来说,告警信息可以是数字逻辑信号从低电平变为高电平,或者,告警信息也可以是数字逻辑信号从高电平变为低电平,当然,告警信息也可以为其他类型的信息,此处不做限定。
14、在判断方式一中,告警信息生成单元判断告警状态采用的参数,可以与第一处理单元确定故障类型信息采用的参数可以相同,例如,可以均采用采样单元采集的第一采样参数。举例来说,本技术实施例中的光模块为光电转换模块、光电放大模块或光交换模块等模块时,第一采样参数可以包括光生电流。光模块为光电转换模块时,第一采样参数可以包括光生电流、光信号幅度、纠前误码率、纠后误码率、电眼图幅度、光信号相位或光信号频谱等参数。当然,在一些情况下,第一采样参数也可以包括其他参数,此处不做限定。
15、判断方式二:
16、上述光模块还可以包括:告警信息生成单元,告警信息生成单元分别与采样单元和第一处理单元电连接。采样单元还用于采集第二采样参数,并将第二采样参数发送至告警信息生成单元,第二采样参数与第一采样参数不同。告警信息生成单元用于判断第二采样参数是否位于预设阈值范围,当第二采样参数超出阈值范围时,生成告警信息,并将告警信息发送至第一处理单元。告警信息生成单元可以实时接收采样单元输出的多个第二采样参数,并将接收到的各第二采样参数逐个与预设阈值范围的端值进行比较,当第二采样参数大于预设阈值范围的最大值或小于预设阈值范围的最小值时,生成告警信息。
17、采样单元可以具体用于以毫秒级的采样时间精度实时采集第二采样参数,毫秒级的采样时间精度表示采样单元在1s内至少采集2个数据,采样单元的采样精度较高,可以为确定故障类型信息提供较多的采样数据。
18、与判断方式一不同的是,在判断方式二中,告警信息生成单元判断告警状态采用的参数,与第一处理单元确定故障类型信息采用的参数不同,具体地,第一处理单元采用第一采样参数确定故障类型信息,告警信息生成单元采用与第一采样参数不同的第二采样参数判断告警状态。
19、举例来说,光模块为光电转换模块时,第一采样参数可以包括光生电流,第二采样参数可以包括光信号幅度;或者,第一采样参数可以包括光生电流,第二采样参数可以包括纠前误码率。在具体实施时,第一采样参数和第二采样参数也可以包括其他参数,此处不做限定。
20、在判断方式一和判断方式二中,告警信息生成单元可以是一个独立的硬件单元,例如,告警信息生成单元可以为比较器等硬件,或者,告警信息生成单元可以与第一处理单元集成于同一处理器或处理芯片中,此处不对告警信息生成单元的具体实现方式进行限定。在具体实施时,可以通过硬件或软件的方式,实现告警信息生成单元中“判断第一采样参数(或第二采样参数)是否位于预设阈值范围,当第一采样参数超出阈值范围时,生成告警信息”的功能。
21、在判断方式一和判断方式二中,通过设置告警信息生成单元来实时监测第一采样参数,当第一采样参数出现异常时,告警信息生成单元可以及时发现该异常,并生成告警信息,将告警信息发送至第一处理单元。
22、判断方式三:
23、光模块中判断告警状态的功能也可以通过第一处理单元来实现。
24、与判断方式一中告警信息生成单元的功能类似,在判断方式三中,第一处理单元可以采用第一采样参数判断告警状态,即第一处理单元可以判断第一采样参数是否位于预设阈值范围,当第一采样参数超出阈值范围时,生成告警信息。第一处理单元可以实时接收采样单元输出的多个第一采样参数,并将接收到的各第一采样参数逐个与预设阈值范围的端值进行比较,当第一采样参数大于预设阈值范围的最大值或小于预设阈值范围的最小值时,生成告警信息。
25、或者,与判断方式二中告警信息生成单元的功能类似,在判断方式三中,第一处理单元可以采用不同于第一采样参数的第二采样参数判断告警状态,即第一处理单元可以判断第二采样参数是否位于预设阈值范围,当第二采样参数超出阈值范围时,生成告警信息。第一处理单元可以实时接收采样单元输出的多个第二采样参数,并将接收到的各第二采样参数逐个与预设阈值范围的端值进行比较,当第二采样参数大于预设阈值范围的最大值或小于预设阈值范围的最小值时,生成告警信息。
26、在一种可能的实现方式中,采样单元可以具体用于以毫秒级的采样时间精度采集第一采样参数,毫秒级的采样时间精度表示采样单元在1s内至少采集2个数据,采样单元的采样精度较高,可以为确定故障类型信息提供较多的采样数据,并且,由于光模块不需要将第一采样参数发送给电子设备,因而,采样单元的采样精度较高,也不会增加光模块与电子设备之间的数据传输压力。在具体实施时,光模块在正常工作状态下,可以实时采集第一采样参数,并将第一采样参数编码后通过第一处理单元存储于采样信息存储单元中,若采样信息存储单元中的存储空间存满,可以从起始处覆盖绕接。
27、第一处理单元可以具体用于在识别到告警信息时,继续将采样单元采集到的p个采样点的第一采样参数存储于采样信息存储单元中,其中p为大于或等于0的整数,在具体实施时,可以根据应用场景设置p的具体数值,例如,p可以为10~1000之间的某个值。之后,读取采样信息存储单元中预设时间窗内的第一采样参数(至少包含2个采样点数据),根据读取的第一采样参数确定告警信息对应的故障类型信息。本技术实施例中,第一处理单元在识别到告警信息时,会继续将采样单元采集到的p个采样点的第一采样参数存储于采样信息存储单元中,并读取采样信息存储单元中预设时间窗内的第一采样参数,p大于或等于0,也就是说,第一处理单元在识别到告警信息时,可以立即读取采样信息存储单元中的第一采样参数,也可以延迟一段时间再读取采样信息存储单元中的第一采样参数。这样,第一处理单元在识别到告警信息后获取的第一采样参数的数据较多,可以通过获取的预设时间窗内的第一采样参数的波形,确定该告警信息对应的故障类型信息,故障分析的准确性较高。
28、在实际应用中,第一处理单元读取采样信息存储单元中预设时间窗内的第一采样参数后,可以提取该预设时间窗内的第一采样参数的特征参数,例如,可以采用有监督和/或无监督的算法,并把提取到的特征参数按照分类结果存到第一处理单元的缓存队列中,第一处理单元可以根据预设时间窗内的第一采样参数的特征参数,进行故障类型分类,以确定告警信息对应的故障类型信息。
29、在本技术的一些实施例中,在通信系统的多种故障场景下,会导致光模块的至少一种参数异常,可以将某一种参数作为第一采样参数,例如,第一采样参数可以包括:光生电流或光信号幅度,在一些情况下,第一采样参数也可以为其他参数,此处不做限定。光模块中的第一处理单元可以根据发生故障时的第一采样参数确定故障类型信息。
30、第一处理单元可以具体用于:
31、在读取预设时间窗内的第一采样参数之后,比较初始时刻与最后时刻的第一采样参数;
32、若初始时刻与最后时刻的第一采样参数的差值小于第一阈值(即初始时刻与最后时刻的第一采样参数的差值较小),且预设时间窗内的第一采样参数的波形规律存在波动事件,也就是说,在预设时间窗内第一采样参数经波动后可以恢复到波动之前的数值,则告警信息对应的故障类型信息为输入光功率波动;或,
33、若初始时刻与最后时刻的第一采样参数的差值大于第一阈值,最后时刻的第一采样参数小于第二阈值(即初始时刻与最后时刻的第一采样参数的差值较大,且最后时刻的第一采样值较小),且预设时间窗内的第一采样参数的波形规律存在波动且下降事件,也就是说,在预设时间窗内第一采样参数经波动后得到的数值较小,则告警信息对应的故障类型信息为输入光功率波动丢失;或,
34、若初始时刻与最后时刻的第一采样参数的差值大于第一阈值,最后时刻的第一采样参数小于第二阈值(即初始时刻与最后时刻的第一采样参数的差值较大,且最后时刻的第一采样值较小),且预设时间窗内的第一采样参数的波形规律存在快速下降事件,也就是说,在预设时间窗内第一采样参数快速下降至较小的数值,则告警信息对应的故障类型信息为输入光功率快速丢失;或,
35、若初始时刻与最后时刻的第一采样参数的差值大于第一阈值,最后时刻的第一采样参数小于第二阈值(即初始时刻与最后时刻的第一采样参数的差值较大,且最后时刻的第一采样参数较小),且预设时间窗内的第一采样参数的波形规律存在阶跃下降事件,也就是说,在预设时间窗内第一采样参数阶跃下降至较小的数值,则告警信息对应的故障类型信息为输入光功率阶跃丢失;或,
36、若初始时刻与最后时刻的第一采样参数的差值大于第一阈值(即初始时刻与最后时刻的第一采样参数的差值较大),最后时刻的第一采样参数大于第二阈值,且预设时间窗内的第一采样参数的波形规律具有劣化特征,也就是说,在预设时间窗内,第一采样参数有一定程度的下降,且最后时刻的第一采样参数在第二阈值与第一阈值之间,例如,最后时刻第一采样参数可以约为初始时刻第一采样参数的一半,则告警信息对应的故障类型信息为输入光功率劣化。
37、本技术实施例中,采用预设时间窗内的第一采样参数确定故障类型信息,结合预设时间窗内第一采样参数的波形和端值,可以准确地确定告警信息对应的故障类型信息,使后续确定故障原因和故障点的准确性较高。
38、在本技术的另一些实施例中,在通信系统的一些故障场景下,可以将至少两种参数作为第一采样参数,例如,第一采样参数可以包括:光生电流和纠前误码率。光模块中的第一处理单元可以根据发生故障时刻的至少两种参数确定故障类型信息。这样,第一处理单元进行故障分类的参数较多,可以准确地确定告警信息对应的故障类型,从而提高故障原因定位的准确度。
39、第一处理单元可以具体用于:
40、在读取预设时间窗内的第一采样参数之后,比较初始时刻与最后时刻的光生电流,比较初始时刻与最后时刻的纠前误码率;
41、若初始时刻与最后时刻的光生电流的差值小于第一阈值,且初始时刻与最后时刻的纠前误码率的差值大于第三阈值(即初始时刻与最后时刻的光生电流的差值较小,初始时刻与最后时刻的纠前误码率的差值较大),也就是说,在预设时间窗内纠前误码率下降,光生电流基本不变,则告警信息对应的故障类型信息为光功率多径干扰劣化。
42、在具体实施时,可以根据网络系统的应用场景等因素,来设置第一阈值、第二阈值、第三阈值和预设时间窗的具体数值。
43、第二方面,本技术实施例还提供了一种电子设备,电子设备可以为光传输设备、光接入设备、光交换设备、光放大设备、路由器、交换机、无线基站、无线远端接入设备或无线基带信号处理设备等。
44、本技术实施例中的电子设备可以包括:第二处理单元,以及上述任一光模块,光模块与第二处理单元连接。光模块用于在识别到告警信息时,向第二处理单元发送告警信息,第二处理单元用于在接收到告警信息的第一预设时间后,读取光模块的故障信息存储单元中的告警信息对应的故障类型信息。第二处理单元可以为服务器等具有较强数据处理功能的器件。
45、本技术实施例中,光模块中的第一处理单元在识别到告警信息时,可以根据第一采样参数确定告警信息对应的故障类型信息,并将故障类型信息存储于故障信息存储单元中。电子设备中的第二处理单元可以在接收到告警信息的第一预设时间后,读取故障信息存储单元中的告警信息对应的故障类型信息,并结合所在通信系统的网络拓扑关系,可以快速、准确地确定故障原因和故障点位置。因而,光模块不需要将大量的采样数据传输至电子设备,节省了数据传输时间,减小了光模块与电子设备之间的数据传输压力,因而,本技术实施例中的通信系统出现光路故障后,确定故障原因和故障点位置所需的延迟时间较短,能够及时定位故障原因和故障点位置。
46、在本技术的一些实施例中,电子设备可以包括至少一个光模块,电子设备可以为一体化设备,光模块可以作为一个可插拔的独立模块直接插在电子设备上,或者光模块也可以设置在电子设备的内部。第二处理单元可以通过硬件管脚接口与光模块中的告警信息生成单元连接,告警信息生成单元用于在生成告警信息时,通过硬件管脚接口的电平跳变向第二处理单元发送告警信息。硬件管脚接口的电平可以由高电平变为低电平,或者,也可以由低电平变为高电平。通过硬件管脚接口的电平跳变,告警信息生成单元能够快速地将告警信息传输至第二处理单元。
47、第二处理单元可以通过通信总线与第一处理单元连接,第一处理单元用于在识别到告警信息时,通过通信总线向第二处理单元发送告警信息。第二处理单元还可以通过通信总线读取故障信息存储单元中的故障类型信息和故障产生时间等参数。此外,第二处理单元可以通过通信总线,读取光模块的状态参数和性能参数,配置光模块的工作参数,当然,第二处理单元也可以通过通信总线与光模块进行其他信息交互,此处不再一一举例。
48、在本技术的另一些实施例中,电子设备可以包括:至少一个单板,单板可以可插拔的插在电子设备上,或者单板也可以设置在电子设备的内部。单板中可以设置至少一个光模块,光模块可以可插拔地插在单板上,或者,光模块也可以设置在单板内部。光模块可以通过单板与电子设备进行信息交互。单板可以包括:第三处理单元,第三处理单元通过硬件管脚接口与光模块中的告警信息生成单元连接,告警信息生成单元用于在生成告警信息时,通过硬件管脚接口的电平跳变向第三处理单元发送告警信息,硬件管脚接口的电平可以由高电平变为低电平,或者,也可以由低电平变为高电平。通过硬件管脚接口的电平跳变,告警信息生成单元能够快速地将告警信息传输至第三处理单元。并且,第三处理单元可以通过通信接口向第二处理单元发送告警信息。
49、第三处理单元可以通过通信总线与第一处理单元连接,第三处理单元通过通信接口与第二处理单元连接。第一处理单元用于在识别到告警信息时,通过通信总线向第三处理单元发送告警信息,第三处理单元用于通过通信接口向第二处理单元发送告警信息。在具体实施时,第三处理单元可以通过通信总线读取故障信息存储单元中的故障类型信息和故障产生时间等参数,并将读取到的故障类型信息和故障产生时间等参数传输至第二处理单元。在具体实施时,光模块还可以通过单板与电子设备进行其他信息交互,此处不再一一举例。
50、在本技术实施例中,通信总线可以为串行外围设备接口(serial perripheralinterface,spi)总线或集成电路之间串行通讯总线(inter-integrated circuit,i2c),为了提高传输速率,上述通信总线也可以为高速通信总线,例如可以为管理数据输入输出接口总线(management data input output interface,mdio),当然,上述通信总线也可以为其他类型的总线,只要能够满足第一处理单元与电子设备之间的传输需求即可,此处不做限定。
51、在一种可能的实现方式中,第一处理单元还用于将延迟提示信息存储于故障信息存储单元,第二处理单元还用于读取故障信息存储单元中的延迟提示信息。延迟提示信息用于指示第二处理单元在接收到告警信息到能够读取到告警信息对应的故障类型信息的最短时长,第一预设时间大于或等于最短时长。这样能够保证第二处理单元在等待第一预设时间后能够读取到故障类型信息。该最短时长的大小至少需要考虑:光模块在产生告警信息后,第一处理单元继续将采样单元采集的第一采样参数存储于采样信息存储单元中所需的时间长度、第一处理单元读取采样信息存储单元中的第一采样参数所需的时间长度,以及第一处理单元根据第一采样参数确定故障类型信息所需的时间长度。在具体实施时,可以在光模块的制作过程中,将延迟提示信息写入到故障信息存储单元中。
52、在具体实施时,第一处理单元还用于在第二处理单元读取故障类型信息后,将故障信息存储单元中的故障类型信息删除,以使光模块在上报故障类型信息后,恢复到无告警信息指示的状态。
53、在本技术的一些实施例中,第二处理单元可以用于根据读取的故障类型信息以及所在网络系统的网络拓扑关系,确定故障原因。由于光模块中的第一处理单元已经确定了故障类型信息,第二处理单元根据该故障类型信息和所在网络系统的网络拓扑关系,就可以确定故障原因,简化了第二处理单元进行故障原因分析的过程,减小了计算量,缩短了故障原因分析所需的时间。
54、具体地,第二处理单元可以具体用于:
55、若识别到故障类型信息为输入光功率波动,则根据所在网络系统的网络拓扑关系,确定产生告警信息的光模块的同缆关系;若与产生告警信息的光模块属于同一电子设备的同缆的光模块正常,或不存在与产生告警信息的光模块属于同一电子设备的同缆的光模块,则故障原因为光跳线震动故障;若存在属于同一电子设备的至少两个同缆的光模块的故障类型为输入光功率波动,则确定故障原因为光缆震动故障;或,
56、若识别到故障类型信息为输入光功率波动丢失,则根据所在网络系统的网络拓扑关系,确定产生告警信息的光模块的同缆关系;若与产生告警信息的光模块属于同一电子设备的同缆的光模块正常,或不存在与产生告警信息的光模块属于同一电子设备的同缆的光模块,则故障原因为光跳线断裂故障;若存在属于同一电子设备的至少两个同缆的光模块的故障类型为输入光功率波动,则确定故障原因为光缆断裂故障。
57、在本技术的另一些实施例中,第二处理单元可以用于根据读取的故障类型信息确定故障原因。由于光模块中的第一处理单元已经确定了故障类型信息,第二处理单元根据该故障类型信息就可以确定故障原因,简化了第二处理单元进行故障原因分析的过程,减小了计算量,缩短了故障原因分析所需的时间。
58、具体地,第二处理单元可以具体用于:
59、若识别到故障类型信息为输入光功率阶跃丢失,则确定故障原因为设备掉电故障;或,
60、若识别到故障类型信息为输入光功率快速丢失,则确定故障原因为光跳线脱落故障;或,
61、若识别到故障类型信息为输入光功率劣化,则确定故障原因为光跳线弯折故障;或,
62、若识别到故障类型信息为光功率多径干扰劣化,则故障原因为光路质量劣化故障。
63、第三方面,本技术实施例还提供了一种通信系统,本技术实施例中的通信系统可以包括:上述任一电子设备,以及供电线路,供电线路用于向电子设备供电。
64、在具体实施时,本技术实施例中的通信系统还可以包括:网管设备,网管设备可以对所在通信系统进行统一的管控。电子设备中的第二处理单元可以通过网络通信接口与网管设备连接,电子设备可以通过网络通信接口与网格设备实现信息交互,例如,电子设备可以通过网络通信接口将故障类型信息和故障产生时间等参数传输至网管设备。
65、在本技术的一些实施例中,网管设备可以用于获取电子设备的故障类型信息,根据故障类型信息以及网络系统的网络拓扑关系,确定故障原因。由于光模块中的第一处理单元已经确定了故障类型信息,网管设备根据该故障类型信息和网络系统的网络拓扑关系,就可以确定故障原因,简化了网管设备进行故障原因分析的过程,减小了计算量,缩短了故障原因分析所需的时间。
66、具体地,电子设备可以具体用于:
67、若识别到故障类型信息为输入光功率波动,则根据所在网络系统的网络拓扑关系,确定产生告警信息的光模块的同缆关系;若与产生告警信息的光模块同缆的光模块正常,或不存在与产生告警信息的光模块同缆的光模块,则故障原因为光跳线震动故障;若存在至少两个同缆的光模块的故障类型为输入光功率波动,则确定故障原因为光缆震动故障;或,
68、若识别到故障类型信息为输入光功率波动丢失,则根据所在网络系统的网络拓扑关系,确定产生告警信息的光模块的同缆关系;若与产生告警信息的光模块同缆的光模块正常,或不存在与产生告警信息的光模块同缆的光模块,则故障原因为光跳线断裂故障;若存在至少两个同缆的光模块的故障类型信息为输入光功率波动,则确定故障原因为光缆断裂故障;
69、在本技术的另一些实施例中,网管设备可以用于获取电子设备的故障类型信息,根据故障类型信息确定故障原因。由于光模块中的第一处理单元已经确定了故障类型信息,网管设备根据该故障类型信息就可以确定故障原因,简化了网管设备进行故障原因分析的过程,减小了计算量,缩短了故障原因分析所需的时间。
70、具体地,电子设备可以具体用于:
71、若识别到故障类型信息为输入光功率阶跃丢失,则确定故障原因为设备掉电故障;或,
72、若识别到故障类型信息为输入光功率快速丢失,则确定故障原因为光跳线脱落故障;或,
73、若识别到故障类型信息为输入光功率劣化,则确定故障原因为光跳线弯折故障;或,
74、若识别到故障类型信息为光功率多径干扰劣化,则故障原因为光路质量劣化故障。
75、第四方面,本技术实施例还提供了一种应用于光模块的故障类型确定方法,该光模块可以包括:第一处理单元,以及分别与第一处理单元电连接的采样单元、采样信息存储单元和故障信息存储单元。
76、本技术实施例中的故障类型确定方法可以包括:
77、采样单元采集第一采样参数,并通过第一处理单元将第一采样参数存储于采样信息存储单元中;
78、第一处理单元在识别到告警信息时,读取采样信息存储单元中的第一采样参数,并根据第一采样参数确定告警信息对应的故障类型信息,将故障类型信息存储于故障信息存储单元中。
79、本技术实施例提供的故障类型确定方法中,第一处理单元在识别到告警信息时,可以根据第一采样参数确定告警信息对应的故障类型信息,并将故障类型信息存储于故障信息存储单元中。这样,光模块内部可以实现第一采样参数的采集、存储和分析等功能,后续电子设备或网管设备读取光模块内存储的故障类型信息,并结合通信系统的网络拓扑关系,可以快速、准确地确定故障原因和故障点位置,以便快速修复通信系统中的故障,并减少故障解决的成本。
80、在本技术实施例中,光模块至少具有以下几种判断告警的方式。
81、判断方式一:
82、上述光模块还可以包括:告警信息生成单元。
83、上述故障类型确定方法还可以包括:
84、采样单元将第一采样参数发送至告警信息生成单元;
85、告警信息生成单元判断第一采样参数是否位于预设阈值范围,当第一采样参数超出阈值范围时,生成告警信息,并将告警信息发送至第一处理单元。告警信息生成单元可以实时接收采样单元输出的多个第一采样参数,并将接收到的各第一采样参数逐个与预设阈值范围的端值进行比较,当第一采样参数大于预设阈值范围的最大值或小于预设阈值范围的最小值时,生成告警信息。
86、在判断方式一中,告警信息生成单元判断告警状态采用的参数,可以与第一处理单元确定故障类型信息采用的参数可以相同。举例来说,本技术实施例中的光模块为光电转换模块、光电放大模块或光交换模块等模块时,第一采样参数可以包括光生电流。光模块为光电转换模块时,第一采样参数可以包括光生电流、光信号幅度、纠前误码率、纠后误码率、电眼图幅度、光信号相位或光信号频谱等参数。当然,在一些情况下,第一采样参数也可以包括其他参数,此处不做限定。
87、判断方式二:
88、上述光模块还可以包括:告警信息生成单元。
89、上述故障类型确定方法还可以包括:
90、采样单元采集第二采样参数,并将第二采样参数发送至告警信息生成单元;第二采样参数与第一采样参数不同;
91、告警信息生成单元判断第二采样参数是否位于预设阈值范围,当第二采样参数超出阈值范围时,生成告警信息,并将告警信息发送至第一处理单元。告警信息生成单元可以实时接收采样单元输出的多个第二采样参数,并将接收到的各第二采样参数逐个与预设阈值范围的端值进行比较,当第二采样参数大于预设阈值范围的最大值或小于预设阈值范围的最小值时,生成告警信息。
92、采样单元可以具体用于以毫秒级的采样时间精度实时采集第二采样参数,毫秒级的采样时间精度表示采样单元在1s内至少采集2个数据,采样单元的采样精度较高,可以为确定故障类型信息提供较多的采样数据。
93、与判断方式一不同的是,在判断方式二中,告警信息生成单元判断告警状态采用的参数,与第一处理单元确定故障类型信息采用的参数不同,具体地,第一处理单元采用第一采样参数确定故障类型信息,告警信息生成单元采用与第一采样参数不同的第二采样参数判断告警状态。举例来说,光模块为光电转换模块时,第一采样参数可以包括光生电流,第二采样参数可以包括光信号幅度;或者,第一采样参数可以包括光生电流,第二采样参数可以包括纠前误码率。在具体实施时,第一采样参数和第二采样参数也可以包括其他参数,此处不做限定。
94、在判断方式一和判断方式二中,通过设置告警信息生成单元来实时监测第一采样参数,当第一采样参数出现异常时,告警信息生成单元可以及时发现该异常,并生成告警信息,将告警信息发送至第一处理单元。
95、判断方式三:
96、上述光模块中判断告警状态的功能也可以通过第一处理单元来实现。
97、在一种可能的实现方式中,采样单元以毫秒级的采样时间精度采集第一采样参数,毫秒级的采样时间精度表示采样单元在1s内至少采集2个数据,采样单元的采样精度较高,可以为确定故障类型信息提供较多的采样数据,并且,由于光模块不需要将第一采样参数发送给电子设备,因而,采样单元的采样精度较高,也不会增加光模块与电子设备之间的数据传输压力。
98、上述第一处理单元在识别到告警信息时,读取采样信息存储单元中的第一采样参数,并根据第一采样参数确定告警信息对应的故障类型信息,可以具体包括:
99、第一处理单元在识别到告警信息时,继续将采样单元采集到的p个采样点的第一采样参数存储于采样信息存储单元中,其中p为大于或等于0的整数。在具体实施时,可以根据应用场景设置p的具体数值,例如,p可以为10~1000之间的某个值。
100、第一处理单元读取采样信息存储单元中预设时间窗内的第一采样参数(至少包含2个采样点数据);
101、根据读取的第一采样参数确定告警信息对应的故障类型信息。
102、本技术实施例中,第一处理单元在识别到告警信息时,会继续将采样单元采集到的p个采样点的第一采样参数存储于采样信息存储单元中,并读取采样信息存储单元中预设时间窗内的第一采样参数,p大于或等于0,也就是说,第一处理单元在识别到告警信息时,可以立即读取采样信息存储单元中的第一采样参数,也可以延迟一段时间再读取采样信息存储单元中的第一采样参数。这样,第一处理单元在识别到告警信息后获取的第一采样参数的数据较多,可以通过获取的预设时间窗内的第一采样参数的波形,确定该告警信息对应的故障类型信息,故障分析的准确性较高。
103、在一种可能的实现方式中,第一处理单元在读取采样信息存储单元中的第一采样参数之后,在确定告警信息对应的故障类型信息之前,还可以检测采样信息存储单元的存储单元是否清零,若未清零,则可以控制采样信息存储单元执行清零操作。
104、在本技术的一些实施例中,第一采样参数可以包括:光生电流或光信号幅度,在一些情况下,第一采样参数也可以为其他参数,此处不做限定。上述第一处理单元根据读取的第一采样参数确定告警信息对应的故障类型信息,可以具体包括:
105、在读取预设时间窗内的第一采样参数之后,比较初始时刻与最后时刻的第一采样参数。在具体实施时,第一处理单元可以提取缓冲队列中的事件并按照时间进行排序,以便后续步骤中判断第一采样参数的波形是否存在波动事件、波动且下降事件等。
106、若初始时刻与最后时刻的第一采样参数的差值小于第一阈值,且预设时间窗内的第一采样参数的波形规律存在波动事件,则告警信息对应的故障类型信息为输入光功率波动;或,
107、若初始时刻与最后时刻的第一采样参数的差值大于第一阈值,最后时刻的第一采样参数小于第二阈值,且预设时间窗内的第一采样参数的波形规律存在波动且下降事件,则告警信息对应的故障类型信息为输入光功率波动丢失;或,
108、若初始时刻与最后时刻的第一采样参数的差值大于第一阈值,最后时刻的第一采样参数小于第二阈值,且预设时间窗内的第一采样参数的波形规律存在快速下降事件,则告警信息对应的故障类型信息为输入光功率快速丢失;或,
109、若初始时刻与最后时刻的第一采样参数的差值大于第一阈值,最后时刻的第一采样参数小于第二阈值,且预设时间窗内的第一采样参数的波形规律存在阶跃下降事件,则告警信息对应的故障类型信息为输入光功率阶跃丢失;或,
110、若初始时刻与最后时刻的第一采样参数的差值大于第一阈值,最后时刻的第一采样参数大于第二阈值,且预设时间窗内的第一采样参数的波形规律具有劣化特征,则告警信息对应的故障类型信息为输入光功率劣化。
111、在本技术的另一些实施例中,第一采样参数可以包括至少两种参数,例如,第一采样参数可以包括:光生电流和纠前误码率。上述第一处理单元根据读取的第一采样参数确定告警信息对应的故障类型信息,可以具体包括:
112、在读取预设时间窗内的第一采样参数之后,比较初始时刻与最后时刻的光生电流,比较初始时刻与最后时刻的纠前误码率;
113、若初始时刻与最后时刻的光生电流的差值小于第一阈值,且初始时刻与最后时刻的纠前误码率的差值大于第三阈值,则告警信息对应的故障类型信息为光功率多径干扰劣化。
114、在具体实施时,可以根据网络系统的应用场景等因素,来设置第一阈值、第二阈值、第三阈值和预设时间窗的具体数值。
115、第五方面,本技术实施例还提供了另一种故障类型确定方法,该故障类型确定方法应用于光模块中的第一处理单元,该故障类型确定方法可以包括:
116、将采样单元采集的第一采样参数存储于采样信息存储单元中;
117、在识别到告警信息时,读取采样信息存储单元中的第一采样参数,并根据第一采样参数确定告警信息对应的故障类型信息,将故障类型信息存储于故障信息存储单元中。
118、本技术实施例提供的故障类型确定方法中,第一处理单元在识别到告警信息时,可以根据第一采样参数确定告警信息对应的故障类型信息,并将故障类型信息存储于故障信息存储单元中。这样,光模块内部可以实现第一采样参数的采集、存储和分析等功能,后续电子设备或网管设备读取光模块内存储的故障类型信息,并结合通信系统的网络拓扑关系,可以快速、准确地确定故障原因和故障点位置,以便快速修复通信系统中的故障,并减少故障解决的成本。
119、在一种可能的实现方式中,上述在识别到告警信息时,读取采样信息存储单元中的第一采样参数,并根据第一采样参数确定告警信息对应的故障类型信息,可以具体包括:
120、在识别到告警信息时,继续将采样单元采集到的p个采样点的第一采样参数存储于采样信息存储单元中,其中p为大于或等于0的整数;
121、读取采样信息存储单元中预设时间窗内的第一采样参数;
122、根据读取的第一采样参数确定告警信息对应的故障类型信息。
123、本技术实施例中,第一处理单元在识别到告警信息时,会继续将采样单元采集到的p个采样点的第一采样参数存储于采样信息存储单元中,并读取采样信息存储单元中预设时间窗内的第一采样参数,p大于或等于0,也就是说,第一处理单元在识别到告警信息时,可以立即读取采样信息存储单元中的第一采样参数,也可以延迟一段时间再读取采样信息存储单元中的第一采样参数。这样,第一处理单元在识别到告警信息后获取的第一采样参数的数据较多,可以通过获取的预设时间窗内的第一采样参数的波形,确定该告警信息对应的故障类型信息,故障分析的准确性较高。
124、在本技术的一些实施例中,第一采样参数可以包括:光生电流或光信号幅度,在一些情况下,第一采样参数也可以为其他参数,此处不做限定。上述根据读取的第一采样参数确定告警信息对应的故障类型信息,可以具体包括:
125、在读取预设时间窗内的第一采样参数之后,比较初始时刻与最后时刻的第一采样参数;
126、若初始时刻与最后时刻的第一采样参数的差值小于第一阈值,且预设时间窗内的第一采样参数的波形规律存在波动事件,则告警信息对应的故障类型信息为输入光功率波动;或,
127、若初始时刻与最后时刻的第一采样参数的差值大于第一阈值,最后时刻的第一采样参数小于第二阈值,且预设时间窗内的第一采样参数的波形规律存在波动且下降事件,则告警信息对应的故障类型信息为输入光功率波动丢失;或,
128、若初始时刻与最后时刻的第一采样参数的差值大于第一阈值,最后时刻的第一采样参数小于第二阈值,且预设时间窗内的第一采样参数的波形规律存在快速下降事件,则告警信息对应的故障类型信息为输入光功率快速丢失;或,
129、若初始时刻与最后时刻的第一采样参数的差值大于第一阈值,最后时刻的第一采样参数小于第二阈值,且预设时间窗内的第一采样参数的波形规律存在阶跃下降事件,则告警信息对应的故障类型信息为输入光功率阶跃丢失;或,
130、若初始时刻与最后时刻的第一采样参数的差值大于第一阈值,最后时刻的第一采样参数大于第二阈值,且预设时间窗内的第一采样参数的波形规律具有劣化特征,则告警信息对应的故障类型信息为输入光功率劣化。
131、在本技术的另一些实施例中,第一采样参数可以包括至少两种参数,例如,第一采样参数可以包括:光生电流和纠前误码率。上述根据读取的第一采样参数确定告警信息对应的故障类型信息,可以具体包括:
132、在读取预设时间窗内的第一采样参数之后,比较初始时刻与最后时刻的光生电流,比较初始时刻与最后时刻的纠前误码率;
133、若初始时刻与最后时刻的光生电流的差值小于第一阈值,且初始时刻与最后时刻的纠前误码率的差值大于第三阈值,则告警信息对应的故障类型信息为光功率多径干扰劣化。
134、第六方面,本技术实施例还提供了一种故障类型确定装置,包括:处理器和存储器,存储器用于存储上述第五方面中的故障类型确定方法中的各步骤,处理器用于执行存储器中存储的各步骤。
135、该故障类型确定装置的具体实施方式可以参照上述第五方面中的故障类型确定方法的实施,重复之处不再赘述。
136、第七方面,本技术实施例还提供了一种故障处理方法,该故障处理方法可以应用于通信系统。通信系统可以包括:电子设备,电子设备可以包括:第二处理单元和光模块,光模块可以包括:第一处理单元,以及分别与第一处理单元电连接的采样单元、采样信息存储单元和故障信息存储单元。
137、本技术实施例中的故障处理方法可以包括:
138、采样单元采集第一采样参数,并通过第一处理单元将第一采样参数存储于采样信息存储单元中;
139、光模块在识别到告警信息时,向第二处理单元发送告警信息;
140、第一处理单元读取采样信息存储单元中的第一采样参数,根据第一采样参数确定告警信息对应的故障类型信息,将故障类型信息存储于故障信息存储单元中。第一处理单元确定故障类型信息的具体过程可以参见上述描述,重复之处不再赘述。
141、第二处理单元在接收到告警信息的第一预设时间后,读取故障信息存储单元中的告警信息对应的故障类型信息。
142、本技术实施例提供的故障处理方法中,光模块中的第一处理单元在识别到告警信息时,可以根据第一采样参数确定告警信息对应的故障类型信息,并将故障类型信息存储于故障信息存储单元中。电子设备中的第二处理单元可以在识别到告警信息的第一预设时间后,读取故障信息存储单元中的告警信息对应的故障类型信息,电子设备或网管设备根据故障类型信息和所在通信系统的网络拓扑关系,可以快速、准确地确定故障原因和故障点位置。因而,光模块不需要将大量的采样数据传输至电子设备,节省了数据传输时间,减小了光模块与电子设备之间的数据传输压力,因而,本技术实施例中的通信系统出现光路故障后,确定故障原因和故障点位置所需的延迟时间较短,能够及时定位故障原因和故障点位置。
143、在具体实施时,光模块中的第一处理单元通过通信总线与第二处理单元连接,第一处理单元可以通过通信总线向第二处理单元发送告警信息。或者,当光模块中具有告警信息生成单元时,告警信息生成单元可以通过硬件管脚接口与第二处理单元连接,告警信息生成单元可以通过硬件管脚接口的电平跳变向第二处理单元发送告警信息。或者,第一处理单元可以将告警信息写入故障信息存储单元中,第二处理单元可以通过通信总线和第一处理单元,查询到故障信息存储单元中存储的告警信息。
144、在本技术实施例中,第二处理单元在识别到告警信息后,需要等待第一预设时间后,在读取故障信息存储单元中的故障类型信息,以使第一处理单元可以在该第一预设时间内完成确定故障类型信息并存储的操作。在具体实施时,可以根据第一处理单元的实际计算量,来确定第一预设时间的具体时长,以便第二处理单元在等待第一预设时间后能够读取到故障类型信息。
145、在一种可能的实现方式中,第一处理单元还可以在第二处理单元读取故障类型信息后,将故障信息存储单元中的故障类型信息删除,以使光模块在上报故障类型信息后,恢复到无告警信息指示的状态。
146、在实际应用中,本技术实施例中的故障处理方法还可以包括:
147、第一处理单元将延迟提示信息存储于故障信息存储单元;
148、第二处理单元读取故障信息存储单元中的延迟提示信息,第二处理单元可以在识别告警信息之前读取延迟提示信息,或者,第二处理单元也可以在识别告警信息之后读取延迟信息。
149、其中,延迟提示信息用于指示第二处理单元在接收到告警信息到能够读取到告警信息对应的故障类型信息的最短时长,第一预设时间大于或等于最短时长。这样能够保证第二处理单元在等待第一预设时间后能够读取到故障类型信息。该最短时长的大小至少需要考虑:光模块在产生告警信息后,第一处理单元继续将采样单元采集的第一采样参数存储于采样信息存储单元中所需的时间长度、第一处理单元读取采样信息存储单元中的第一采样参数所需的时间长度,以及第一处理单元根据第一采样参数确定故障类型信息所需的时间长度。在具体实施时,可以在光模块的制作过程中,将延迟提示信息写入到故障信息存储单元中。
150、在本技术的一些实施例中,电子设备中的第二处理单元可以根据读取的故障类型信息以及所在网络系统的网络拓扑关系,确定故障原因,具体包括以下步骤:
151、第二处理单元若识别到故障类型信息为输入光功率阶跃丢失,则确定故障原因为设备掉电故障;或,
152、第二处理单元若识别到故障类型信息为输入光功率快速丢失,则确定故障原因为光跳线脱落故障;或,
153、第二处理单元若识别到故障类型信息为输入光功率劣化,则确定故障原因为光跳线弯折故障;或,
154、第二处理单元若识别到故障类型信息为输入光功率波动,则根据所在网络系统的网络拓扑关系,确定产生告警信息的光模块的同缆关系;若与产生告警信息的光模块属于同一电子设备的同缆的光模块正常,或不存在与产生告警信息的光模块属于同一电子设备的同缆的光模块,则故障原因为光跳线震动故障;若存在属于同一电子设备的至少两个同缆的光模块的故障类型为输入光功率波动,则确定故障原因为光缆震动故障;
155、第二处理单元若识别到故障类型信息为输入光功率波动丢失,则根据所在网络系统的网络拓扑关系,确定产生告警信息的光模块的同缆关系;若与产生告警信息的光模块属于同一电子设备的同缆的光模块正常,或不存在与产生告警信息的光模块属于同一电子设备的同缆的光模块,则故障原因为光跳线断裂故障;若存在属于同一电子设备的至少两个同缆的光模块的故障类型为输入光功率波动,则确定故障原因为光缆断裂故障;或,
156、第二处理单元若识别到故障类型信息为光功率多径干扰劣化,则故障原因为光路质量劣化故障。
157、综上,电子设备可以根据光模块的故障类型信息和故障产生时间信息等信息,并结合其他光模块的故障类型信息和故障产生时间等信息,可以准确地确定故障原因。此外,在确定故障原因后,电子设备还可以将故障原因和故障点位置等信息推送给用户。
158、在本技术的另一些实施例中,电子设备可以将告警信息对应的故障类型信息、故障产生时间信息等信息上传至网管设备,网管设备可以根据读取的故障类型信息以及所在网络系统的网络拓扑关系,确定故障原因,具体包括以下步骤:
159、网管设备若识别到故障类型信息为输入光功率阶跃丢失,则确定故障原因为设备掉电故障;或,
160、网管设备若识别到故障类型信息为输入光功率快速丢失,则确定故障原因为光跳线脱落故障;或,
161、网管设备若识别到故障类型信息为输入光功率劣化,则确定故障原因为光跳线弯折故障;或,
162、网管设备若识别到故障类型信息为输入光功率波动,则根据所在网络系统的网络拓扑关系,确定产生告警信息的光模块的同缆关系;若与产生告警信息的光模块同缆的光模块正常,或不存在与产生告警信息的光模块同缆的光模块,则故障原因为光跳线震动故障;若存在至少两个同缆的光模块的故障类型为输入光功率波动,则确定故障原因为光缆震动故障;或,
163、网管设备若识别到故障类型信息为输入光功率波动丢失,则根据所在网络系统的网络拓扑关系,确定产生告警信息的光模块的同缆关系;若与产生告警信息的光模块同缆的光模块正常,或不存在与产生告警信息的光模块同缆的光模块,则故障原因为光跳线断裂故障;若存在至少两个同缆的光模块的故障类型为输入光功率波动,则确定故障原因为光缆断裂故障;或,
164、网管设备若识别到故障类型信息为光功率多径干扰劣化,则故障原因为光路质量劣化故障。
165、综上,网管设备可以根据光模块的故障类型信息和故障产生时间信息等信息,并结合其他光模块的故障类型信息和故障产生时间等信息,可以准确地确定故障原因。此外,在确定故障原因后,网管设备还可以将故障原因和故障点位置等信息推送给用户。
166、以上介绍了电子设备或网管设备确定故障原因和故障点的具体过程,在具体实施时,在其他故障场景下,电子设备或网管设备也可以采用类似的方法确定故障原因和故障点的位置,此处不再一一举例。
167、在本技术实施例中,确定故障原因和故障点位置的过程可以在电子设备中实现,或者,也可以在网管设备中实现,或者,可以由电子设备对故障原因和故障点位置进行初步判断,再由网管设备进行二次判断,通过电子设备与网管设备结合的方式,实现精确确定故障原因和故障点位置的效果。