网元异常检测方法及装置与流程

文档序号:12751792阅读:382来源:国知局
本发明实施例涉及通信
技术领域
,尤其涉及一种网元异常检测方法及装置。
背景技术
:随着通信技术的发展,移动网络日益复杂,网络管理和优化的难度不断加剧。移动网络包括大量的网元,有些网元需要和用户终端交互,有些网元不需要和用户终端交互。通常网元会产生大量的网络数据。现有的网元故障排查主要由人工分析网元异常性能指标完成,最常用的方法是预设各项网元性能指标的正常范围,通过判断性能指标是否在正常范围内,近似地判断网元性能是否正常。现有技术中,通过人工分析网元异常性能指标,不仅造成网元故障排查能力不足,同时也造成网元故障排查效率低。技术实现要素:本发明实施例提供一种网元异常检测方法及装置,以提升网元故障排查能力,同时提高网元故障排查自动化水平。本发明实施例的一个方面是提供一种网元异常检测方法,包括:根据网元的历史网络数据进行建模获得网元行为模型,所述网元行为模型包括多个神经元,所述神经元包括第一权值向量和第二权值向量,所述网元行为模型保留有网元历史状态的上下文向量;根据所述历史网络数据、所述第一权值向量、所述第二权值向量和所述上下文向量,确定空间检测门限和时间检测门限;获取所述网元的当前网络数据;根据所述网元的当前网络数据,确定所述多个神经元中所述当前网络数据的获胜神经元;根据所述当前网络数据和所述获胜神经元对应的第一权值向量,确定当前空间量化误差;根据所述获胜神经元对应的第二权值向量和所述上下文向量,确定当前时间量化误差;根据所述当前空间量化误差和所述空间检测门限,确定所述网元当前行为是否空间异常;根据所述当前时间量化误差和所述时间检测门限,确定所述网元当前行为是否时间异常。本发明实施例的另一个方面是提供一种网元异常检测装置,包括:建模模块,用于根据网元的历史网络数据进行建模获得网元行为模型,所述网元行为模型包括多个神经元,所述神经元包括第一权值向量和第二权值向量,所述网元行为模型保留有网元历史状态的上下文向量;确定模块,用于根据所述历史网络数据、所述第一权值向量、所述第二权值向量和所述上下文向量,确定空间检测门限和时间检测门限;获取模块,用于获取所述网元的当前网络数据;所述确定模块还用于根据所述网元的当前网络数据,确定所述多个神经元中所述当前网络数据的获胜神经元;根据所述当前网络数据和所述获胜神经元对应的第一权值向量,确定当前空间量化误差;根据所述获胜神经元对应的第二权值向量和所述上下文向量,确定当前时间量化误差;根据所述当前空间量化误差和所述空间检测门限,确定所述网元当前行为是否空间异常;根据所述当前时间量化误差和所述时间检测门限,确定所述网元当前行为是否时间异常。本发明实施例提供的网元异常检测方法及装置,通过网元的历史网络数据进行建模获得网元行为模型,用网元行为模型的多个神经元表征网元的历史网络数据,并将网元的当前网络数据映射到神经元上,根据历史网络数据和神经元可确定空间检测门限和时间检测门限,根据当前网络数据和神经元可确定当前空间量化误差和当前时间量化误差,通过比较当前空间量化误差和空间检测门限,可判断网元当前行为是否空间异常;通过比较当前时间量化误差和时间检测门限,可判断网元当前行为是否时间异常,相比于人工分析网元异常性能指标,能够实现网元空间和时间维度的异常检测,提升了网元故障排查能力,同时能够实现在线异常检测,提高了网元故障排查自动化水平。附图说明图1为本发明实施例提供的网元异常检测方法流程图;图2为本发明实施例提供的网元异常检测方法流程图;图3为本发明实施例提供的网元异常检测方法流程图;图4为本发明实施例提供的网元异常检测方法流程图;图5为本发明实施例提供的网元异常检测结果的输出流程图;图6为本发明实施例提供的网元异常检测装置的结构图;图7为本发明另一实施例提供的网元异常检测装置的结构图。具体实施方式图1为本发明实施例提供的网元异常检测方法流程图。本发明实施例针对通过人工分析网元异常性能指标,不仅造成网元故障排查能力不足,同时也造成网元故障排查效率低,提供了网元异常检测方法,该方法具体步骤如下:步骤S101、根据网元的历史网络数据进行建模获得网元行为模型,所述网元行为模型包括多个神经元,所述神经元包括第一权值向量和第二权值向量,所述网元行为模型保留有网元历史状态的上下文向量。在本实施例中,网元可以是网络上的任一网络设备,例如路由器、基站等。网元在运行过程中,会产生大量的网络数据,根据网络数据产生的先后顺序,可以划分为历史网络数据和当前网络数据,另外,大量的历史网络数据也有时间先后之分。本实施例采用网元的历史网络数据对网元行为进行建模,对网元行为进行建模的具体方式可以实现为如图2所示的步骤:步骤S201、采集网元的历史网络数据。由于不同的网元产生的历史网络数据不同,本实施例针对不同的网元分别进行网元行为建模,本实施例以一个网元为例,采集该网元的历史网络数据。步骤S202、对历史网络数据进行标准化处理。对历史网络数据进行标准化处理的目的是保证历史网络数据在同一个尺度上。步骤S203、对历史网络数据按照时间顺序排列。由于历史网络数据也有时间先后之分,因此,可根据历史网络数据产生的先后顺序,将历史网络数据进行排序。步骤S204、将标准化、排序后的历史网络数据输入递推自组织映射神经网络进行建模,得到网元行为模型。所述网元行为模型包括多个神经元,所述神经元包括两个权值向量即第一权值向量和第二权值向量,所述网元行为模型保留有网元历史状态的上下文向量。在本实施例中,神经元包括的第一权值向量用wx表示,第二权值向量用wy表示,网元行为模型对应的网元历史状态的上下文向量用y(t)表示。步骤S102、根据所述历史网络数据、所述第一权值向量、所述第二权值向量和所述上下文向量,确定空间检测门限和时间检测门限。在本实施例中,根据所述历史网络数据、所述第一权值向量、所述第二权值向量和所述上下文向量,确定空间检测门限和时间检测门限,可通过如图3所示的方法步骤确定:步骤S301、根据所述历史网络数据和所述第一权值向量,确定建模空间量化误差。根据所述历史网络数据和所述第一权值向量,确定建模空间量化误差的方法可以实现为计算每个历史网络数据和所述第一权值向量的欧式距离,每个历史网络数据对应的欧式距离构成所述建模空间量化误差。具体的,在本实施例中,历史网络数据用x(t)表示,此处的t表示历史时刻,且t可以取多个历史时刻,计算历史网络数据x(t)和第一权值向量wx的欧式距离QEs如公式(1)所示:QEs=||x(t)-wx||2(1)在本实施例中,t可以取多个历史时刻,x(t)可以是多个历史时刻的历史网络数据,则相应的QEs可有多个值。根据不同历史时刻的历史网络数据计算的QEs构成建模空间量化误差。步骤S302、根据所述建模空间量化误差,确定空间检测门限。根据所述建模空间量化误差,确定空间检测门限可以实现为:根据所述建模空间量化误差中的最大值和最小值,确定空间检测门限。具体的,获取建模空间量化误差中的最大值和最小值,计算出空间检测门限,具体的,空间检测门限=(训练空间量化误差最大值-训练空间量化误差最小值)*5,其中,训练空间量化误差最大值是建模空间量化误差中的最大值,训练空间量化误差最小值是建模空间量化误差中的最小值。步骤S303、根据所述第二权值向量和所述上下文向量,确定建模时间量化误差。根据所述上下文向量和所述第二权值向量,确定建模时间量化误差可以实现为:计算与每个历史网络数据在同一时刻的所述上下文向量和所述第二权值向量的欧式距离,所述欧式距离构成所述建模时间量化误差。具体的,根据公式(2)计算第二权值向量wy和上下文向量y(t)的欧式距离QET:QET=||y(t)-wy||2(2)在本实施例中,t可以取多个历史时刻,y(t)可以是多个历史时刻的上下文向量,y(t)和x(t)中的t保持同步,即每个x(t)对应有一个y(t),则相应的QET可有多个值,且QEs和QET的个数相同。多个QET构成建模时间量化误差。步骤S304、根据所述建模时间量化误差,确定时间检测门限。根据所述建模时间量化误差,确定时间检测门限可实现为:将所述建模时间量化误差中的每个欧式距离按照从小到大的顺序排列;将所述排列中百分位数为阈值的欧式距离确定为所述时间检测门限。具体的,将多个QET的值按照从小到大的顺序进行排列,取该排列的第95百分位数为时间检测门限,例如,该排列是从1到100的连续100个数字,则时间检测门限的值为95,若该排列是从1到200的连续200个数字,则时间检测门限的值为190。另外,此处只是举例第95百分位数为时间检测门限,在其他实施例中,可以不限定百分位数的值。步骤S103、获取所述网元的当前网络数据。获取网元的当前网络数据,当前网络数据可表示为m(t),此处的t表示当前时刻。步骤S104、根据所述网元的当前网络数据,确定所述多个神经元中所述当前网络数据的获胜神经元。根据所述网元的当前网络数据,确定所述多个神经元中所述当前网络数据的获胜神经元的方法可以根据如图4所示的方法步骤实现:步骤S401、遍历所述多个神经元中的每个神经元,计算所述当前网络数据和所述神经元的第一权值向量的第一欧式距离。由于网元行为模型包括多个神经元,每个神经元表示一种网元行为,由于网元行为模型是根据网元的历史网络数据进行建模获得的,则网元行为模型包括的多个神经元可用于表征网元的历史网络数据,同样,还可将网元的当前网络数据映射到某一个神经元,当前网络数据可以映射到的神经元作为当前网络数据的获胜神经元。假设网元行为模型包括M个神经元,第i个神经元包括的第一权值向量用表示,第二权值向量用表示,网元行为模型在当前时刻的前一时刻即t-1时刻的上下文向量用y(t-1)表示。遍历所述多个神经元中的每个神经元,计算所述当前网络数据m(t)和所述神经元的第一权值向量的第一欧式距离步骤S402、计算所述神经元的第二权值向量和前一时刻的所述上下文向量的第二欧式距离。遍历所述多个神经元中的每个神经元,计算所述神经元的第二权值向量和前一时刻的所述上下文向量y(t-1)的第二欧式距离步骤S403、根据所述第一欧式距离和所述第二欧式距离,计算递推距离。根据第一欧式距离和第二欧式距离计算递推距离其中,α和β是系数。步骤S404、将所述多个神经元中对应所述递推距离最小的神经元确定为所述当前网络数据的获胜神经元。由于网元行为模型包括M个神经元,第i个神经元对应的递推距离是Ei,则M个神经元共有M个递推距离,选择使Ei值最小的神经元作为当前网络数据的获胜神经元。在本实施例中,假定第i个神经元是当前网络数据的获胜神经元。步骤S105、根据所述当前网络数据和所述获胜神经元对应的第一权值向量,确定当前空间量化误差。根据当前网络数据m(t)和获胜神经元对应的第一权值向量采用上述公式(1),可计算出步骤S106、根据所述获胜神经元对应的第二权值向量和所述上下文向量,确定当前时间量化误差。根据所述获胜神经元对应的第二权值向量和所述上下文向量y(t),采用公式(2)计算当前时间量化误差步骤S107、根据所述当前空间量化误差和所述空间检测门限,确定所述网元当前行为是否空间异常。比较所述当前空间量化误差和所述空间检测门限,若所述当前空间量化误差大于所述空间检测门限,则确定所述网元的当前空间异常。若所述当前空间量化误差小于所述空间检测门限,则确定所述网元的当前空间正常。步骤S108、根据所述当前时间量化误差和所述时间检测门限,确定所述网元当前行为是否时间异常。比较所述当前时间量化误差和所述时间检测门限,若所述当前时间量化误差大于所述时间检测门限,则确定所述网元的当前时间异常,若所述当前时间量化误差小于所述时间检测门限,则确定所述网元的当前时间正常。对网元的检测结果输出具体如图5所示,当前空间检测结果表示当前空间异常,且当前时间检测结果表示当前时间异常时,输出11;当前空间检测结果表示当前空间异常,且当前时间检测结果表示当前时间正常时,输出10;当前空间检测结果表示当前空间正常,且当前时间检测结果表示当前时间异常时,输出01;当前空间检测结果表示当前空间正常,且当前时间检测结果表示当前时间正常时,输出00。本发明实施例通过网元的历史网络数据进行建模获得网元行为模型,用网元行为模型的多个神经元表征网元的历史网络数据,并将网元的当前网络数据映射到神经元上,根据历史网络数据和神经元可确定空间检测门限和时间检测门限,根据当前网络数据和神经元可确定当前空间量化误差和当前时间量化误差,通过比较当前空间量化误差和空间检测门限,可判断网元当前行为是否空间异常;通过比较当前时间量化误差和时间检测门限,可判断网元当前行为是否时间异常,相比于人工分析网元异常性能指标,能够实现网元空间和时间维度的异常检测,提升了网元故障排查能力,同时能够实现在线异常检测,提高了网元故障排查自动化水平。下面以一个基站小区作为网元为例,详细介绍上述方法实施例,随机选取基站小区在三周502小时内7个网元性能的数据。第一周的性能数据作为训练数据集来建模网元行为,第二周的性能数据作为交叉验证数据集来验证模型的有效性,第三周的性能数据作为测试数据集来进行异常检测。对基站小区进行异常检测的方法步骤具体如下:1)网元行为建模首先采用Min-Max算法对第一周的性能数据进行标准化操作,保证第一周的性能数据在同一尺度上,随后输入20个神经元的RSOM进行建模,建模后的第一权值向量wx如表1所示,第二权值向量wy如表2所示,建模后的上下文向量如表3所示:表1表2表3神经元状态Hour1Hour2Hour3Hour4Hour5Hour6Hour7Hour8Hour9Hour10神经元10.1410.2080.1610.0930.0640.0580.0600.1140.2100.375神经元20.2030.3900.3620.2760.2250.2530.3010.4800.7240.948神经元30.2350.4360.4230.3880.3990.5140.6590.8820.9740.860神经元40.1990.3830.3910.4430.5400.7760.9480.9530.7450.491神经元50.1650.3450.4010.5500.7420.9630.9190.6770.4390.273神经元60.1610.3670.5140.7570.9180.8660.6390.4230.2930.206神经元70.1680.4330.6570.8940.8020.6080.4100.2890.2300.192神经元80.1720.5180.7970.8240.5670.3840.2700.2160.2050.195神经元90.2640.6460.6700.5230.3150.2350.1810.1770.1910.206神经元100.1490.3370.4090.3250.1720.1140.0840.0950.1150.149神经元110.1060.2200.2170.1430.0700.0510.0390.0530.0720.107神经元120.1000.1470.1710.0960.0620.0320.0260.0350.0570.073神经元130.0680.0740.0620.0310.0210.0130.0110.0180.0330.047神经元140.0750.0850.0530.0300.0190.0150.0130.0230.0380.066神经元150.1460.2330.1570.0870.0500.0410.0350.0540.0780.116神经元160.1500.3860.3950.2190.1150.0820.0670.0860.1280.189神经元170.2150.5000.3960.2210.1230.1030.0900.1190.1650.245神经元180.6110.6870.3680.2260.1770.1620.1490.1930.2520.294神经元190.2820.2720.1240.0740.0540.0560.0540.0970.1370.223神经元200.1560.1070.0450.0260.0210.0210.0210.0430.0710.1202)计算空间检测门限和时间检测门限,具体的计算方法如上述方法实施例所述,此处不再赘述。时间检测门限为0.54,各个神经元对应的空间检测门限如表4所示:表43)获取当前网络数据,判别当前网络数据对应的获胜神经元,计算当前空间量化误差和当前时间量化误差,计算过程如上述实施例所述,此处不再赘述。4)检测当前空间异常和当前时间异常。本实施例以一个具体的网元即网元1为例,对比当前空间量化误差与对应神经元的空间检测门限,若超出门限则判定为空间异常,空间检测结果如表5所示:表5本实施例以一个具体的网元即网元1为例,对比当前时间量化误差与时间检测门限,若超出门限则判定为时间异常,假定时间检测门限为0.54,对比当前时间量化误差,时间检测结果如表6所示:表65)结果整合输出,整合时空检测结果并输出,输出结果如表7所示:表7本发明实施例通过网元的历史网络数据进行建模获得网元行为模型,用网元行为模型的多个神经元表征网元的历史网络数据,并将网元的当前网络数据映射到神经元上,根据历史网络数据和神经元可确定空间检测门限和时间检测门限,根据当前网络数据和神经元可确定当前空间量化误差和当前时间量化误差,通过比较当前空间量化误差和空间检测门限,可判断网元当前行为是否空间异常;通过比较当前时间量化误差和时间检测门限,可判断网元当前行为是否时间异常,相比于人工分析网元异常性能指标,能够实现网元空间和时间维度的异常检测,提升了网元故障排查能力,同时能够实现在线异常检测,提高了网元故障排查自动化水平。图6为本发明实施例提供的网元异常检测装置的结构图。本发明实施例提供的网元异常检测装置可以执行网元异常检测方法实施例提供的处理流程,如图6所示,网元异常检测装置包括:建模模块71、确定模块72、获取模块73。建模模块71,用于根据网元的历史网络数据进行建模获得网元行为模型,所述网元行为模型包括多个神经元,所述神经元包括第一权值向量和第二权值向量,所述网元行为模型保留有网元历史状态的上下文向量。确定模块72,用于根据所述历史网络数据、所述第一权值向量、所述第二权值向量和所述上下文向量,确定空间检测门限和时间检测门限。获取模块73,用于获取所述网元的当前网络数据。所述确定模块72还用于根据所述网元的当前网络数据,确定所述多个神经元中所述当前网络数据的获胜神经元;根据所述当前网络数据和所述获胜神经元对应的第一权值向量,确定当前空间量化误差;根据所述获胜神经元对应的第二权值向量和所述上下文向量,确定当前时间量化误差;根据所述当前空间量化误差和所述空间检测门限,确定所述网元当前行为是否空间异常;根据所述当前时间量化误差和所述时间检测门限,确定所述网元当前行为是否时间异常。本发明实施例通过网元的历史网络数据进行建模获得网元行为模型,用网元行为模型的多个神经元表征网元的历史网络数据,并将网元的当前网络数据映射到神经元上,根据历史网络数据和神经元可确定空间检测门限和时间检测门限,根据当前网络数据和神经元可确定当前空间量化误差和当前时间量化误差,通过比较当前空间量化误差和空间检测门限,可判断网元当前行为是否空间异常;通过比较当前时间量化误差和时间检测门限,可判断网元当前行为是否时间异常,相比于人工分析网元异常性能指标,能够实现网元空间和时间维度的异常检测,提升了网元故障排查能力,同时能够实现在线异常检测,提高了网元故障排查自动化水平。图7为本发明另一实施例提供的网元异常检测装置的结构图。如图7所示,在图6所示实施例的基础上,确定模块72具体用于根据所述历史网络数据和所述第一权值向量,确定建模空间量化误差;根据所述建模空间量化误差,确定空间检测门限;根据所述第二权值向量和所述上下文向量,确定建模时间量化误差;根据所述建模时间量化误差,确定时间检测门限。确定模块72包括计算单元721、确定单元722,计算单元721,用于计算每个历史网络数据和所述第一权值向量的欧式距离,每个历史网络数据对应的欧式距离构成所述建模空间量化误差;确定单元722,用于根据所述建模空间量化误差中的最大值和最小值,确定空间检测门限。或者,计算单元721用于计算与每个历史网络数据在同一时刻的所述上下文向量和所述第二权值向量的欧式距离,所述欧式距离构成所述建模时间量化误差;确定单元722用于将所述建模时间量化误差中的每个欧式距离按照从小到大的顺序排列;将所述排列中百分位数为阈值的欧式距离确定为所述时间检测门限。另外,确定单元72具体用于遍历所述多个神经元中的每个神经元,计算所述当前网络数据和所述神经元的第一权值向量的第一欧式距离;计算所述神经元的第二权值向量和前一时刻的所述上下文向量的第二欧式距离;根据所述第一欧式距离和所述第二欧式距离,计算递推距离;将所述多个神经元中对应所述递推距离最小的神经元确定为所述当前网络数据的获胜神经元。本发明实施例提供的网元异常检测装置可以具体用于执行上述图1、图2、图3、图4所提供的方法实施例,具体功能此处不再赘述。本发明实施例通过网元的历史网络数据进行建模获得网元行为模型,用网元行为模型的多个神经元表征网元的历史网络数据,并将网元的当前网络数据映射到神经元上,根据历史网络数据和神经元可确定空间检测门限和时间检测门限,根据当前网络数据和神经元可确定当前空间量化误差和当前时间量化误差,通过比较当前空间量化误差和空间检测门限,可判断网元当前行为是否空间异常;通过比较当前时间量化误差和时间检测门限,可判断网元当前行为是否时间异常,相比于人工分析网元异常性能指标,能够实现网元空间和时间维度的异常检测,提升了网元故障排查能力,同时能够实现在线异常检测,提高了网元故障排查自动化水平。综上所述,本发明实施例通过网元的历史网络数据进行建模获得网元行为模型,用网元行为模型的多个神经元表征网元的历史网络数据,并将网元的当前网络数据映射到神经元上,根据历史网络数据和神经元可确定空间检测门限和时间检测门限,根据当前网络数据和神经元可确定当前空间量化误差和当前时间量化误差,通过比较当前空间量化误差和空间检测门限,可判断网元当前行为是否空间异常;通过比较当前时间量化误差和时间检测门限,可判断网元当前行为是否时间异常,相比于人工分析网元异常性能指标,能够实现网元空间和时间维度的异常检测,提升了网元故障排查能力,同时能够实现在线异常检测,提高了网元故障排查自动化水平。在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(RandomAccessMemory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。本领域技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1