一种网元设备误配置检测方法及检测设备的制造方法

文档序号:10492007阅读:906来源:国知局
一种网元设备误配置检测方法及检测设备的制造方法
【专利摘要】本发明公开了一种网元设备误配置检测方法及检测设备,涉及数据挖掘和网络管理领域,以解决现有误配置检测需要投入大量的人力和时间,导致的误配置检测效率和灵活性较低的问题。所述方法包括:获取M个配置文件,对所述M个配置文件进行聚类处理,形成N个配置文件组群,对每个配置文件组群进行处理,确定每个配置文件组群中的一致性规律,根据待检测的配置文件所属的配置文件组群的一致性规律,对待检测的配置文件进行误配置检查。
【专利说明】
-种网元设备误配置检测方法及检测设备
技术领域
[0001] 本发明设及数据挖掘和网络管理领域,尤其设及一种网元设备误配置检测方法及 检测设备。
【背景技术】
[0002] 随着网络技术的发展,宽带路由器在网络中的应用变得越来越广泛,且在网络中 占据重要地位。然而,宽带路由器在运行过程中难免会出现故障,甚至导致网络暂时性的中 断,运不但会给企业带来诸多的不便,也可能会因此造成一定的损失,因而及时地检测并解 决路由器的故障是很有必要的。而在对路由器故障产生原因的排查过程中,人们发现:路由 器配置错误(即误配置)的原因占了很大一部分比例,因而对路由器的配置错误进行检测及 更正是很有必要的,运样可W很好的避免路由器故障的发生。
[0003] 目前,人们多采用人工检测配置文件的方式,逐条检测配置文件中的命令配置,检 测出配置文件中出现的错误。由于,目前在误配置检测过程中人为参与的部分较多,投入了 大量的人力和时间,同时,又需要结合大量的专业知识识别出网络设备的错误配置,误配置 检测效率和灵活性较低。

【发明内容】

[0004] 为解决上述问题,本发明实施例提供一种网元设备误配置检测方法及检测设备, W解决现有误配置检测需要投入大量的人力和时间,导致的误配置检测效率和灵活性较低 的问题。
[0005] 为达到上述目可选的,本发明的实施例采用如下技术方案:
[0006] 第一方面,本发明实施例提供一种网元设备误配置检测方法,应用于检测设备,该 检测方法可W包括:
[0007] 获取M个包含:上级命令行、W及属于所述上级命令行的至少一个下级命令行的配 置文件;
[0008] 对运M个配置文件进行聚类处理,将实现功能或配置结构相同或相似的配置文件 作为一类配置文件集合在一起,得到N个配置文件组群;
[0009] 确定每个配置文件组群中的一致性规律;
[0010] 根据待检测的配置文件所属的配置文件组群的一致性规律,对待检测的配置文件 进行误配置检查。
[0011] 如此,可W寻找出一类配置文件群组中存在的一致性规律,根据一致性规律自动 对属于该类的配置文件进行检测,确定出配置文件中的误配置命令,实现了自动检测,显著 提升了误配置问题的解决效率
[0012] 可选的,在第一方面的一种可实现方式中,所述对所述M个配置文件进行聚类处 理,形成N个配置文件组群,可W包括:
[OOK]计算M个配置文件中任意两个配置文件间的相似距离,得到M*M的矩阵,M*M的矩阵 中第i行第j列的元素表示:M个配置文件中配置文件i与配置文件j之间的相似距离,i、j均 为小于等于M的整数;
[0014] 对M*M的矩阵进行处理,得到归一化的拉普拉斯矩阵;
[0015] 对归一化的拉普拉斯矩阵进行计算,得到由S个M行向量组成的M巧的特征向量矩 阵,M*S的特征向量矩阵的M行向量与所述M个配置文件--对应;
[0016] 对所述M行向量进行聚类,形成N个向量组群;
[0017] 遍历所述N个向量组群中的每个向量组群,将与所述向量组群包含的向量相对应 的配置文件组合成一个配置文件组群,得到N个配置文件组群。
[0018] 如此,可W通过配置文件间相似距离的计算,将相似的配置文件聚合在一起组成 配置文件组群,提高同类配置文件一致性规律挖掘的完整性和准确性。
[0019] 具体的,对于M个配置文件中的任意两个配置文件:第一配置文件和第二配置文 件,可W根据下述方法计算运两个配置文件间的相似距离:
[0020] 在计算M个配置文件中任意两个配置文件间的相似距离之前,将M个配置文件中每 个配置文件转化为一颗包含至少一个字符串的配置树,每个字符串可W包含:上级命令行、 与上级命令行对应的一个下级参数命令、W及与下级参数命令相对应的参数值。
[0021 ]若第一配置文件对应第一配置树,第二配置文件对应第二配置树,则遍历第一配 置树中的每个字符串,分别计算字符串与第二配置树中每个字符串间的相似距离;
[0022] 将计算出来的相似距离进行求和,得到与字符串对应的相似距离;
[0023] 将第一配置树中每个字符串对应的相似距离进行求和,得到第一配置文件与第二 配置文件间的相似距离。
[0024] 如此,可W将配置文件简化为一颗配置树,通过配置树中字符串的比较来确定配 置文件间的相似距离,降低了相似距离计算的复杂性。
[0025] 由于,在实际应用中,本领域技术人员发现:对于实现功能或配置结构相似的多个 配置文件而言,通常存在下述一致性规律:在运些配置文件中某些参数命令对应的参数值 可能是相同的、固定不变的,即取该参数值的参数命令在运些配置文件中出现的频率是较 高的,而与该参数命令对应的其他参数值支持度较少或者不会出现;同时,在运些配置文件 中,某些参数命令常常会联系在一起同时且高频率地出现在运些配置文件中。
[0026] 基于此,在第一方面的一种可实现方式中,对于N个配置文件组群中的第一配置文 件组群,第一配置文件组群为N个配置文件中的任一配置文件组群,可W根据下述两种方式 确定第一配置文件组群中的一致性规律,并根据确定出的一致性规律进行误配置检测:
[0027] (1)根据贝叶斯检测方法,确定第一配置文件组群中与属于第一上级命令行的第 一下级参数命令相对应的训练参数;第一上级命令行为第一配置文件组群中的任一上级命 令行,第一下级参数命令为属于第一上级命令行的任一下级参数命令;
[0028] 对待检测的配置文件进行归类处理;
[0029] 若待检测的配置文件归为第一配置文件组群,则计算待检测的配置文件中,属于 第一上级命令行的第一下级参数命令所对应的参数值的概率,
[0030] 若概率小于训练参数,则确定待检测的配置文件中属于第一上级命令行的第一下 级参数命令的配置是错误的。
[0031] 具体的,所述根据贝叶斯检测方法,确定所述第一配置文件组群中与属于第一上 级命令行的第一下级参数命令相对应的训练参数,可W包括:
[0032] 分别根据下述公式,计算属于第一上级命令行Pi的第一下级参数命令Cj的赌和逆 文档频率;
[0033]
[0034] 逆文档频率:
其中,所述Pi@Cj表示:属于第一上级命令行的第 一下级参数命令,所述A为Pi@Cj对应的参数值的所有可能取值,Q为所述第一配置文件组群 包含的配置文件的总个数,t为所述第一配置文件组群中出现Pi@C北勺配置文件的个数;
[003引令 Zi,j = Pi@Cj,则 H(Zi,j) = I(Zi,j)*Wf(Zi,j)
[0036] 根据下述公式得到与Pi@C如目对应的训练参数al地a:
[0037]
[0038] (2)遍历第一配置文件群组中的任一上级命令行,确定属于上级命令行的下级命 令行组,下级命令行组包含:属于上级命令行的至少一个下级命令行,且至少一个下级命令 行在第一配置文件组群中的支持度大于等于最小支持度,且至少一个下级命令行满足最小 置信度;
[0039] 对待检测的配置文件进行归类处理;
[0040] 若待检测的配置文件归为第一配置文件组群,则查看待检测的配置文件中的下级 命令行;
[0041] 若在待检测的配置文件中的下级命令行中,存在属于第一上级命令行的第一下级 命令行包含在确定出的属于第一上级命令行的第一下级命令行组内,而第一下级命令行组 内的其他下级命令行未包含在待检测的配置文件中,则确定待检测的配置文件中属于第一 上级命令行的配置是错误的。
[0042] 具体的,对于第一配置文件群组中的第一上级命令行Pi,第一上级命令行为第一 配置文件组群中的任一上级命令行,确定属于Pi的下级命令行组,可W包括:
[0043] WPi为单位,统计属于Pi的每个下级命令行在第一配置文件群组中的支持度,将支 持度大于等于最小支持度的下级命令行放入一阶频繁项集^中;
[0044] 若^不为空,则根据^生成二阶候选项集C2,C2包含至少一个候选项,候选项由b中 两个不同的下级命令行组成;
[0045] WPi为单位,统计C2中每个候选项在第一配置文件群组中的支持度,将支持度大于 等于最小支持度的候选项放入二阶频繁项集L2中;
[0046] 若L2不为空,则重复上述过程,直到生成啡介频繁项集Lk, Lk包含至少一个频繁项, 每个频繁项由K-I阶频繁项集Lk-I中的K个不同的下级命令行组成;
[0047] 若Lk不为空,则根据Lk中的频繁项生成规则集合,所述规则集合包含至少一个规则 项,每个规则项包含:所述Lk中的至少一个频繁项、W及所述至少一个频繁项之间的相互关 系;
[004引将所述规则集合中置信度大于等于最小置信度的规则项作为属于所述第一上级 命令行的下级命令行组
[0049] 如此,可W根据上述方式确定出配置文件组群中存在的一致性规律,根据确定出 的一致性规律,将不满足该一致性规律的网元设备的配置确定为误配置。
[0050] 第二方面,本发明实施例还提供一种检测设备,用于执行第一方面所述的网元设 备误配置检测方法,对网元设备的配置进行误配置检测,该设备可W包括:
[0051] 获取单元,用于获取M个包含上级命令行、W及属于上级命令行的至少一个下级命 令行的配置文件,每个下级命令行包含:下级参数命令、W及与下级参数命令相对应的参数 值;
[0052] 聚类单元,用于对获取单元获取到的M个配置文件进行聚类处理,形成N个配置文 件组群;
[0053] 规律确定单元,用于确定聚类单元得到的每个配置文件组群中的一致性规律;
[0054] 检测单元,用于根据待检测的配置文件所属的配置文件组群的一致性规律,对待 检测的配置文件进行误配置检查。
[0055] 具体的,上述获取单元、聚类单元、规律确定单元W及检测单元的执行过程可W参 照第一方面所述方法中的执行过程,在此不再详细寶述。
[0056] 需要说明的是,第二方面中的获取单元可W为检测设备的通信单元,第二方面中 的聚类单元、规律确定单元W及检测单元可W为单独设立的处理器,也可W集成在检测设 备的某一个处理器中实现,此外,也可WW程序代码的形式存储于检测设备的存储器中,由 检测设备的某一个处理器调用并执行W上聚类单元、规律确定单元W及检测单元的功能。 运里所述的处理器可W是一个中央处理器(Central Processing化it,CPU),或者是特定 集成电路(Application Specific Integrated Cir州it,ASIC),或者是被配置成实施本发 明实施例的一个或多个集成电路。
[0057] 由上可知,本发明实施例提供一种网元设备误配置检测方法及检测设备,获取M个 配置文件,对所述M个配置文件进行聚类处理,形成N个配置文件组群,确定配置文件组群中 的一致性规律,根据待检测的配置文件所属的配置文件组群的一致性规律,对待检测的配 置文件进行误配置检查。如此,寻找配置文件中存在的一致性规律,根据一致性规律自动对 配置文件进行检测,确定出配置文件中的误配置命令,实现了自动检测,显著提升了误配置 问题的解决效率。
【附图说明】
[0058] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可W 根据运些附图获得其他的附图。
[0059] 图1为本发明实施例提供的误配置检测的原理框图;
[0060] 图2为本发明实施例提供的检测设备20的结构图;
[0061] 图3为本发明实施例提供的网元设备误配置检测方法的流程图;
[0062] 图4为本发明实施例提供的检测设备30的结构图。
【具体实施方式】
[0063] 本发明的基本原理是:在一个局域网中,对不同路由器的配置文件进行汇总处理, 将配置形似或相同的配置文件进行聚类,找到每类配置文件中存在的一致性规律(如某条 参数命令的参数值在配置文件中具有较高的出现频率,或者,多条参数命令在配置文件中 组合出现的频率较高),然后根据运种规律找到一种合适的数学检测方法对待检测的配置 文件中的参数命令进行实时检测,若该条参数命令违反该一致性规律,则确定该参数命令 配置的参数值或者该配置文件内可能存在错误配置,如此,根据合适的检测方法对配置文 件进行自动检测,提升了误配置检测的效率和灵活性。
[0064] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他 实施例,都属于本发明保护的范围。
[0065] 例如,图1为本发明实施例提供的误配置检测的原理框图,如图1所示,将处于同一 局域网的不同路由器的配置文件作为训练文件,对运些文件进行配置文件聚类,将相同或 相似的配置文件归为一类,对每类配置文件进行一致性规律挖掘,找出该类配置文件中参 数命令出现的规律性,然后,对待检测的配置文件归类,根据配置文件所属类别对应的一致 性规律进行误配置检测,进而将误配置结果通过检测报告反馈给检测人员。
[0066] 其中,本发明提供的网元设备误配置检测方法可由图2所示的检测设备20执行,用 于对网络设备10的配置进行误差检测,所述网络设备10可W为路由器,所述检测设备20可 W为:交换机、路由器、网管设备、Web(网页)服务器、软件定义网络(Software Defined 化twork,SDN)控制器等设备中的任一种设备。可选的,如图2所示,所述检测设备20可W包 括:处理器2011、存储器2012、通信单元2013W及至少一个通信总线2014,通信总线2014用 于实现运些装置之间的连接和相互通信.
[0067] 处理器2011,可能是一个中央处理器(^cenhal processing unit,简称为CPU),也 可W是特定集成电路(Application Specific Integrated Cir州it,ASIC),或者是被配置 成实施本发明实施例的一个或多个集成电路,例如:一个或多个微处理器(digital singnal processor,DSP),或,一个或者多个现场可编程口阵列(Field Programmable Gate Array,FPGA)〇
[006引存储器2012,可W是易失性存储器(volatile memo巧),例如随机存取存储器 (random-access memoir ,RAM);或者非易失性存储器(non-volatile memoir),例如只读存 储器(read-only memory,R0M),快闪存储器(flash memoir),硬盘化 ard disk 化 ive,皿 D) 或固态硬盘(solid-s化te化ive,SSD);或者上述种类的存储器的组合。
[0069] 通信单元2013可用于与外部网元之间进行数据交互,如:收集网络设备10产生的 配置文件,并将检测出的误配置文件反馈给检测人员。
[0070] 通信总线2014可W分为地址总线、数据总线、控制总线等,可W是工业标准体系结 构(Industry Standard A;rchitec1:ure,ISA)总线、夕F部设备互连(Peripheral Component, PCI)总线或扩展工业标准体系结构化xtended IndustiT Standard A;rchitec1:ure,EISA) 总线等。为便于表示,图2中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总 线。
[0071] 具体的,通信单元2013,可W用于获取M个配置文件,所述M为大于等于1的整数,所 述配置文件包含上级命令行、W及属于所述上级命令行的至少一个下级命令行,每个所述 下级命令行包含:下级参数命令、W及与所述下级参数命令相对应的参数值.
[0072] 处理器2011,可W用于对所述M个配置文件进行聚类处理,形成N个配置文件组群, 所述配置文件组群包含至少一个配置文件,所述N^M,所述N为大于等于1的整数;
[0073] 确定所述配置文件组群中的一致性规律,根据待检测的配置文件所属的配置文件 组群的一致性规律,对待检测的配置文件进行误配置检查。
[0074] 如此,可W寻找出一类配置文件群组中存在的一致性规律,根据一致性规律自动 对属于该类的配置文件进行检测,确定出配置文件中的误配置命令,实现了自动检测,显著 提升了误配置问题的解决效率。
[0075] 为了便于描述,W下实施例一W步骤的形式示出并详细描述了本发明中检测设备 20执行的网元设备误配置检测方法,其中,示出的步骤也可W在除检测设备20之外的诸如 一组可执行指令的计算机系统中执行,如:本发明所述的方法还可W由网络设备10执行,即 图2所示的检测设备20中包含的执行本发明提供的方法的单元也可W包含在网络设备10 中,由网络设备10执行本发明提供的网元设备误配置检测方法。此外,虽然在图中示出了逻 辑顺序,但是在某些情况下,可W W不同于此处的顺序执行所示出或描述的步骤。
[0076] 实施例一
[0077] 图3为本发明实施例提供的网元设备误配置检测方法的流程图,由图2所示的检测 设备20执行,用于对图2中的检测设备20进行误配置检测,如图3所示,所述方法可W包括:
[0078] SlOl:获取M个配置文件,所述M为大于等于1的整数。
[0079] 其中,配置文件为网络设备活动行为的执行依据,每个配置文件可W包含多个命 令片段,每个命令片段可W由一系列具有等级结构的字符串组成,可W包含:上级命令行、 W及属于上级命令行的至少一个下级命令行,所述上级命令行包含:上级参数命令、W及与 上级参数命令相对应的参数值,下级命令行包含下级参数命令、W及与下级参数命令相对 应的参数值;需要说明的是,在某些情况下,配置文件中命令片段包含的上级命令行可W为 空,即可W在该命令片段中不存在上级命令行,仅包含至少一个下级命令行。
[0080] 例如,对于下述命令片段:
[0081] isis 112
[0082] is-level level-2
[0083] cost-style wide
[0084] 其中,isis 112为上级命令行,isis为上级参数命令,112为与上级参数命令相对 应的参数值,"is-level leve]_-2"、"cost-style wide"分别为同属于上级命令行isis 112 的下级命令行,W下级命令行"is-level level-2"为例,"is-level"为下级参数命令, "leve^2"为与该下级参数命令相对应的参数值。
[0085] 可选的,检测设备可W直接从至少一个网络设备的存储器中读取得到至少一个配 置文件,也可W从独立于网络设备之外的数据库中获取至少一个网络设备在一段时间内的 配置文件,其中,数据库可W存在于一服务器中,且该服务器可W预先存储网络中每个网络 设备的配置文件。需要说明的是,在本发明实施例中,每个网络设备可对应一个配置文件。
[0086] S102:对所述M个配置文件进行聚类处理,形成N个配置文件组群,所述N ^ M,所述N 为大于等于1的整数。
[0087] 可选的,所述对所述M个配置文件进行聚类处理,形成N个配置文件组群,可W包 括:
[0088] 计算所述M个配置文件中任意两个配置文件间的相似距离,得到M*M的矩阵,所述 M*M的矩阵中第i行第j列的元素表示:所述M个配置文件中配置文件i与配置文件j之间的相 似距离,i、j均为小于等于M的整数;
[0089] 对所述M*M的矩阵进行处理,得到归一化的拉普拉斯矩阵;
[0090] 对所述归一化的拉普拉斯矩阵进行计算,得到M巧的特征向量矩阵,所述M巧的特 征向量矩阵由S个M行向量组成,所述M*S的特征向量矩阵的M行向量与所述M个配置文件一 一对应,所述S ^ M,所述S为大于等于1的整数;
[0091 ]对所述M行向量进行聚类,形成N个向量组群,所述N个向量组群包含至少一行向 量;
[0092] 遍历所述N个向量组群中的每个向量组群,将与所述向量组群包含的向量相对应 的配置文件组合成一个配置文件组群,得到N个配置文件组群。
[0093] 其中,两个配置文件间的相似距离用于表示:运两个配置文件实现的功能和/或配 置结构的相似程度。通常情况下,配置文件间的相似距离越大,则表示配置文件间的功能 和/或结构越不相似,配置文件间的相似距离越小,则表示配置文件间的功能和/或结果越 相似。
[0094] 可选的,在本发明实施例中,在计算M个配置文件中任意两个配置文件间的相似距 离之前,可W将M个配置文件中每个配置文件转化为一颗配置树,所述配置树可W包含:至 少一个字符串,每个字符串可W包含下述=个部分:上级命令行、属于该上级命令行的一个 下级参数命令、W及与该下级参数命令相对应的参数值,运=部分之间可W采用特殊符号 隔开,如:可W采用符号@隔开;
[0095] 对于M个配置文件中的任意两个配置文件:第一配置文件和第二配置文件,第一配 置文件对应第一配置树,第二配置文件对应第二配置树,计算第一配置文件和第二配置文 件间的相似距离具体可W包括:
[0096] 遍历所述第一配置树中的每个字符串,分别计算所述字符串与所述第二配置树中 每个字符串间的相似距离;
[0097] 将计算出来的相似距离进行求和,得到与所述字符串对应的相似距离;
[0098] 将所述第一配置树中每个字符串对应的相似距离进行求和,得到所述第一配置文 件与所述第二配置文件间的相似距离。
[0099] 如此,将配置文件表示为一颗配置树,既可W保留配置文件中的等级信息又可W 提升配置文件间相似距离计算的准确性和简单程度。
[0100] 其中,可W采用下述顺序匹配的方式来计算字符串间的相似距离,先匹配字符串 间的上级命令行是否相同,若相同,则将字符串间的相似距离记为0,若不相同,则将字符串 间的相似距离记为1;然后,匹配字符间的下级参数命令,若相同,则将字符串的相似距离记 为0,若不相同,则将字符串的相似距离记为1,最后,匹配字符串间的参数值,若相同,则将 字符串的相似距离记为0,若不相同,则将字符串间的相似距离记为1,累计每次记录的相似 距离,将累计后的值作为字符串间的相似距离。
[0101] 应当理解的是,上述采用数字0和1来记录匹配结果的方式仅为本实施例的可选方 式,本领域技术人员还可W根据具体的应用环境W及其他相关背景选取其他数字来对应记 录匹配结果,此外,上述顺序匹配上级命令行、下级参数命令、参数值的方式也仅为本实施 例的可选方式,本领域技术人员还可W根据具体的应用环境W及其他相关背景打乱上述匹 配顺序,采用其他顺序进行匹配,如,可采用下述顺序:参数值、下级参数命令、顺序匹配上 级命令行进行匹配。
[0102] 例如,若第一配置文件包含下述命令片段:
[0103] isis 112
[0104] is-level level-2
[0105] cost-style wide
[0106] 第二配置文件包含下述命令片段:
[0107] isis 112
[0108] timer Isp-generation I 50 501evel-2
[0109] flash-flood level-2
[0110] 则该第一配置文件对应的配置树为:isis 112@is-level@level-2、isisll2@ cost-style@wide;第二配置文件对应的配置树为:isis 112@time;r lsp-generation@l 50 501evel-2、isis 112@flash-flood@level-2;
[0111] 将第一配置文件的字符串"isis 112@is-level@level-2"与第二配置文件对应的 配置树中的字符串 "isis 112@timer lsp-generation@l 50 501evel-2、isis 112@flash-f lood@level-2"分别进行匹配,得到"isis 112@is-level@level-2"与"isis 112@timer lsp-generation@l 50 501evel-2"间的相似距离为:2,字符串 "isis 112@is-level@ level-2"与 "isis 112@flash-flood@level-2"的相似距离为 1,则字符串''1318 112@13-level@leve]_-2"对应的相似距离为:2+1 = 3;
[0112] 同理,计算得到字符串"isis 112@cost-style@wide"的相似距离为:2巧=4,则第 一配置文件与第二配置文件间的相似距离为:3+4 = 7。
[0113] 如此,可W根据上述方法得到M个配置文件中任意两个配置文件间的相似距离。可 理解的而是,当计算配置文件与自身之间的相似距离时,可W计算与该配置文件对应的配 置树中每个字符串与该配置树中其他字符串之间的相似距离,将计算得到的每个字符串对 应的相似距离相加得到该配置文件与自身之间的相似距离。
[0114] 可选的,对于M*M的矩阵E,可W先根据公式:L = D-E得到拉普拉斯矩阵L,矩阵D为 对角矩阵,其对角线上的元素为M*M的矩阵E对应行或列所有元素的和,然后,在对得到的拉 普拉斯矩阵L进行归一化处理,得到归一化的拉普拉斯矩阵。
[0115] 其中,归一化处理可W为现有技术,在此不再进行详细寶述。
[0116] 可选的,可W采用K-mean聚类的方法对M行向量进行聚类,形成N个向量组群;其 中,K-means聚类算法是一种基于样本间相似性度量的间接聚类方法,此算法Wk为参数,把 多个对象分为k个簇,W使簇内具有较高的相似度,而且簇间的相似度较低,相似度的计算 根据一个簇中对象的平均值来进行,此算法首先随机选择k个对象,每个对象代表一个聚类 中屯、,对于其余的每一个对象,根据该对象与各聚类中屯、之间的距离,把它分配到与之最相 似的聚类中,然后,计算每个聚类的新中屯、,重复上述过程,直到准则函数收敛。
[0117] S103:确定每个配置文件组群的一致性规律,根据待检测的配置文件所属的配置 文件组群的一致性规律,对所述待检测的配置文件进行误配置检查。
[0118] 由于,在实际应用中,本领域技术人员发现:对于实现功能或配置结构相似的多个 配置文件而言,通常存在下述两个规律(1)在运些配置文件中某些参数命令对应的参数值 可能是相同的、固定不变的,即取该参数值的参数命令在运些配置文件中出现的频率是较 高的,而与该参数命令对应的其他参数值出现次数较少或者不会出现,(2)在运些配置文件 中,某些参数命令常常会联系在一起同时且高频率地出现在运些配置文件中,为此,本发明 技术人员采集大量的配置文件,结合合适的数学方法对采集到的配置文件进行训练,找到 实现功能或配置结构相似的同类配置文件中的一致性规律,若属于该类配置文件的待检测 的配置文件违反该一致性规律(如:本该出现次数较频繁的参数命令却在待检测的配置文 件中出现次数较低或不出现,或者,本该和其他参数命令一起同时出现在待检测的配置文 件中的参数命令,在待检测的配置文件却没有出现),则确定该待检测的配置文件中出现配 置错误。
[0119] 基于此,对于所述N个配置文件组群中的第一配置文件组群,所述第一配置文件组 群为所述N个配置文件中的任一配置文件组群,可W根据下述两种方式确定所述第一配置 文件组群中的一致性规律,并进行误配置检测:
[0120] (1)根据贝叶斯检测方法,确定所述第一配置文件组群中与属于第一上级命令行 的第一下级参数命令相对应的训练参数;所述第一上级命令行为所述第一配置文件组群中 的任一上级命令行,所述第一下级参数命令为属于所述第一上级命令行的任一下级参数命 令;
[0121] 所述根据待检测的配置文件所属的配置文件组群的一致性规律,对所述待检测的 配置文件进行误配置检查,可W包括:
[0122] 对所述待检测的配置文件进行归类处理;
[0123] 若所述待检测的配置文件归为所述第一配置文件组群,则计算所述待检测的配置 文件中,属于所述第一上级命令行的第一下级参数命令所对应的参数值的概率,
[0124] 若所述概率小于所述训练参数,则确定所述待检测的配置文件中属于所述第一上 级命令行的第一下级参数命令的配置是错误的。
[0125] 其中,计算属于第一上级命令行的第一下级参数命令所对应的参数值的概率可W 为:
[0126] 统计待检测的配置文件中,包含该参数值的第一下级参数命令的个数、W及第一 下级参数命令的总个数,将统计的包含该参数值的第一下级参数命令的个数作为分子、第 一下级参数命令的总个数作为分母进行计算,将得到的分数值作为该参数值的概率。
[0127] 具体的,根据贝叶斯检测方法,确定所述第一配置文件组群中与属于第一上级命 令行的第一下级参数命令相对应的训练参数,可W包括:
[0128] 根据下述公式分别计算属于第一上级命令行Pi的第一下级参数命令Cj的赌和逆文 档频率:
[0129]
[0130] 逆文档频率:
其中,Pi@Cj为属于第一上级命令行的第一下级 参数命令,所述A为PiOC^目对应的参数值的所有可能取值,Q为所述第一配置文件组群包含 的配置文件的总个数,t为所述第一配置文件组群中出现Pi@C北勺配置文件的个数;
[0131] 令 ZiJ = PiOCj,则H(ZiJ) = KZi (Zi, j)
[0132] 庶据下冰/A井俱副占姑对而的祉I链泉掀g Inhg .
[0133]
[0134] 其中,祉Eanomaly表示PiOCj配置错误时对应的参数值,m、n、l分别表示配置正常 的上级参数命令、下级参数命令W及参数值。
[0135] 若待检测的配置文件中的命令Zi,J的概率满足
则说明该待检 测的配置文件中的命令Zi,J为误配置。
[0136] (2)遍历所述第一配置文件群组中的任一上级命令行,确定属于所述上级命令行 的下级命令行组,下级命令行组包含:属于所述上级命令行的至少一个下级命令行,且所述 至少一个下级命令行在所述第一配置文件组群中的支持度大于等于最小支持度,且所述至 少一个下级命令行满足最小置信度;
[0137] 所述根据待检测的配置文件所属的配置文件组群的一致性规律,对所述待检测的 配置文件进行误配置检查,可W包括:
[0138] 对所述待检测的配置文件进行归类处理;
[0139] 若所述待检测的配置文件归为所述第一配置文件组群,则查看所述待检测的配置 文件中的下级命令行.
[0140] 若在所述待检测的配置文件中的下级命令行中,存在属于第一上级命令行的第一 下级命令行包含在确定出的属于所述第一上级命令行的第一下级命令行组内,而第一下级 命令行组内的其他下级命令行未包含在所述待检测的配置文件中,则确定所述待检测的配 置文件中属于所述第一上级命令行的配置是错误的。
[0141] 具体的,对于所述第一配置文件群组中的第一上级命令行Pi,所述第一上级命令 行为所述第一配置文件组群中的任一上级命令行,所述确定属于所述第一上级命令行的下 级命令行组,可W包括:
[0142] WPi为单位,统计属于Pi的每个下级命令行在第一配置文件群组中的支持度,将支 持度大于等于最小支持度的下级命令行放入一阶频繁项集^中;
[0143] 若^不为空,则根据^生成二阶候选项集C2,所述C2包含至少一个候选项,所述候 选项由所述b中两个不同的下级命令行组成;
[0144] WPi为单位,统计C2中每个候选项在第一配置文件群组中的支持度,将支持度大于 等于最小支持度的候选项放入二阶频繁项集L2中;
[0145] 若L2不为空,则重复上述过程,直到生成啡介频繁项集Lk, Lk包含至少一个频繁项, 每个频繁项由K-I阶频繁项集Lk-I中的K个不同的下级命令行组成,且由所述Lk生成的K+1候 选项集Ck+1中所有候选项的在所述第一配置文件群组中的支持度均小于所述最小支持度;
[0146] 若Lk不为空,则根据Lk中的频繁项生成规则集合,所述规则集合包含至少一个规则 项,每个规则项包含:所述Lk中的至少一个频繁项、W及所述至少一个频繁项之间的相互关 系;
[0147] 将所述规则集合中置信度大于等于最小置信度的规则项作为属于所述第一上级 命令行的下级命令行组。
[0148] 其中,在本发明实施例中,最小支持度、最小置信度为预先设置的口限值,其具体 取值可W根据需要进行设置,本发明实施例对此不进行限定;若命令行或候选项的支持度 大于等于最小支持度,则表示该命令行或候选项在该配置文件群组中出现的频率较高,为 频繁出现项,若命令行的支持度小于最小支持度,则表示该命令行在该配置文件群组中的 出现频率较低。
[0149] 若确定出的规则项的置信度大于等于最小置信度,则表示该规则项中设置的频繁 项之间的相互关系在配置文件群组中可靠度较高,若确定出的规则项的置信度小于最小置 信度,则表示该规则项中设置的频繁项之间的相互关系在配置文件群组中的可靠度较低, 有可能在某种情况下,该规则项中各频繁项之间的相互关系可能会发生变化。
[0150] 其中,上述下级命令行在第一配置文件群组中的支持度可W为:第一配置文件组 群中出现该下级命令行的次数与第一配置文件组群包含的总的配置文件个数的比值,当候 选项是由多个下级命令行组成时,该候选项在该第一配置文件组群中的支持度可W指:第 一配置文件组群中出现候选项的次数与组成候选项的每个下级命令行在第一配置文件组 群中出现的次数的和的比值。需要说明的是,在本发明实施例中,若下级命令行或候选项在 第一配置文件组群的S个配置文件中出现过,则表示该下级命令行或候选项出现的次数为S 次,即下级命令行或候选项只要在一个配置文件中出现过,不论在该配置文件中出现一次 或多次,都可W确定为该下级命令行或候选项在该配置文件中出现1次。
[0151] 例如,若一配置文件组群包含10个配置文件,且Pi@Ci@ai在第一个配置文件中出现 的次数为4(即第一个配置文件包含4个命令行Pi@Ci@ai),Pi@Ci@ai在第五个配置文件中出现 的次数为3,Pi@Ci@ai在第八个配置文件中出现的次数为5,由此可知,命令行Pi@Ci@ai仅在第 一个配置文件、第五个配置文件、W及第八个配置文件3个配置文件中出现过,因此,Pi@Ci@ ai的出现次数为3次,Pi@Ci@ai的支持度为3/10 = 0.3。
[0152] 需要说明的是,在本发明实施例中,规则项中至少一个频繁项之间的相互关系可 W任意设定,如:可W将至少一个频繁项中的任一个频繁项设置为处于主导地位,其他频繁 项由该频繁项推导出来,即至少一个频繁项中的其他频繁项从属与该频繁项,其中,规则项 的置信度可W为:该规则项中至少一个频繁项同时出现在配置文件组群中的次数与规则项 中处于主导地位的频繁项在配置文件组群中出现的次数的比值。
[0153] 例如:若最终确定出的Lk包含4个频繁项{a,b,C,d},则可W将Lk中的频繁项任何组 合,生成规则集合,如可W生成{(a一b),(a一b、c),(a一c、d),(b一c、d)}的规则集合,其中, "a^b"表示:a推到出来b,a处于主导地位,b处于从属地位,规则项(a^b)的置信度为:a和b 同时在配置文件组群中出现的次数/a在配置组群中出现的次数。
[0154] 可理解的是,在上述确定属于所述第一上级命令行的下级命令行组的过程中,若 任意阶频繁项集以为空,则结束循环,返回i-1阶频繁项集以-1,根据以-1中的频繁项生成规 则集合,将规则集合中置信度大于等于最小置信度的频繁项作为属于所述第一上级命令行 的下级命令行组。
[0155] 例如,若一配置文件组群中属于上级命令行Pi的下级命令行Pi@Ci@ai、Pi@Ci@a2、Pi@ C2@ai的支持度均大于等于最小支持度,则将Pi@Ci@ai、Pi@Ci@a2、Pi@C2@ai放入一阶频繁项集 1^1中,然后,将Pi@Ci@ai、Pi@Ci@a2、Pi@C2@ai两两组合生成二阶候选项集C2={(Pi@Ci@ai、Pi@ Ci@a2),(Pi@Ci@ai、Pi@C2@ai),(Pi@Ci@a2、Pi@C2@ai)},若二阶候选项集C2中候选项(Pi@Ci@ai、 Pi@Ci@a2)、W@Ci@ai、Pi@C2@ai)的支持度大于等于最小支持度,则将化@Ci@ai、Pi@Ci@a2)、 (Pi@Ci@ai、Pi@C2@ai)两个候选项放入二阶频繁项集L2中,此时,若根据L2生成的立阶候选项 集C3 = {(Pi@Ci@ai、Pi@Ci@a2、Pi@C2@ai)}中的候选项(Pi@Ci@ai、Pi@Ci@a2、Pi@C2@ai)的支持度 小于最小支持度,则结束计算,返回L2,根据L2中的频繁项生成规则集合{((Pi@Ci@ai、Pi@Ci@ B2) 一化@扣@曰1、口1齡2@曰1))},将规则集合中置信度大于等于最小置信度的规则项化@扣@ 曰1、Pi@Ci@a2) 一化@Ci@ai、Pi@C2@ai)作为属于上级命令行Pi的下级命令行组。
[0156] 需要说明的是,上述两种方式可W单独执行,也可W结合在一起执行,W更加准确 的检测出配置文件中的误配置命令,例如:可W先通过方式(2)确定出配置文件中属于上级 命令行1的配置是错误的,然后,再根据方式(1)仅对属于上级命令行1的下级命令行的配置 进行检测,确定出属于上级命令行1的具体哪个下级命令行的配置是错误的。
[0157] 由上可知,本发明实施例提供一种网元设备误配置检测方法,获取M个配置文件, 对所述M个配置文件进行聚类处理,形成N个配置文件组群,确定配置文件组群中的一致性 规律,根据待检测的配置文件所属的配置文件组群的一致性规律,对待检测的配置文件进 行误配置检查。如此,寻找配置文件中存在的一致性规律,根据一致性规律自动对配置文件 进行检测,确定出配置文件中的误配置命令,实现了自动检测,显著提升了误配置问题的解 决效率。
[0158] 根据本发明实施例,本发明下述实施例还提供了一种检测设备30,优选地用于实 现上述方法实施例中的方法。
[0159] 实施例二
[0160] 图4为本发明实施例提供的一种检测设备30的结构图,所述检测设备30可W为:交 换机、路由器、网管设备、Web(网页)服务器、软件定义网络(Software Defined化twork, SDN)控制器等设备中的任一种设备,用于执行实施例一所述的方法,如图4所示,所述检测 设备30可W包括:
[0161] 获取单元301,用于获取M个配置文件,所述M为大于等于1的整数,所述配置文件包 含上级命令行、W及属于所述上级命令行的至少一个下级命令行,每个所述下级命令行包 含:下级参数命令、W及与所述下级参数命令相对应的参数值。
[0162] 聚类单元302,用于对所述获取单元301获取到的M个配置文件进行聚类处理,形成 N个配置文件组群,所述配置文件组群包含至少一个配置文件,所述N^M,所述N为大于等于 1的整数。
[0163] 规律确定单元303,用于确定出所述聚类单元302得到的每个配置文件组群中的一 致性规律。
[0164] 检测单元304,用于根据待检测的配置文件所属的配置文件组群的一致性规律,对 所述待检测的配置文件进行误配置检查。
[0165] 可选的,所述聚类单元302,可W用于:
[0166] 计算所述M个配置文件中任意两个配置文件间的相似距离,得到M*M的矩阵,所述 M*M的矩阵中第i行第j列的元素表示:所述M个配置文件中配置文件i与配置文件j之间的相 似距离,i、j均为小于等于M的整数;
[0167] 对所述M*M的矩阵进行处理,得到归一化的拉普拉斯矩阵;
[0168] 对所述归一化的拉普拉斯矩阵进行计算,得到S个M行向量,所述S个M行向量与所 述M个配置文件--对应;
[0169 ]对所述S个M行向量进行聚类,开多成N个向量组群;
[0170]根据所述N个向量组群,得到与所述N个向量组群一一对应的N个配置文件组群。
[0171 ]其中,对于所述M个配置文件中的任意两个配置文件:第一配置文件和第二配置文 件,所述聚类单元302具体可W用于通过下述方式计算配置文件间的相似距离:
[0172] 在计算所述M个配置文件中任意两个配置文件间的相似距离之前,将所述M个配置 文件中每个配置文件转化为一颗配置树,所述第一配置文件对应第一配置树,所述第二配 置文件对应第二配置树,所述配置树包含:至少一个字符串,每个字符串包含:上级命令行、 与所述上级命令行对应的一个下级参数命令、W及与所述下级参数命令相对应的参数值;
[0173] 遍历所述第一配置树中的每个字符串,分别计算所述字符串与所述第二配置树中 每个字符串间的相似距离;
[0174] 将计算出来的相似距离进行求和,得到与所述字符串对应的相似距离;
[0175] 将所述第一配置树中每个字符串对应的相似距离进行求和,得到所述第一配置文 件与所述第二配置文件间的相似距离。
[0176] 可选的,对于所述N个配置文件组群中的第一配置文件组群,所述第一配置文件组 群为所述N个配置文件中的任一配置文件组群,所述规律确定单元303可W用于通过下述两 种方式确定第一配置文件组群中的一致性规律,检测单元304可W根据规律确定单元303确 定出的一致性规律采用不同的网元设备误配置检测方法:
[0177] (1)根据贝叶斯检测设备,确定所述第一配置文件组群中与属于第一上级命令行 的第一下级参数命令相对应的训练参数;所述第一上级命令行为所述第一配置文件组群中 的任一上级命令行,所述第一下级参数命令为属于所述第一上级命令行的任一下级参数命 令;
[0178] 所述检测单元304用于:
[0179] 对待检测的配置文件进行归类处理;
[0180] 若所述待检测的配置文件归为所述第一配置文件组群,则计算所述待检测的配置 文件中,属于所述第一上级命令行的第一下级参数命令所对应的参数值的概率,
[0181] 若所述概率小于所述训练参数,则确定所述待检测的配置文件中属于所述第一上 级命令行的第一下级参数命令的配置是错误的。
[0182] 具体的,所述规律确定单元303,可W用于:
[0183] 分别根据下述公式,计算属于第一上级命令行Pi的第一下级参数命令Cj的赌和逆 文档频率;
[0184]
[0185] 逆文档频率:
其中,所述Pi@Cj表示:属于第一上级命令行的第 一下级参数命令,所述A为Pi@Cj对应的参数值的所有可能取值,Q为所述第一配置文件组群 包含的配置文件的总个数,t为所述第一配置文件组群中出现Pi@C北勺配置文件的个数;
[0186] 令 Zi,j = Pi@Cj,则 H(Zi,j) = I(Zi,j)*Wf(Zi,j)
[0187]根据下述公式得到与Pi@C如目对应的训练参数al地a:
[018 引
[0189] 所述检测单元304可W用于:
[0190] 若待检测的配置文件中的命令Zi,北勺概率满足;
I则说明该待检 测的配置文件中的命令Zi,J为误配置。
[0191] (2)遍历所述第一配置文件群组中的任一上级命令行,确定出属于所述上级命令 行的下级命令行组,下级命令行组包含:属于所述上级命令行的至少一个下级命令行,且所 述至少一个下级命令行在所述第一配置文件组群中的支持度大于等于最小支持度,所述至 少一个下级命令行满足最小置信度;
[0192] 所述检测单元304用于:
[0193] 对所述待检测的配置文件进行归类处理;
[0194] 若所述待检测的配置文件归为所述第一配置文件组群,则查看所述待检测的配置 文件中的下级命令行.
[0195] 若在所述待检测的配置文件中的下级命令行中,存在属于第一上级命令行的第一 下级命令行包含在确定出的属于所述第一上级命令行的第一下级命令行组内,而第一下级 命令行组内的其他下级命令行未包含在所述待检测的配置文件中,则确定所述待检测的配 置文件中属于所述第一上级命令行的配置是错误的。
[0196] 具体的,对于所述第一配置文件群组中的第一上级命令行Pi,所述第一上级命令 行为所述第一配置文件组群中的任一上级命令行,所述规律确定单元303,具体用于:
[0197] W所述Pi为单位,统计属于所述Pi的每个下级命令行在第一配置文件群组中的支 持度,将支持度大于等于最小支持度的下级命令行放入一阶频繁项集^中;
[0198] 若所述^不为空,则根据所述^生成二阶候选项集C2,所述C2包含至少一个候选 项,所述候选项由所述b中两个不同的下级命令行组成;
[0199] W所述Pi为单位,统计所述C2中每个候选项在第一配置文件群组中的支持度,将支 持度大于等于最小支持度的候选项放入二阶频繁项集L2中;
[0200] 若所述L2不为空,则重复上述过程,直到生成啡介频繁项集Lk, Lk包含至少一个频繁 项,每个频繁项由K-I阶频繁项集Lk-I中的K个不同的下级命令行组成;
[0201] 若Lk不为空,则根据Lk中的频繁项生成规则集合,所述规则集合包含至少一个规则 项,每个规则项包含:所述Lk中的至少一个频繁项、W及所述至少一个频繁项之间的相互关 系;
[0202] 将所述规则集合中置信度大于等于最小置信度的规则项作为属于所述第一上级 命令行的下级命令行组。
[0203] 需要说明的是,图4中的获取单元301可W为图2所示检测设备20中的通信单元 2013,图4中的聚类单元302、规律确定单元303W及检测单元304可W为单独设立的处理器 2011,也可W集成在图2所示检测设备20中的某一个处理器2011中实现,此外,也可W W程 序代码的形式存储于图2所示检测设备20中的存储器2012中,由图2所示检测设备20中的某 一个处理器2011调用并执行W上聚类单元302、规律确定单元303W及检测单元304的功能。
[0204] 由上可知,本发明实施例提供一种检测设备,获取M个配置文件,对所述M个配置文 件进行聚类处理,形成N个配置文件组群,确定配置文件组群中的一致性规律,根据待检测 的配置文件所属的配置文件组群的一致性规律,对待检测的配置文件进行误配置检查。如 此,寻找配置文件中存在的一致性规律,根据一致性规律自动对配置文件进行检测,确定出 配置文件中的误配置命令,实现了自动检测,显著提升了误配置问题的解决效率。
[0205] 所属领域的技术人员可W清楚地了解到,为描述的方便和简洁,上述描述的单元 和系统的具体工作过程,可W参考前述方法实施例中的对应过程,在此不再寶述。
[0206] 在本申请所提供的几个实施例中,应该理解到,所掲露的系统,设备和方法,可W 通过其它的方式实现。例如,W上所描述的设备实施例仅仅是示意性的,例如,所述单元的 划分,仅仅为一种逻辑功能划分,实际实现时可W有另外的划分方式,例如多个单元或组件 可W结合或者可W集成到另一个系统,或一些特征可W忽略,或不执行。
[0207] 所述作为分离部件说明的单元可W是或者也可W不是物理上分开的,作为单元显 示的部件可W是或者也可W不是物理单元,即可W位于一个地方,或者也可W分布到多个 网络单元上。可W根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目 的。
[0208] 另外,在本发明各个实施例中的各功能单元可W集成在一个处理单元中,也可W 是各个单元单独物理包括,也可W两个或两个W上单元集成在一个单元中。上述集成的单 元既可W采用硬件的形式实现,也可W采用硬件加软件功能单元的形式实现。
[0209] 上述W软件功能单元的形式实现的集成的单元,可W存储在一个计算机可读取存 储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用W使得一台计算机 设备(可W是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的部 分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,简称 ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等各种可W存储 程序代码的介质。
[0210] 本领域普通技术人员可W理解上述实施例的各种方法中的全部或部分步骤是可 W通过程序来指令相关的硬件(例如处理器)来完成,该程序可W存储于一计算机可读存储 介质中,存储介质可W包括:只读存储器、随机存储器、磁盘或光盘等。
[0211] 最后应说明的是:W上实施例仅用W说明本发明的技术方案,而非对其限制;尽管 参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可 W对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换; 而运些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和 范围。
【主权项】
1. 一种网元设备误配置检测方法,应用于检测设备,其特征在于,所述方法包括: 获取Μ个配置文件,所述Μ为大于等于1的整数,所述配置文件为网络设备活动行为的执 行依据,所述配置文件包含上级命令行、W及属于所述上级命令行的至少一个下级命令行, 每个所述下级命令行包含:下级参数命令、W及与所述下级参数命令相对应的参数值; 对所述Μ个配置文件进行聚类处理,形成Ν个配置文件组群,所述配置文件组群包含至 少一个配置文件,所述Ν ^ Μ,所述Ν为大于等于1的整数; 确定每个配置文件组群中的一致性规律; 根据待检测的配置文件所属的配置文件组群的一致性规律,对所述待检测的配置文件 进行误配置检查。2. 根据权利要求1所述的方法,其特征在于,对于所述Ν个配置文件组群中的第一配置 文件组群,所述第一配置文件组群为所述Ν个配置文件中的任一配置文件组群,确定所述第 一配置文件组群中的一致性规律,包括: 根据贝叶斯检测方法,确定所述第一配置文件组群中与属于第一上级命令行的第一下 级参数命令相对应的训练参数;所述第一上级命令行为所述第一配置文件组群中的任一上 级命令行,所述第一下级参数命令为属于所述第一上级命令行的任一下级参数命令; 所述根据待检测的配置文件所属的配置文件组群的一致性规律,对所述待检测的配置 文件进行误配置检查,包括: 对所述待检测的配置文件进行归类处理; 若所述待检测的配置文件归为所述第一配置文件组群,则计算所述待检测的配置文件 中,属于所述第一上级命令行的第一下级参数命令所对应的参数值的概率; 若所述概率小于所述训练参数,则确定所述待检测的配置文件中属于所述第一上级命 令行的第一下级参数命令的配置是错误的。3. 根据权利要求2所述的方法,其特征在于,所述根据贝叶斯检测方法,确定所述第一 配置文件组群中与属于第一上级命令行的第一下级参数命令相对应的训练参数,包括: 分别根据下述公式,计算属于第一上级命令行Pi的第一下级参数命令Cj的赌和逆文档 频率:逆文档频率:/WP,.@C,)二log^,其中,所述Pi@C康示:属于第一上级命令行的第一下 级参数命令,所述A为Pi@C^f应的参数值的所有可能取值,Q为所述第一配置文件组群包含 的配置文件的总个数,t为所述第一配置文件组群中出现Pi@C北勺配置文件的个数; 令 Zij = Pi@Cj,则 H(Zi,j) = I(Zi,j)*Wf(Zi,j) 根据下述公式得到与Pi@C油对应的训练参数al地a:4. 根据权利要求1所述的方法,其特征在于,对于所述N个配置文件组群中的第一配置 文件组群,所述第一配置文件组群为所述N个配置文件中的任一配置文件组群,确定所述第 一配置文件组群中的一致性规律,包括: 遍历所述第一配置文件群组中的任一上级命令行,确定属于所述上级命令行的下级命 令行组,下级命令行组包含:属于所述上级命令行的至少一个下级命令行,且所述至少一个 下级命令行在所述第一配置文件组群中的支持度大于等于最小支持度,且所述至少一个下 级命令行满足最小置信度; 所述根据待检测的配置文件所属的配置文件组群的一致性规律,对所述待检测的配置 文件进行误配置检查,包括: 对所述待检测的配置文件进行归类处理; 若所述待检测的配置文件归为所述第一配置文件组群,则查看所述待检测的配置文件 中的下级命令行; 若在所述待检测的配置文件中的下级命令行中,存在属于第一上级命令行的第一下级 命令行包含在确定出的属于所述第一上级命令行的第一下级命令行组内,而第一下级命令 行组内的其他下级命令行未包含在所述待检测的配置文件中,则确定所述待检测的配置文 件中属于所述第一上级命令行的配置是错误的。5. 根据权利要求4所述的方法,其特征在于,对于所述第一配置文件群组中的第一上级 命令行Pi,所述第一上级命令行为所述第一配置文件组群中的任一上级命令行,所述确定 属于所述Pi的下级命令行组,包括: W所述Pi为单位,统计属于所述Pi的每个下级命令行在第一配置文件群组中的支持度, 将支持度大于等于最小支持度的下级命令行放入一阶频繁项集b中; 若所述b不为空,则根据所述b生成二阶候选项集C2,所述C2包含至少一个候选项,所述 候选项由所述b中两个不同的下级命令行组成; W所述Pi为单位,统计所述C2中每个候选项在第一配置文件群组中的支持度,将支持度 大于等于最小支持度的候选项放入二阶频繁项集L2中; 若所述L2不为空,则重复上述过程,直到生成啡介频繁项集Lk,Lk包含至少一个频繁项, 每个频繁项由K-1阶频繁项集Lk-1中的K个不同的下级命令行组成; 若Lk不为空,则根据Lk中的频繁项生成规则集合,所述规则集合包含至少一个规则项, 每个规则项包含:所述Lk中的至少一个频繁项、W及所述至少一个频繁项之间的相互关系; 将所述规则集合中置信度大于等于最小置信度的规则项作为属于所述第一上级命令 行的下级命令行组。6. 根据权利要求1-5任一项所述的方法,其特征在于,所述对所述Μ个配置文件进行聚 类处理,形成Ν个配置文件组群,包括: 计算所述Μ个配置文件中任意两个配置文件间的相似距离,得到Μ*Μ的矩阵,所述Μ*Μ的 矩阵中第i行第j列的元素表示:所述Μ个配置文件中配置文件i与配置文件j之间的相似距 离,i、j均为小于等于Μ的整数; 对所述Μ*Μ的矩阵进行处理,得到归一化的拉普拉斯矩阵; 对所述归一化的拉普拉斯矩阵进行计算,得到Μ巧的特征向量矩阵,所述Μ巧的特征向 量矩阵由S个Μ行向量组成,所述Μ巧的特征向量矩阵的Μ行向量与所述Μ个配置文件 对 应,所述S含Μ,所述S为大于等于1的整数; 对所述Μ行向量进行聚类,形成Ν个向量组群,所述Ν个向量组群包含至少一行向量; 遍历所述Ν个向量组群中的每个向量组群,将与所述向量组群包含的向量相对应的配 置文件组合成一个配置文件组群,得到N个配置文件组群。7. 根据权利要求6所述的方法,其特征在于,在所述计算所述Μ个配置文件中任意两个 配置文件间的相似距离之前,所述方法还包括: 将所述Μ个配置文件中每个配置文件转化为一颗配置树,所述配置树包含:至少一个字 符串,每个字符串包含:上级命令行、与所述上级命令行对应的一个下级参数命令、W及与 所述下级参数命令相对应的参数值。8. 根据权利要求7所述的方法,其特征在于,对于所述Μ个配置文件中的任意两个配置 文件:第一配置文件和第二配置文件,所述第一配置文件对应第一配置树,所述第二配置文 件对应第二配置树,计算所述第一配置文件和所述第二配置文件间的相似距离包括: 遍历所述第一配置树中的每个字符串,分别计算所述字符串与所述第二配置树中每个 字符串间的相似距离; 将计算出来的相似距离进行求和,得到与所述字符串对应的相似距离; 将所述第一配置树中每个字符串对应的相似距离进行求和,得到所述第一配置文件与 所述第二配置文件间的相似距离。9. 一种检测设备,其特征在于,所述设备包括: 获取单元,用于获取Μ个配置文件,所述Μ为大于等于1的整数,所述配置文件包含上级 命令行、W及属于所述上级命令行的至少一个下级命令行,每个所述下级命令行包含:下级 参数命令、W及与所述下级参数命令相对应的参数值; 聚类单元,用于对所述获取单元获取到的Μ个配置文件进行聚类处理,形成Ν个配置文 件组群,所述配置文件组群包含至少一个配置文件,所述Ν ^ Μ,所述Ν为大于等于1的整数; 规律确定单元,用于确定所述聚类单元得到的每个配置文件组群中的一致性规律; 检测单元,用于根据待检测的配置文件所属的配置文件组群的一致性规律,对所述待 检测的配置文件进行误配置检查。10. 根据权利要求9所述的设备,其特征在于,对于所述Ν个配置文件组群中的第一配置 文件组群,所述第一配置文件组群为所述Ν个配置文件中的任一配置文件组群,所述规律确 定单元用于: 根据贝叶斯检测设备,确定所述第一配置文件组群中与属于第一上级命令行的第一下 级参数命令相对应的训练参数;所述第一上级命令行为所述第一配置文件组群中的任一上 级命令行,所述第一下级参数命令为属于所述第一上级命令行的任一下级参数命令; 所述检测单元用于: 对所述待检测的配置文件进行归类处理; 若所述待检测的配置文件归为所述第一配置文件组群,则计算所述待检测的配置文件 中,属于所述第一上级命令行的第一下级参数命令所对应的参数值的概率, 若所述概率小于所述训练参数,则确定所述待检测的配置文件中属于所述第一上级命 令行的第一下级参数命令的配置是错误的。11. 根据权利要求10所述的设备,其特征在于,所述规律确定单元,具体用于: 分别根据下述公式,计算属于第一上级命令行Pi的第一下级参数命令Cj的赌和逆文档 频率:逆文档频率:/聲(P倘C,) = k)g^,其中,所述Pi@C徒示:属于第一上级命令行的第一下 级参数命令,所述A为Pi@C^f应的参数值的所有可能取值,Q为所述第一配置文件组群包含 的配置文件的总个数,t为所述第一配置文件组群中出现Pi@C北勺配置文件的个数; 令 Zij = Pi@Cj,则 H(Zi,j) = I(Zi,j)*Wf(Zi,j) 根据下述公式得到与Pi@C油对应的训练参数al地a:12. 根据权利要求9所述的设备,其特征在于,对于所述N个配置文件组群中的第一配置 文件组群,所述第一配置文件组群为所述N个配置文件中的任一配置文件组群,所述规律确 定单元,用于: 遍历所述第一配置文件群组中的任一上级命令行,确定属于所述上级命令行的下级命 令行组,下级命令行组包含:属于所述上级命令行的至少一个下级命令行,且所述至少一个 下级命令行在所述第一配置文件组群中的支持度大于等于最小支持度,且所述至少一个下 级命令行满足最小置信度; 所述检测单元用于: 对所述待检测的配置文件进行归类处理; 若所述待检测的配置文件归为所述第一配置文件组群,则查看所述待检测的配置文件 中的下级命令行; 若在所述待检测的配置文件中的下级命令行中,存在属于第一上级命令行的第一下级 命令行包含在确定出的属于所述第一上级命令行的第一下级命令行组内,而第一下级命令 行组内的其他下级命令行未包含在所述待检测的配置文件中,则确定所述待检测的配置文 件中属于所述第一上级命令行的配置是错误的。13. 根据权利要求12所述的设备,其特征在于,对于所述第一配置文件群组中的第一上 级命令行Pi,所述第一上级命令行为所述第一配置文件组群中的任一上级命令行,所述规 律确定单元,具体用于: W所述Pi为单位,统计属于所述Pi的每个下级命令行在第一配置文件群组中的支持度, 将支持度大于等于最小支持度的下级命令行放入一阶频繁项集b中; 若所述b不为空,则根据所述b生成二阶候选项集C2,所述C2包含至少一个候选项,所述 候选项由所述b中两个不同的下级命令行组成; W所述Pi为单位,统计所述C2中每个候选项在第一配置文件群组中的支持度,将支持度 大于等于最小支持度的候选项放入二阶频繁项集L2中; 若所述L2不为空,则重复上述过程,直到生成啡介频繁项集Lk,Lk包含至少一个频繁项, 每个频繁项由K-1阶频繁项集Lk-1中的K个不同的下级命令行组成; 若Lk不为空,则根据Lk中的频繁项生成规则集合,所述规则集合包含至少一个规则项, 每个规则项包含:所述Lk中的至少一个频繁项、W及所述至少一个频繁项之间的相互关系; 将所述规则集合中置信度大于等于最小置信度的规则项作为属于所述第一上级命令 行的下级命令行组。14. 根据权利要求9-13任一项所述的设备,其特征在于,所述聚类单元,用于: 计算所述Μ个配置文件中任意两个配置文件间的相似距离,得到M*M的矩阵,所述M*M的 矩阵中第i行第j列的元素表示:所述Μ个配置文件中配置文件i与配置文件j之间的相似距 离,i、j均为小于等于Μ的整数; 对所述Μ*Μ的矩阵进行处理,得到归一化的拉普拉斯矩阵; 对所述归一化的拉普拉斯矩阵进行计算,得到Μ巧的特征向量矩阵,所述Μ巧的特征向 量矩阵由S个Μ行向量组成,所述Μ巧的特征向量矩阵的Μ行向量与所述Μ个配置文件 对 应,所述S含Μ,所述S为大于等于1的整数; 对所述Μ行向量进行聚类,形成Ν个向量组群,所述Ν个向量组群包含至少一行向量; 遍历所述Ν个向量组群中的每个向量组群,将与所述向量组群包含的向量相对应的配 置文件组合成一个配置文件组群,得到Ν个配置文件组群。15. 根据权利要求14所述的设备,其特征在于,所述聚类单元,还用于: 在计算所述Μ个配置文件中任意两个配置文件间的相似距离之前,将所述Μ个配置文件 中每个配置文件转化为一颗配置树,所述配置树包含:至少一个字符串,每个字符串包含: 上级命令行、与所述上级命令行对应的一个下级参数命令、W及与所述下级参数命令相对 应的参数值。16. 根据权利要求15所述的设备,其特征在于,对于所述Μ个配置文件中的任意两个配 置文件:第一配置文件和第二配置文件,所述第一配置文件对应第一配置树,所述第二配置 文件对应第二配置树,所述聚类单元,具体用于: 遍历所述第一配置树中的每个字符串,分别计算所述字符串与所述第二配置树中每个 字符串间的相似距离; 将计算出来的相似距离进行求和,得到与所述字符串对应的相似距离; 将所述第一配置树中每个字符串对应的相似距离进行求和,得到所述第一配置文件与 所述第二配置文件间的相似距离。
【文档编号】H04L12/26GK105847065SQ201610349172
【公开日】2016年8月10日
【申请日】2016年5月24日
【发明人】林雪峰, 宋跃忠, 程敏, 刘文印
【申请人】华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1