一种基于分布式自动化测量的性能瓶颈分析方法及装置的制造方法

文档序号:9219646阅读:348来源:国知局
一种基于分布式自动化测量的性能瓶颈分析方法及装置的制造方法
【技术领域】
[0001 ] 本发明涉及大规模数据中心网络、高性能巨型机网络中系统测量及性能分析技术领域,尤其涉及一种基于分布式自动化测量的性能瓶颈分析方法及装置。
【背景技术】
[0002]当前数据中心一般使用数量众多的核心交换机、汇聚交换机和接入交换机,负责为整个数据中心的计算服务器、应用服务器和存储系统提供高速信息交互的支撑平台,数据中心网络的可用性和连通性是影响整个数据中心网络提供服务的重要因素。由于数据中心互连计算和服务节点数能达到1K以上的量级,而交换节点数也接近K的量级,在这种规模下,快速排查和精确定位整个网络故障非常困难,因而针对这种大规模数据中心网络,如何通过智能测量自动发现数据中心网络的网络故障设备、链路和网络瓶颈显得尤为重要。针对网络测量的方法通常应该具有以下特性:a.健壮性,即在被测网络发成轻微变化时,测量方法不会因此失效;b.可重复行,即在相同网络条件下,多次测量结果应该保持一致,不会出现较大差别;c.准确性,即测量的结果能够准确的反映网络的实际情况。
[0003]目前针对网络测量的方法从测量的方式、测量点的位置、测量参与者等方面分类,主要有以下几类:
(O主动测量和被动测量:主动测量是根据测量需要向被测网络中发送一些特定的探测数据包,通过对探测数据包穿越网络而发生的变化进行分析,得到当前网络的状态和性能参数;例如,网络测试命令Ping通过发送ICMP探测数据包,获得被测网络的连通性、往返延时和丢包率;被动测量是在网络中的关键设备和节点上部署测量装置捕获数据包并进行统计分析,进而获得当前网络的状态和性能参数。
[0004](2)网络边缘测量和网络内部测量:网络边缘测量不需要网络核心设备的配合,只需要网络边缘主机的参与即可,通过边缘主机对网络进行端到端的业务性能测量,了解网络的性能参数,例如网络延时、分组丢包率;网络断层扫描或网络层析(NetworkTomography,NT)技术就是一种网络边缘测量技术,NT技术就是根据对网络外部(网络端点)的测量来分析和推断整个网络的拓扑结构和网络性能;网络内部设备测量是一种被动测量的方法,是在网络内相关设备上通过抽样统计等方法,来对网络的性能和流量进行测量。
[0005](3)协作式测量和非协作式测量:协作式测量指需要被测网络配合才能对所测网络进行测量的方法,例如,路由器协作的测量;非协作式的测量方法不需要被测网络的参与,例如,监测网络拓扑的变化。
[0006](4 )单点测量和分布式测量:单点测量方法主要针对网络规模较小、且网络结构相对简单的情况,通过设置单个测量点就能够测试网络的性能;对于规模较大的网络,则需要在所测网络中部署较多的测量代理进行分布式的测量,得到更详细的测量数据以实现对网络更精确的测量。
[0007]综上所述,以上几种方法都需要网络管理人员较大的参与度,而当前数据中心具有网络规模大而复杂的特点,因而以上方法均无法实现对数据中心网络自动化和智能化的测量,更难以实现快速的发现和定位网络故障。

【发明内容】

[0008]本发明要解决的技术问题就在于:针对现有技术存在的技术问题,本发明提供一种能够针对大规模网络实现分布式的自动化测量,同时能够快速、准确的定位网络瓶颈点或故障点的基于分布式自动化测量的性能瓶颈分析方法及装置。
[0009]为解决上述技术问题,本发明提出的技术方案为:
一种基于分布式自动化测量的性能瓶颈分析方法,步骤包括:
O网络信息获取:获取被测网络的网络拓扑信息,所述网络拓扑信息包括被测网络中所有交换机节点信息、计算节点信息以及交换机节点与计算节点之间的连接信息;
2 )关键链路分析:根据所述网络拓扑信息获取被测网络的中各交换机节点之间的链路作为关键链路,分别执行各条所述关键链路的测量,并根据各条关键链路的测量结果分别进行关键链路故障定位,且每次定位时若未定位到,则根据测量结果收敛关键链路的待测网络规模,直至定位得到关键链路的瓶颈点、故障点;
3)端链路分析:根据所述网络拓扑信息获取被测网络中交换机节点与计算节点之间的链路作为端链路,分别执行各条所述端链路的测量,并根据各条端链路的测量结果分别进行端链路故障定位,且每次定位时若未定位到,则根据所述端链路的测量结果收敛端链路的待测网络规模,直至定位得到端链路的所有瓶颈点、故障点。
[0010]作为本发明方法的进一步改进:所述步骤2)、步骤3)中收敛待测网络规模具体是通过递归的基于最小覆盖原则的测量方法,将测量结果为正常的链路从测量集合中删除,以逐渐收敛待测网络的规模。
[0011]作为本发明方法的进一步改进,所述步骤2)的具体步骤为:
2.1)关键链路获取:获取被测网络的所有链路中直连的两个节点均为交换机节点的链路作为关键链路,构成待测关键链路集合;
2.2)关键链路任务生成:启动测量时,从被测网络的核心层设备开始,依次递归的取出与核心层相连的汇聚设备,以及再通过汇聚设备找到相连的接入交换设备,生成关键链路的测量任务;
2.3)关键链路任务执行:配置各所述关键链路测量任务中每个关键任务测量对的测量参数并执行测量,得到各关键任务测量对的测量结果;
2.4)关键链路任务分析:分别判断所述各关键任务测量对的测量结果,每次判断时,若存在异常,则判定对应关键任务测量对之间所覆盖的关键链路中存在瓶颈点或故障点;若正常,则判定对应关键任务测量对之间所覆盖的所有关键链路均正常,并将对应关键任务测量对从待测关键链路集合中删除以收敛待测关键链路集合的规模,各关键任务测量对判断完成后得到关键链路的所有瓶颈点、故障点。
[0012]作为本发明方法的进一步改进,所述步骤2.2)的具体步骤为:
2.2.1)启动测量时,获取被测网络的所有核心层交换机节点构成核心交换节点集合;定义一个关键链路测量任务集合并初始化为空;
2.2.2)判断核心交换节点集合是否为空,若不为空,则取出其中任意一个核心层交换机节点作为当前核心层交换机节点,跳转到步骤2.2.3);若为空,得到所有核心层交换机节点对应的关键链路测量任务集合并退出;
2.2.3)获取当前核心层交换机节点下所有的子节点构成一级子节点集合,跳转到步骤2.2.4);
2.2.4)判断所述一级子节点集合是否为空,若不为空则取出其中任意两个子节点,跳转到步骤2.2.5);若为空,生成得到当前核心层交换机节点对应的关键链路测量任务集合,返回执行步骤2.2.2);
2.2.5)判断所述步骤2.2.4)取出的两个子节点是否均为接入层交换机节点,如果是,则由所述取出的两个子节点构成关键链路测量任务对并加入到关键链路测量任务集合中,删除取出的所述两个子节点,跳转到步骤2.2.4);否则跳转到步骤2.2.6);
2.2.6)由所述步骤2.2.4)取出的两个子节点下的所有子节点得到两个对应的二级子节点集合,转入执行步骤2.2.7);
2.2.7)判断所述步骤2.2.6)中得到的两个二级子节点集合是否为空,若均不为空,则分别从所述两个二级子节点集合中任意取一个子节点,转入执行步骤2.2.8);若其中有一个为空,则从不为空的二级子节点集合中任意取一个子节点,并从与所述一级子节点集合中子节点直连的所有子节点中任意取一个接入层交换机节点,转入执行步骤2.2.8);若均为空,返回执行步骤2.2.4);
2.2.8)若所述步骤2.2.7)取出的两个子节点均为接入层交换机节点,则由取出的两个子节点构成关键链路测量任务对并加入到所述关键链路测量任务集合中,删除取出的所述两个子节点,返回执行步骤2.2.7)。
[0013]作为本发明方法的进一步改进,所述步骤2.4)中关键任务测量对之间的所有链路的获取步骤为:
2.4.1)定义一个存储关键任务测量对之间关键链路的测量分析链路集合并初始化为空,跳转执行步骤2.4.2);
2.4.2)取所述关键链路测量任务集合中一个关键链路测量任务对作为当前测量任务对,并将对应的两个节点作为当前两个分析节点,跳转执行步骤2.4.3);
2.4.3)将当前两个分析节点与对应直连父节点之间的关键链路加入至所述测量分析链路集合中,跳转执行步骤2.4.4);
2.4.4)若当前两个分析节点的两个直连父节点不相同,则递归循环的取上一次两个分析节点的直连父节点作为当前两个分析节点,跳转执行步骤2.4.3),直至当前两个分析节点的直连父节点相同,输出当前测量任务对所对应的测量分析链路集合。
[0014]作为本发明方法的进一步改进,所述步骤3)的具体步骤为:
3.1)端链路获取:获取被测网络的所有链路中直连的两个节点分别为交换机节点、计算节点的链路作为端链路,构成待测端链路集合;
3.2)端链路测量任务生成:启动测量,依次的获取每一个接入层设备下所有计算节点,生成对应各接入层交换机的端链路测量任务;
3.3)端链路测量任务执行:配置各端链路测量任务中每一个端链路任务的测量参数并执行测量,得到各端链路任务测量对的测量结果;
3.4)端链路性能分析:分别判断所述各端链路任务的测量结果,每次判断时,若测量结果异常,则定位得到网络瓶颈点、故障点;若测量结果正常,将对应的测量端链路从待测端链路集合中剔除,各端链路任务判断完成后得到端链路的所有瓶颈点、故障点。
[0015]作为本发明方法的进一步改进,所述步骤3.2)的具体步骤为:
3.2.1)启动测量时,获取被测网络所有接入层交换机节点构成接入层交换机节点集合;定义一个端链路测量任务集合并初始化为空;
3.2.2)判断所述接入层交换机节点集合是否为空,若不为空,从其中任意取出一个接入层交换机节点作为当前接入层交换机节点,跳转执行步骤3.2.3);若为空,得到所有接入层交换机节点对应的端链路测量任务集合并退出;
3.2.3)获取当前接入层交换机节点的所有子节点构成接入子节点集合,从所述接入子节点集合中循环的取出两个计算节点构成端链路任务测量对并加入至所述端链路测量任务集合中,删除取出的两个所述计算节点并作为已测量节点;当所述接入子节点集合中只存在一个目标计算节点时,任取一个已测量节点与所述目标计算节点构成端链路任务测量对并加入至所述端链路测量任务集合中,生成
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1