可容错数据中心网络的地址自动配置方法

文档序号:7775870阅读:321来源:国知局
专利名称:可容错数据中心网络的地址自动配置方法
技术领域
本方法是实现在可容错数据中心中,如果存在硬件原因或者连接错误造成实际的物理拓扑与设计蓝图不同时,该方法仍可实现对于此种可容错数据中心的地址自动配置, 本方法属于计算机网络领域。
背景技术
在大规模的数据中心中,存在数以万计的服务器和交换机,为了这种大规模数据中心的安全性和高效路由的考虑,位置信息和拓扑信息常常被编码到数据中心的网络地址中(例如,在分布式的文件系统GFS中,许多的数据块要被复制多份,且存储在不同的服务器上,为了数据操作的方便,数据中心需要了解怎样去从比较近的服务器上获得数据,因此数据中心会将位置信息编码到网络地址中便于操作)。虽然这种编址方式极大的方便了数据中心的某些操作,却为地址配置带来困难。由于现有数据中心的规模是极其庞大的,而且在地址配置时DHCP协议又不能进行应用。地址人工配置将是一个很长的过程,且会出现很多的错误。所以在配置数据中心时需要对这些服务器和交换机做一个地址自动快速的配置。在实际布置数据中心时,由于机器网卡问题,或者两个物理机器之间连线错误,或者缺少连线等等原因,使得实际的物理拓扑连接与设计蓝图的定义不同。针对于此,ETAC方法实现对于这种可容错数据中心网络的地址自动配置。由于ETAC方法中进行错误检测步骤后,对于没有错误节点的数据中心网络也能进行地址的自动配置,所以ETAC方法同样适用于连线完全正确的数据中心网络。

发明内容
大规模数据中心中地址的配置问题可被抽象为一个设计蓝图生成的逻辑图和实际物理拓扑连接生成的物理图的节点对应问题。将在布线之前,物理拓扑本应该连接的图称为设计蓝图,实际的物理机器的连接图为物理图(一般可通过Physical topology Protocol,PCP协议进行收集)。然而,由于物理机器硬件损坏或者连线错误等,一般实际的物理拓扑相对于设计蓝图都会存在差错。如果实际的物理拓扑没有错误,则ETAC方法可对此种网络进行地址的快速配置。如果实际的物理拓扑存在连线错误,则ETAC方法首先在物理图中去除有错误的节点生成设备图,然后对于剩余连接正确的节点进行地址的快速自动配置,即就是对于逻辑图和设备图这两个图中的节点进行一个相应节点的匹配。因为设备图是逻辑图的一个导出子图,这在数学上称为一个导出子图同构问题。ETAC方法进行节点匹配的过程中,可以应用一些导出子图所具有的性质对搜索匹配过程进行简化。在设备图中的节点都对应到逻辑图上时,就可以根据逻辑图上标注的节点地址去对设备图中的相应节点进行地址配置了。最后再将ETAC方法应用于各种数据中心的拓扑结构之上,对于不同的拓扑结构和错误节点及其相连的边删除后的图进行地址的自动快速匹配,实验结果显示 ETAC方法对于可容错数据中心的地址自动快速配置效果良好。
ETAC方法具体包括以下步骤步骤I :逻辑图生成步骤,根据所述数据中心网络的设计蓝图生成一个逻辑图;步骤2 :物理图生成步骤,根据实际的物理拓扑生成物理图;步骤3 :错误检测步骤,将所述物理图和逻辑图进行对比,找出物理图相对于逻辑图是否存在不能正常进行地址配置的节点;如果存在,则转到步骤4 ;如果不存在,则将物理图定义为一个设备图,转到步骤5 ;步骤4:设备图生成步骤,将所述不能正常配置的节点及其相连的边在物理图中删除,对于剩余节点按邻接矩阵或者邻接表存储,生成设备图;步骤5 :匹配步骤,将所述设备图中的节点与所述逻辑图中的节点进行匹配,找到设备图中的每个节点对应于逻辑图中的节点;步骤6 :配置地址步骤,对于设备图中的节点找到对应逻辑图中的节点,则可按逻辑图中标注的地址对设备图中的节点进行地址的相应设置。步骤I设计蓝图生成逻辑图,其中,设计蓝图是在连接实际的server和switch之前定义的物理机器的连接关系,设计蓝图按邻接矩阵或者邻接表存储,记作逻辑图;逻辑图节点标识为sever或swith对应的网络逻辑地址。步骤2物理拓扑生成物理图,在实际物理拓扑连接之后,根据物理拓扑收集协议, 获得实际的物理拓扑连接关系,这种连接关系按邻接矩阵或者邻接表存储,记作物理图;物理图节点标识为sever或swith对应的物理地址。所述物理拓扑收集协议的实现,是在实际的物理网络之上建立一个通信信道去收集物理拓扑的信息,设置一个控制器来建立一棵生成树,所有节点的物理拓扑信息将由生成树的叶子节点通过通信信道依次按生成树往上传递,直到根节点。步骤3具体按照如下步骤执行步骤3. I :首先在物理图中选出一部分节点,然后对这些选定的每一个节点,计算其和逻辑图中的所有节点的SPLD之差的绝对值,将逻辑图中SPLD之差绝对值最小的点和这个物理图中的节点记做一个节点对,一个节点的SPLD为这个节点到图中所有其他节点的最短距离;步骤3. 2 :对步骤3. I所述的节点对,在物理图和逻辑图中分别从和这两个点相距I跳的所有节点开始,验证这些所有的节点是否同构, 直到和这两个点相距X跳时,这些点同构,而相距x+1跳时,这些点不同构,则对于这些x+1 跳的节点,对它们的counter值加一;步骤3. 3 :在结束所有测试节点的检测之后,对于那些具有counter值的节点按counter值降序排列,counter值越大,其出错的概率越大;对于数据中心的管理员,从counter值大的节点开始检测是否存在连线错误。步骤3所述不能正常进行地址匹配的节点是由于硬件原因或连接错误产生。步骤5具体按照如下步骤执行,该步骤递归的划分逻辑图Gl和设备图Gd为更小的集合,直到Gd中的每个点都在Gl中找到了相匹配的点,则成功返回;或者在前一步发现匹配错误了,则进行回溯,接着去沿另一个方向尝试与Gl中的下一个节点进行匹配;由于逻辑图Gl中的点一般会多于设备图Gd中的点(物理图中没有错误节点时两个图的节点数一样),所以在匹配过程中,用空集对Gd中那些对应不到Gl中的集合予以对应,匹配过程保证Gd中的集合个数等于Gl中集合的个数;在进行逻辑图和设备图匹配时,主要包括分解和验证两个过程。所述分解过程为,每次把一个点V由其所在Gd中的集合0分离为0\{v}和{v},其他集合保持不变,相应的,把Gl中与Gd集合0对应的集合0’中的一个点u划分出来,分为 0’ \{u}和{u},在此过程中,称每对新出现的单元素集合{v}对应{u}。所述验证的过程为,每次进行分解出{v},{u}之后,验证过程对这次分裂进行检验,在Gd中把每个集合用与{v}的连接关系划分为与{v}相连和不相连两个集合;相应地在Gl中把每个集合用与{u}的连接关系划分为与{u}相连和不相连两个集合;对于新出现的每对单元素集合,都去进行是否对应的判断,直到没有新的单元素集合出现则成功返回, 或者发现匹配出错返回。所述验证过程采用三种加速搜索判定定理第一个定理为对于每次新出现的单元素集合Iv} G Gd, {u} G Gl,设f (V) = u,即设备图中V节点对应逻辑图中的u节点; 对Iv}与Gd中相连的每个单集合元素vs,当且仅当u都与Gl中对应的单集合元素f (vs) 相连,则逐步匹配下去,结果一定正确;第二个定理为对每次新出现的单元素集合对, M G Gd,{u} G Gl, M的度数大于{u}的度数;第三个定理为对每次新出现的单元素集合对,Iv} G Gd, {u} G Gl, v把Gd中的每个非空集合0(i)划分为与v相连的部分Oc (i) 和与V不相连的部分One (i),u把Gl中的与0(i)对应的非空集合0’ (i)划分为与u相连的部分Oc’(i)和与u不相连的部分One’(i),则应该满足以下条件IOc (i) I ( IOc' (i) and I Onc⑴I ( One/ (i)|,其中01表示集合0中的元素个数。本发明的有益效果是该ETAC方法对于可容错数据中心的地址自动快速配置效果良好。


图I为ETAC方法的整体步骤框图。图2为对于设计蓝图,实际连线的物理图和设备图的一个具体的示例。图3为ETAC方法用于图2所示示例的一个实现过程。其中包括分解和验证两个主要过程和用对应点去进行split操作。图4为ETAC方法用于四种经典的数据中心网络结构,在错误节点数控制在50时, 其算法执行时间和数据中心规模之间的变化关系。图5为四种不同的数据中心网络结构在固定规模的情况下,错误点数和ETAC方法执行时间之间的关系。图6为对于数据中心网络的Bcube结构和Dcell结构,对于server和switch按照一定比例错误的情况时,对于固定规模的BCube结构和Dcell结构,ETAC方法的执行时间。
具体实施例方式下面结合附图对本发明做具体说明。图I是ETAC方法对于数据中心网络进行地址配置的整体框图。它含有步骤I设计蓝图生成逻辑图;步骤2物理拓扑生成物理图;步骤3错误检测;步骤4设备图生成;步骤5设备图和逻辑图进行匹配;步骤6配置设备图地址。步骤I设计蓝图生成逻辑图。设计蓝图是在连接实际的server和switch之前定义的物理机器的连接关系,设计蓝图可按邻接矩阵或者邻接表存储,记作逻辑图。
步骤2物理拓扑生成物理图。在实际物理拓扑连接之后,根据物理拓扑收集协议 (Physical topology Collection Protocol, PCP),可以获得实际的物理拓扑的连接关系, 这种连接关系图可按邻接矩阵或者邻接表存储,记作物理图。物理拓扑收集协议的实现是在实际的物理网络之上建立一个通信信道去收集物理拓扑的信息,对于所有的物理拓扑信息,有一个ETAC manager去建立一棵生成树,所有的物理拓扑信息将由生成树的叶子节点依次往上传递,直到根节点ETAC manager。步骤3错误检测,其按照如下步骤执行步骤3. I :当数据中心的实际物理拓扑存在连线错误时,ETAC方法可以首先根据在逻辑图和物理图中一些节点的最短路径长度分布(shortest path length distribution, SPLD),选出这两个图中一部分具有相同SPLD的节点作为测试节点集合,一个节点的SPLD为这个节点到图中所有其他节点的距离;步骤32 :在逻辑图和物理图中比较对于每一对对应的测试节点,计算当和它们相距X跳数时,此时这两个图最大相同子图同构,然而当和它们相距x+1跳数时,这两个图最大相同子图不同构,则对于这些X+1跳的节点,对它们的counter值加一;步骤3. 3 :在结束所有测试节点的检测之后,对于那些具有counter值的节点进行按counter值降序排列,counter值越大,其出错概率越大;对于数据中心的管理员,从 counter值大的节点开始检测是否存在连线错误即可。步骤4设备图生成是在进行步骤3错误检测后,确定在实际的物理连接图中,由于硬件原因,或者连接错误等,不能正常进行地址配置的节点,将其在物理图中删除,对于剩余节点按邻接矩阵或者邻接表存储,记作设备图。步骤5设备图和逻辑图匹配步骤是对于设备图和逻辑图进行对应节点的匹配过程,该步骤递归的划分逻辑图Gl和设备图Gd为更小的集合,直到Gd中的每个点都在Gl中找到了相匹配的点,则成功返回;或者在前一步发现匹配错误了,则进行回溯,接着去沿另一个方向尝试与Gl中的下一个节点进行匹配;由于逻辑图Gl中的点一般会多于设备图Gd 中的点(物理图中没有错误节点时两个图的节点数一样),所以在匹配过程中,用空集对Gd 中那些对应不到Gl中的集合予以对应,匹配过程保证Gd中的集合个数等于Gl中的集合个数;在进行逻辑图和设备图匹配时,主要包括decomposition和refinement两个过程。设备图和逻辑图进行匹配步骤的伪代码如下
权利要求
1.一种可容错数据中心网络的地址自动配置方法,该方法为数据中心的每台sever和 swith设置正确的网络逻辑地址,其特征在于,它包括以下步骤步骤I :逻辑图生成步骤,根据所述数据中心网络的设计蓝图生成一个逻辑图;步骤2 :物理图生成步骤,根据实际的物理拓扑生成物理图;步骤3 :错误检测步骤,将所述物理图和逻辑图进行对比,找出物理图相对于逻辑图是否存在不能正常进行地址配置的节点;如果存在,则转到步骤4 ;如果不存在,则将物理图定义为一个设备图,转到步骤5 ;步骤4:设备图生成步骤,将所述不能正常配置的节点及其相连的边在物理图中删除, 对于剩余节点按邻接矩阵或者邻接表存储,生成设备图;步骤5:匹配步骤,将所述设备图中的节点与所述逻辑图中的节点进行匹配,找到设备图中的每个节点对应于逻辑图中的节点;步骤6 :配置地址步骤,对于设备图中的节点找到对应逻辑图中的节点,则可按逻辑图中标注的地址对设备图中的节点进行地址的相应设置。
2.根据权利要求I所述的方法,其特征在于步骤I设计蓝图生成逻辑图,其中,设计蓝图是在连接实际的server和switch之前定义的物理机器的连接关系,设计蓝图按邻接矩阵或者邻接表存储,记作逻辑图;逻辑图节点标识为sever或swith对应的网络逻辑地址。
3.根据权利要求I所述的方法,其特征在于步骤2物理拓扑生成物理图,在实际物理拓扑连接之后,根据物理拓扑收集协议,获得实际的物理拓扑连接关系,这种连接关系按邻接矩阵或者邻接表存储,记作物理图;物理图节点标识为sever或swith对应的物理地址。
4.根据权利要求3所述的方法,其特征在于所述物理拓扑收集协议的实现,是在实际的物理网络之上建立一个通信信道去收集物理拓扑的信息,设置一个控制器来建立一棵生成树,所有节点的物理拓扑信息将由生成树的叶子节点通过通信信道依次按生成树往上传递,直到根节点。
5.根据权利要求I所述的方法,其特征在于步骤3具体按照如下步骤执行步骤3. I :首先在物理图中选出一部分节点,然后对这些选定的每一个节点,计算其和逻辑图中的所有节点的SPLD之差的绝对值,将逻辑图中SPLD之差绝对值最小的点和这个物理图中的节点记做一个节点对,一个节点的SPLD为这个节点到图中所有其他节点的最短距离;步骤32 :对步骤3. I所述的节点对,在物理图和逻辑图中分别从和这两个点相距I跳的所有节点开始,验证这些所有的节点是否同构,直到和这两个点相距X跳时,这些点同构,而相距x+1跳时,这些点不同构,则对于这些x+1跳的节点,对它们的counter值加一;步骤3.3 :在结束所有测试节点的检测之后,对于那些具有counter值的节点按 counter值降序排列,counter值越大,其出错的概率越大;对于数据中心的管理员,从 counter值大的节点开始检测是否存在连线错误。
6.根据权利要求I所述的方法,其特征在于步骤3所述不能正常进行地址匹配的节点是由于硬件原因或连接错误产生。
7.根据权利要求I所述的方法,其特征在于步骤5具体按照如下步骤执行,该步骤递归的划分逻辑图Gl和设备图Gd为更小的集合,直到Gd中的每个点都在Gl中找到了相匹配的点,则成功返回;或者在前一步发现匹配错误了,则进行回溯,接着去沿另一个方向尝试与Gl中的下一个节点进行匹配;由于逻辑图Gl中的点一般会多于设备图Gd中的点(物理图中没有错误节点时两个图的节点数一样),所以在匹配过程中,用空集对Gd中那些对应不到Gl中的集合予以对应,匹配过程保证Gd中的集合个数等于Gl中集合的个数;在进行逻辑图和设备图匹配时,主要包括分解和验证两个过程。
8.根据权利要求7所述的方法,其特征在于所述分解过程为,每次把一个点V由其所在Gd中的集合0分离为0\ M和{v},其他集合保持不变,相应的,把Gl中与Gd集合0对应的集合0’中的一个点u划分出来,分为0’ \{u}和{u},在此过程中,称每对新出现的单元素集合M对应{u}。
9.根据权利要求7所述的方法,其特征在于所述验证的过程为,每次进行分解出{v}, {u}之后,验证过程对这次分裂进行检验,在Gd中把每个集合用与{v}的连接关系划分为与 M相连和不相连两个集合;相应地在Gl中把每个集合用与{u}的连接关系划分为与{u} 相连和不相连两个集合;对于新出现的每对单元素集合,都去进行是否对应的判断,直到没有新的单元素集合出现则成功返回,或者发现匹配出错返回。
10.根据权利要求9所述的方法,其特征在于所述验证过程采用三种加速搜索判定定理第一个定理为对于每次新出现的单元素集合Iv} G Gd,{u} G G1,设f(v) = u,即设备图中V节点对应逻辑图中的u节点;对{v}与Gd中相连的每个单集合元素VS,当且仅当 u都与Gl中对应的单集合元素f (vs)相连,则逐步匹配下去,结果一定正确;第二个定理为对每次新出现的单元素集合对,Iv} G Gd,{u} G Gl, {v}的度数大于 {u}的度数;第三个定理为对每次新出现的单元素集合对,Iv} G Gd,{u} G Gl,v把Gd中的每个非空集合0(i)划分为与V相连的部分Oc (i)和与V不相连的部分One (i), u把Gl中的与 0(i)对应的非空集合0’(i)划分为与u相连的部分0c’(i)和与u不相连的部分One’(i), 则应该满足以下条件I Oc (i) ( Oc' (i) I and I One (i) I ( One' (i)|,其中|0|表示集合0中的元素个数。
全文摘要
本方法属于计算机网络中数据中心技术领域,它含有步骤1设计蓝图生成逻辑图,步骤2物理拓扑生成物理图,步骤3错误检测,步骤4设备图生成,步骤5逻辑图和设备图进行匹配,步骤6配置设备图地址。其中,逻辑图和设备图进行匹配步骤主要包括分解和验证两个过程。在进行验证过程中,ETAC方法又设计了三种保证正确性的加速搜索判断策略,该方法实现了对于可容错数据中心网络的地址自动快速配置。
文档编号H04L29/12GK102546852SQ201110415570
公开日2012年7月4日 申请日期2011年12月13日 优先权日2011年12月13日
发明者张宏涛, 张彻, 胡成臣 申请人:西安交通大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1