并行计算机系统通信中网络存在故障域时的路由方法

文档序号:7686378阅读:222来源:国知局
专利名称:并行计算机系统通信中网络存在故障域时的路由方法
技术领域
本发明属于通信系统中的并行计算机网络通信技术领域,特别是一种当二维 Mesh/Tori网络通信中出现故障域时的容错路由方法。
背景技术
Mesh/Tori网络结构被广泛用于大规模并行计算机通信系统中,为实现并行计算机系 统高性能计算提供了良好的解决方法,并在一定程度上满足了对计算能力日益增长的要 求。但随着网络的规模不断增大,整个网络发生故障的几率也会随之增大;而一个运行很 久的网络,随着运行时间的增长,网络运行的故障率亦会增加。因此,在无法保证网络不 发生故障、以及原本针对无故障网络开发的路由方法在网络出现故障时失效、甚至导致网 络瘫痪的前提下,人们设计了容错路由方法。目前,在网络运行过程中,当网络出现故障 (域)时的常规容错路由方法是设置一条由与故障域(节点)相邻的正常节点组成的故 障环,所有只剩最后一条最短路由的报文在被故障域阻塞时,都必须进入故障环进行绕道 路由,而在无故障区域内的报文仍按原为无故障网络设计的正常路由进行。如文献《Torus 网络中针对重迭块状故障域的容错虫孔路由方法》(J. -D. Shih, "Fault-tolerant wormhole routing in torus networks with overlapped block faults, ,, IEE Proc. Comput. Digit. Tech. , vol. 150, no. 1, Jan. 2003.),以及《Mesh网络中针对非凸形 故障域的一种容错路由方法》(Chen and Chiu, "A fault-tolerant routing scheme for meshes with nonconvex faults, ,, IEEE Transactions on Parallel and Distributed Systems, vol. 12, no. 5, May 2001.)中所公开的路由方法即属于此类通过故障环上的 绕道路由来实现报文顺利传递的技术。该类路由方法虽然克服了众多为无故障网络设计的 路由方法在网络发生(存在)故障(域)时失效等弊病,但随着网络流量的大幅度增加, 进入故障环上而需绕道报文的流量无疑亦将随之增加,从而又加重了故障环上的负载,使 其成为制约网络有效运行的瓶颈,影响到网络顺畅、高效运行。

发明内容
本发明的目的是针对背景技术存在的缺陷,研究设计一种并行计算机系统通信中网络 存在故障域时的路由方法。其路由方法是在原故障环外增设一外环来分流故障环上的报文 数量,有效地减少必须进入故障环绕道报文的数量,减轻故障环上的负载,消除网络运行
中因故障环上流量过大行成的瓶颈效应等弊病,以达到降低故障环制约网络运行性能的瓶 颈效应,以达到确保网络顺畅、高效运行等目的。
本发明的解决方案是在传统容错路由的基础上,通过在故障环外围增设一条由与该故
障环相邻的正常节点组成且与其形状相同的分流环作为外环,以有效减少进入故障环绕道
报文的数量,该外环为故障环分流时其报文传递方式与在相应的故障环上的传递方式相
同,而在无故障节点区域内仍按传统的正常路由方式传递报文,从而实现其目的。因此,
本发明路由方法包括网络中存在的故障域及围绕该故障域设置的故障环,关键在于在故障
环外围还设有一条由与该故障环相邻的正常节点组成且与其形状相同的分流环作为外环,
同时设定拟进入外环分流传递的报文类别;而网络系统进行报文传递的方法为 1.0.网络(源)节点收到报文并读取目的节点地址;
1. l.判断源节点是否位于故障环上?如果是,则转到1.2按传统故障环上的路由方式 传递报文直至到达目的节点2. l通过本地发射通道移出网络;如果不是,则转1.3进一步 判断;
1.3.判断源节点是否位于外环上?如果不是,则转到1.4按正常路由传递到下一节点 2.0;如果是,则转到1.5进一步判断;
1.5.判断是否为故障环分流?如果不是,则转到1.6报文进入故障环,之后按1.2所述 的路由方式传递报文至目的节点2.1通过本地发射通道移出网络;如果是,则转到1.7按故
障环上的路由方式传递报文至下一节点3. 0;
2.0.判断该节点是否为目的节点?如果不是目的节点,则返回1.3继续处理;如果是, 则进入目的节点2. l通过本地发射信道移出网络;
3.0.判断该节点是否为目的节点?如果是则进入目的节点2. l通过本地发射通道移 出网络;如果不是目的节点,则进入3.1继续判断;
3. l.判断是否继续分流?如果不是,则按正常路由3.2传递至目的节点2. l通过本地发 射通道移出网络;如果是,则返回1.7继续处理至到达目的节点2. l并通过本地发射通道移
出网络。
在二维Mesh网络中,上述由与故障环相邻的正常节点组成且与其形状相同的外环,当 故障环上部分节点位于该网络边界节点上时,这部分节点在分流时作为外环上的节点处
理。而所述设定拟进入外环分流传递的报文类别,其报文类别的设定根据地址址偏移量
选取来自东-西(EW)、南-北(SN)、西-东(WE)及北-南(NS)中的任意两类报文作为分
流的报文,其余两类报文则仍进入故障环进行绕道路由。
本发明由于在故障环外围增设了一条与其形状相同的外环,该外环从必须进入故障环 进行路由的报文中按设定类别分流到外环上,从而有效地减少了必须进入故障环绕道报文 的数量,减轻了故障环上的负载,消除了网络运行中因故障环上流量过大而行成的制约网 络高效运行的瓶颈效应等弊病;从而可确保网络顺畅、高效运行等特点。


图l.为本发明路由方法流程图; 图2.为实施例附图3.为具体实施方式
与背景技术仿真运行"平均延时"效果曲线对比示意图; 图4.为具体实施方式
与背景技术仿真运行"网络吞吐量"效果曲线对比示意图; 图2中O为正常,点,〇为故障节点,①为故障环上节点,②为外环上节点,Si、
S2:源节点,Dh D2:目的节点,山为分流报文传递终止点,d2为绕道报文终止点;一为报
文传递方向。
具体实施例方式
附图2为本实施方式报文传具体递过程示意图。
本实施例设定南-北及北-南类别报文为分流传递的报文类别。现以在OPNET平台上搭 建12 X 12的Tori网络运行为例
A. 当源节点Si收到报文并读取目的节点地址为Di,经l. 1及1.3判断得知该节点既不是 故障环上节点也不是外环上节点,因此按1.7正常路由传至下一节点2.0;首先经2.0判断 当前节点不是目的节点,因此返回1.3判断该节点也不是外环上节点,则按1.7正常路由传 递至下一节点;再经2.0判断得知当前节点仍不是目的节点、返回1.3,经判断得知当前节 点是外环上节点,再经l. 4判断得知该报文属于北-南类需分流的报文而进入l. 7按故障环 上的路由方式开始并依次传递报文至根据目的节点D,地址在外环上d节点处结束分流路 由,继而按正常路由传递报文直至目的节点D,。
B. 当源节点S2收到报文并读取目的节点地址为D2,经l. l判断得知该节点是故障环上节 点,因此按1.2原故障环上路由方式传至故障环上的节点d2、再经正常路由传递至目的节 占。点。
附图3及附图4:分别为本实施方式与与背景技术(仅设故障环)在相同网络条件下进行 仿真运行过程中,网络的"平均延时"及"吞吐量"效果曲线对比示意图。
权利要求
1、一种并行计算机系统通信中网络存在故障域时的路由方法,包括网络中的故障域及围绕该故障域设置的故障环,其特征在于在故障环外围还设有一条由与该故障环相邻的正常节点组成且与其形状相同的外环作为分流,同时设定拟进入外环分流传递的报文类别;而网络系统进行报文传递的方法为1. 0.网络源节点收到报文并读取目的节点地址;。1. 1.判断源节点是否位于故障环上?如果是,则转到1.2按原故障环上的路由方式传递报文直至到达目的节点2.1通过本地发射通道移出网络;如果不是,则转1.3进一步判断;1. 3.判断源节点是否位于外环上?如果不是,则转到1.4按正常路由传递到下一节点2.0;如果是,则转到1.5进一步判断;1. 5.判断是否为故障环分流?如果不是,则转到1.6报文进入故障环,之后按1.2的路由方式传递报文至目的节点2.1通过本地发射通道移出网络;如果是,则转到1.7按故障环上的路由方式传递报文至下一节点3.0;2. 0.判断该节点是否为目的节点?如果不是目的节点,则返回1.3继续处理;如果是,则进入目的节点2.1通过本地发射通道移出网络;3. 0.判断该节点是否为目的节点?如果是则进入目的节点2.1通过本地发射通道移出网络;如果不是目的节点,则进入3.1继续判断;3. 1.判断是否继续分流?如果不是,则按正常路由3.2传递至目的节点2.1通过本地发射通道移出网络;如果是,则返回1.7继续处理至到达目的节点2.1并通过本地发射通道移出网络。
2、 按权利要求l所述并行计算机系统通信中网络存在故障域时的路由方法,其特征 在于在二维Mesh网络运行中,当故障环上部分节点位于该网络边界节点上时,这部分节点在分流时作为外环上的节点处理。
3、 按权利要求l所述并行计算机系统通信中网络存在故障域时的路由方法,其特征在于报文类别的设定根据地址偏移量,选取来自东-西、南-北、西-东及北-南中的任意两类 报文作为分流的报文,其余两类报文则仍进入故障环进行绕道路由。
全文摘要
该发明属于并行计算机通信中网络出现故障域时的容错路由方法。包括围绕网络故障域设置的故障环,及围绕该故障环由正常节点组成的与其形状相同的外环,以及设定的拟进入外环分流传递的报文类别;而网络在无故障节点区域内仍按正常路由传递报文,当报文进入外环时首先根据报文类别决定是进入故障环绕道路由、还是在外环上按绕道路由的方式分流传递。该发明由于将绕道报文的通道由一条增设至两条,从而大幅度减少了必须进入故障环绕道报文的数量,减轻了故障环上的负载,消除了网络运行中因故障环上流量过大而行成的制约网络高效运行的瓶颈效应等弊病;从而具有可确保网络顺畅、高效运行等特点。
文档编号H04L12/56GK101394343SQ20081004638
公开日2009年3月25日 申请日期2008年10月27日 优先权日2008年10月27日
发明者晟 王, 都 许, 谢铃富 申请人:电子科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1