使用分段队列远程数据存取的设备互联失效备援系统和方法_6

文档序号:9621379阅读:来源:国知局
对消息进行处理。因此,可以理解因该错误所产生的任何间隔,可以在不需要第一计算设备54和第二计算设备58之间进行丢失消息序列号交互被调和,且不需要第一计算设备54不得不追踪成功接收的消息及第二计算设备58对头指针172进行的移动。虽然,在本实施例中,对队列72中的全部消息均进行了复制,在其他一些实施例中,可以仅复制队列72中没有被第二通信接口卡74的队列80所接收的消息。但是,可以理解的是,确定哪些消息86传输成功需要占用较多的计算资源,且第一计算设备54和第二计算设备58需要进行更多的信息传递,这将导致正常操作中所发送的后续消息之间较长的时延,以及通过第二链路66开始发送的消息86之前的失效备援之后较长的时延。
[0085]与第一链路类似,第二链路66通常配置为携带表示从第一计算设备54至第二计算设备58的消息90-1至90-n的电信号。在本实施例中,第二链路66是一根配置为携带从第三通信接口卡78至第四通信接口卡82且符合PCIe标准的协议的电信号的电缆线。在本实施例中,在正常操作情况下,第二链路66 —般处于休眠状态,以使得其无法在传输任何消息。在其他实施例中,第一链路62和第二链路66交替地作为主要链路,以减少消息堵塞的可能性,并可以持续地验证两条链路的可用性,以在一条链路失效时,另一条链路可以承担起所有的数据传输的职责。
[0086]在本实施例中,第一通信接口卡70通常配置为经由第一链路62将第一计算设备54上的队列72中的多个消息86-1至86-n发送至第二计算设备58上。第一通信接口卡70并不受特定的限制,其可以是任意类型的支持经由一低时延链路,如PCIe链路发送消息的远程存储器访问的通信接口卡。如上所述,低时延链路可以是任意支持远程存储器访问的设备互联,且优选无法执行其他协议中,如TCP/IP协议,需要额外的在先处理相应的网络层服务。可以理解的是,通过这种描述,存储空间中可以包括用于存储消息86-1至86-n的队列72。所使用的存储器的类型并不做特定的限制,其可以是易失性或非易失性的存储器。在本实施例中,易失性存储部件可以用于存储消息86-1至86-n,以快速存取消息86_1至 86_n0
[0087]第二通信接口卡74通常配置为接收第一计算设备54经由第一链路62发送的消息86-1至86-n。第二通信接口卡74并不受特定的限制,其可以是可以经由支持远程存储器访问的低时延设备互联接收消息的任何类型的通信接口卡,其可以包括上述与第一通信接口卡有关的类型。在本实施例中,第二通信接口卡74与第一通信接口卡70相同。
[0088]与第一通信接口卡70和第二通信接口卡74类似,第三通信接口卡78和第四通信接口卡82通常配置为相互之间可以经由第二链路66进行通信。在本实施例中,第三通信接口卡78和第四通信接口卡82分别与第一通信接口卡70和第二通信接口卡74相同,并分别与队列80和84相对应。
[0089]可以理解的是,可以对上述可携带电子设备和方法进行任意的变换。作为非受限的实施例,方法300可以与方法400中的通过中断消息的发送和将第一和第二通信接口卡进行隔离的特征进行结合。在其他的实施例中,系统50中经由第二链路66传输的数据可以以通过第一链路62上的消息86的传输作为参照,以提供冗余的链路。类似地,系统50a可以以第一链路62上消息86-1至86-n的传输作为镜像参照,通过第二链路进行消息86_1至86-n的传输,以提供冗余的链路。而且,虽然系统50和50a使用电缆通信,第一链路62和第二链路66可以分别为无线连接链路或者其他可以支持计算设备54和第二计算设备58之间的远程数据存储的任意类型的链路。
[0090]上述对特定的实施例进行说明和介绍,权利要求的保护范围并不受前述优选实施例的限制,应从整体上对权利要求作与
【发明内容】
一致的广义解释。
【主权项】
1.一种第一计算设备和第二计算设备之间的设备互联失效备援方法,其特征在于,所述方法包括: 构建第一计算设备上的第一通信接口卡和第二计算设备上的第二通信接口卡的第一远程存储器访问(remote memory access)链路;以及 检测与所述第一远程存储器访问链路相关的错误,且为了应对所述错误: 在所述第一计算设备上将与第一通信接口卡相关的分段队列的消息复制到与第三通信接口卡相关的分段队列中; 激活所述第三通信接口卡与所述第二计算设备上的第四通信接口卡之间的第二远程存储器访问链路; 通过所述第二远程存储器访问链路将与所述第三通信接口卡相关的所述分段队列中的消息重新发送到所述第四通信接口卡中;以及 所述第二计算设备丢弃重复的接收消息,如果有的话。2.根据权利要求1所述的方法,其特征在于,所述重新发送包括将所述第一计算设备上的所述第三通信接口卡相关的分段队列的当前分段的消息重新发送,其中,所述当前分段为包括一写指针的分段。3.根据权利要求1所述的方法,其特征在于,所述错误包括所述第一通信接口卡中的错误事件。4.根据权利要求1所述的方法,其特征在于,所述错误包括校验总和错误。5.根据权利要求1所述的方法,其特征在于,所述错误包括所述第一远程存储器访问链路的物理毁损。6.根据权利要求1所述的方法,其特征在于,所述错误包括无法在预设时间段内接收消息。7.根据权利要求1所述的方法,其特征在于,所述错误包括确定所述分段消息的尾指针在预设时间内没有指向所述分段消息的下一分段。8.根据权利要求1所述的方法,其特征在于,还包括:从所述第二计算设备向所述第一计算设备发送一中断消息。9.根据权利要求8所述的方法,其特征在于,所述中断消息用于将所述错误告知所述第一计算设备。10.根据权利要求1所述的方法,其特征在于,还包括:为了应对所述错误,将所述第一计算设备与所述第一通信接口卡隔离,并将所述第二计算设备与所述第二通信接口卡隔离。11.根据权利要求1所述的方法,其特征在于,还包括:将所述错误导致的间隔进行恢复(reconciling)。12.一种系统,其特征在于,包括: 第一计算设备;以及 通过第一远程存储器访问链路和第二远程存储器访问链路与所述第一计算设备连接的第二计算设备; 所述第一计算设备被配置为,为了应对所述第一远程存储器访问链路的错误的检测,将所述第一远程存储器访问链路相关的分段队列的消息复制到所述第二远程存储器访问链路相关的分段队列,并将第二远程存储器访问链路相关的所述分段消息重新发送至所述第二计算设备;以及 所述第二计算设备被配置为丢弃重复的接收消息。13.根据权利要求12所述的系统,其特征在于,所述第一计算设备和所述第二计算设备中至少之一被配置为激活所述第二远程存储器访问链路,以应对所述错误的检测。14.根据权利要求12所述的系统,其特征在于,所述第一计算设备包括一第一通信接口卡,所述第二计算设备包括一第二通信接口卡,所述第一远程存储器访问链路包括所述第一通信接口卡和所述第二通信接口卡,且所述第一计算设备包括第三通信接口卡,所述第二计算设备包括第四通信接口卡,所述第二远程存储器访问链路包括所述第三通信接口卡和所述第四通信接口卡。15.根据权利要求14所述的系统,其特征在于,所述错误包括所述第一通信接口卡中的一错误事件。16.根据权利要求14所述的系统,其特征在于,所述第一计算设备被配置为与所述第一通信接口卡隔离,以应对所述错误,且所述第二计算设备被配置为与所述第二通信接口卡隔离,以应对所述错误。17.根据权利要求14所述的系统,其特征在于,所述第一计算设备被配置为重新发送所述第一远程存储器访问链路相应的所述分段队列的当前分段的消息,其中,所述当前分段包括一写指针。18.根据权利要求12所述的系统,其特征在于,所述错误包括检验总和错误。19.根据权利要求12所述的系统,其特征在于,所述错误包括所述第一远程存储器访问链路的物理毁损。20.根据权利要求12所述的系统,其特征在于,所述错误包括无法在预设时间段内接收到消息。21.根据权利要求12所述的系统,其特征在于,所述第二计算设备被配置为向所述第一计算设备发送中断消息。22.根据权利要求21所述的系统,其特征在于,所述中断消息用于将所述错误告知所述第一计算设备。23.根据权利要求12所述的系统,其特征在于,所述第一计算设备和所述第二计算设备中至少之一被配置为对所述错误导致的间隔进行恢复(reconciling)。24.—种第一计算设备和第二计算设备之间的设备互联失效备援方法,其特征在于,所述方法包括: 构建所述第一计算设备和第二计算设备之间的第一远程存储器访问链路;以及 检测与所述第一远程存储器访问链路相关的错误,且为了应对所述错误: 所述第一计算设备将消息从所述第一远程存储器访问链路相关的分段队列复制到第二远程存储器访问链路相关的分段队列中; 激活所述第一计算设备与所述第二计算设备之间的所述第二远程存储器访问链路; 所述第一计算设备通过所述第二远程存储器访问链路将消息从所述第一远程存储器访问链路相关的所述分段队列中重新发送到所述第二计算设备;以及 所述第二计算设备丢弃重复的接收消息,如果有的话。
【专利摘要】创建第一计算设备上的第一通信接口卡与第二通信接口之间的第一远程存储器访问链路。为了应对所述第一远程存储器访问链路的错误,将所述第一计算设备上的第一通信接口卡相应的分段队列的消息复制到第二通信接口卡相应的分段队列中。激活第二计算设备上的第三通信接口卡与第四通信接口卡之间的第二远程存储器访问链路,通过所述第二远程存储器访问链路将所述第三通信接口卡相应的分段队列中的消息重新发送至所述第四通信接口卡,第二计算设备所接收的复制消息。
【IPC分类】H04L12/707, H04L29/14
【公开号】CN105379229
【申请号】CN201480033755
【发明人】都铎·莫洛森, 格雷戈里·阿瑟斯·阿伦
【申请人】多伦多证券交易所
【公开日】2016年3月2日
【申请日】2014年6月12日
【公告号】CA2912941A1, EP3008880A1, US20160149801, WO2014197975A1
当前第6页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1