一种建立光通路的方法及相关设备与流程

文档序号:36249497发布日期:2023-12-02 18:13阅读:33来源:国知局
一种建立光通路的方法及相关设备与流程

本技术涉及计算机,尤其涉及一种建立光通路的方法、系统以及光网络控制器、光网络交换设备、计算机可读存储介质、计算机程序产品。


背景技术:

1、随着计算机技术的不断发展,各种计算架构应运而生。其中,数据驱动的计算架构(data driven architecture),也称以内存为中心的计算架构(memory centricarchitecture)或者分级共享内存(disaggregated shared memory)架构,是计算产业的一次架构级创新,也是业界的技术研究热点。

2、数据驱动的计算架构基于新型内存语义网络,如计算快速连接(compute expresslink, cxl)内存语义网络、一致性加速处理器接口(coherent accelerator processorinterface,capi) 内存语义网络或者genz内存语义网络构建内存互联网络(memoryfabric)集群,实现分级内存的资源池化与全局共享。

3、内存互联网络集群要求高效、稳定、可靠的跨节点内存访问。具体地,内存互联网络集群通常要求超高带宽(tbps级别)、超低平均时延与长尾时延(<1us,百纳秒级别),例如带宽可以为兆比特每秒(terabits per second,tbps)级别,平均时延或长尾时延可以为百纳秒级别,其中,百纳秒级别是指小于1微秒(microsecond,us)。

4、目前,内存互联网络集群通常采用一跳(onehop)组网方式组建。onehop组网是指将计算节点连接至同一交换设备如交换机(switch)上,使得各个计算节点之间通过该switch 进行数据交换的组网方式。

5、然而,采用onehop组网方式,当各计算节点产生突发的流量时,易触发短时拥塞,导致长尾时延暴涨,由此制约内存互联网络集群的性能。


技术实现思路

1、本技术提供了一种建立光通路的方法,该方法通过对波长进行切分,从而在光网络交换设备与内存互联网络集群的子网中计算节点之间建立不同光通路,使得光网络交换设备能够根据波长区分光信号,并根据光信号的波长选择相应的光通路将光信号直通到计算节点,避免突发流量导致的拥塞问题,缩短长尾时延,保障了内存互联网络集群的性能。本技术还提供了上述对应的系统、光网络控制器、光网络交换设备以及计算机可读存储介质、计算机程序产品。

2、第一方面,本技术提供了一种建立光通路的方法。该方法应用于光网络。光网络具体是光传送网,例如是采用光交叉连接传送光信号的网络。光网络包括光网络控制器和光网络交换设备。其中,光网络交换设备用于为集群(即上文中的内存互联网络集群)中的计算节点交换数据。

3、具体地,光网络控制器获取集群的子网的拓扑结构,该拓扑结构记录有子网中计算节点的地址,光网络控制器根据拓扑结构确定波长切分配置,并向光网络交换设备提供所述波长切分配置,其中,波长切分配置用于为所述子网中计算节点分配不同波长,相应地,光网络交换设备根据所述波长切分配置建立光网络交换设备与子网中计算节点的光通路。

4、在该方法中,根据波长切分配置建立光网络交换设备与子网中不同计算节点的光通路,可以使得光网络交换设备能够根据波长区分光信号,并根据光信号的波长选择相应的通路将光信号直通到计算节点,避免突发流量导致的拥塞问题,缩短长尾时延,保障了集群的性能。

5、在一些可能的实现方式中,子网中包括n个计算节点,其中,n大于1。针对n个计算节点中的目标计算节点,该目标计算节点可以是n个计算节点中的任意计算节点,光网络控制器可以从波长范围(可使用的波长范围,如可见光的波长范围)中确定子范围,并从该子范围中采样n-1个波长,然后光网络控制器根据子网中除所述目标计算节点之外的 n-1个计算节点的地址、所述n-1个波长、所述n-1个计算节点连接的所述光网络交换设备的出端口、所述目标计算节点连接的所述光网络交换设备的入端口,确定波长切分配置。该波长切分配置具体可以为子网中计算节点的地址、子网中计算节点允许接收的光信号的波长(从子范围中采样得到的波长)以及光网络交换设备的入端口、出端口的对应关系。

6、该方法中,光网络控制器从波长范围中确定子范围,并从子范围中采样若干波长,根据采样的波长、子网中计算节点的地址以及光网络交换设备的入端口、出端口,确定波长切分配置,从而实现细粒度的波长切分,如此可以实现将入端口接收的光信号,按照其波长,从相应的出端口,通过相应的光通路直通至计算节点,无需进行复杂的路径计算,缩短了时延,提高了传送效率,保障了集群的性能。

7、在一些可能的实现方式中,光网络控制器可以通过随机采样方式或平均采样方式,从子范围中采样n-1个波长。这n-1个波长可以被分配给子网中除目标计算节点以外的n-1 个计算节点。其中,平均采样方式可以使得波长间隔比较均匀,避免波长过于接近从而产生信号干扰。随机采样方式可以使得波长无规律可循,提升了光通路的复杂度,保障了安全性。

8、在一些可能的实现方式中,光网络交换设备为光交叉连接交换机,该光交叉交换机包括波长选择开关。相应地,光网络交换设备在建立光通路时,可以根据所述波长切分配置,通过所述波长选择开关建立光网络交换设备与所述子网中计算节点的光通路。

9、该方法中,光网络交换设备通过波长选择开关可以实现根据波长切分配置自动调整光通路,使得光信号到达光网络交换设备后能够自动按照该光通路传输到达相应的计算节点,无需事先对端口进行复杂的物理连线,在解决拥塞问题的基础上,还简化了组网方式,提升了用户体验。

10、在一些可能的实现方式中,子网中计算节点配置有光网络适配设备,该光网络适配设备用于接入所述光网络。相应地,光网络控制器还可以向所述光网络适配设备提供所述波长切分配置,以使所述光网络适配设备根据所述波长切分配置将电信号转换为相应波长的光信号。

11、如此,子网中计算节点之间进行数据交换时,可以将电信号转换为相应波长的光信号,然后由光网络交换设备将上述波长的光信号,通过相应的光通路直通至计算节点,由此提高了传送效率,缩短了时延,保障了集群的性能。

12、在一些可能的实现方式中,所述子网中包括第一计算节点和第二计算节点。所述第一计算节点配置的光网络适配设备可以根据所述波长切分配置,将待发送至所述第二计算节点的电信号转换为相应波长的光信号,向所述光网络交换设备发送所述光信号。然后,光网络交换设备通过所述光网络交换设备与所述第二计算节点的光通路传输所述光信号至所述第二计算节点。

13、由此实现了子网中计算节点之间的高速通信,避免了突发流量导致的拥塞问题,缩短了长尾时延,保障了集群的性能,提高了作业的执行效率。

14、在一些可能的实现方式中,光网络控制器可以向光网络交换设备提供所述波长切分配置中的第一配置信息,向光网络适配设备提供波长切分配置中的第二配置信息。其中,第一配置信息包括所述子网中计算节点允许接收的光信号的波长和所述光网络交换设备的入端口、出端口的对应关系,第二配置信息包括所述子网中计算节点的地址和所述子网中计算节点允许接收的光信号的波长的对应关系。如此可以减少传输开销,降低成本。

15、在一些可能的实现方式中,光网络控制器可以统一向光网络交换设备和光网络适配设备提供较完整的波长切分配置,例如光网络控制器可以向光网络交换设备和光网络适配设备提供子网中计算节点的地址、所述子网中计算节点允许接收的光信号的波长和光网络交换设备的入端口、出端口的对应关系。如此,光网络控制器侧可以减少复杂操作,降低计算量,即使低配置的光网络控制器也能够满足需求。

16、在一些可能的实现方式中,集群可以为高性能计算集群。高性能计算集群设置有作业调度器。作业调度器可以根据调度策略生成子网的拓扑结构,光网络控制器可以接收作业调度器根据调度策略生成的子网的拓扑结构。例如,光网络控制器可以提供北向应用程序编程接口,作业调度器可以调用该北向应用程序接口向光网络控制器下发子网的拓扑结构。

17、如此,可以将作业调度至高性能计算集群的子网中计算节点上执行,充分利用高性能计算集群的资源,提升资源利用率。

18、在一些可能的实现方式中,光网络控制器还可以与云平台对接。具体地,光网络控制器可以接收云平台的基础设施即服务iaas层网络管理发送的所述集群的子网的拓扑结构。如此可以实现高性能计算集群的云化调度,进一步提高资源利用率,降低成本。而且,光网络的底层整体架构无需任何变动,仅需iaas层网络管理添加少量适配,例如是光网络控制器的北向应用程序编程接口的适配,即可实现光网络控制器平滑对接到公有云/混合云等云平台的iaas网络服务层。

19、在一些可能的实现方式中,光网络包括多个所述光网络交换设备,光网络控制器向多个光网络交换设备提供波长切分配置,如此可以避免光网络交换设备的单点故障导致的服务不可用,提高了集群的可用性。

20、在一些可能的实现方式中,所述多个光网络交换设备的工作模式为主备模式或多活模式。当多个光网络交换设备的工作模式为主备模式时,主设备发生故障时,备用设备可以成为新的主设备,从而为集群的子网中的计算节点交换数据,保障了服务正常运行。当多个光网络交换设备的工作模式为多活模式时,一方面可以避免单点故障导致服务不可用,另一方面可以实现负载均衡。

21、第二方面,本技术提高了一种建立光通路的系统。所述系统包括光网络控制器和光网络交换设备,所述光网络交换设备用于为集群中的计算节点交换数据;

22、所述光网络控制器,用于获取集群的子网的拓扑结构,所述拓扑结构记录有所述子网中计算节点的地址;

23、所述光网络控制器,还用于根据所述拓扑结构确定波长切分配置,并向所述光网络交换设备提供所述波长切分配置,所述波长切分配置包括为所述子网中计算节点分配的不同波长;

24、所述光网络交换设备,用于根据所述波长切分配置建立所述光网络交换设备与所述子网中计算节点的光通路。

25、在一些可能的实现方式中,所述子网中包括n个计算节点,所述n大于1,所述光网络控制器具体用于:

26、针对所述n个计算节点中的目标计算节点,从波长范围中确定子范围,并从所述子范围中采样n-1个波长;

27、根据所述子网中除所述目标计算节点之外的n-1个计算节点的地址、所述n-1个波长、所述n-1个计算节点连接的所述光网络交换设备的出端口、所述目标计算节点连接的所述光网络交换设备的入端口,确定波长切分配置。

28、在一些可能的实现方式中,所述光网络交换设备为光交叉连接oxc交换机,所述oxc 交换机包括波长选择开关;

29、所述光网络交换设备具体用于:

30、根据所述波长切分配置,通过所述波长选择开关建立光网络交换设备与所述子网中计算节点的光通路。

31、在一些可能的实现方式中,所述子网中计算节点配置有光网络适配设备,所述光网络适配设备用于接入光网络,所述光网络控制器还用于:

32、向所述光网络适配设备提供所述波长切分配置,以使所述光网络适配设备根据所述波长切分配置将电信号转换为相应波长的光信号。

33、在一些可能的实现方式中,所述子网中包括第一计算节点和第二计算节点;

34、所述第一计算节点配置的光网络适配设备,用于根据所述波长切分配置,将待发送至所述第二计算节点的电信号转换为相应波长的光信号,向所述光网络交换设备发送所述光信号;

35、所述光网络交换设备,还用于通过所述光网络交换设备与所述第二计算节点的光通路传输所述光信号至所述第二计算节点。

36、在一些可能的实现方式中,所述光网络控制器具体用于:

37、向所述光网络交换设备提供所述波长切分配置中的第一配置信息,所述第一配置信息包括所述子网中计算节点允许接收的光信号的波长和所述光网络交换设备的入端口、出端口的对应关系;

38、所述光网络控制器具体用于:

39、向所述光网络适配设备提供所述波长切分配置中的第二配置信息,所述第二配置信息包括所述子网中计算节点的地址和所述子网中计算节点允许接收的光信号的波长的对应关系。

40、在一些可能的实现方式中,所述光网络控制器具体用于:

41、接收作业调度器根据调度策略生成的子网的拓扑结构。

42、在一些可能的实现方式中,所述光网络控制器具体用于:

43、接收云平台的基础设施即服务iaas层网络管理发送的所述集群的子网的拓扑结构。

44、在一些可能的实现方式中,所述系统包括多个所述光网络交换设备,所述光网络控制器具体用于:

45、向多个所述光网络交换设备提供所述波长切分配置。

46、在一些可能的实现方式中,所述多个光网络交换设备的工作模式为主备模式或多活模式。

47、第三方面,本技术提供一种光网络控制器。所述控制器包括至少一个处理器和至少一个存储器。所述至少一个处理器、所述至少一个存储器进行相互的通信。所述至少一个处理器用于执行所述至少一个存储器中存储的指令,以使得光网络控制器执行如第一方面的方法中由光网络控制器执行的步骤。

48、第四方面,本技术提供一种光网络交换设备。所述光网络交换设备包括至少一个处理器和至少一个存储器。所述至少一个处理器、所述至少一个存储器进行相互的通信。所述至少一个处理器用于执行所述至少一个存储器中存储的指令,以使得光网络交换设备执行如第一方面的方法中由光网络交换设备执行的步骤。

49、第五方面,本技术提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,所述指令用于执行上述第一方面或第一方面的任一种实现方式所述的建立光通路的方法。

50、第六方面,本技术提供了一种包含指令的计算机程序产品,所述指令用于执行上述第一方面或第一方面的任一种实现方式所述的建立光通路的方法。

51、本技术在上述各方面提供的实现方式的基础上,还可以进行进一步组合以提供更多实现方式。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1