业务数据的传输方法及装置、服务器与流程

文档序号:34009754发布日期:2023-04-29 21:59阅读:33来源:国知局
业务数据的传输方法及装置、服务器与流程

本技术实施例涉及计算机领域,具体而言,涉及一种业务数据的传输方法及装置、服务器。


背景技术:

1、随着时代科技的进步,人工智能以及云端服务的架构也越来越多,ai(artificialintelligence,人工智能)芯片计算平台,具有高兼容、高扩展、高能效、可灵活部署等特性。适用于图像处理、语音识别、金融分析、目标检测、自然语言处理、智能推荐等典型ai应用场景。随着ai算力需求激增,数据海量增长与模型巨量化发展,ai芯片产业格局正呈现多元化发展趋势为了提高显示适配器加速运算的能力,ocp(open computer project,开放计算项目)协会推出了oai(open accelerator infrastructure,开放加速器基础设施)系统架构,定义了开放加速标准(oam,ocp accelerator module),可以有效提升上述的功能。

2、在现有的oai架构上,多个oam模块连接至switch(交换机),再由switch连接至host(服务机)端(例如cpu(central processing unit,中央处理器)),由host端对oam模块进行控制,从而满足ai运算需求,但是当前的oai架构中,oam模块和host端会发生掉卡导致oam模块和host端无法进行业务数据的传输,此时们只能重新启动让host端的cpu重新链接oam装置,由于伺服器重新开启并链接的时间很长,会导致重启这段期间的浪费,且因为oam拆装不易,要检查也会浪费不少时间,甚至其他oam在计算到一半的工作会被迫停止,若是计算庞大的工作,中途因为某些原因导致链路不通,而先前的工作就会功亏一篑


技术实现思路

1、本技术实施例提供了一种业务数据的传输方法及装置、服务器,以至少解决相关技术中的对业务模块的控制效率较低问题。

2、根据本技术的一个实施例,提供了一种业务数据的传输方法,应用于处理器,包括:在检测到所述处理器与第一业务模块之间的第一业务传输链路处于故障状态的情况下,确定第二业务模块,其中,所述处理器,所述第一业务模块和所述第二业务模块部署在服务器上,所述处理器与每个业务模块之间建立了业务传输链路和消息传输链路,所述业务传输链路用于传输业务数据,所述消息传输链路用于传输消息指令,所述第二业务模块所对应的第二业务传输链路处于工作状态;通过所述第一业务模块对应的第一消息传输链路向所述第一业务模块传输第一消息指令,并通过所述第二业务模块对应的第二消息传输链路向所述第二业务模块传输第二消息指令,其中,所述第一消息指令和所述第二消息指令均用于指示建立所述第一业务模块与所述第二业务模块之间的数据传输链路;通过所述数据传输链路和所述第二业务传输链路,传输与所述第一业务模块之间的业务数据。

3、可选的,所述确定第二业务模块,包括:从所述服务器上部署的多个业务模块中筛选出第三业务模块,其中,所述第三业务模块与所述第一业务模块之间通过算力分享链路连接,并且所述第三业务模块所对应的第三业务传输链路处于工作状态,所述算力分享链路用于实现业务模块之间分享算力;从所述第三业务模块中筛选出业务量小于目标业务量的业务模块作为所述第二业务模块。

4、可选的,所述通过所述第一业务模块对应的第一消息传输链路向所述第一业务模块传输第一消息指令,并通过所述第二业务模块对应的第二消息传输链路向所述第二业务模块传输第二消息指令,包括:生成携带有第一状态信息和第一业务模块信息的所述第一消息指令,以及生成携带有第二状态信息和第二业务模块信息的所述第二消息指令,其中,所述第一状态信息用于指示所述第一业务模块与所述处理器之间的所述业务传输链路处于故障状态,所述第一业务模块信息用于指示所述第二业务模块,所述第二状态信息用于指示所述第二业务模块与所述处理器之间的所述业务传输链路处于工作状态,所述第二业务模块信息用于指示所述第一业务模块;通过所述第一消息传输链路传输所述第一消息指令,并通过所述第二消息传输链路传输所述第二消息指令。

5、可选的,所述通过所述数据传输链路和所述第二业务传输链路,传输与所述第一业务模块之间的业务数据,包括以下至少之一:通过所述第二业务传输链路将第一业务数据传输至所述第二业务模块,其中,所述第一业务数据用于指示所述第二业务模块通过所述数据传输链路将所述第一业务数据传输至所述第一业务模块;接收所述第二业务传输链路传输的第二业务数据,其中,所述第二业务数据是所述第一业务模块通过所述数据传输链路传输至所述第二业务模块的,所述第二业务数据用于指示所述第二业务模块将所述第二业务数据传输至所述处理器。

6、根据本技术的另一个实施例,提供了一种业务数据的传输方法,应用于第一业务模块,包括:接收处理器通过所述第一业务模块对应的第一消息传输链路向所述第一业务模块传输的第一消息指令,其中,所述处理器,所述第一业务模块和第二业务模块部署在服务器上,所述处理器与每个业务模块之间建立了业务传输链路和消息传输链路,所述业务传输链路用于传输业务数据,所述消息传输链路用于传输消息指令,所述第一消息指令为在所述处理器检测到与所述第一业务模块之间的第一业务传输链路处于故障状态,并确定出所述第二业务模块的情况下传输的,所述第二业务模块所对应的第二业务传输链路处于工作状态,所述第一消息指令用于指示建立所述第一业务模块与所述第二业务模块之间的数据传输链路;响应所述第一消息指令,建立与所述第二业务模块之间的所述数据传输链路;通过所述数据传输链路和所述第二业务传输链路,传输与所述处理器之间的业务数据。

7、可选的,所述响应所述第一消息指令,建立与所述第二业务模块之间的所述数据传输链路,包括:根据所述第一消息指令从与所述第一业务模块通过算力分享链路连接的业务模块中确定出所述第二业务模块;将与所述第二业务模块之间连接的目标算力分享链路转换为所述数据传输链路,其中,所述目标算力分享链路用于实现所述第二业务模块和所述第一业务模块之间分享算力。

8、可选的,所述根据所述第一消息指令从与所述第一业务模块通过算力分享链路连接的业务模块中确定出所述第二业务模块,包括:识别所述第一消息指令中携带的第一状态信息,其中,所述第一状态信息用于指示所述第一业务模块与所述处理器之间的所述业务传输链路的工作状态;在所述第一状态信息用于指示所述第一业务模块与所述处理器之间的所述业务传输链路处于故障状态的情况下,将所述第一消息指令中携带的第一业务模块信息所指示的业务模块确定为所述第二业务模块。

9、可选的,所述将与所述第二业务模块之间连接的目标算力分享链路转换为所述数据传输链路,包括:获取预先存储的目标数据传输协议;将所述目标算力分享链路上所采用的传输协议转换为所述目标数据传输协议,得到所述数据传输链路。

10、根据本技术的另一个实施例,提供了一种业务数据的传输方法,应用于第二业务模块,包括:接收处理器通过所述第二业务模块对应的第二消息传输链路向所述第二业务模块传输的第二消息指令,其中,所述处理器,第一业务模块和所述第二业务模块部署在服务器上,所述处理器与每个业务模块之间建立了业务传输链路和消息传输链路,所述业务传输链路用于传输业务数据,所述消息传输链路用于传输消息指令,所述第二消息指令为在所述处理器检测到与所述第一业务模块之间的第一业务传输链路处于故障状态,并确定出所述第二业务模块的情况下传输的,所述第二业务模块所对应的第二业务传输链路处于工作状态,所述第二消息指令用于指示建立所述第一业务模块与所述第二业务模块之间的数据传输链路;响应所述第二消息指令,建立与所述第一业务模块之间的所述数据传输链路;通过所述数据传输链路和所述第二业务传输链路,传输所述第一业务模块与所述处理器之间的业务数据。

11、可选的,所述响应所述第二消息指令,建立与所述第一业务模块之间的所述数据传输链路,包括:根据所述第二消息指令从与所述第二业务模块通过算力分享链路连接的业务模块中确定出所述第一业务模块;将与所述第一业务模块之间连接的目标算力分享链路转换为所述数据传输链路,其中,所述目标算力分享链路用于实现所述第二业务模块和所述第一业务模块之间分享算力。

12、可选的,所述根据所述第二消息指令从与所述第二业务模块通过算力分享链路连接的业务模块中确定出所述第一业务模块,包括:识别所述第二消息指令中携带的第二状态信息,其中,所述第二状态信息用于指示所述第二业务模块与所述处理器之间的所述业务传输链路的工作状态;在所述第二状态信息用于指示所述第二业务模块与所述处理器之间的所述业务传输链路处于工作状态的情况下,将所述第二消息指令中携带的第二业务模块信息所指示的业务模块确定为所述第一业务模块。

13、可选的,所述将与所述第一业务模块之间连接的目标算力分享链路转换为所述数据传输链路,包括:获取预先存储的目标数据传输协议;将所述目标算力分享链路上所采用的传输协议转换为所述目标数据传输协议,得到所述数据传输链路。

14、根据本技术的另一个实施例,提供了一种服务器,包括:处理器、第一业务模块和第二业务模块,其中,所述处理器与每个业务模块之间建立了业务传输链路和消息传输链路,所述业务传输链路用于传输业务数据,所述消息传输链路用于传输消息指令;所述处理器,用于在检测到与所述第一业务模块之间的第一业务传输链路处于故障状态的情况下,确定所述第二业务模块,其中,所述第二业务模块所对应的第二业务传输链路处于工作状态;通过所述第一业务模块对应的第一消息传输链路向所述第一业务模块传输第一消息指令,并通过所述第二业务模块对应的第二消息传输链路向所述第二业务模块传输第二消息指令,其中,所述第一消息指令和所述第二消息指令均用于指示建立所述第一业务模块与所述第二业务模块之间的数据传输链路;通过所述数据传输链路和所述第二业务模块对应的第二业务传输链路,传输与所述第一业务模块之间的业务数据;所述第一业务模块,用于接收所述第一消息指令;响应所述第一消息指令,建立与所述第二业务模块之间的所述数据传输链路;通过所述数据传输链路和所述第二业务传输链路,传输与所述处理器之间的业务数据;所述第二业务模块,用于接收所述第二消息指令;响应所述第二消息指令,建立与所述第一业务模块之间的所述数据传输链路;通过所述数据传输链路和所述第二业务传输链路,传输所述第一业务模块与所述处理器之间的业务数据。

15、可选的,所述服务器上部署了多个业务模块,其中,所述处理器,还用于从所述多个业务模块中筛选出第三业务模块,其中,所述第三业务模块与所述第一业务模块之间通过算力分享链路连接,并且所述第三业务模块所对应的第三业务传输链路处于工作状态,所述算力分享链路用于实现所述第三业务模块和所述第一业务模块之间分享算力;从所述第三业务模块中筛选出业务量小于目标业务量的业务模块作为所述第二业务模块;所述第一业务模块,还用于根据所述第一消息指令从与所述第一业务模块通过所述算力分享链路连接的业务模块中确定出所述第二业务模块;将与所述第二业务模块之间连接的目标算力分享链路转换为所述数据传输链路,其中,所述目标算力分享链路用于实现所述第二业务模块和所述第一业务模块之间分享算力;所述第二业务模块,还用于根据所述第二消息指令从与所述第二业务模块通过所述算力分享链路连接的业务模块中确定出所述第一业务模块;将与所述第一业务模块之间连接的所述目标算力分享链路转换为所述数据传输链路。

16、可选的,所述第一业务模块上配置有第一缓存器,所述第二业务模块上配置有第二缓存器,其中,所述第一缓存器用于存储所述第一消息指令,所述第二缓存器用于存储所述第二消息指令。

17、根据本技术的另一个实施例,提供了一种业务数据的传输装置,应用于处理器,包括:确定模块,用于在检测到所述处理器与第一业务模块之间的第一业务传输链路处于故障状态的情况下,确定第二业务模块,其中,所述处理器,所述第一业务模块和所述第二业务模块部署在服务器上,所述处理器与每个业务模块之间建立了业务传输链路和消息传输链路,所述业务传输链路用于传输业务数据,所述消息传输链路用于传输消息指令,所述第二业务模块所对应的第二业务传输链路处于工作状态;第一传输模块,用于通过所述第一业务模块对应的第一消息传输链路向所述第一业务模块传输第一消息指令,并通过所述第二业务模块对应的第二消息传输链路向所述第二业务模块传输第二消息指令,其中,所述第一消息指令和所述第二消息指令均用于指示建立所述第一业务模块与所述第二业务模块之间的数据传输链路;第二传输模块,用于通过所述数据传输链路和所述第二业务传输链路,传输与所述第一业务模块之间的业务数据。

18、根据本技术的另一个实施例,提供了一种业务数据的传输装置,应用于第一业务模块,包括:第一接收模块,用于接收处理器通过所述第一业务模块对应的第一消息传输链路向所述第一业务模块传输的第一消息指令,其中,所述处理器,所述第一业务模块和第二业务模块部署在服务器上,所述处理器与每个业务模块之间建立了业务传输链路和消息传输链路,所述业务传输链路用于传输业务数据,所述消息传输链路用于传输消息指令,所述第一消息指令为在所述处理器检测到与所述第一业务模块之间的第一业务传输链路处于故障状态,并确定出所述第二业务模块的情况下传输的,所述第二业务模块所对应的第二业务传输链路处于工作状态,所述第一消息指令用于指示建立所述第一业务模块与所述第二业务模块之间的数据传输链路;第一处理模块,用于响应所述第一消息指令,建立与所述第二业务模块之间的所述数据传输链路;第三传输模块,用于通过所述数据传输链路和所述第二业务传输链路,传输与所述处理器之间的业务数据。

19、根据本技术的另一个实施例,提供了一种业务数据的传输装置,应用于第二业务模块,包括:第二接收模块,用于接收处理器通过所述第二业务模块对应的第二消息传输链路向所述第二业务模块传输的第二消息指令,其中,所述处理器,第一业务模块和所述第二业务模块部署在服务器上,所述处理器与每个业务模块之间建立了业务传输链路和消息传输链路,所述业务传输链路用于传输业务数据,所述消息传输链路用于传输消息指令,所述第二消息指令为在所述处理器检测到与所述第一业务模块之间的第一业务传输链路处于故障状态,并确定出所述第二业务模块的情况下传输的,所述第二业务模块所对应的第二业务传输链路处于工作状态,所述第二消息指令用于指示建立所述第一业务模块与所述第二业务模块之间的数据传输链路;第二处理模块,用于响应所述第二消息指令,建立与所述第一业务模块之间的所述数据传输链路;第四传输模块,用于通过所述数据传输链路和所述第二业务传输链路,传输所述第一业务模块与所述处理器之间的业务数据。

20、根据本技术的又一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

21、根据本技术的又一个实施例,还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。

22、通过本技术,处理器和服务器上部署的每个业务模块之间通过两条链路连接,即业务传输链路和消息传输连路,业务传输链路用于传输业务数据,消息传输链路用于传输消息指令,因此,当检测到处理器与第一业务模块的第一业务传输链路处于故障状态的情况下,从服务器上部署的业务模块中确定出与处理器之间的业务传输链路处于工作状态的第二业务模块,并通过消息传输链路分别向第一业务模块和第二业务模块传输消息指令的方式,指示其建立第一业务模块和第二业务模块之间的数据传输链路,进而通过数据传输链路和第二业务传输链路传输与第一业务模块之间的业务数据,实现在服务器上部署的第一业务模块的第一业务传输链路处于故障状态的情况下,在服务器上选择与处理器之间的业务传输链路正常的第二业务模块帮助传输第一业务模块和处理器之间的业务数据的目的,保证了服务器的业务功能,以及对服务器中部署的业务模块的有效控制,因此,可以解决相关技术中存在的对业务模块的控制效率较低的问题,达到提高对业务模块的控制效率的技术效果。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1