算力网络系统及算力网络系统的运行方法与流程

文档序号:32855438发布日期:2023-01-06 23:51阅读:32来源:国知局
算力网络系统及算力网络系统的运行方法与流程

1.本技术涉及通信技术,尤其涉及一种算力网络系统及算力网络系统的运行方法。


背景技术:

2.算力网络是一种根据业务需求,在云、网、边之间按需分配和灵活调度计算资源、存储资源以及网络资源的新型信息基础设施。通俗的说,算力网络好比是电网,算力好比就是电。电力时代,我们构建了一张电网,有电可以用电话、洗衣机、电饭煲、电风扇、电视机。而在人工智能的世界,有算力的前提下,自动驾驶、人脸识别、玩的游戏、看的视频等才能正常使用。
3.算力网络当前仍处于研究的初级阶段,算力网络的将采取怎样的架构,是否要有集中化的控制器,算力网络如何建设,采用怎样的标识体系,以及其运行模式应是怎样,都还没有统一的规范或标准,是需要持续讨论的问题。目前的算力网络架构中存在算网大脑(即核心系统),负责算力网络和传统网络的协同,以及制定相应的协同策略以实现算网一体的效果。
4.但是,算网大脑的架构是十分复杂的,这就使得算力网络的架构变得复杂。而且将大部分的权限集中在算网大脑不仅会增加算力网络的建设成本,还会降低算力网络的鲁棒性。如何架构一种新的算力网络,以减少算力网络的建设成本,提高算力网络的鲁棒性,仍然是需要考虑的。


技术实现要素:

5.本技术提供一种算力网络系统及算力网络系统的运行方法,用以解决如何架构一种新的算力网络,以减少算力网络的建设成本,提高算力网络的鲁棒性的问题。
6.一方面,本技术提供一种算力网络系统,包括至少一个算力节点、至少一个网络设备和至少一个算力资源服务器;一个或多个所述算力节点通过所述网络设备通信连接一个算力资源服务器,所述网络设备还用于连接外部的终端设备;
7.所述网络设备用于接收终端设备发送的算力请求,并将所述算力请求转发至连接的算力资源服务器,接收所述算力资源服务器反馈的目标节点信息后将所述目标节点信息发送至所述终端设备;
8.所述网络设备还用于接收所述终端设备发送的数据报文,并将所述数据报文转发至目标节点信息对应的目标算力节点,其中所述数据报文携带所述目标节点信息和终端设备的信息;
9.所述目标算力节点用于接收所述数据报文后为所述终端设备提供算力服务。
10.可选的,所述算力资源服务器用于实时或定时获知通信连接的算力节点的占用率;
11.所述算力资源服务器还用于接收所述网络设备转发的所述算力请求后,根据通信连接的算力节点的占用率确定目标节点信息,并将所述目标节点信息发送至所述网络设
备。
12.可选的,所述算力请求携带所述终端设备的信息,所述算力资源服务器确定目标节点信息后,还用于:
13.将所述终端设备的信息通过网络设备发送至目标节点信息对应的目标算力节点;
14.所述目标算力节点用于接收所述数据报文后为所述终端设备提供算力服务时,具体用于:
15.当所述算力资源服务器发送的所述终端设备的信息与所述数据报文携带的终端设备的信息相同时,为所述终端设备提供算力服务。
16.可选的,所述算力资源服务器用于根据通信连接的算力节点的占用率确定目标节点信息时,具体用于:
17.当第一算力节点的占用率小于或等于预设占用率时,确定第一算力节点为目标节点,并生成目标节点信息,所述目标节点信息包括目标节点的地址信息。
18.可选的,所述至少一个网络设备包括三类网络设备;
19.第一类网络设备一端连接一个算力节点,另一端连接第二类网络设备;
20.所述第二类网络设备一端连接多个所述第一类网络设备,另一端用于连接外部的终端设备;
21.第三类网络设备一端连接一个算力资源服务器,另一端连接多个所述第一类网络设备。
22.可选的,所述第二类网络设备用于接收所述终端设备发送的算力请求,并将所述算力请求发送至连接的所述第一类网络设备;
23.所述第一类网络设备用于将接收的所述算力请求发送至连接的所述第三类网络设备,所述第三类网络设备用于将接收的所述算力请求转发至连接的所述算力资源服务器;
24.所述第三类网络设备还用于接收所述算力资源服务器反馈的目标节点信息后将所述目标节点信息发送至所述第一类网络设备,所述第一类网络设备用于将接收的所述目标节点信息发送至连接的所述第二类网络设备,所述第二类网络设备用于将所述目标节点信息发送至连接的终端设备。
25.可选的,所述算力请求携带所述终端设备的信息,所述第三类网络设备还用于将所述终端设备的信息发送所述目标节点信息对应的目标节点所连接的目标第一类网络设备,由所述目标第一类网络设备将所述终端设备的信息转发至所述目标节点。
26.可选的,还包括终端设备。
27.另一方面,本技术提供一种算力网络系统的运行方法,应用于算力网络系统,所述算力网络系统包括至少一个算力节点、至少一个网络设备和至少一个算力资源服务器;一个或多个所述算力节点通过所述网络设备通信连接一个算力资源服务器,所述网络设备还用于连接外部的终端设备;所述方法包括:
28.所述网络设备接收终端设备发送的算力请求,并将所述算力请求转发至连接的算力资源服务器,以及接收所述算力资源服务器反馈的目标节点信息后将所述目标节点信息发送至所述终端设备;
29.所述网络设备接收所述终端设备发送的数据报文,并将所述数据报文转发至目标
节点信息对应的目标算力节点,其中所述数据报文携带所述目标节点信息和终端设备的信息;
30.所述目标算力节点接收所述数据报文后为所述终端设备提供算力服务。
31.可选的,所述算力资源服务器用于实时或定时获知通信连接的算力节点的占用率,所述方法还包括:
32.所述算力资源服务器接收所述网络设备转发的所述算力请求后,根据通信连接的算力节点的占用率确定目标节点信息,并将所述目标节点信息发送至所述网络设备。
33.本技术的实施例提供的算力网络系统包括算力节点、网络设备和算力资源服务器,架构简单,减少了算力网络系统的维护成本和建设成本。在使用本技术的实施例提供的算力网络系统提供算力服务时,通过算力节点、网络设备和算力资源服务器的交互,实现终端设备所请求提供服务的业务的识别和算力的分配,无需算网大脑就可以从技术层面和流程层面都实现了算网一体的效果。随着算力服务需求的增多,还可以增多算力节点、网络设备和算力资源服务器的数量或计算能力,适应算力服务需求不断增多的情况,提高了算力网络的鲁棒性。
附图说明
34.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
35.图1为本技术的一个实施例提供的算力网络系统的示意图;
36.图2为本技术的一个实施例提供的算力网络系统的另一个示意图;
37.图3为本技术的一个实施例提供的算力网络系统的又一个示意图;
38.图4为本技术的一个实施例提供的算力网络系统的运行方法的流程示意图;
39.图5为本技术的一个实施例提供的算力节点匹配方法的流程示意图;
40.图6为本技术的一个实施例提供的算力节点匹配装置的示意图;
41.图7为本技术的一个实施例提供的电子设备的示意图。
42.通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
43.这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
44.在本技术的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本技术的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
45.算力网络是一种根据业务需求,在云、网、边之间按需分配和灵活调度计算资源、
存储资源以及网络资源的新型信息基础设施。通俗的说,算力网络好比是电网,算力好比就是电。电力时代,我们构建了一张电网,有电可以用电话、洗衣机、电饭煲、电风扇、电视机。而在人工智能的世界,有算力的前提下,自动驾驶、人脸识别、玩的游戏、看的视频等才能正常使用。
46.算力网络当前仍处于研究的初级阶段,算力网络的将采取怎样的架构,是否要有集中化的控制器,算力网络如何建设,采用怎样的标识体系,以及其运行模式应是怎样,都还没有统一的规范或标准,是需要持续讨论的问题。目前的算力网络架构中存在算网大脑(即核心系统),负责算力网络和传统网络的协同,以及制定相应的协同策略以实现算网一体的效果。但是,算网大脑的架构是十分复杂的,这就使得算力网络的架构变得复杂。而且将大部分的权限集中在算网大脑不仅会增加算力网络的建设成本,还会降低算力网络的鲁棒性。
47.目前算力网络架构的演进方向正在向着软件定义网络(software defined network,简称sdn)架构靠近。在sdn网络架构中,存在一个sdn控制器,它负责管理所有网络单元,针对每一台网络设备制定特定的策略。但是这种一个sdn控制器具有大部分权限的架构仍然具有增加算力网络的建设成本、降低算力网络的鲁棒性的缺点。
48.如何架构一种新的算力网络,以减少算力网络的建设成本,提高算力网络的鲁棒性,仍然是需要考虑的。
49.基于此,本技术提供一种算力网络系统及算力网络系统的运行方法。该算力网络系统包括算力节点、网络设备和算力资源服务器,架构简单,减少了算力网络系统的维护成本和建设成本。在使用本技术的实施例提供的算力网络系统提供算力服务时,通过算力节点、网络设备和算力资源服务器的交互,实现终端设备所请求提供服务的业务的识别和算力的分配,无需算网大脑就可以从技术层面和流程层面都实现了算网一体的效果。
50.请参见图1,本技术的一个实施例提供一种算力网络系统10,包括至少一个算力节点11、至少一个网络设备12和至少一个算力资源服务器13。
51.该算力节点11可以采用公有云技术搭建,用于为各类业务或者为特定业务提供算力服务(计算机服务)。本实施例中,该算力网络系统10包括的每个算力节点11的规模和具有的资源的大小可以不同,每一个算力节点11为一个业务提供算力服务。算力节点11的资源例如包括算力节点11的中央处理器(central processing unit,简称cpu)资源、图形处理器(graphics processing unit,简称gpu)资源、存储资源、嵌入式神经网络处理器(neural-network processing units,简称npu)资源和现场可编程逻辑门阵列(field programmable gate array,简称fpga)等资源。需要说明的是,每个算力节点11处于自运行的状态,无需由算力资源服务器13控制开启或关闭。
52.该网络设备12的类型例如包含基站、交换机、路由器和核心网设备等。该网络设备12就像传统的网络设备一样,承担的是数据转发的作用。
53.如图1所示,一个或多个该算力节点11通过该网络设备12通信连接一个算力资源服务器13,即算力节点11和算力资源服务器13之间通过网络设备12间接通信连接。也就是说算力节点11和算力资源服务器13之间需要由网络设备12进行数据转发。可选的,一个该算力节点11通过多个网络设备12通信连接一个算力资源服务器13,该多个网络设备12之间直接连接以形成用于数据转换的通信链路。
54.该网络设备12用于接收终端设备20发送的算力请求,并将该算力请求转发至连接的算力资源服务器13。该算力请求用于请求算力节点11提供算力服务,但是算力节点11具体为哪一个是未知的,需要由该算力资源服务器13根据实际情况分配合适的算力节点11。因此,先将该算力请求转发至连接的算力资源服务器13,由算力资源服务器13分配合适的算力节点11后,再给该网络设备12反馈目标节点信息,该目标节点信息至少包括目标算力节点11的地址(互联网协议地址)。
55.在一个可选的实施例中,该算力资源服务器13用于实时或定时获知通信连接的算力节点11的占用率,该占用率包括以下任意一种或多种:cpu占用率、gpu占用率、存储占用率、npu占用率和fpga占用率。具体的,每个算力节点11(或算力节点11中的边缘设备)与网络设备12通信,并将自身的资源情况(占用率)以特定报文的方式发送至网路设备,网络设备12会将该资源情况保存在连接的算力资源服务器13上。
56.该算力资源服务器13用于接收该网络设备12转发的该算力请求后,根据通信连接的算力节点11的占用率确定目标节点信息,并将该目标节点信息发送至该网络设备12。具体的,当第一算力节点11的占用率小于或等于预设占用率时,确定第一算力节点11为目标节点,并生成目标节点信息,该目标节点信息包括目标节点的地址。第一算力节点11的占用率小于或等于预设占用率例如第一算力节点11的cpu占用率小于50%,或者cpu占用率和gpu占用率均小于50%。可选的,该算力资源服务器13将该目标节点信息发送至该网络设备12时可以是将该目标节点信息打包成特定信令后,将该特定信令发送至该网络设备12。
57.如此,通过不同算力节点11的占用率合理分配算力节点11的服务资源,调配占用率小的算力节点11为外部的终端设备20提供服务,不仅可以更好、更快得为外部的终端设备20提供服务,还降低了算力网络系统内部资源占用率过高导致的宕机风险。
58.该网络设备12将该目标信息发送至该终端设备20后,该终端设备20可以获知目标节点的地址。该终端设备20再向该网络设备12发送数据报文,该数据报文携带目标节点信息和终端设备20的信息,该终端设备20的信息至少包括终端设备20的地址(互联网协议地址)和用户名。该目标算力节点11用于接收该数据报文后为该终端设备20提供算力服务。该网络设备12接收该终端设备20发送的数据报文,并将该数据报文转发至目标节点信息对应的目标算力节点11。该目标算力节点11接收该数据报文后为该终端设备20提供算力服务。
59.请参见图2,在一个可选的实施例中,该算力请求携带该终端设备20的信息,该算力资源服务器13确定目标节点信息后,还用于将该终端设备20的信息通过网络设备12发送至目标节点信息对应的目标算力节点11。该目标算力节点11用于接收该数据报文后为该终端设备20提供算力服务时,具体用于当该算力资源服务器13发送的该终端设备20的信息与该数据报文携带的终端设备20的信息相同时,为该终端设备20提供算力服务。
60.该目标算力节点11在接受到该数据报文后,先检查该数据报文携带的终端设备20的地址(互联网协议地址)和用户名是否与算力资源服务器13发送的终端设备20的地址和用户名相同,如果相同再为该终端设备20提供算力服务。如果该数据报文携带的终端设备20的地址(互联网协议地址)和用户名是否与算力资源服务器13发送的终端设备20的地址和用户名不同,可能是终端设备20发送有误,则不为该终端设备20提供算力服务。
61.例如,终端设备a对标的目标算力节点11为算力节点a,终端设备a发送的数据报文携带的目标节点信息也是算力节点a的信息,但由于通信错误或其他,算力节点b接收到终
端数据发送的数据报文。算力节点b所对标服务的是终端设备b,此时,算力节点b接收到算力资源服务器13发送的终端设备b的信息与接收的终端设备a的信息不同,则算力节点b不会为终端设备a提供算力服务。
62.算力节点11对终端设备20发送的数据报文所携带的终端设备20的信息进行判断,即算力节点11对终端设备20进行识别,可以防止由于非目标算力节点11提供了算力服务导致的非目标算力节点11运行过载的问题。例如非目标算力节点11的占用率已经高达98%,但在接收终端设备20发送的数据报文后可以准确识别终端设备20的信息后拒绝提供算力服务,从而保障自身避免运行过载的问题。算力节点11自身的正常运行状态可以保障整个算力网络系统的运行稳定性。
63.综上,本实施例提供的算力网络系统10包括算力节点11、网络设备12和算力资源服务器13,终端设备20是需求方,算力节点11是算力服务提供方,而网络设备12是数据的传输介质。该算力网络系统10架构简单,减少了算力网络系统10的维护成本和建设成本。
64.在使用本技术的实施例提供的算力网络系统10提供算力服务时,通过算力节点11、网络设备12和算力资源服务器13的交互,实现终端设备20所请求提供服务的业务的识别和算力的分配,无需算网大脑就可以从技术层面和流程层面都实现了算网一体的效果。
65.业务数据需要被处理时,在传统的架构下,这种处理方式是单一和固定的,比如全部交由某个中心云进行处理,但现有的这种网络架构无法适应广泛的算力服务需求。而本实施例提供的算力网络系统10随着算力服务需求的增多,还可以增多算力节点11、网络设备12和算力资源服务器13的数量或计算能力,适应算力服务需求不断增多的情况,提高了算力网络的鲁棒性。
66.请参见图3,在本技术的一个实施例中,该算力网络系统10中的至少一个网络设备12包括三类网络设备12。
67.第一类网络设备121一端连接一个算力节点11,另一端连接第二类网络设备122。该第二类网络设备122一端连接多个该第一类网络设备121,另一端用于连接外部的终端设备20。第三类网络设备123一端连接一个算力资源服务器13,另一端连接多个该第一类网络设备121。
68.该第二类网络设备122用于接收该终端设备20发送的算力请求,并将该算力请求发送至连接的该第一类网络设备121。该第一类网络设备121用于将接收的该算力请求发送至连接的该第三类网络设备123,该第三类网络设备123用于将接收的该算力请求转发至连接的该算力资源服务器13。该第三类网络设备123还用于接收该算力资源服务器13反馈的目标节点信息后将该目标节点信息发送至该第一类网络设备121,该第一类网络设备121用于将接收的该目标节点信息发送至连接的该第二类网络设备122,该第二类网络设备122用于将该目标节点信息发送至连接的终端设备20。
69.在一个可选的实施例中,该算力请求携带该终端设备20的信息,该第三类网络设备123还用于将该终端设备20的信息发送该目标节点信息对应的目标节点所连接的目标第一类网络设备121,由该目标第一类网络设备121将该终端设备20的信息转发至该目标节点。
70.请参见图4,本技术的一个实施例还提供一种算力网络系统的运行方法,应用于算力网络系统,该算力网络系统包括至少一个算力节点、至少一个网络设备和至少一个算力
资源服务器;一个或多个该算力节点通过该网络设备通信连接一个算力资源服务器,该网络设备还用于连接外部的终端设备。该算力网络系统可以是如上任一项实施例所提供的算力网络系统10。
71.该算力网络系统的运行方法包括:
72.s410,该网络设备接收终端设备发送的算力请求,并将该算力请求转发至连接的算力资源服务器,以及接收该算力资源服务器反馈的目标节点信息后将该目标节点信息发送至该终端设备。
73.该网络设备12接收终端设备20发送的算力请求,并将该算力请求转发至连接的算力资源服务器13。该算力请求用于请求算力节点11提供算力服务,但是算力节点11具体为哪一个是未知的,需要由该算力资源服务器13根据实际情况分配合适的算力节点11。因此,先将该算力请求转发至连接的算力资源服务器13,由算力资源服务器13分配合适的算力节点11后,再给该网络设备12反馈目标节点信息,该目标节点信息至少包括目标算力节点11的地址(互联网协议地址)。
74.在一个可选的实施例中,该算力资源服务器13实时或定时获知通信连接的算力节点11的占用率,该占用率包括以下任意一种或多种:cpu占用率、gpu占用率、存储占用率、npu占用率和fpga占用率。具体的,每个算力节点11(或算力节点11中的边缘设备)与网络设备12通信,并将自身的资源情况(占用率)以特定报文的方式发送至网路设备,网络设备12会将该资源情况保存在连接的算力资源服务器13上。
75.该算力资源服务器13接收该网络设备转发的该算力请求后,根据通信连接的算力节点11的占用率确定目标节点信息,并将该目标节点信息发送至该网络设备。具体的,当第一算力节点11的占用率小于或等于预设占用率时,确定第一算力节点11为目标节点,并生成目标节点信息,该目标节点信息包括目标节点的地址。第一算力节点11的占用率小于或等于预设占用率例如第一算力节点11的cpu占用率小于50%,或者cpu占用率和gpu占用率均小于50%。可选的,该算力资源服务器13将该目标节点信息发送至该网络设备时可以是将该目标节点信息打包成特定信令后,将该特定信令发送至该网络设备。
76.如此,通过不同算力节点11的占用率合理分配算力节点11的服务资源,调配占用率小的算力节点11为外部的终端设备20提供服务,不仅可以更好、更快得为外部的终端设备20提供服务,还降低了算力网络系统内部资源占用率过高导致的宕机风险。
77.该网络设备将该目标信息发送至该终端设备20后,该终端设备20可以获知目标节点的地址。该终端设备20再向该网络设备发送数据报文,该数据报文携带目标节点信息和终端设备20的信息,该终端设备20的信息至少包括终端设备20的地址(互联网协议地址)和用户名。该目标算力节点11接收该数据报文后为该终端设备20提供算力服务。
78.s420,该网络设备接收该终端设备发送的数据报文,并将该数据报文转发至目标节点信息对应的目标算力节点,其中该数据报文携带该目标节点信息和终端设备的信息。
79.该网络设备12将该目标信息发送至该终端设备20后,该终端设备20可以获知目标节点的地址。该终端设备20再向该网络设备12发送数据报文,该数据报文携带目标节点信息和终端设备20的信息,该终端设备20的信息至少包括终端设备20的地址(互联网协议地址)和用户名。该目标算力节点11用于接收该数据报文后为该终端设备20提供算力服务。该网络设备12接收该终端设备20发送的数据报文,并将该数据报文转发至目标节点信息对应
的目标算力节点11。
80.s430,该目标算力节点接收该数据报文后为该终端设备提供算力服务。
81.该目标算力节点11接收该数据报文后为该终端设备20提供算力服务。
82.在一个可选的实施例中,该算力请求携带该终端设备20的信息,该算力资源服务器13确定目标节点信息后,还用于将该终端设备20的信息通过网络设备12发送至目标节点信息对应的目标算力节点11。该目标算力节点11用于接收该数据报文后为该终端设备20提供算力服务时,具体用于当该算力资源服务器13发送的该终端设备20的信息与该数据报文携带的终端设备20的信息相同时,为该终端设备20提供算力服务。
83.该目标算力节点11在接受到该数据报文后,先检查该数据报文携带的终端设备20的地址(互联网协议地址)和用户名是否与算力资源服务器13发送的终端设备20的地址和用户名相同,如果相同再为该终端设备20提供算力服务。如果该数据报文携带的终端设备20的地址(互联网协议地址)和用户名是否与算力资源服务器13发送的终端设备20的地址和用户名不同,可能是终端设备20发送有误,则不为该终端设备20提供算力服务。
84.例如,终端设备a对标的目标算力节点11为算力节点a,终端设备a发送的数据报文携带的目标节点信息也是算力节点a的信息,但由于通信错误或其他,算力节点b接收到终端数据发送的数据报文。算力节点b所对标服务的是终端设备b,此时,算力节点b接收到算力资源服务器13发送的终端设备b的信息与接收的终端设备a的信息不同,则算力节点b不会为终端设备a提供算力服务。
85.算力节点11对终端设备20发送的数据报文所携带的终端设备20的信息进行判断,即算力节点11对终端设备20进行识别,可以防止由于非目标算力节点11提供了算力服务导致的非目标算力节点11运行过载的问题。例如非目标算力节点11的占用率已经高达98%,但在接收终端设备20发送的数据报文后可以准确识别终端设备20的信息后拒绝提供算力服务,从而保障自身避免运行过载的问题。算力节点11自身的正常运行状态可以保障整个算力网络系统的运行稳定性。
86.综上,本实施例提供的算力网络系统的运行方法,通过算力节点11、网络设备12和算力资源服务器13的交互,实现终端设备20所请求提供服务的业务的识别和算力的分配,无需算网大脑就可以从技术层面和流程层面都实现了算网一体的效果。
87.业务数据需要被处理时,在传统的架构下,这种处理方式是单一和固定的,比如全部交由某个中心云进行处理,但现有的这种网络架构无法适应广泛的算力服务需求。而本实施例提供的算力网络系统的运行方法随着算力服务需求的增多,还可以增多算力节点11、网络设备12和算力资源服务器13的数量或计算能力,适应算力服务需求不断增多的情况,提高了算力网络的鲁棒性。
88.请参见图5,本技术的一个实施例还提供一种算力节点匹配方法,应用于如上任一项实施例提供的算力网络系统10中的算力资源服务器13,该算力节点匹配方法包括:
89.s510,响应网关设备发送的算力请求,确定占用率小于或等于预设占用率的第一算力节点为目标节点,并生成目标节点信息;该目标节点信息至少包括目标节点的地址。
90.该算力请求由终端设备20发送至网关设备,再由网关设备发送至连接的算力资源服务器13。
91.该算力请求用于请求算力节点11提供算力服务,但是算力节点11具体为哪一个是
未知的,需要由该算力资源服务器13根据实际情况分配合适的算力节点11。因此,先将该算力请求转发至连接的算力资源服务器13,由算力资源服务器13分配合适的算力节点11后,再给该网络设备12反馈目标节点信息,该目标节点信息至少包括目标算力节点11的地址(互联网协议地址)。
92.该算力资源服务器13用于实时或定时获知通信连接的算力节点11的占用率,该占用率包括以下任意一种或多种:cpu占用率、gpu占用率、存储占用率、npu占用率和fpga占用率。具体的,每个算力节点11(或算力节点11中的边缘设备)与网络设备12通信,并将自身的资源情况(占用率)以特定报文的方式发送至网路设备,网络设备12会将该资源情况保存在连接的算力资源服务器13上。
93.该算力资源服务器13用于接收该网络设备12转发的该算力请求后,根据通信连接的算力节点11的占用率确定目标节点信息,并将该目标节点信息发送至该网络设备12。具体的,当第一算力节点11的占用率小于或等于预设占用率时,确定第一算力节点11为目标节点,并生成目标节点信息,该目标节点信息包括目标节点的地址。第一算力节点11的占用率小于或等于预设占用率例如第一算力节点11的cpu占用率小于50%,或者cpu占用率和gpu占用率均小于50%。可选的,该算力资源服务器13将该目标节点信息发送至该网络设备12时可以是将该目标节点信息打包成特定信令后,将该特定信令发送至该网络设备12。
94.如此,通过不同算力节点11的占用率合理分配算力节点11的服务资源,调配占用率小的算力节点11为外部的终端设备20提供服务,不仅可以更好、更快得为外部的终端设备20提供服务,还降低了算力网络系统10内部资源占用率过高导致的宕机风险。
95.s520,将该目标节点信息发送至该网关设备,以使该网关设备将该目标节点信息发送至终端设备,该终端设备为向该网关设备发送该算力请求的设备。
96.该网络设备12将该目标信息发送至该终端设备20后,该终端设备20可以获知目标节点的地址。该终端设备20再向该网络设备12发送数据报文,该数据报文携带目标节点信息和终端设备20的信息,该终端设备20的信息至少包括终端设备20的地址(互联网协议地址)和用户名。该目标算力节点11用于接收该数据报文后为该终端设备20提供算力服务。该网络设备12接收该终端设备20发送的数据报文,并将该数据报文转发至目标节点信息对应的目标算力节点11。该目标算力节点11接收该数据报文后为该终端设备20提供算力服务。
97.在一个可选的实施例中,该算力请求携带该终端设备20的信息,该算力资源服务器13确定目标节点信息后,还用于将该终端设备20的信息通过网络设备12发送至目标节点信息对应的目标算力节点11。该目标算力节点11用于接收该数据报文后为该终端设备20提供算力服务时,具体用于当该算力资源服务器13发送的该终端设备20的信息与该数据报文携带的终端设备20的信息相同时,为该终端设备20提供算力服务。
98.该目标算力节点11在接受到该数据报文后,先检查该数据报文携带的终端设备20的地址(互联网协议地址)和用户名是否与算力资源服务器13发送的终端设备20的地址和用户名相同,如果相同再为该终端设备20提供算力服务。如果该数据报文携带的终端设备20的地址(互联网协议地址)和用户名是否与算力资源服务器13发送的终端设备20的地址和用户名不同,可能是终端设备20发送有误,则不为该终端设备20提供算力服务。
99.例如,终端设备a对标的目标算力节点11为算力节点a,终端设备a发送的数据报文携带的目标节点信息也是算力节点a的信息,但由于通信错误或其他,算力节点b接收到终
端数据发送的数据报文。算力节点b所对标服务的是终端设备b,此时,算力节点b接收到算力资源服务器13发送的终端设备b的信息与接收的终端设备a的信息不同,则算力节点b不会为终端设备a提供算力服务。
100.算力节点11对终端设备20发送的数据报文所携带的终端设备20的信息进行判断,即算力节点11对终端设备20进行识别,可以防止由于非目标算力节点11提供了算力服务导致的非目标算力节点11运行过载的问题。例如非目标算力节点11的占用率已经高达98%,但在接收终端设备20发送的数据报文后可以准确识别终端设备20的信息后拒绝提供算力服务,从而保障自身避免运行过载的问题。算力节点11自身的正常运行状态可以保障整个算力网络系统10的运行稳定性。
101.请参见图6,本技术的一个实施例还提供一种算力节点匹配装置30,应用于如上任一项实施例提供的算力网络系统10中的算力资源服务器13,该算力节点匹配装置30包括:
102.处理模块31,用于响应网关设备发送的算力请求,确定占用率小于或等于预设占用率的第一算力节点为目标节点,并生成目标节点信息;该目标节点信息至少包括目标节点的地址。
103.通信模块32,用于将该目标节点信息发送至该网关设备,以使该网关设备将该目标节点信息发送至终端设备,该终端设备为向该网关设备发送该算力请求的设备。
104.请参见图7,本技术的一个实施例还提供一种电子设备40,包括处理器41,以及与该处理器41通信连接的存储器42。该存储器42存储计算机执行指令,该处理器41执行该存储器42存储的计算机执行指令,以实现如上任一项实施例提供的算力节点匹配方法。
105.本技术还提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机执行指令,当该指令被执行时,使得计算机执行指令被处理器执行时用于实现如上任一项实施例提供的该算力节点匹配方法。
106.本技术还提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如上任一项实施例提供的该算力节点匹配方法。
107.需要说明的是,上述计算机可读存储介质可以是只读存储器(read only memory,rom)、可编程只读存储器(programmable read-only memory,prom)、可擦除可编程只读存储器(erasable programmable read-only memory,eprom)、电可擦除可编程只读存储器(electrically erasable programmable read-only memory,eeprom)、磁性随机存取存储器(ferromagnetic random access memory,fram)、快闪存储器(flash memory)、磁表面存储器、光盘、或只读光盘(compact disc read-only memory,cd-rom)等存储器。也可以是包括上述存储器之一或任意组合的各种电子设备,如移动电话、计算机、平板设备、个人数字助理等。
108.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
109.上述本技术实施例序号仅仅为了描述,不代表实施例的优劣。
110.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方
法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本技术各个实施例所描述的方法。
111.本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
112.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
113.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
114.以上仅为本技术的优选实施例,并非因此限制本技术的专利范围,凡是利用本技术说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本技术的专利保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1