本发明涉及云计算大数据边缘计算和人工智能,特别是涉及分层算力调度方法、系统、设备及存储介质。
背景技术:
1、通用算力测算路径为,接受目标用户算力设备请求信息->根据服务器当前指标对设备集群进行过滤,得到目标集群->根据服务器当前指标对目标集群中的服务器进行评分->返回最高评分服务器供目标用户算力设备请求进行调用。例如:根据算力设备信息中的cpu使用率、带宽使用率、剩余cpu核数、剩余内存和带宽成本等通用指标对算力设备进行过滤,得到目标算力设备集;采用预设评分法则,对目标算力设备集中的算力设备进行打分,得分最高的算力设备确定为目标用户对应的目标算力设备。
2、现有最接近的技术方案,《可灵活配置的算力调度实现方法、装置及存储介质》,申请公布号:cn 114461382 a。现有技术方案存在以下缺点:第一,只考虑设备下限,未考虑设备上限,存在小算力需求算法占用高配置服务器,造成高算力要求算法等待等算力浪费的场景的发生;只考虑向下路径选择,未考虑由于网络或其他场景导致的调用失败补偿场景。第二、只考虑服务器性能,未考虑网络可达性,网络质量。第三、资源的使用情况不够精细化,仅考虑资源利用率,未考虑资源平衡性、资源成本,响应时间。
技术实现思路
1、本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
2、为此,本发明提出了一种分层算力调度方法,为服务器资源利用率的提升和系统整体成本的优化提供了有效的技术解决方案,虑资源空闲率、资源负载情况、资源价格和响应速度等服务器性能参数,首先通过资源空闲率和资源负载情况全面地衡量资源利用率,再基于资源价格降低资源整体成本,最后通过响应速度综合衡量当前服务器性能。
3、本发明的另一个目的在于提出一种分层算力调度系统。
4、本发明的第三个目的在于提出一种计算机设备。
5、本发明的第四个目的在于提出一种非临时性计算机可读存储介质。
6、为达上述目的,本发明一方面提出一种分层算力调度方法,包括:
7、利用算力调度系统接收并解析用户算力请求以确定请求类别;
8、根据所述请求类别确定对应所述用户算力请求的任务类型;
9、基于所述任务类型将所述用户算力请求拆分为若干个子任务,并根据子任务的优先级信息下发任务调度的调用请求;
10、响应所述调用请求,以基于所述子任务的优先级信息和所述任务类型进行分层筛选确定执行任务调度的最终服务器。
11、本发明实施例的分层算力调度方法还可以具有以下附加技术特征:
12、在本发明的一个实施例中,所述任务类型,包括聚类任务、人物聚类任务、事物聚类任务和特征提取任务;所述算力调度系统,包括原子ai能力预设模块、任务调度模块和cpu分层算力调度模块中的多种。
13、在本发明的一个实施例中,基于所述任务类型将所述用户算力请求拆分为若干个子任务,并根据子任务的优先级信息下发任务调度的调用请求,包括:
14、基于任务类型信息以利用所述原子ai能力预设模块确定多个待调度任务,并下发对应所述多个待调度任务的调度指令;
15、响应所述调度指令,利用所述任务调度模块将用户算力请求拆分成对应的子任务,并根据子任务的预设的优先级信息向所述cpu分层算力调度模块下发所述多个待调度任务的任务调度的调用请求。
16、在本发明的一个实施例中,所述方法还包括:响应所述调用请求,以利用所述cpu分层算力调度模块判断服务器参数是否满足预设要求,以根据判断结果对所有服务器进行筛选得到目标调度服务器集群,包括:
17、利用所述cpu分层算力调度模块筛选所有服务器的最后一次上报时间,判断上报时间是否超时,并将不可达的服务器进行过滤以得到第一服务器集合;
18、判断所述第一服务器集合中服务器的空闲cpu和内存是否满足使用需求,并将不满足需求的服务器进行过滤以得到第二服务器集合;
19、判断第二服务器集合中服务器是否进入内存和cpu压力状态,并将内存和cpu使用率超过预设百分比的服务器进行过滤得到目标调度服务器集群,以得到第三服务器集合。
20、在本发明的一个实施例中,基于所述子任务的优先级信息和所述任务类型进行分层筛选确定执行任务调度的最终服务器,包括:
21、基于余弦相似度和服务器参数对目标调度服务器集群中的服务器进行分组以划分得到不同组别服务器,并对所述不同组别服务器的服务器参数进行评分以根据评分结果得到第四服务器集合;
22、基于当前用户和第四服务器集合中服务器的距离得到第五服务器集合,并根据任务类型标签对第五服务器集合中的服务器进行评分排序以根据排序结果匹配任务类型标签得到第六服务器集合,以及根据子任务的优先级信息确定确认执行任务调度的最终服务器。
23、在本发明的一个实施例中,根据任务类型标签对第五服务器集合中的服务器进行评分排序以根据排序结果匹配任务类型标得到第六服务器集合,包括:
24、根据当前用户ip地址确定第五服务器集合中服务器的地理位置,并根据任务类型标签确定当前用户倾向的服务器类型;
25、根据倾向的服务器类型以按评分对第五服务器集合中的服务器进行倒序排序得到倒序排序结果;
26、根据所述倒序排序结果匹配任务类型标签以得到服务器匹配结果,并基于所述服务器匹配结果得到第六服务器集合,以及输出第六服务器集合中所述地理位置相近的服务器数量。
27、在本发明的一个实施例中,基于余弦相似度和服务器参数对目标调度服务器集群中的服务器进行分组以划分得到不同组别服务器,包括:
28、基于服务器参数得到服务器指标向量,并将所述服务器指标向量与业务需求指标向量进行余弦相似度计算得到余弦相似度值;
29、基于所述余弦相似度值对所述第三服务器集合中的服务器进行排序划分以划分得到不同组别服务器。
30、为达上述目的,本发明另一方面提出一种分层算力调度系统,包括:
31、请求类别确定模块,用于利用算力调度系统接收并解析用户算力请求以确定请求类别;
32、任务类型确定模块,用于根据所述请求类别确定对应所述用户算力请求的任务类型;
33、调用请求下发模块,用于基于所述任务类型将所述用户算力请求拆分为若干个子任务,并根据子任务的优先级信息下发任务调度的调用请求;
34、任务调度执行模块,用于响应所述调用请求,以基于所述子任务的优先级信息和所述任务类型进行分层筛选确定执行任务调度的最终服务器。
35、本发明实施例的分层算力调度方法和系统,考虑通过分层筛选服务器,能够避免低配置要求任务占用高配置服务器,造成高配置要求任务阻塞的情况。
36、为达上述目的,本技术第三方面实施例提出了一种计算机设备,包括:处理器和存储器;其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如第一方面实施例所述的分层算力调度方法。
37、为达上述目的,本技术第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面实施例所述的分层算力调度方法。
38、本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。