用于协调解聚的加速器装置资源的技术的制作方法

文档序号:17049187发布日期:2019-03-05 19:51阅读:216来源:国知局
用于协调解聚的加速器装置资源的技术的制作方法

本申请要求2016年11月29日提交的美国临时专利申请no.62/427,268和2017年8月30日提交的印度临时专利申请no.201741030632的权益。



背景技术:

在现代云环境中,计算装置(有时称为计算滑板(sled))托管每个执行特定功能的许多计算机应用(例如,工作负荷)。每个应用要求处理能力来完成各种应用任务(例如,工作负荷内的操作、功能、进程),例如数据处理,但还有输入和输出任务,例如显示数据、接收数据等等。使用实施复杂逻辑序列的计算机程序来处理许多上面提到的任务。当由专用组件(例如现场可编程门阵列、专用集成电路(asic)或特定地配置用于执行此类计算的其它装置(例如,加速器装置))实行时,此类逻辑序列常常更快地执行。可以使用例如硬件定义语言来配置加速器装置,以执行由计算机应用指配的任务。

给定加速器装置通常专用于执行具体类型的任务(例如,加密、压缩等),计算装置的操作系统或在计算装置上执行的应用典型地必须识别一个或多个加速器装置的可用特征并管理与一个或多个加速器装置进行的通信,从而减损可能以其它方式耗费在执行应用上的计算资源(例如,处理器周期)。

附图说明

本文描述的概念通过示例方式而不是通过限制方式而在附图中示出。为了说明的简单性和清楚性,附图中示出的元件不一定按比例绘制。在认为适当的情况下,在附图间重复参考标记以指示对应或类似的元件。

图1是其中可以根据各种实施例实现本文描述的一种或多种技术的数据中心的概念性概述的图;

图2是图1的数据中心的机架(rack)的逻辑配置的示例实施例的图;

图3是根据各种实施例的其中可以实现本文描述的一种或多种技术的另一数据中心的示例实施例的图;

图4是根据各种实施例的其中可以实现本文描述的一种或多种技术的数据中心的另一示例实施例的图;

图5是表示可以在图1、3和4的数据中心的各种滑板(sled)之间建立的链路层连接性的连接性方案的图;

图6是根据一些实施例的可以表示图1-4中描绘机架的任何具体一个的架构的机架架构的图;

图7是可以与图6的机架架构一起使用的滑板的示例实施例的图;

图8是为以扩展能力为特征的滑板提供支持的机架架构的示例实施例的图;

图9是根据图8的机架架构实现的机架的示例实施例的图。;

图10是设计用于与图9的机架结合使用的滑板的示例实施例的图;

图11是根据各种实施例的其中可以实现本文描述的一种或多种技术的数据中心的示例实施例的图;

图12是用于使用池化系统管理引擎(psme)装置管理解聚的加速器资源的系统的至少一个实施例的简化框图;

图13是图12的系统的计算滑板的至少一个实施例的简化框图;

图14是可由图12和图13的计算滑板建立的环境的至少一个实施例的简化框图;以及

图15-18是可以由图12和图13的计算滑板执行的用于管理解聚的加速器资源的方法的至少一个实施例的简化流程图。

具体实施方式

虽然本公开的概念容许各种修改和备选形式,其特定实施例已通过示例方式在附图中示出并且将在本文中详细描述。然而,应该理解的是,不存在将本公开的概念限制于所公开的具体形式的意图,而是相反,意图是要覆盖与本公开和所附权利要求一致的所有修改、等效和备选方案。

在说明书中引用“一个实施例”、“实施例”、“说明性实施例”等指示所描述的实施例可包括具体特征、结构或特性,但每一个实施例可以或者可以不必要地包括该具体特征、结构或特性。此外,此类短语不一定是指相同实施例。此外,当具体特征、结构或特性联系实施例进行描述时,认为它在本领域技术人员的知识范围内,以便联系其它实施例实施此类特征、结构或特性(不管是否明确描述)。此外,应该意识到,包含在以“至少一个a、b和c”的形式的列表中的项可表示:(a);(b);(c);(a和b);(a和c);(b和c)或(a、b和c)。类似地,以“a、b或c中的至少一个”形式列出的项可表示:(a);(b);(c);(a和b);(a和c);(b和c);或(a,b和c)。

所公开的实施例在一些情况下可用硬件、固件、软件或其任何组合来实现。所公开的实施例也可作为由暂时性或非暂时性机器可读(例如计算机可读)介质携带或存储在其上的指令而被实现,其可由一个或多个处理器读取和执行。机器可读存储介质可被实施为用于存储或传送以由机器(例如易失性或非易失性存储器、媒体盘或其它媒体装置)可读形式的信息的任何存储装置、机制或其它物理结构。

在附图中,一些结构特征或方法特征可按特定布置和/或排序示出。然而,应该意识到,可能不要求此类特定布置和/或排序。而是,在一些实施例中,此类特征可按与在说明性附图中示出的不同的方式和/或顺序布置。此外,在具体附图中包括结构或方法特征不打算意指在所有实施例中要求此类特征,并且在一些实施例中,此类特征可以不被包括或者可以与其它特征组合。

图1示出了根据各种实施例的数据中心100的概念性概述,所述数据中心100通常可以表示数据中心或其它类型的计算网络,在其中/针对其可以实现本文描述的一种或多种技术。如图1中所示的,数据中心100通常可以包含多个机架,每个机架可以容纳包括相应的物理资源集合的计算装备。在图1中描绘的具体非限制性示例中,数据中心100包含四个机架102a至102d,其容纳包括物理资源(pcr)105a至105d的相应集合的计算装备。根据此示例,数据中心100的物理资源106的共同集合包括分布在机架102a至102d之间的物理资源105a至105d的各种集合。物理资源106可以包括多种类型的资源,诸如-例如-处理器、协处理器、加速器、现场可编程门阵列(fpga)、存储器和存储装置。实施例不限于这些示例。

说明性数据中心100在许多方面不同于典型的数据中心。例如,在说明性实施例中,其上放置诸如cpu、存储器和其它组件的组件的电路板(“滑板”)针对增加的热性能而设计。尤其,在说明性实施例中,滑板比典型的板更浅薄。换句话说,滑板从前到后较短(其中冷却风扇位于其处)。这降低了空气必须行进跨过板上组件的路径的长度。此外,滑板上的组件比起在典型的电路板中要间隔得更远,并且所述组件被布置成减少或消除遮蔽(即,另一组件的空气流动路径中的一个组件)。在说明性实施例中,诸如处理器的处理组件位于滑板的顶侧上,而诸如dimm的附近存储器位于滑板的底侧上。作为通过此设计提供的增强的气流的结果,组件可以以比在典型系统更高的频率和功率级操作,由此增加性能。此外,滑板配置成与每个机架102a、102b、102c、102d中的功率和数据通信缆线盲配对,从而增强它们被快速移除、升级、重新安装和/或更换的能力。类似地,位于滑板上的各个组件(例如处理器、加速器、存储器和数据存储驱动器)配置成被容易地升级(由于它们彼此增加的间隔)。在说明性实施例中,组件附加地包括硬件证明特征以证实其可靠性。

此外,在说明性实施例中,数据中心100利用支持多个其它网络架构(包括以太网和omni-path)的单个网络架构(“组构”)。在说明性实施例中,滑板经由光纤耦合到交换机,其提供比典型双绞线缆线(例如,类别5、类别5e、类别6等)更高的带宽和更低的时延。由于高带宽、低时延互连和网络架构,数据中心100可以使用物理上解聚的池资源(例如存储器,加速器(例如,图形加速器、fpga、asic等),以及数据存储驱动器),并在按需的基础上将它们提供给计算资源(例如,处理器),使计算资源能够访问池化资源(就好像它们是本地的)。说明性数据中心100附加地接收各种资源的利用信息,基于过去的资源利用预测不同类型的工作负荷的资源利用,并基于此信息动态地重新分配资源。

数据中心100的机架102a、102b、102c、102d可以包括促进各种各样类型的维护任务的自动化的物理设计特征。例如,数据中心100可以使用设计成机器人式访问并且接受和容纳机器人式可操纵的资源滑板的机架来实现。此外,在说明性实施例中,机架102a、102b、102c、102d包括集成功率源,其接收比对于功率源典型的电压更大的电压。增加的电压使功率源能够将附加功率提供到每个滑板上的组件,使组件能够以高于典型频率的频率进行操作。

图2示出了数据中心100的机架202的示范逻辑配置。如图2中所示的,机架202通常可以容纳多个滑板,每个滑板可以包括相应的物理资源集合。在图2中描绘的具体非限制性示例中,机架202容纳包括物理资源205-1至205-4的相应集合的滑板204-1至204-4,其每个构成在机架202中包括的物理资源206的共同集合的一部分。针对于图1,如果机架202表示-例如-机架102a,则物理资源206可以对应于机架102a中包括的物理资源105a。在此示例的上下文中,物理资源105a因此可以由物理资源的相应集合组成,包括在机架202的滑板204-1至204-4中包括的物理存储资源205-1、物理加速器资源205-2、物理存储器资源205-3和物理计算资源205。实施例不限于此示例。每个滑板可以包含各种类型的物理资源(例如,计算、存储器、加速器、存储)中的每个的池。通过具有包括解聚资源的机器人式可访问和机器人式可操纵的滑板,每种类型的资源可以彼此独立地并且以其自己的优化刷新率升级。

图3示出了根据各种实施例的数据中心300的示例,所述数据中心300通常可以表示在其中/针对其可以实现本文描述的一种或多种技术的数据中心。在图3中描绘的具体非限制性示例中,数据中心300包括机架302-1至302-32。在各种实施例中,数据中心300的机架可以以如定义和/或适应各种访问路径的此种方式布置。例如,如图3中所示的,数据中心300的机架可以以如定义和/或适应访问路径311a、311b、311c和311d的此种方式布置。在一些实施例中,此类访问路径的存在可以通常使自动化维护装备(例如机器人维护装备)能够以物理地访问容纳在数据中心300的各种机架中的计算装备并执行自动化维护任务(例如,替换故障的滑板、升级滑板)。在各种实施例中,可以选择访问路径311a、311b、311c和311d的尺寸、机架302-1至302-32的尺寸,和/或数据中心300的物理布局的一个或多个其它方面以促进此类自动化操作。实施例不限于在此上下文中。

图4示出了根据各种实施例的数据中心400的示例,所述数据中心400通常可以表示在其中/针对其可以实现本文描述的一种或多种技术的数据中心。如图4中所示的,数据中心400可以以光组构412为特征。光组构412通常可以包括光信令媒体(例如光缆)和光交换基础设施的组合,数据中心400中的任何具体滑板可以经由它们将信号发送到数据中心400中的每个其它滑板以及接收来自数据中心400中的每个其它滑板的信号。光组构412提供到任何给定滑板的信令连接性可以包括到相同机架中的其它滑板和其它机架中的滑板二者的连接性。在图4中描绘的具体非限制性示例中,数据中心400包括四个机架402a至402d。机架402a至402d容纳滑板的相应对404a-1和404a-2、404b-1和404b-2、404c-1和404c-2以及404d-1和404d-2。因此,在此示例中,数据中心400包括总共八个滑板。经由光组构412,每个此类滑板可以拥有与数据中心400中的其它七个滑板中的每个的信令连接性。例如,经由光组构412,机架402a中的滑板404a-1可以拥有与机架402a中的滑板404a-2的信令连接性,以及与分布在数据中心400的其它机架402b、402c和402d之间的其它六个滑板404b-1、404b-2、404c-1、404c-2、404d-1和404d-2的信令连接性。实施例不限于此示例。

图5示出了连接性方案500的概述,所述连接性方案500通常可以表示在一些实施例中可以在数据中心(例如图1、3和4的示例数据中心100、300和400中的任何一个)的各种滑板之间建立的链路层连接性。可以使用以双模光交换基础设施514为特征的光组构来实现连接性方案500。双模光交换基础设施514通常可以包括交换基础设施,其能够根据多个链路层协议经由相同的统一光信令媒体集合接收通信,并适当地交换此类通信。在各种实施例中,可以使用一个或多个双模光交换机515来实现双模光交换基础设施514。在各种实施例中,双模光交换机515通常可以包括高基(high-radix)交换机。在一些实施例中,双模光交换机515可以包括多层交换机,例如四层交换机。在各种实施例中,双模光交换机515可以以集成硅光子学为特征(与常规交换装置相比,使它们能够通过显着减少的时延交换通信)。在一些实施例中,双模光交换机515可以构成叶脊架构中的叶交换机530,其附加地包括一个或多个双模光脊交换机520。

在各种实施例中,双模光交换机可以能够经由光组构的光信令媒体接收携带因特网协议(ip分组)的以太网协议通信和根据第二高性能计算(hpc)链路层协议(例如,intel的omni-path架构,infiniband)的通信。如图5中所反映的,针对于拥有到光组构的光信令连接性的滑板504a和504b的任何具体对,连接性方案500因此可以经由以太网链路和hpc链路提供对链路层连接性的支持。因此,可以由单个高带宽、低时延交换组构支持以太网和hpc通信二者。实施例不限于此示例。

图6示出了根据一些实施例的机架架构600的一般概述,所述机架架构600可以表示图1至4中描绘的机架中的任何具体架构。如图6中所反映的,机架架构600通常可以以滑板可以插入其中的多个滑板空间为特征,每个滑板空间可以经由机架访问区域601而机器人式可访问。在图6中描绘的具体非限制性示例中,机架架构600以五个滑板空间603-1至603-5为特征。滑板空间603-1至603-5以相应的多功能连接器模块(mpcm)616-1至616-5为特征。

图7示出了可以表示此类类型的滑板的滑板704的示例。如图7中所示的,滑板704可以包括物理资源705集合,以及mpcm716,其被设计成当滑板704插入到滑板空间(例如图6的任何滑板空间603-1至603-5)中时与对应物mpcm耦合。滑板704还可以以扩展连接器717为特征。扩展连接器717通常可以包括插座、插槽或其它类型的连接元件(其能够接受一种或多种类型的扩展模块,例如扩展滑板718)。通过与扩展滑板718上的对应物连接器耦合,扩展连接器717可以为物理资源705提供对驻留在扩展滑板718上的补充计算资源705b的访问。实施例不限于在此上下文中。

图8示出了可以表示机架架构的机架架构800的示例,所述机架架构可以被实现以便为以扩展能力为特征的滑板(例如图7的滑板704)提供支持。在图8中描绘的具体非限制性示例中,机架架构800包括七个滑板空间803-1至803-7,其以相应的mpcm816-1至816-7为特征。滑板空间803-1至803-7包括相应的主区域803-1a至803-7a和相应的扩展区域803-1b至803-7b。针对于每个此类滑板空间,当对应的mpcm与插入的滑板的对应物mpcm耦合时,主区域通常可以构成滑板空间的区域,其可以物理地适应插入的滑板。扩展区域通常可以构成滑板空间的区域,其可以物理地适应扩展模块,例如图7的扩展滑板718(在插入的滑板配置有此类模块的情况下)。

图9示出了根据一些实施例的机架902的示例,其可以表示根据图8的机架架构800实现的机架。在图9中描绘的具体非限制性示例中,机架902以七个滑板空间903-1至903-7为特征,其包括相应的主区域903-1a至903-7a和相应的扩展区域903-1b至903-7b。在各种实施例中,可以使用空气冷却系统来实现机架902中的温度控制。例如,如图9中所反映的,机架902可以以多个风扇919为特征,风扇919通常布置成在各种滑板空间903-1至903-7内提供空气冷却。在一些实施例中,滑板空间的高度大于常规的“1u”服务器高度。在此类实施例中,如与常规机架配置中使用的风扇相比,风扇919通常可以包括相对慢的大直径冷却风扇。相对于以较高速度运行的较小直径的冷却风扇,以较低的速度运行较大直径的冷却风扇可以增加风扇寿命,同时仍然提供相同的冷却量。滑板比常规的机架尺寸物理上更浅薄。此外,在每个滑板上布置组件以减少热遮蔽(即,不在气流方向上串联布置)。因此,更宽、更浅薄的滑板允许装置性能的增加,因为由于改进的冷却(即,没有热遮蔽、装置之间的更多空间、针对更大散热器的更多空间等),装置可以以更高的热封套(例如,250w)操作。

mpcm916-1至916-7可以配置成为插入的滑板提供对由相应的功率模块920-1至920-7供应的功率的使用,每个功率模块可以从外部功率源921提取功率。在各种实施例中,外部功率源921可以向机架902递送交流(ac)功率,并且功率模块920-1至920-7可以配置成将此类ac功率转换为要供应到插入的滑板的直流(dc)功率。在一些实施例中,例如,功率模块920-1至920-7可以配置成将277伏ac功率转换成12伏dc功率,以经由相应的mpcm916-1至916-7提供给插入的滑板。实施例不限于此示例。

mpcm916-1至916-7还可以被布置成为插入的滑板提供到双模光交换基础设施914的光信令连接性,双模光交换基础设施914可以与图5的双模光交换基础设施514相同或与其类似。在各种实施例中,包含在mpcm916-1至916-7中的光连接器可以被设计成与插入的滑板的mpcm中包含的对应物光连接器耦合,以经由相应长度的光缆922-1至922-7为此类滑板提供到双模光交换基础设施914的光信令连接性。在一些实施例中,每个此类长度的光缆可以从其对应的mpcm延伸到在机架902的滑板空间外部的光互连织机(loom)923。在各种实施例中,光互连织机923可以布置成通过支撑柱或者机架902的其它类型的负荷承载元件。实施例不限于在此上下文中。由于插入的滑板经由mpcm连接到光交换基础设施,因此可以节省通常花费在手动配置机架缆线以适应新插入的滑板的资源。

图10示出了根据一些实施例的滑板1004的示例,其可以表示设计用于与图9的机架902结合使用的滑板。滑板1004可以以mpcm1016为特征,mpcm1016包括光连接器1016a和功率连接器1016b,并且被设计成与滑板空间的对应物mpcm耦合(与将mpcm1016插入到该滑板空间中结合)。将mpcm1016与此类对应物mpcm耦合可以使功率连接器1016与对应物mpcm中包括的功率连接器耦合。这通常可以使滑板1004的物理资源1005能够经由功率连接器1016和功率传输媒体1024从外部源供应功率,功率传输媒体1024将功率连接器1016导电地耦合到物理资源1005。

滑板1004还可以包括双模光网络接口电路1026。双模光网络接口电路1026通常可以包括能够根据由图9的双模光交换基础设施914支持的多个链路层协议中的每个通过光信令媒体进行通信的电路。在一些实施例中,双模光网络接口电路1026可以具有以太网协议通信和根据第二高性能协议的通信二者的能力。在各种实施例中,双模光网络接口电路1026可以包括一个或多个光收发器模块1027,每个光收发器模块1027可以能够通过一个或多个光通道中的每个来传送和接收光信号。实施例不限于在此上下文中。

将mpcm1016与给定机架中的滑板空间的对应物mpcm耦合可以使光连接器1016a与对应物mpcm中包括的光连接器耦合。这通常可以经由光通道1025集合中的每个在双模光网络接口电路1026和滑板的光缆之间建立光连接性。双模光网络接口电路1026可以经由电信令媒体1028与滑板1004的物理资源1005通信。除了用于提供改进的冷却并使能以相对较高的热封套(例如,250w)操作的滑板上的组件的布置和滑板的尺寸之外(如上面参考图9所描述的),在一些实施例中,滑板可包括一个或多个附加特征以促进空气冷却,例如热管和/或散热器(布置成耗散由物理资源1005生成的热)。值得注意的是,尽管图10中描绘的示例滑板1004没有以扩展连接器为特征,但以滑板1004的设计元件为特征的任何给定滑板也可以根据一些实施例以扩展连接器为特征。实施例不限于在此上下文中。

图11示出了根据各种实施例的数据中心1100的示例,所述数据中心1100通常可以表示在其中/针对其可实现本文描述的一种或多种技术的数据中心。如图11中反映的,可以实现物理基础设施管理框架1150a以促进管理数据中心1100的物理基础设施1100a。在各种实施例中,物理基础设施管理框架1150a的一个功能可以将要管理数据中心1100内的自动化维护功能,例如使用机器人维护装备来服务物理基础设施1100a内的计算装备。在一些实施例中,物理基础设施1100a可以以先进的遥测系统为特征,所述遥测系统执行遥测报告,所述遥测报告足够鲁棒以支持物理基础设施1100a的远程自动化管理。在各种实施例中,由此类先进的遥测系统提供的遥测信息可以支持诸如故障预测/预防能力和容量规划能力的特征。在一些实施例中,物理基础设施管理框架1150a还可以配置成使用硬件证明技术来管理物理基础设施组件的认证。例如,机器人可以在安装之前通过分析从与要安装的每个组件关联的射频标识(rfid)标签收集的信息来验证组件的可靠性。实施例不限于在此上下文中。

如图11中所示的,数据中心1100的物理基础设施1100a可以包括光组构1112,其可以包括双模光交换基础设施1114。光组构1112和双模光交换基础设施1114可以分别与图4的光组构412和图5的双模光交换基础设施514相同或与其类似,并且可以在数据中心1100的滑板之间提供高带宽、低时延、多协议连接性。如上面所讨论的,参考图1,在各种实施例中,此类连接性的可用性可以使解聚和动态地池化诸如加速器、存储器和存储的资源可行。在一些实施例中,例如,一个或多个池化加速器滑板1130可以包括在数据中心1100的物理基础设施1100a之间,每个物理基础设施1100a可以包括加速器资源池-例如协处理器和/或fpga-例如-其经由光组构1112和双模光交换基础设施1114对其它滑板全局可访问。

在另一示例中,在各种实施例中,一个或多个池化存储滑板1132可以包括在数据中心1100的物理基础设施1100a之间,每个物理基础设施1100a可以包括经由光组构1112和双模光交换基础设施1114对其它滑板全局可访问的存储资源池。在一些实施例中,此类池化存储滑板1132可以包括固态存储装置(例如固态驱动器(ssd))的池。在各种实施例中,一个或多个高性能处理滑板1134可以包括在数据中心1100的物理基础设施1100a之间。在一些实施例中,高性能处理滑板1134可以包括高性能处理器池以及冷却特征(其增强空气冷却以产生高达250w或更高的较高热封套)。在各种实施例中,任何给定的高性能处理滑板1134可以以扩展连接器1117为特征,所述扩展连接器1117可以接受远存储器扩展滑板,使得对该高性能处理滑板1134本地可用的远存储器从包括在该滑板上的近存储器以及处理器中解聚。在一些实施例中,此类高性能处理滑板1134可以被配置有远存储器(使用包括低时延ssd存储装置的扩展滑板)。光基础设施允许一个滑板上的计算资源以利用远程加速器/fpga、存储器和/或ssd资源(其在位于相同机架或数据中心中的任何其它机架上的滑板上解聚)。在上面参考图5描述的脊-叶网络架构中,远程资源可以位于距一个交换机跳或距两个交换机跳的距离。实施例不限于在此上下文中。

在各种实施例中,可以将一个或多个抽象的层应用于物理基础设施1100a的物理资源,以便定义虚拟基础设施,例如软件定义的基础设施1100b。在一些实施例中,可以分配软件定义的基础设施1100/b的虚拟计算资源1136以支持云服务1140的提供。在各种实施例中,可以对虚拟计算资源1136的具体集合进行分组以用于提供到云服务1140(以sdi服务1138的形式)。云服务1140的示例可以包括-但不限于-软件即服务(saas)服务1142、平台即服务(paas)服务1144,以及基础设施即服务(iaas)服务1146。

在一些实施例中,可以使用虚拟基础设施管理框架1150b来进行软件定义的基础设施1100b的管理。在各种实施例中,虚拟基础设施管理框架1150b可以被设计成结合管理到云服务1140的虚拟计算资源1136和/或sdi服务1138的分配来实现工作负荷指纹识别技术和/或机器学习技术。在一些实施例中,虚拟基础设施管理框架1150b可以结合执行此类资源分配来使用/咨询遥测数据。在各种实施例中,可以实现应用/服务管理框架1150c,以便为云服务1140提供qos管理能力。实施例不限于在此上下文中。

现在参考图12,用于管理解聚的架构中的解聚的加速器资源的系统1210可以根据上面参考图1、3、4和11描述的数据中心100、300、400、1100来实现。在说明性实施例中,管理解聚的加速器资源意味着通过从应用接收工作负荷处理请求并将全部或部分工作负荷分发到加速器装置来促进应用工作负荷处理。基于配置和容量来选择这些加速器装置以有效地处理应用工作负荷(例如,加密操作、压缩操作、图像处理操作、分组检查操作等)。加速器装置可以位于正执行应用的相同计算装置(例如,计算滑板)上和/或位于可能以其它方式对应用不可访问的一个或多个远程计算装置(例如,远程加速器滑板)上。工作负荷处理请求由池化系统管理引擎(psme)接收和实现,所述池化系统管理引擎可以本地安装在与请求工作负荷处理的应用相同的宿主计算装置上。术语“psme”是由intel公司使用的命名法,并且在本文中仅出于方便而使用。应该理解的是,psme可以实施为任何滑板-、机架-或托盘-级管理引擎。扩展psme的开箱即用(out-of-box)功能以提供本文描述的解聚加速器管理能力,使得应用可以利用可能以其它方式不可访问的加速器装置。

在说明性实施例中,系统1210包括与计算滑板1230、1232和加速器滑板1260、1262通信的协调器服务器1216。在说明性实施例中,协调器服务器1216包括在计算滑板1218内。可以将滑板1230、1232、1260或1262中的一个或多个分组到管理的节点中(例如通过协调器服务器1216),以共同执行工作负荷,例如应用。管理的节点可以实施为资源(例如,物理资源206)的组合体,诸如计算资源(例如,物理计算资源205-4)、存储器资源(例如,物理存储器资源205-3)、存储资源(例如,物理存储资源205-1)或来自相同或不同滑板(例如,滑板204-1、204-2、204-3、204-4)或机架(例如,机架302-1至302-32中的一个或多个)的其它资源(例如,物理加速器资源205-2)。此外,可以在要将工作负荷指配到管理的节点的时间或者在任何其它时间由协调器服务器1216建立、定义或“旋转加速(spinup)”管理的节点,并且管理的节点可以存在,而不管任何工作负荷当前是否被指配到管理的节点。系统1210可以位于数据中心中,并且向通过网络1212与系统1210通信的客户端装置1214提供存储和计算服务(例如,云服务)。协调器服务器1216可以支持云操作环境。例如openstack,以及由协调器服务器1216建立的管理的节点可以代表客户端装置1214的用户执行一个或多个应用或进程(即,工作负荷),例如在虚拟机或容器中。在说明性实施例中,计算滑板1230通过一个或多个处理器1250执行工作负荷1234(例如,应用),并且计算滑板1232通过一个或多个处理器1252执行另一工作负荷1236(例如,另一应用)。此外,计算滑板1230和1232中的一个或多个可以托管psme1270,psme1270配置成执行上面描述的解聚的加速器资源管理功能。此外,加速器滑板1260包括一个或多个加速器装置1264(例如,物理加速器资源205-2),并且加速器滑板1266还包括一个或多个加速器装置1266(例如,物理加速器资源205-2)。

如本文更详细描述的,配备有psme1270的滑板(例如,计算滑板1230)可以检测数据中心(例如,系统1210)内的加速器装置,包括发现关于每个检测到的加速器装置的信息(例如,处理能力、配置、专用功能性、平均利用等等),从应用接收对帮助加速应用的执行的请求,并且基于发现进程和来自应用的请求的分析,滑板(使用psme1270)可以调度应用的一个或多个部分(例如,任务),从而由系统1210中可用的适合于加速任务的对应加速器装置加速(例如,在包括用于执行加密操作的专用电路的加速器装置上调度加密相关的任务)。此外,在说明性实施例中,psme1270在带外执行上面功能(例如,无需消耗会以其它方式用于执行应用和/或基础操作系统的滑板的计算容量)。

现在参考图13,计算滑板1230可以实施为能够执行本文描述的功能的任何类型的计算装置,所述功能包括执行工作负荷(例如,工作负荷1234),从工作负荷1234获得加速工作负荷的执行的请求,识别在系统1210中可用的加速器装置(在系统1210内,例如在计算滑板1230上和/或其它滑板1232、1260、1262中),其包括它们的特征(例如,每个加速器装置能够加速的功能类型)和可用性(例如,当前负载),以及选择加速器装置中的一个或多个以执行工作负荷的一个或多个部分(例如,任务)以增加工作负荷的执行速度。在说明性实施例中,计算滑板1230执行上面功能而不消耗会以其它方式由应用(例如,工作负荷)和/或支持所述应用的操作系统使用的计算容量。

如图13中所示的,说明性计算滑板1230包括计算引擎1302、输入/输出(i/o)子系统1308、通信电路1310,以及一个或多个数据存储装置1314。计算滑板1230还可以包括一个或多个加速器(描绘为加速器1320和1322)。当然,在其它实施例中,计算滑板1230可以包括其它或附加组件,例如通常在计算机中找到的那些组件(例如,显示器,外设装置等)。此外,在一些实施例中,一个或多个说明性组件可以结合在另一组件中,或者以其它方式形成另一组件的一部分。

计算引擎1302可以实施为能够执行下面描述的各种计算功能的任何类型的装置或装置集合。在一些实施例中,计算引擎1302可以实施为单个装置,诸如集成电路、嵌入式系统,现场可编程门阵列(fpga)、片上系统(soc)或其它集成系统或装置。此外,在一些实施例中,计算引擎1302包括或实施为处理器1304(例如,类似于一个或多个处理器1250)和存储器1306。处理器1304可以实施为能够执行工作负荷(例如,应用1234)的任何类型的处理器。例如,处理器1304可以实施为一个或多个单核或多核处理器、微控制器或其它处理器或处理/控制电路。在一些实施例中,处理器1304可以实施为,包括或耦合到fpga、专用集成电路(asic)、可重新配置硬件或硬件电路或其它专用硬件,以促进执行本文描述的功能。在一些实施例中,psme1270可以包括在专用处理器1305内,专用处理器1305与执行计算引擎1302的其它计算功能(例如,执行应用)的处理器1304分开。psme1270可以实施为专用装置,诸如协处理器、fpga、图形处理单元(gpu)或asic,以用于执行上面描述的加速器资源管理操作。

如本文更详细描述的,psme1270配置成管理解聚的加速器资源(例如,通过利用对于例如针对来自远程加速器(例如,在加速器滑板1260、1262上)的加速器服务的协调器1216的加速器服务请求来响应于工作负荷处理请求)。此外,并且如上面描述的,计算滑板1230包括加速器1320和1322,其可以配置成执行加速任务(例如,对专门配置成执行加密操作的加速器的加密操作)。psme1270配置成以带宽外容量(例如,无需消耗会以其它方式用于执行应用和/或基础操作系统的滑板的计算容量)将来自工作负荷处理请求的工作负荷的全部或部分引导到加速器1320和/或加速器1322(即,由与运行应用和psme1270的计算滑板相同的计算滑板托管的加速器)。在一些实施例中,psme1270配置成如果使用安全和认证的通道也以带内容量(例如,通过消耗会以其它方式用于执行应用和/或基础操作系统的滑板的计算容量)将来自工作负荷处理请求的工作负荷的全部或部分引导到加速器1320和/或加速器1322。

主存储器1306可以实施为能够执行本文描述的功能的任何类型的易失性(例如,动态随机存取存储器(dram)等)或非易失性存储器或数据存储装置。易失性存储器可以是要求具有维护由介质存储的数据的状态的能力的存储介质。易失性存储器的非限制性示例可以包括各种类型的随机存取存储器(ram),诸如动态随机存取存储器(dram)或静态随机存取存储器(sram)。可以在存储器模块中使用的一种具体类型的dram是同步动态随机存取存储器(sdram)。在具体实施例中,存储器组件的dram可符合由jedec颁布的标准,例如针对ddrsdram的jesd79f、针对ddr2sdram的jesd79-2f、针对ddr3sdram的jesd79-3f、针对ddr4sdram的jesd79-4a、针对低功率ddr(lpddr)的jesd209、针对lpddr2的jesd209-2、针对lpddr3的jesd209-3以及针对lpddr4的jesd209-4(这些标准在www.jedec.org可得到)。此类标准(以及类似标准)可以被称为基于ddr的标准,并且实现此类标准的存储装置的通信接口可以被称为基于ddr的接口。

在一个实施例中,存储器装置是块可寻址存储器装置,诸如基于nand或nor技术的那些。存储器装置还可以包括未来一代非易失性装置,诸如三维交叉点存储器装置,或其它字节可寻址的位置写入(write-in-place)非易失性存储器装置。在一个实施例中,存储器装置可以是或可以包括使用硫属化物玻璃的存储器装置、多阈值级nand闪存、nor闪存、单级或多级相变存储器(pcm)、电阻存储器、纳米线存储器、铁电晶体管随机存取存储器(fetram)、反铁电存储器、磁阻随机存取存储器(mram)、结合忆阻器技术的存储器、包括金属氧化物基、氧空位基的电阻存储器和导电桥随机存取存储器(cb-ram),或自旋转移力矩(stt)-mram、基于自旋电子磁结点存储器的装置、基于磁隧道结点(mtj)的装置、基于dw(畴壁)和sot(自旋轨道转移)的装置、基于晶闸管的存储器装置或任何上面装置的组合,或其它存储器。存储器装置可以指管芯本身和/或封装的存储器产品。

在一些实施例中,3d交叉点存储器可以包括无晶体管的可堆叠交叉点架构,其中存储器单元位于字线和位线的交叉处并且独立可寻址,并且其中位存储基于块体电阻的改变。在一些实施例中,主存储器1306的全部或一部分可以集成到处理器1304中。在操作中,主存储器1306可以存储在操作期间使用的各种软件和数据,诸如加速器配置数据、加速器目录数据、应用数据、应用、程序、库和驱动器。

计算引擎1302经由i/o子系统1308通信地耦合到计算滑板1230的其它组件,i/o子系统1308可以实施为电路和/或组件以促进与计算引擎1302(例如,与处理器1304和/或主存储器1306)以及计算滑板1230的其它组件的输入/输出操作。例如,i/o子系统1308可以实施为或以其它方式包括存储器控制器中枢、输入/输出控制中枢、集成传感器中枢、固件装置、通信链路(例如,点对点链路、总线链路、电线、缆线、光导线、印刷电路板迹线等),和/或其它组件和子系统,以促进输入/输出操作。在一些实施例中,i/o子系统1308可以形成片上系统(soc)的一部分,并且连同处理器1304、主存储器1306和计算滑板1230的其它组件中的一个或多个结合到计算引擎1302中。

通信电路1310可以实施为任何通信电路、装置或其集合,能够使能计算滑板1230与另一计算装置(例如,协调器服务器1216、和/或一个或多个滑板1230、1232、1260、1262)之间通过网络1212的通信。通信电路1310可以配置成使用任何一种或多种通信技术(例如,有线或无线通信)和关联协议(例如,以太网、蓝牙®、wi-fi®、wimax等)来实现此类通信。

说明性通信电路1310包括网络接口控制器(nic)1312。nic1312可以实施为一个或多个插件板、子卡、网络接口卡、控制器芯片、芯片集或其它装置,其可以由计算滑板1230用来与另一计算装置(例如,协调器服务器1216和/或滑板1232、1260、1262)连接。在一些实施例中,nic1312可以实施为包括一个或多个处理器的片上系统(soc)的一部分,或者包括在也包含一个或多个处理器的多芯片封装上。在一些实施例中,nic1312可以包括本地处理器(未示出)和/或本地存储器(未示出),它们对于nic1312是本地的。在此类实施例中,nic1312的本地处理器可以能够执行本文描述的计算引擎1302的一个或多个功能。附加地或备选地,在此类实施例中,nic1312的本地存储器可以以板级、插座级、芯片级和/或其它级集成到计算滑板1230的一个或多个组件中。在一些实施例中,psme1270可以包括在nic1312中。

一个或多个说明性数据存储装置1314可以实施为被配置用于短期或长期存储数据的任何类型的装置,例如存储器装置和电路、存储器卡、硬盘驱动器、固态驱动器或其它数据存储装置。每个数据存储装置1314可以包括存储数据存储装置1314的数据和固件代码的系统分区。每个数据存储装置1314还可以包括存储针对操作系统的数据文件和可执行文件的操作系统分区。

附加地或备选地,计算滑板1230可以包括一个或多个外设装置1316。此类外设装置1316可以包括通常在计算装置中找到的任何类型的外设装置,例如显示器、扬声器、鼠标、键盘和/或其它输入/输出装置、接口装置和/或其它外设装置。

客户端装置1214、协调器服务器1216和计算滑板1232可以具有与图13中描述的那些组件类似的组件。计算滑板1230的那些组件的描述同样可适用于那些装置的组件的描述,并且为了描述的清楚性本文不再重复,除了客户端装置1214和协调器服务器1216不包括psme1270并且在说明性实施例中,可以不包括加速器1320、1322。此外,应该意识到,客户端装置1214、协调器服务器1216和计算滑板1230、1232中的任何一个可以包括通常在计算装置中找到的装置、子组件和其它组件,它们未参考计算滑板1230而在上面讨论,并且为了描述的清楚性,在本文中未讨论。此外,加速器滑板1260、1262包括与上面描述的那些组件类似的组件,并且应该理解的是,图12中所示的一个或多个加速器1264、1266可以类似于上面参考图13描述的加速器1320、1322。

如上面所描述的,计算滑板1230、协调器服务器1216和滑板1230、1232、1260、1262说明性地经由网络1212进行通信,网络1212可以实施为任何类型的有线或无线通信网络,包括全球网络(例如,互联网)、局域网(lan)或广域网(wan)、蜂窝网络(例如,全球移动通信系统(gsm)、3g、长期演进(lte)、全球微波接入互操作性(wimax)等)、数字订户线(dsl)网络、有线网络(例如,同轴网络、光纤网络等)或其任何组合。

现在参考图14,计算滑板1230可以在操作期间建立环境1400。说明性环境1400包括网络通信器1420和psme管理器1430。环境1400的每个组件可以实施为硬件、固件、软件或其组合。如此,在一些实施例中,环境1400的一个或多个组件可以实施为电路或电气装置的集合(例如,网络通信器电路1420、psme管理器电路1430等)。应该意识到,在此类实施例中,网络通信器电路1420或psme管理器电路1430中的一个或多个可以形成计算引擎1302、psme1270、通信电路1310、i/o子系统1308和/或计算滑板1230的其它组件中的一个或多个的一部分。

此外,说明性环境1400包括加速器配置数据1404,其可以实施为指示加速器配置的任何数据,包括加速器处理速度,每个加速器能够加速的功能类型(例如,加密操作、压缩操作等)、并行处理能力、专用配置模式、加速器架构数据(例如,核的数量)、关联的滑板标识符(例如,关联的加速器滑板标识符)等等。

此外,说明性环境1400包括加速器目录数据1406,其可以实施为指示保持加速器装置、加速器装置类型(例如,fpga,gpu,asic等等)的列表的数据结构的任何数据。此外,加速器目录数据1406可以存储与对应的加速器滑板标识符相关的加速器装置标识符。加速器目录1406还可以包括加速器使用历史数据(例如,最频繁使用加速器的应用、加速器的专用使用或配置,像图形处理或音频处理等等)、加速器性能度量、加速器年龄(age)数据(例如,加速器已连接到协调器服务器1216多长时间,加速器是较新的还是较旧的加速器,它是否先前从现役(commission)中移除)等等。

此外,在说明性实施例中,环境1400包括应用数据1408,其可以实施为指示从psme1270请求工作负荷处理的应用的任何数据。应用数据1408还可以实施为指示应用工作负荷处理请求、工作负荷处理请求的调度(例如,重复请求)等等的任何数据。

在说明性环境1400中,网络通信器1420(其可以实施为如上面所讨论的硬件、固件、软件、虚拟化硬件、仿真架构和/或其组合)配置成促进分别到计算滑板1230的入局网络通信和从计算滑板1230的出局网络通信(例如,网络业务、网络分组、网络流等)。为此,网络通信器1420配置成从一个系统或计算装置(例如,计算滑板1230、1232)接收和处理数据分组,并准备和发送数据分组到另一计算装置或系统(例如,加速器滑板1260、1262)。相应地,在一些实施例中,网络通信器1420的功能性的至少一部分可以由通信电路1310执行,并且在说明性实施例中,由nic1312执行。

psme管理器1430(其可以实施为硬件、固件、软件、虚拟化硬件、仿真架构和/或其组合)配置成跨系统1210提供有效的解聚加速器管理。为此,在说明性实施例中,psme管理器1430包括请求分析器接口1432、加速器选择管理器1434、加速器查询管理器1436和加速器目录管理器1438。在说明性实施例中,请求分析器接口1432配置成处理应用工作负荷处理请求(例如,来自计算滑板1230)(通过接收工作负荷处理请求(例如,源自应用1234的一个请求)、确定是否分析工作负荷处理请求、分析对请求元数据(例如一个或多个请求参数)的工作负荷处理请求、识别与工作负荷处理请求一起传送的每个请求参数、并识别由应用提交的工作负荷。在一些实施例中,请求分析器接口1442可以生成加速器服务请求,所述加速器服务请求被特定地格式化以用于供协调器服务器1216消耗。加速器服务请求配置成包括一个或多个请求参数、由应用传送的工作负荷,以及选择的加速器(例如,加速器1264)(连同关联的加速器滑板标识符(例如,针对加速器滑板1260的))。

在说明性实施例中,加速器选择管理器1434配置成查询加速器目录(例如,如由加速器目录数据1406所表示的),以便识别会最佳适合于处理工作负荷(如由从工作负荷处理请求提取的请求参数定义的)的加速器装置。更具体地,并且如在说明性实施例中指示的,加速器选择管理器1434配置成使用请求参数查询加速器目录,以便定位具有匹配请求参数的配置的加速器装置。如本文更详细描述的,由加速器选择管理器1434执行的查询将返回搜索结果,所述搜索结果包括一个或多个加速器(其配置是针对一个或多个请求参数的匹配)的标识符。基于返回的结果,加速器选择管理器1434配置成收集一个或多个加速器装置标识符的集合,其然后被包括在发送到协调器服务器1216的加速器服务请求内,如上面所描述的。

在说明性实施例中,加速器查询管理器1436配置成向协调器(例如,协调器服务器1216)查询关于对协调器服务器1216可访问或与协调器服务器1216通信的加速器装置的更新信息,以维护和保持当前加速器目录(例如,如由加速器目录数据1406所表示的,或者由加速器目录数据1406和加速器配置数据1404共同表示的)。因此,加速器查询管理器1436周期性地(或按需)将环境发现查询传送到协调器服务器1216以用于加速器更新。加速器更新可以包括用于新连接的加速器、移除的加速器等等的加速器标识符的列表。加速器查询管理器1436还将加速器配置更新查询传送到协调器服务器1216。加速器配置更新查询可以请求协调器服务器1216返回每个识别的加速器的加速器配置数据(例如,以复查任何最近的加速器配置改变)。加速器查询管理器1436还配置成将加速器健康查询传送到协调器服务器1216。在说明性实施例中,加速器健康查询请求关于加速器健康度量的数据,包括加速器运行时间统计、加速器停机时间统计、自加速器启动以来流逝的时间、自加速器重新配置以来流逝的时间、加速器错误统计等等。

在说明性实施例中,加速器目录管理器1438配置成维护与协调器服务器1216通信的所有加速器的当前且连续更新的目录。在说明性实施例中,加速器目录管理器1438接收由加速器查询管理器1436传送的查询的结果。加速器目录管理器1438使用查询结果来更新加速器目录(例如,如由加速器目录数据1406所实施的)。

应该意识到,请求分析器接口1432、加速器选择管理器1434、加速器查询管理器1436和加速器目录管理器1438中的每个可以单独地实施为硬件、固件、软件、虚拟化硬件、仿真架构和/或其组合。例如,请求分析器接口1432可以实施为硬件组件,而加速器选择管理器1434、加速器查询管理器1436和加速器目录管理器1438实施为虚拟化硬件组件或实施为硬件、固件、软件、虚拟化硬件、仿真架构和/或其组合的一些其它组合。此外,应该意识到,在一些实施例中,包含psme1270的滑板1230、1232、1260、1262可以建立类似于上面描述的环境1400的环境。

现在参考图15,在使用中,计算装置(例如,包括psme1270的计算滑板1230)可以执行用于管理解聚的加速器装置资源的方法1500。为简单起见,下面将方法1500描述为由psme1270执行。然而,应该理解,在其它实施例中,方法1500可以由一个或多个其它计算装置(例如,包括psme1270的滑板1232、1260、1262)执行。方法1500以框1501开始,其中psme1270从应用接收工作负荷处理请求。在实施例中,计算滑板1230(或计算滑板1230的一些子组件)可以从应用接收工作负荷处理请求并对其进行处理。在说明性实施例中,psme1270从应用接收工作负荷处理请求,并以带外容量处理工作负荷处理请求(例如,无需使用宿主计算滑板的处理器或操作系统)。如上面所描述的,在一些实施例中,psme1270可以通过安全且认证的通道以带内容量(例如,通过消耗会以其它方式用于执行应用和/或基础操作系统的滑板的计算容量)将来自工作负荷处理请求的工作负荷的全部或部分引导到加速器1320和/或加速器1322。

更具体地,psme1270从在与psme相同的计算滑板上执行的应用接收处理请求。在其它实施例中,psme1270可以从在其它计算滑板上执行的应用接收工作负荷处理请求(例如,经由协调器服务器1216)。方法1500前进到框1502。

在框1502中,如果psme1270确定是否分析工作负荷处理请求,则方法1500前进到框1504。否则,方法返回到框1501。在框1504中,psme1270分析工作负荷处理请求。在说明性实施例中,工作负荷处理请求将包括定义的工作负荷(例如,要由一个或多个加速器装置处理的数据)。此外,并且如框1506中所示的,psme1270从工作负荷处理请求中检索请求元数据。在说明性实施例中,psme1270配置成解析工作负荷处理请求以便识别进一步包括一个或多个请求参数的请求元数据。更具体地,并且如框1508中所示的,psme1270确定工作负荷处理请求内包括的任何服务级别协议(sla)要求。例如,请求参数可以包括特定工作负荷处理要求,诸如最大处理时间(例如,目标时延)、最小吞吐量要求(例如,目标吞吐量)、处理期间所要求的逻辑完整性的阈值级、预定义的错误检查机制或错误率包络等等。元数据可以附加地或备选地指示是否可以同时加速工作负荷的两个或更多部分(例如,并行地)。

方法1500前进到框1510,其中psme1270查询加速器目录(例如,加速器目录1406)以确定针对工作负荷处理请求将会最适合的一个或多个加速器装置。在说明性实施例中,查询可以例如使用请求参数中的一个作为关键。更具体地,psme1270可以向加速器目录查询可以满足某个请求参数(例如,特定sla要求,诸如在最大处理时间内完成处理)的所有加速器装置。例如,并且如框1512中所指示的,psme1270使用加速器标识符从目录中检索加速器实例。加速器标识符可以是作为查询加速器目录的结果所生成的搜索结果的集合的一部分。例如,并且如框1514中所指示的,psme1270查看加速器配置。如更早针对于加速器配置数据1404所描述的,加速器配置可以包括诸如加速器处理速度、加速器能够加速的功能类型、并行处理能力、专用配置模式、加速器架构数据(例如,核的数量)、识别的关联滑板(例如,关联的加速器滑板标识符)等等的数据。

方法1500前进到框1516,其中psme1270基于加速器配置将请求元数据匹配到加速器。例如,psme1270可以确定所识别的加速器实例能够满足工作负荷处理请求中的每个请求参数。作为另一示例,psme1270可以确定单个加速器实例不能满足每个请求参数。相应地,psme1270将从加速器目录检索另一加速器实例(例如,通过重新执行如针对于框1510所描述的查询)。作为结果,psme1270确定可以一起满足工作负荷处理请求中的所有请求参数的加速器资源的组合。

现在参考图16,在使用中,方法1500前进到框1518,其中psme1270确定作为框1510中的查询的结果检索的一个或多个加速器是否能够满足所有请求参数。如果检索到的一个或多个加速器不能够满足所有请求参数,则方法1500返回到框1510以继续向加速器目录查询满足所有请求参数的加速器。在一些实施例中,计算滑板1230可以将具有一个或多个请求参数的请求发送到协调器服务器1216并且作为响应接收能够根据一个或多个请求参数处理工作负荷的一个或多个加速器的标识,而不是本地确定能够满足请求的一个或多个加速器。方法1500前进到框1520。在说明性实施例中,psme1270确定将来自工作负荷处理请求的工作负荷传送到所选择的一个或多个加速器。方法1500前进到框1522,其中psme1270从加速器目录检索所选择的一个或多个加速器的加速器滑板标识符。

使用一个或多个加速器滑板标识符,方法1500前进到框1524。计算滑板1230配置成传送来自协调器服务器1216的传出消息。在说明性实施例中,psme1270将所选择的一个或多个加速器的一个或多个加速器滑板标识符提供到协调器服务器1216(例如,在加速器服务请求中)。方法1500前进到框1526。计算滑板1230配置成从协调器服务器1216接收传入消息。在说明性实施例中,psme1270从协调器服务器1216接收表示协调器服务器1216批准将工作负荷从psme1270传输到识别以处理工作负荷的一个或多个加速器的批准。如更早所描述的,加速器可以由不是psme1270的宿主的加速器滑板托管。在相关实施例中,一个或多个加速器可以对还托管psme1270的计算滑板1230是本地的。方法1500前进到框1528,其中psme1270将工作负荷从应用传送到协调器。在说明性实施例(未示出)中,所识别的加速器将处理如从psme1270提供的工作负荷。加速器将完成处理以生成工作产品。在说明性实施例中,此工作产品可以采用处理的数据的形式。例如,处理的数据可以是加密数据、解密数据、压缩数据、解压缩数据、搜索功能结果、处理的音频或视频数据等等。工作产品也可以是消息代码或通知。例如,工作产品可以是所提供的工作负荷导致音频或视觉显示装置上的某个音频或视觉状态、特定网络状态、远程无线或有线通信的确认、接收或传输信号、测试结果等等的通知。

方法1500前进到框1530,其中psme1270从协调器服务器1216接收工作产品。更具体地,所识别的一个或多个加速器将处理所提供的工作负荷并将得到的工作产品返回到协调器服务器1216。然后,协调器服务器1216将工作产品传送到psme1270。方法1500前进到框1532,其中psme1270将工作产品发送到应用。

现在参考图17,在使用中,计算装置(例如,包括psme1270的计算滑板1230和/或另一滑板1232、1260、1262)可以执行用于管理解聚的加速器装置资源的方法1700。更具体地,方法1700涉及向协调器(例如,协调器服务器1216)查询关于对协调器服务器1216可访问或与协调器服务器1216通信的加速器装置的更新信息。目标是要维护并保持当前加速器目录(例如,如由加速器目录数据1406表示的,或者由加速器目录数据1406和加速器配置数据1404共同表示的)。方法1700在框1702开始,其中psme1270确定是否向协调器查询加速器更新。例如,并且在说明性实施例中,psme1270可以具有定期调度的进程以向协调器服务器1216查询加速器更新。作为另一示例,psme1270配置成通过操作员(例如,计算滑板1230的人力主管)按需查询协调器服务器1216。

方法1700前进到框1704,其中psme1270向协调器服务器1216查询加速器更新。例如,并且如框1706中指示的,psme1270查询已经进入到与协调器服务器1216的通信中的任何新加速器。在相关实施例中,psme1270可以向协调器服务器1216查询连接到协调器服务器1216的所有加速器的加速器标识符。psme1270然后将会将由协调器服务器1216返回的加速器的列表与由psme1270维护的加速器目录进行比较。psme1270使用所述比较来识别新的加速器。此外,并且如框1708中所示的,psme1270向协调器服务器1216查询移除的加速器。类似于框1706,协调器可以返回针对移除的加速器的加速器标识符的列表,psme1270然后使用该加速器标识符来移除其加速器目录中的加速器条目。在相关实施例中,psme1270可以向协调器服务器1216查询连接到协调器服务器1216的所有加速器。psme1270然后将会将由协调器服务器1216返回的加速器列表与由psme1270维护的加速器目录进行比较。psme1270使用所述比较来识别移除的加速器。

此外,并且如框1710中指示的,psme1270将确定加速器配置是否已针对加速器目录中的任何加速器而改变。更具体地,除了如上面针对于框1706和1708所描述的加速器标识符之外,psme1270向协调器服务器1216查询加速器配置数据。例如,psme1270将传送一个或多个加速器标识符连同对针对识别的加速器的加速器配置数据的请求。方法1700前进到框1712,其中psme1270从协调器接收加速器更新。换句话说,协调器服务器1216将响应于所述查询返回加速器配置数据。使用返回的配置数据,psme1270将确定是否针对识别的加速器更新存储在加速器目录内的加速器配置数据。例如,并且如框1714中所指示的,psme1270响应于来自协调器服务器1216的所识别的加速器的改变的配置的通知,更新所识别的加速器的加速器目录条目。

现在参考图18,在使用中,计算装置(例如,包括psme1270的计算滑板1230和/或另一滑板1232、1260、1262)可以执行用于管理解聚的加速器装置资源的方法1800。更具体地,方法1800涉及向协调器(例如,协调器服务器1216)查询关于对协调器服务器1216可访问或与协调器服务器1216通信的加速器装置的健康数据(或状态数据)。

方法1800在框1802开始,其中psme1270确定向协调器服务器1216查询一个或多个加速器健康度量。方法1800前进到框1804,其中psme1270使用特定加速器标识符(例如,加速器1264中的一个的加速器标识符)查询协调器服务器1216。如框1806中所示的,psme1270可以从协调器服务器1216接收加速器健康度量。如本文所使用的,加速器健康度量可以包括加速器运行时间统计、加速器停机时间统计、自加速器启动以来流逝的时间、自加速器重新配置以来流逝的时间、加速器错误统计等等中的一个或多个。此外,并且如框1808中指示的,psme1270可以接收加速器吞吐量度量。如本文所使用的,加速器吞吐量度量可以包括当前加速器处理速度、加速器处理速度历史等等中的一个或多个。此外,并且如框1810中指示的,psme1270可以接收加速器操作状态。如本文所使用的,加速器操作状态可包括加速器温度、净加速器处理负载等等中的一个或多个。

方法1800前进到框1812,其中psme1270确定加速器当前是否满足(或预计满足)如由工作负荷处理请求(例如,上面针对图15和16描述的工作负荷处理请求)定义的一个或多个请求参数。例如,psme1270可以确定所识别的加速器不满足如由工作负荷处理请求的请求参数定义的吞吐量要求(或吞吐量要求的加速器的定义部分)。基于此确定,方法1800前进到框1814,其中psme1270向加速器目录查询替换加速器。更具体地,psme1270使用不再满足一个或多个请求参数的先前识别的加速器(或失效加速器)的加速器配置数据来查询加速器目录。在说明性实施例中,使用上面提到的加速器配置数据查询加速器目录返回至少一个结果(以替换加速器的形式)。所识别的替换加速器能够执行由不再满足请求参数的失效加速器执行的工作负荷。方法1800前进到框1816,其中psme1270将工作负荷路由离开失效加速器并朝向替换加速器。更具体地,psme1270使用加速器标识符执行图16的方法框1522至1532以便使替换加速器处理工作负荷。方法1800前进到框1818,其中psme1270确定是否要向协调器服务器1216查询关于更多加速器的健康。例如,psme1270可以具有调度的任务,以在加速器正处理由psme1270指配的工作负荷的时间期间周期性地检查加速器健康。

方法1800前进到框1820,其中psme1270确定是否应该向协调器服务器1216查询更多加速器健康度量。如果psme1270确定针对更多加速器要求健康数据,则方法1800返回到框1804。如果psme1270确定针对当前时间段不要求更多加速器健康数据,则方法1800前进到框1822,其中psme1270用如由协调器服务器1216提供的更新的加速器健康数据来更新在psme1270的加速器目录。

本公开提供一组技术方案,如下:

1.一种管理到解聚计算资源的工作流的计算装置,所述计算装置包括:

计算引擎,所述计算引擎用于:

接收工作负荷处理请求,所述工作负荷处理请求由至少一个请求参数定义;

确定能够根据所述至少一个请求参数处理工作负荷的至少一个加速器装置;

将工作负荷传送到所述至少一个加速器装置;

从所述工作负荷接收由所述至少一个加速器装置产生的工作产品;以及

将所述工作产品提供到应用。

2.如技术方案1所述的计算装置,其中,所述计算引擎包括池化系统管理引擎(psme),其中,所述psme以相对于所述计算装置的带外容量操作,并且其中:

接收所述工作负荷处理请求包括:接收所述工作负荷处理请求而不利用宿主处理器并且不利用所述计算装置的宿主操作系统,

确定能够处理所述工作负荷的所述至少一个加速器装置包括:确定所述至少一个加速器装置而不利用所述宿主处理器并且不利用所述计算装置的所述宿主操作系统,

将所述工作负荷传送到所述至少一个加速器装置包括:传送所述工作负荷而不利用所述宿主处理器并且不利用所述计算装置的所述宿主操作系统,

接收由所述至少一个加速器装置产生的所述工作产品包括:接收所述工作产品而不利用所述宿主处理器并且不利用所述计算装置的所述宿主操作系统,以及

将所述工作产品提供到所述应用包括:将所述工作产品提供到所述应用而不利用所述宿主处理器并且不利用所述计算装置的所述宿主操作系统。

3.如技术方案2所述的计算装置,其中,确定能够处理所述工作负荷的所述至少一个加速器装置包括:确定至少一个其它加速器装置,所述至少一个其它加速器装置被托管在还托管所述psme的所述计算装置上。

4.如技术方案1所述的计算装置,其中,接收所述工作负荷处理请求包括:从在所述计算装置上执行的应用接收所述工作负荷处理请求。

5.如技术方案1所述的计算装置,其中,所述多个指令在由所述一个或多个处理器执行时还使所述计算装置解析对所述至少一个请求参数的所述工作负荷处理请求,其中,所述至少一个请求参数对应于服务级别协议(sla)要求。

6.如技术方案1所述的计算装置,其中,所述计算引擎还生成加速器装置目录,其中,所述加速器装置目录存储加速器装置标识符以及所述至少一个加速器装置的加速器滑板标识符,所述加速器装置标识符识别与配置数据相关的所述至少一个加速器装置,并且其中所述配置数据指示所述至少一个加速器装置能够执行的每秒操作的数量、所述至少一个加速器装置能够加速的功能、以及所述至少一个加速器装置的当前利用。

7.如技术方案6所述的计算装置,其中,所述计算引擎还用于:

从所述加速器装置目录中识别所述至少一个加速器装置的配置参数;以及

确定所述配置参数表示所述至少一个加速器装置处理所述工作负荷的能力。

8.如技术方案1所述的计算装置,其中,所述计算引擎还用于:

检索所述至少一个加速器装置的加速器滑板标识符;以及

将加速器装置请求传送到协调器,其中所述加速器装置请求包括将所述工作负荷传送到与所述加速器滑板标识符关联的所述至少一个加速器装置的请求。

9.如技术方案8所述的计算装置,其中,所述计算引擎还从所述协调器接收所述工作产品,所述工作产品表示通过所述至少一个加速器装置完成所述工作负荷的处理。

10.如技术方案1所述的计算装置,其中,将工作负荷传送到所述至少一个加速器装置包括:通过安全且经认证的通道在带内传送所述工作负荷。

11.如技术方案1所述的计算装置,其中,确定能够根据所述至少一个请求参数处理工作负荷的至少一个加速器装置包括:基于加速器装置目录,确定能够根据所述至少一个请求参数处理工作负荷的所述至少一个加速器装置。

12.如技术方案1所述的计算装置,其中,所述确定的加速器装置被托管在与所述计算装置不同的远程装置上。

13.如技术方案1所述的计算装置,其中,确定能够根据所述至少一个请求参数处理工作负荷的所述至少一个加速器装置包括用于:

将所述工作负荷处理请求发送到协调器服务器;以及

从所述协调器服务器接收能够处理所述工作负荷的所述至少一个加速器装置的标识。

14.一个或多个机器可读存储媒体,包括存储在其上的多个指令,所述指令响应于被执行,使计算装置用于:

接收工作负荷处理请求,所述工作负荷处理请求由至少一个请求参数定义;

确定能够根据所述至少一个请求参数处理工作负荷的至少一个加速器装置;

将工作负荷传送到所述至少一个加速器装置;

从所述工作负荷接收由所述至少一个加速器装置产生的工作产品;以及

将所述工作产品提供到应用。

15.如技术方案14所述的一个或多个机器可读存储媒体,其中所述计算引擎包括池化系统管理引擎(psme),其中所述psme以相对于所述计算装置的带外容量操作,并且其中:

接收所述工作负荷处理请求包括:接收所述工作负荷处理请求而不利用宿主处理器并且不利用所述计算装置的宿主操作系统,

确定能够处理所述工作负荷的所述至少一个加速器装置包括:确定所述至少一个加速器装置而不利用所述宿主处理器并且不利用所述计算装置的所述宿主操作系统,

将所述工作负荷传送到所述至少一个加速器装置包括:传送所述工作负荷而不利用所述宿主处理器并且不利用所述计算装置的所述宿主操作系统,

接收由所述至少一个加速器装置产生的所述工作产品包括:接收所述工作产品而不利用所述宿主处理器并且不利用所述计算装置的所述宿主操作系统,以及

将所述工作产品提供到所述应用包括:将所述工作产品提供到所述应用而不利用所述宿主处理器并且不利用所述计算装置的所述宿主操作系统。

16.如技术方案15所述的一个或多个机器可读存储媒体,其中,确定能够处理所述工作负荷的所述至少一个加速器装置包括:确定至少一个其它加速器装置,所述至少一个其它加速器装置被托管在还托管所述psme的所述计算装置上。

17.如技术方案14所述的一个或多个机器可读存储媒体,其中,接收所述工作负荷处理请求包括:从在所述计算装置上执行的应用接收所述工作负荷处理请求。

18.如技术方案14所述的一个或多个机器可读存储媒体,其中,所述多个指令还使所述计算装置解析对所述至少一个请求参数的所述工作负荷处理请求,并且其中,所述至少一个请求参数对应于服务级别协议(sla)要求。

19.如技术方案14所述的一个或多个机器可读存储媒体,其中,所述多个指令还使所述计算装置生成加速器装置目录,其中,所述加速器装置目录存储加速器装置标识符以及所述至少一个加速器装置的加速器滑板标识符,所述加速器装置标识符识别与配置数据相关的所述至少一个加速器装置,并且其中所述配置数据指示所述至少一个加速器装置能够执行的每秒操作的数量、所述至少一个加速器装置能够加速的功能、以及所述至少一个加速器装置的当前利用。

20.如技术方案14所述的一个或多个机器可读存储媒体,其中,所述多个指令还使所述计算装置用于:

从所述加速器装置目录中识别所述至少一个加速器装置的配置参数;以及

确定所述配置参数表示所述至少一个加速器装置处理所述工作负荷的能力。

21.如技术方案14所述的一个或多个机器可读存储媒体,其中,所述多个指令还使所述计算装置用于:

检索所述至少一个加速器装置的加速器滑板标识符;以及

将加速器装置请求传送到协调器,其中所述加速器装置请求包括将所述工作负荷传送到与所述加速器滑板标识符关联的所述至少一个加速器装置的请求。

22.如技术方案21所述的一个或多个机器可读存储媒体,其中,所述多个指令还使所述计算装置从所述协调器接收所述工作产品,所述工作产品表示通过所述至少一个加速器装置完成所述工作负荷的处理。

23.一种计算装置,包括:

管理器电路,所述管理器电路用于:

接收工作负荷处理请求,所述工作负荷处理请求由至少一个请求参数定义;

确定能够根据所述至少一个请求参数处理工作负荷的至少一个加速器装置;

将工作负荷传送到所述至少一个加速器装置;

从所述工作负荷接收由所述至少一个加速器装置产生的工作产品;以及

将所述工作产品提供到应用。

24.如技术方案23所述的计算装置,其中,所述计算装置包括池化系统管理引擎(psme),其中,所述psme以相对于所述计算装置的带外容量操作,并且所述管理电路要以相对于所述计算装置的带外容量操作,并且其中:

接收所述工作负荷处理请求包括:接收所述工作负荷处理请求而不利用宿主处理器并且不利用所述计算装置的宿主操作系统,

确定能够处理所述工作负荷的所述至少一个加速器装置包括:确定所述至少一个加速器装置而不利用所述宿主处理器并且不利用所述计算装置的所述宿主操作系统,

将所述工作负荷传送到所述至少一个加速器装置包括:传送所述工作负荷而不利用所述宿主处理器并且不利用所述计算装置的所述宿主操作系统,

接收由所述至少一个加速器装置产生的所述工作产品包括:接收所述工作产品而不利用所述宿主处理器并且不利用所述计算装置的所述宿主操作系统,以及

将所述工作产品提供到所述应用包括:将所述工作产品提供到所述应用而不利用所述宿主处理器并且不利用所述计算装置的所述宿主操作系统。

25.如技术方案24所述的计算装置,其中,确定能够处理所述工作负荷的所述至少一个加速器装置包括:确定至少一个其它加速器装置,所述至少一个其它加速器装置被托管在还托管所述psme的所述计算装置上。

26.如技术方案23所述的计算装置,其中,接收所述工作负荷处理请求包括:从在所述计算装置上执行的应用接收所述工作负荷处理请求。

27.一种用于管理到解聚计算资源的工作流的方法,所述方法包括:

由计算装置接收工作负荷处理请求,所述工作负荷处理请求由至少一个请求参数定义;

由所述计算装置确定能够根据所述至少一个请求参数处理工作负荷的至少一个加速器装置;

由所述计算装置将工作负荷传送到所述至少一个加速器装置;

由所述计算装置从所述工作负荷接收由所述至少一个加速器装置产生的工作产品;以及

由所述计算装置将所述工作产品提供到应用。

28.如技术方案27所述的方法,其中,所述计算装置包括池化系统管理引擎(psme),其中,所述psme以相对于所述计算装置的带外容量操作,并且其中:

接收所述工作负荷处理请求包括接收所述工作负荷处理请求而不利用宿主处理器并且不利用所述计算装置的宿主操作系统,

确定能够处理所述工作负荷的所述至少一个加速器装置包括:确定所述至少一个加速器装置而不利用所述宿主处理器并且不利用所述计算装置的所述宿主操作系统,

将所述工作负荷传送到所述至少一个加速器装置包括:传送所述工作负荷而不利用所述宿主处理器并且不利用所述计算装置的所述宿主操作系统,

接收由所述至少一个加速器装置产生的所述工作产品包括:接收所述工作产品而不利用所述宿主处理器并且不利用所述计算装置的所述宿主操作系统,以及

将所述工作产品提供到所述应用包括将所述工作产品提供到所述应用而不利用所述宿主处理器并且不利用所述计算装置的所述宿主操作系统。

29.如技术方案28所述的方法,其中,确定能够处理所述工作负荷的所述至少一个加速器装置包括:确定至少一个其它加速器装置,所述至少一个其它加速器装置被托管在还托管所述psme装置的所述计算装置上。

30.如技术方案27所述的方法,其中,接收所述工作负荷处理请求包括:从在所述计算装置上执行的应用接收所述工作负荷处理请求。

示例

下面提供本文公开的技术的说明性示例。技术的实施例可以包括下面描述的示例中的任何一个或多个以及其任何组合。

示例1包括一种管理到解聚计算资源的工作流的计算装置,所述计算装置包括计算引擎以:接收工作负荷处理请求,所述工作负荷处理请求由至少一个请求参数定义;确定能够根据所述至少一个请求参数处理工作负荷的至少一个加速器装置;将工作负荷传送到所述至少一个加速器装置;从所述工作负荷接收由所述至少一个加速器装置产生的工作产品;以及将所述工作产品提供到应用。

示例2包括示例1所述的主题,并且其中,所述计算引擎包括池化系统管理引擎(psme),其中,所述psme以相对于所述计算装置的带外容量操作,并且其中:接收所述工作负荷处理请求包括接收所述工作负荷处理请求而不利用宿主处理器并且不利用所述计算装置的宿主操作系统;确定能够处理所述工作负荷的所述至少一个加速器装置包括确定所述至少一个加速器装置而不利用所述宿主处理器并且不利用所述计算装置的所述宿主操作系统;将所述工作负荷传送到所述至少一个加速器装置包括传送所述工作负荷而不利用所述宿主处理器并且不利用所述计算装置的所述宿主操作系统;接收由所述至少一个加速器装置产生的所述工作产品包括接收所述工作产品而不利用所述宿主处理器并且不利用所述计算装置的所述宿主操作系统,以及将所述工作产品提供到所述应用包括将所述工作产品提供到所述应用而不利用所述宿主处理器并且不利用所述计算装置的所述宿主操作系统。

示例3包括示例1和2的任何一个所述的主题,并且其中,确定能够处理所述工作负荷的所述至少一个加速器装置包括确定至少一个其它加速器装置,所述至少一个其它加速器装置被托管在还托管所述psme的所述计算装置上。

示例4包括示例1-3的任何一个所述的主题,并且其中,接收所述工作负荷处理请求包括从在所述计算装置上执行的应用接收所述工作负荷处理请求。

示例5包括示例1-4的任何一个所述的主题,并且其中,所述多个指令在由所述一个或多个处理器执行时还使所述计算装置解析对所述至少一个请求参数的所述工作负荷处理请求,其中,所述至少一个请求参数对应于服务级别协议(sla)要求。

示例6包括示例1-5的任何一个所述的主题,并且其中,所述计算引擎还生成加速器装置目录,其中,所述加速器装置目录存储加速器装置标识符以及所述至少一个加速器装置的加速器滑板标识符,所述加速器装置标识符识别与配置数据相关的所述至少一个加速器装置,并且其中所述配置数据指示所述至少一个加速器装置能够执行的每秒操作的数量,所述至少一个加速器装置能够加速的功能,以及所述至少一个加速器装置的当前利用。

示例7包括示例1-6的任何一个所述的主题,并且其中,所述计算引擎还:从所述加速器装置目录中识别所述至少一个加速器装置的配置参数;以及确定所述配置参数表示所述至少一个加速器装置处理所述工作负荷的能力。

示例8包括示例1-7的任何一个所述的主题,并且其中,所述计算引擎还:检索所述至少一个加速器装置的加速器滑板标识符;以及将加速器装置请求传送到协调器,其中所述加速器装置请求包括将所述工作负荷传送到与所述加速器滑板标识符关联的所述至少一个加速器装置的请求。

示例9包括示例1-8的任何一个所述的主题,并且其中,所述计算引擎还从所述协调器接收所述工作产品,所述工作产品表示通过所述至少一个加速器装置完成所述工作负荷的处理。

示例10包括示例1-9的任何一个所述的主题,并且其中,将工作负荷传送到所述至少一个加速器装置包括:通过安全且经认证的通道在带内传送所述工作负荷。

示例11包括示例1-10的任何一个所述的主题,并且其中,确定能够根据所述至少一个请求参数处理工作负荷的至少一个加速器装置包括:基于加速器装置目录,确定能够根据所述至少一个请求参数处理工作负荷的所述至少一个加速器装置。

示例12包括示例1-11的任何一个所述的主题,并且其中,所述确定的加速器装置被托管在与所述计算装置不同的远程装置上。

示例13包括示例1-12的任何一个所述的主题,并且其中,确定能够根据所述至少一个请求参数处理工作负荷的所述至少一个加速器装置包括:将所述工作负荷处理请求发送到协调器服务器;以及从所述协调器服务器接收能够处理所述工作负荷的所述至少一个加速器装置的标识。

示例14包括示例1-13中任何一个所述的主题,并且其中所述至少一个请求参数包括元数据,所述元数据指示所述工作负荷的两个或更多部分是否可以同时加速。

示例15包括示例1-14中任何一个所述的主题,并且其中所述至少一个请求参数包括元数据,所述元数据指示与所述工作负荷关联的服务的目标质量。

示例16包括示例1-15中任何一个所述的主题,并且其中所述元数据指示与所述工作负荷关联的目标时延或目标吞吐量中的至少一个。

示例17包括一种用于管理到解聚计算资源的工作流的方法,所述方法包括:由计算装置接收工作负荷处理请求,所述工作负荷处理请求由至少一个请求参数定义;由所述计算装置确定能够根据所述至少一个请求参数处理工作负荷的至少一个加速器装置;由所述计算装置将工作负荷传送到所述至少一个加速器装置;由所述计算装置从所述工作负荷接收由所述至少一个加速器装置产生的工作产品;以及由所述计算装置将所述工作产品提供到应用。

示例18包括示例17所述的主题,并且其中,所述计算装置包括池化系统管理引擎(psme),其中,所述psme以相对于所述计算装置的带外容量操作,并且其中:接收所述工作负荷处理请求包括接收所述工作负荷处理请求而不利用宿主处理器并且不利用所述计算装置的宿主操作系统;确定能够处理所述工作负荷的所述至少一个加速器装置包括确定所述至少一个加速器装置而不利用所述宿主处理器并且不利用所述计算装置的所述宿主操作系统;将所述工作负荷传送到所述至少一个加速器装置包括传送所述工作负荷而不利用所述宿主处理器并且不利用所述计算装置的所述宿主操作系统;接收由所述至少一个加速器装置产生的所述工作产品包括接收所述工作产品而不利用所述宿主处理器并且不利用所述计算装置的所述宿主操作系统,以及将所述工作产品提供到所述应用包括将所述工作产品提供到所述应用而不利用所述宿主处理器并且不利用所述计算装置的所述宿主操作系统。

示例19包括示例17和18的任何一个所述的主题,并且其中,确定能够处理所述工作负荷的所述至少一个加速器装置包括确定至少一个其它加速器装置,所述至少一个其它加速器装置被托管在还托管所述psme装置的所述计算装置上。

示例20包括示例17-19的任何一个所述的主题,并且其中,接收所述工作负荷处理请求包括从在所述计算装置上执行的应用接收所述工作负荷处理请求。

示例21包括示例17-20的任何一个所述的主题,并且还包括由所述计算装置解析对所述至少一个请求参数的所述工作负荷处理请求,其中,所述至少一个请求参数对应于服务级别协议(sla)要求。

示例22包括示例17-21的任何一个所述的主题,并且还包括生成加速器装置目录,其中,所述加速器装置目录存储加速器装置标识符以及所述至少一个加速器装置的加速器滑板标识符,所述加速器装置标识符识别与配置数据相关的所述至少一个加速器装置,并且其中所述配置数据指示所述至少一个加速器装置能够执行的每秒操作的数量,所述至少一个加速器装置能够加速的功能,以及所述至少一个加速器装置的当前利用。

示例23包括示例17-22的任何一个所述的主题,并且还包括:由所述计算装置从所述加速器装置目录中识别所述至少一个加速器装置的配置参数;以及由所述计算装置确定所述配置参数表示所述至少一个加速器装置处理所述工作负荷的能力。

示例24包括示例17-23的任何一个所述的主题,并且还包括:由所述计算装置检索所述至少一个加速器装置的加速器滑板标识符;以及由所述计算装置将加速器装置请求传送到协调器,其中所述加速器装置请求包括将所述工作负荷传送到与所述加速器滑板标识符关联的所述至少一个加速器装置的请求。

示例25包括示例17-24的任何一个所述的主题,并且还包括从所述协调器接收所述工作产品,其中所述工作产品表示通过所述至少一个加速器装置完成所述工作负荷的处理。

示例26包括示例17-25的任何一个所述的主题,并且其中,将工作负荷传送到所述至少一个加速器装置包括通过安全且经认证的通道在带内传送所述工作负荷。

示例27包括示例17-26的任何一个所述的主题,并且其中,确定能够根据所述至少一个请求参数处理工作负荷的至少一个加速器装置包括基于加速器装置目录,确定能够根据所述至少一个请求参数处理工作负荷的所述至少一个加速器装置。

示例28包括示例17-27的任何一个所述的主题,并且其中,所述确定的加速器装置被托管在与所述计算装置不同的远程装置上。

示例29包括示例17-28的任何一个所述的主题,并且其中,确定能够根据所述至少一个请求参数处理工作负荷的所述至少一个加速器装置包括将所述工作负荷处理请求发送到协调器服务器;以及从所述协调器服务器接收能够处理所述工作负荷的所述至少一个加速器装置的标识。

示例30包括示例17-29中任何一个所述的主题,并且其中所述至少一个请求参数包括元数据,所述元数据指示所述工作负荷的两个或更多部分是否可以同时加速。

示例31包括示例17-30中任何一个所述的主题,并且其中所述至少一个请求参数包括元数据,所述元数据指示与所述工作负荷关联的服务的目标质量。

示例32包括示例17-31中任何一个所述的主题,并且其中所述元数据指示与所述工作负荷关联的目标时延或目标吞吐量中的至少一个。

示例33包括一个或多个计算机可读存储媒体,所述计算机可读存储媒体包括存储在其上的多个指令,所述指令响应于被执行使计算装置执行示例17-23中任何一个所述的方法。

示例34包括计算装置,所述计算装置包括用于执行示例17-23中任何一个所述的方法的部件。

示例35包括一种计算装置,其包括管理器电路以:接收工作负荷处理请求,所述工作负荷处理请求由至少一个请求参数定义;

确定能够根据所述至少一个请求参数处理工作负荷的至少一个加速器装置;将工作负荷传送到所述至少一个加速器装置;从所述工作负荷接收由所述至少一个加速器装置产生的工作产品;以及将所述工作产品提供到应用。

示例36包括示例35所述的主题,并且其中,所述计算装置包括池化系统管理引擎(psme),其中,所述psme以相对于所述计算装置的带外容量操作,并且所述管理电路要以相对于所述计算装置的带外容量操作,并且其中:接收所述工作负荷处理请求包括接收所述工作负荷处理请求而不利用宿主处理器并且不利用所述计算装置的宿主操作系统;确定能够处理所述工作负荷的所述至少一个加速器装置包括确定所述至少一个加速器装置而不利用所述宿主处理器并且不利用所述计算装置的所述宿主操作系统;将所述工作负荷传送到所述至少一个加速器装置包括传送所述工作负荷而不利用所述宿主处理器并且不利用所述计算装置的所述宿主操作系统;接收由所述至少一个加速器装置产生的所述工作产品包括接收所述工作产品而不利用所述宿主处理器并且不利用所述计算装置的所述宿主操作系统;以及将所述工作产品提供到所述应用包括将所述工作产品提供到所述应用而不利用所述宿主处理器并且不利用所述计算装置的所述宿主操作系统。

示例37包括示例35和36的任何一个所述的主题,并且其中,确定能够处理所述工作负荷的所述至少一个加速器装置包括确定至少一个其它加速器装置,所述至少一个其它加速器装置被托管在还托管所述psme的所述计算装置上。

示例38包括示例35-37的任何一个所述的主题,并且其中,接收所述工作负荷处理请求包括从在所述计算装置上执行的应用接收所述工作负荷处理请求。

示例39包括示例35-38的任何一个所述的主题,并且其中,所述管理器电路还解析对所述至少一个请求参数的所述工作负荷处理请求,并且其中,所述至少一个请求参数对应于服务级别协议(sla)要求。

示例40包括示例35-39的任何一个所述的主题,并且其中,所述管理器电路还生成加速器装置目录,其中,所述加速器装置目录存储加速器装置标识符以及所述至少一个加速器装置的加速器滑板标识符,所述加速器装置标识符识别与配置数据相关的所述至少一个加速器装置,并且其中所述配置数据指示所述至少一个加速器装置能够执行的每秒操作的数量,所述至少一个加速器装置能够加速的功能,以及所述至少一个加速器装置的当前利用。

示例41包括示例35-40的任何一个所述的主题,并且其中,所述管理器电路还:从所述加速器装置目录中识别所述至少一个加速器装置的配置参数;以及确定所述配置参数表示所述至少一个加速器装置处理所述工作负荷的能力。

示例42包括示例35-41的任何一个所述的主题,并且其中,所述管理器电路还:检索所述至少一个加速器装置的加速器滑板标识符;还包括网络通信电路,其将加速器装置请求传送到协调器,其中所述加速器装置请求包括将所述工作负荷传送到与所述加速器滑板标识符关联的所述至少一个加速器装置的请求。

示例43包括示例35-42的任何一个所述的主题,并且其中,所述网络通信电路还从所述协调器接收所述工作产品,所述工作产品表示通过所述至少一个加速器装置完成所述工作负荷的处理。

示例44包括示例35-43的任何一个所述的主题,并且其中,将工作负荷传送到所述至少一个加速器装置包括通过安全且经认证的通道在带内传送所述工作负荷。

示例45包括示例35-44的任何一个所述的主题,并且其中,确定能够根据所述至少一个请求参数处理工作负荷的至少一个加速器装置包括:基于加速器装置目录,确定能够根据所述至少一个请求参数处理工作负荷的所述至少一个加速器装置。

示例46包括示例35-45的任何一个所述的主题,并且其中,所述确定的加速器装置被托管在与所述计算装置不同的远程装置上。

示例47包括示例35-46的任何一个所述的主题,并且其中,确定能够根据所述至少一个请求参数处理工作负荷的所述至少一个加速器装置包括:将所述工作负荷处理请求发送到协调器服务器;以及从所述协调器服务器接收能够处理所述工作负荷的所述至少一个加速器装置的标识。

示例48包括示例35-47中任何一个所述的主题,并且其中所述至少一个请求参数包括元数据,所述元数据指示所述工作负荷的两个或更多部分是否可以同时加速。

示例49包括示例35-48中任何一个所述的主题,并且其中所述至少一个请求参数包括元数据,所述元数据指示与所述工作负荷关联的服务的目标质量。

示例50包括示例35-49中任何一个所述的主题,并且其中所述元数据指示与所述工作负荷关联的目标时延或目标吞吐量中的至少一个。

示例51包括一种计算装置,其包括用于接收工作负荷处理请求的电路,所述工作负荷处理请求由至少一个请求参数定义;用于

确定能够根据所述至少一个请求参数处理工作负荷的至少一个加速器装置的部件;用于将工作负荷传送到所述至少一个加速器装置的电路;用于从所述工作负荷接收由所述至少一个加速器装置产生的工作产品的电路;以及用于将所述工作产品提供到应用的电路。

示例52包括示例51所述的主题,并且其中,用于接收所述工作负荷处理请求的电路包括用于接收所述工作负荷处理请求而不利用宿主处理器并且不利用所述计算装置的宿主操作系统的电路;用于确定能够处理所述工作负荷的所述至少一个加速器装置的部件包括用于确定所述至少一个加速器装置而不利用所述宿主处理器并且不利用所述计算装置的所述宿主操作系统的电路;用于将所述工作负荷传送到所述至少一个加速器装置的电路包括用于传送所述工作负荷而不利用所述宿主处理器并且不利用所述计算装置的所述宿主操作系统的电路;用于接收由所述至少一个加速器装置产生的所述工作产品的电路包括用于接收所述工作产品而不利用所述宿主处理器并且不利用所述计算装置的所述宿主操作系统的电路;以及用于将所述工作产品提供到所述应用的电路包括将所述工作产品提供到所述应用而不利用所述宿主处理器并且不利用所述计算装置的所述宿主操作系统的电路。

示例53包括示例51和52的任何一个所述的主题,并且其中,用于确定能够处理所述工作负荷的所述至少一个加速器装置的部件包括用于确定至少一个其它加速器装置的电路,所述至少一个其它加速器装置被托管在还托管所述psme装置的所述计算装置上。

示例54包括示例51-53的任何一个所述的主题,并且其中,用于接收所述工作负荷处理请求的电路包括用于从在所述计算装置上执行的应用接收所述工作负荷处理请求的电路。

示例55包括示例51-54的任何一个所述的主题,并且还包括用于解析对所述至少一个请求参数的所述工作负荷处理请求的电路,其中,所述至少一个请求参数对应于服务级别协议(sla)要求。

示例56包括示例51-55的任何一个所述的主题,并且还包括用于生成加速器装置目录的电路,其中,所述加速器装置目录存储加速器装置标识符以及所述至少一个加速器装置的加速器滑板标识符,所述加速器装置标识符识别与配置数据相关的所述至少一个加速器装置,并且其中所述配置数据指示所述至少一个加速器装置能够执行的每秒操作的数量,所述至少一个加速器装置能够加速的功能,以及所述至少一个加速器装置的当前利用。

示例57包括示例51-56的任何一个所述的主题,并且还包括用于从所述加速器装置目录中识别所述至少一个加速器装置的配置参数;以及确定所述配置参数表示所述至少一个加速器装置处理所述工作负荷的能力的电路。

示例58包括示例51-57的任何一个所述的主题,并且还包括用于检索所述至少一个加速器装置的加速器滑板标识符;以及将加速器装置请求传送到协调器的电路,其中所述加速器装置请求包括将所述工作负荷传送到与所述加速器滑板标识符关联的所述至少一个加速器装置的请求。

示例59包括示例51-58的任何一个所述的主题,并且还包括用于从所述协调器接收所述工作产品的电路,其中所述工作产品表示通过所述至少一个加速器装置完成所述工作负荷的处理。

示例60包括示例51-59的任何一个所述的主题,并且其中,用于将工作负荷传送到所述至少一个加速器装置的电路包括用于通过安全且经认证的通道在带内传送所述工作负荷的电路。

示例61包括示例51-60的任何一个所述的主题,并且其中,用于确定能够根据所述至少一个请求参数处理工作负荷的至少一个加速器装置的部件包括用于基于加速器装置目录,确定能够根据所述至少一个请求参数处理工作负荷的所述至少一个加速器装置的部件。

示例62包括示例51-61的任何一个所述的主题,并且其中,所述确定的加速器装置被托管在与所述计算装置不同的远程装置上。

示例63包括示例51-62的任何一个所述的主题,并且其中,用于确定能够根据所述至少一个请求参数处理工作负荷的所述至少一个加速器装置的部件包括用于将所述工作负荷处理请求发送到协调器服务器的电路;以及用于从所述协调器服务器接收能够处理所述工作负荷的所述至少一个加速器装置的标识的电路。

示例64包括示例51-63中任何一个所述的主题,并且其中所述至少一个请求参数包括元数据,所述元数据指示所述工作负荷的两个或更多部分是否可以同时加速。

示例65包括示例51-64中任何一个所述的主题,并且其中所述至少一个请求参数包括元数据,所述元数据指示与所述工作负荷关联的服务的目标质量。

示例66包括示例51-65中任何一个所述的主题,并且其中所述元数据指示与所述工作负荷关联的目标时延或目标吞吐量中的至少一个。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1