异构系统、数据处理方法及装置与流程

文档序号:12719385阅读:335来源:国知局
异构系统、数据处理方法及装置与流程

本发明实施例涉及数据处理领域,特别涉及一种异构系统、数据处理方法及装置。



背景技术:

异构系统是指将使用不同类型的指令集合和体系架构的计算单元组成计算系统的计算方式。常见的异构系统包括中央处理器(Central Processing Unit,CPU)类计算设备、图形处理器(Graphics Processing Unit,GPU)类计算设备和现场可编程门阵列(Field Programmable Gate Array,FPGA)计算设备。

每种计算设备在执行数据处理任务时具有各自擅长的类型,当异构系统中的管理设备接收到数据处理任务时,管理设备根据数据处理任务的类型将数据处理任务分配给异构系统中相应的计算设备进行处理。

在实现本发明的过程中,发明人发现现有技术至少存在以下问题:在分配数据处理任务时,只考虑了数据处理任务的任务类型。当计算设备的空心资源较少且被分配了较多的数据处理任务,而其他种类的计算设备具有空闲资源时,降低了异构系统的计算效率。



技术实现要素:

为了解决现有技术的问题,本发明实施例提供了一种异构系统、数据处理方法及装置。该技术方案如下:

第一方面,提供了一种异构系统,该异构系统包括管理设备和n种计算设备,每个所述计算设备包括至少一种计算卡,n为大于等于2的整数;

所述管理设备,用于根据数据处理任务对应的数据处理算法,从所述n种计算设备中确定具有执行所述数据处理任务的能力的计算设备;将所述数据处理算法分解为至少两个类型的处理算核,并根据所述处理算核的类型将所述数据处理任务划分为若干个预定处理任务;根据功效比和能效比从所述计算设备中确定出目标计算设备;将所述预定处理任务发送至所述目标计算设备;接收所述目标计算设备发送的处理结果,并组合所述处理结果得到最终处理结果;

所述目标计算设备,用于执行所述预定处理任务

可选的,所述管理设备,还用于将所述预定处理任务发送至集中式运算集群中的至少一个服务器和/或分布式运算集群中的至少一个普通计算机;

其中,所述集中式运算集群中包括至少一种计算卡,所述分布式运算集群中包括至少一种计算卡。

可选的,所述至少一种计算卡包括中央处理器CPU类计算卡、图像处理器GPU类计算卡、现场可编程门阵列FPGA类计算卡和数字信号处理DSP类计算卡中的至少一种。

第二方面,提供了一种数据处理方法,应用于包括管理设备和n种计算设备的异构系统中,每个所述计算设备包括至少一种计算卡,n为大于等于2的整数,该方法包括:

根据数据处理任务对应的数据处理算法,从所述n种计算设备中确定具有执行所述数据处理任务的能力的计算设备;

将所述数据处理算法分解为至少两个类型的处理算核,并根据所述处理算核的类型将所述数据处理任务划分为若干个预定处理任务;

根据功效比和能效比从所述计算设备中确定出目标计算设备,所述目标计算设备用于执行所述预定处理任务;

将所述预定处理任务发送至所述目标计算设备;

接收所述目标计算设备发送的处理结果,并组合所述处理结果得到最终处理结果。

可选的,所述将所述预定处理任务发送至所述目标计算设备,包括:

将所述预定处理任务发送至集中式运算集群中的至少一个服务器和/或分布式运算集群中的至少一个普通计算机;

其中,所述集中式运算集群中包括至少一种计算卡,所述分布式运算集群中包括至少一种计算卡。

可选的,所述至少一种计算卡包括中央处理器CPU类计算卡、图像处理器GPU类计算卡、现场可编程门阵列FPGA类计算卡和数字信号处理DSP类计算卡中的至少一种。

第三方面,提供了一种数据处理装置,该装置包括:

第一确定单元,用于根据数据处理任务对应的数据处理算法,从n种计算设备中确定具有执行所述数据处理任务的能力的计算设备,每个所述计算设备包括至少一种计算卡,n为大于等于2的整数;

分解单元,用于将所述数据处理算法分解为至少两个类型的处理算核,并根据所述处理算核的类型将所述数据处理任务划分为若干个预定处理任务;

第二确定单元,用于根据功效比和能效比从所述计算设备中确定出目标计算设备,所述目标计算设备用于执行所述预定处理任务;

发送单元,用于将所述预定处理任务发送至所述目标计算设备;

组合单元,用于接收所述目标计算设备发送的处理结果,并组合所述处理结果得到最终处理结果。

可选的,所述将发送单元,还用于:

将所述预定处理任务发送至集中式运算集群中的至少一个服务器和/或分布式运算集群中的至少一个普通计算机;

其中,所述集中式运算集群中包括至少一种计算卡,所述分布式运算集群中包括至少一种计算卡。

可选的,所述至少一种计算卡包括中央处理器CPU类计算卡、图像处理器GPU类计算卡、现场可编程门阵列FPGA类计算卡和数字信号处理DSP类计算卡中的至少一种。

本发明实施例提供的技术方案带来的有益效果是:

通过管理设备根据数据处理任务对应的数据处理算法,从n种计算设备中确定具有执行数据处理任务的能力的计算设备;将数据处理算法分解为至少两个类型的处理算核,并根据处理算核的类型将数据处理任务划分为若干个预定处理任务;根据功效比和能效比从计算设备中确定出目标计算设备,由目标计算设备执行预定处理任务;管理设备将预定处理任务发送至目标计算设备;接收目标计算设备发送的处理结果,并组合处理结果得到最终处理结果;解决了在分配数据处理任务时,从数据处理任务的类型的角度将数据处理任务看作一个整体,只向一个类型的计算设备发送数据处理任务,可能会降低异构系统的计算效率的问题;达到了将一个数据处理任务按其对应的处理算法包括的算核进行拆分,由不同种类的计算设备同时进行数据处理,提高异构系统计算能力和计算效率的效果。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明一示例性实施例提供的异构系统的结构示意图;

图2是本发明一个示例性实施例提供的管理设备的结构示意图;

图3是本发明一个示例性实施例提供的集中式运算集群中的计算设备的结构示意图;

图4是本发明一个示例性实施例提供的分布式运算集群中的计算设备的结构示意图;

图5是本发明一示例性实施例示出的一种计算卡的结构示意图;

图6是根据一示例性实施例示出的一种数据处理方法的流程图;

图7是根据一示例性实施例示出的一种数据处理装置的框图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。

图1是根据本发明一示例性实施例提供的异构系统的结构示意图。如图1所示,该异构系统至少包括管理设备100、集中式运算集群200、分布式运算集群300。

可选的,管理设备为具有管理计算设备功能的管理服务器。

集中式运算集群200中包括若干个计算设备。集中式运算集群200至少包括n种计算卡,每个计算设备包括至少一种计算卡,n为大于等于2的整数。可选的,集中式运算集群中包括的计算设备为服务器。

分布式运算集群300中包括若干个计算设备,分布式运算集群200至少包括n种计算卡,每个计算设备包括至少一种计算卡,n为大于等于2的整数。可选的,分布式运算集群中包括的计算设备为普通计算机。

需要说明的是,集中式运算集群中计算设备的数量和分布式运算集群中计算设备的数量根据实际需求确定。可选的,集中式运算集群中计算设备的数量为5个,分布式运算集群中计算设备的数量为5个。

管理设备100与分布式运算集群300中的各个计算设备建立间歇性通信连接。

管理设备100与分布式运算集群中的计算设备建立间歇性通信连接,是指当管理设备100需要调用计算设备时,将计算设备与管理设备100连接,管理设备100与计算设备进行数据传输;当管理设备100不需要调用计算设备时,将与管理设备100连接的计算设备断开,管理设备100与计算设备之间不进行数据传输。

管理设备100与集中式运算集群200中的各个计算设备建立持续性通信连接。

管理设备100与集中式运算集群中的计算设备建立持续性通信连接,是指管理设备100在需要调用计算设备或不需要调用计算设备时都与计算设备连接,管理设备100可在任意时间与计算设备进行数据传输。

管理设备100通过有线网络或无线网络与集中式运算集群200中的计算设备和/或分布式运算集群300中的计算设备连接。

可选的,上述的无线网络或有线网络使用标准通信技术和/或协议。网络通常为因特网、但也可以是任何网络,包括但不限于局域网(英文:Local Area Network,LAN)、城域网(英文:Metropolitan Area Network,MAN)、广域网(英文:Wide Area Network,WAN)、移动、有线或者无线网络、专用网络或25者虚拟专用网络的任何组合)。在一些实施例中,使用包括超文本标记语言(英文:Hyper Text Mark-up Language,HTML)、可扩展标记语言(英文:Extensible Markup Language,XML)等的技术和/或格式来代表通过网络交换的数据。此外还可以使用诸如安全套接字层(英文:Secure Socket Layer,SSL)、传输层安全(英文:Transport Layer Security,TLS)、虚拟专用网络(英文:Virtual Private 30Network,VPN)、网际协议安全(英文:Internet Protocol Security,IPsec)等常规加密技术来加密所有或者一些链路。在另一些实施例中,还可以使用定制和/或专用数据通信技术取代或者补充上述数据通信技术。

图2示出了本发明一个示例性实施例提供的管理设备100的结构示意图。该管理设备100包括处理器110、电源120、存储器130、网络接口140和总线150。

处理器110包括一个或者一个以上处理核心,处理器110通过运行软件程序及模块,执行各种功能应用预计数据处理。

网络接口140可以为多个,其中一部分网络接口140用于管理设备与集中式运算集群中的计算设备和/或分布式运算集群中的计算设备进行通信。

网络接口140和存储器130分别通过总线150与处理器110连接。

电源120通过总线150分半与处理器110、存储器130、网络接口140连接。

存储器130用于存储软件以及模块。存储器130可存储操作系统、至少一个功能所需的应用程序模块。操作系统可以是RTX(Real Time Xecutive,实时操作系统)、LINUX、UNIX、WINDOWS或OS X之类的操作系统。

此外,存储器130可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。相应地。

可选的,管理设备100还包括高速缓存器。

本领域技术人员可以理解,图2中所示出的管理设备100结构并不构成对管理设备100的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

图3示出了本发明一个示例性实施例提供的如图1所示的集中式运算集群中的计算设备210的结构示意图。

计算设备210包括处理器211、电源212、存储器213、网络接口214、总线215和计算卡216。

可选的,计算卡为CPU类计算卡或GPU类计算卡或FPGA类计算卡或Digital Signal Processing,数字信号处理)类计算卡,或者,计算卡为CPU+GPU类计算卡,或计算卡为GPU+FPGA类计算卡。

处理器211包括一个或者一个以上处理核心,处理器211通过运行软件程序及模块,执行各种功能应用预计数据处理。

网络接口214可以为多个,其中一部分网络接口214用于计算设备210与管理设备100连接。

网络接口214和存储器213分别通过总线215与处理器211连接。

电源212通过总线215分半与处理器211、存储器213、网络接口214连接。

存储器213用于存储软件以及模块。存储器213可存储操作系统、至少一个功能所需的应用程序模块。操作系统可以是RTX、LINUX、UNIX、WINDOWS或OS X之类的操作系统。

此外,存储器213可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。相应地。

可选的,服务器210还包括高速缓存器。

本领域技术人员可以理解,图2中所示出的计算设备210结构并不构成对计算设备210的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

本领域技术人员还可以理解,计算设备220、计算设备230等图1中所示出的集中式运算集群200中的计算设备具有与图2中所示出的计算设备210相同或者相似的结构。

图4示出了本发明一个示例性实施例提供的如图1所示的分布式运算集群中的计算设备310的结构示意图。

计算设备310包括处理器311、电源312、存储器313、网络接口314、总线315和计算卡316。

可选的,计算卡为CPU类计算卡或GPU类计算卡或FPGA类计算卡或DSP类计算卡,或者,计算卡为CPU+GPU类计算卡,或计算卡为GPU+FPGA类计算卡。

处理器311包括一个或者一个以上处理核心,处理器311通过运行软件程序及模块,执行各种功能应用预计数据处理。

网络接口314可以为多个,其中一部分网络接口314用于计算设备310与管理设备连接。

网络接口314和存储器313分别通过总线315与处理器311连接。

电源312通过总线315分半与处理器311、存储器313、网络接口314连接。

存储器313用于存储软件以及模块。存储器313可存储操作系统、至少一个功能所需的应用程序模块。操作系统可以是RTX、LINUX、UNIX、WINDOWS或OS X之类的操作系统。

此外,存储器313可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。相应地。

可选的,计算设备310还包括高速缓存器。

本领域技术人员可以理解,图4中所示出的计算设备310结构并不构成对计算设备310的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

本领域技术人员还可以理解,计算设备320、计算设备330等如图1所示的分布式运算集群300中的计算设备具有与图4中所示出的计算设备310相同或者相似的结构。

在如图3所示的计算设备或如图4所示的计算设备中包括的计算卡的结构示意图如图5所示,计算卡包括供电系统510、散热系统520、拟态管理系统530、存储管理系统540、外接口通信系统550、拟态计算系统560。

拟态管理系统550与拟态计算系统560连接,拟态管理系统550与存储管理系统540连接,外接口通信系统550与拟态计算系统560连接。

外接口通信系统550用于将外接口及时序转换为统一的局部总线接口及统一的时序。

拟态计算系统560用于将需要运算的数据通过相应的算法转化为数据结果,并进行处理。

拟态管理系统530有多片功能完全相同的计算节点。

存储管理系统540采用多片计算资源及高性能存储器,每片计算节点连接多片功能完全相同的存储芯片,存储芯片中可存储大量数据。

供电系统510用于对计算卡上的所有系统进行供电。

散热系统520用于对计算卡上的所有系统进行散热,减少热量,防止计算卡过热导致计算卡的功能出现异常。

可选的,外接口通信系统550连接服务器或者普通计算机的PCl-e插槽、RJ45网口、PCI插槽、ATCA、RS232或RS485等串口总线。

请参考图6,其示出了本发明一个实施例提供的数据处理方法的流程图。该数据处理方法适用于如图1所示的异构系统中。如图6所示,该数据处理方法可以包括以下步骤:

步骤601,管理设备根据数据处理任务对应的数据处理算法,从n种计算设备中确定具有执行数据处理任务的能力的计算设备。

异构系统包括管理设备和n种计算设备,计算设备的种类根据计算设备包括的计算卡区分,n为大于等于2的整数。每个计算设备包括至少一种计算卡。

管理设备接收用户端发送的数据处理任务。可选的,用户端是将针对特定数据的数据处理任务发送至管理设备,并请求管理设备对该数据处理任务进行处理的设备,比如:手机、平板电脑、个人计算机等。

每个数据处理任务对应一个数据处理算法,管理设备根据数据处理任务获取数据处理任务对应的数据处理算法,从n种计算设备中确定具有执行数据处理任务能力的计算设备。

步骤602,管理设备将数据处理算法分解为至少两个类型的处理算核,并根据处理算核的类型将数据处理任务划分为若干个预定处理任务。

每个数据处理算法包括至少两个类型的处理算核。

可选的,管理设备根据处理算核的类型的数量将数据处理任务划分为若干个预定处理任务,预定处理任务的数量与处理算核的类型的数量相同,一个预定处理任务对应一个处理算核。比如:数据处理算法包括两个处理算核,则将数据处理任务划分为两个预定处理任务,每个预定处理任务对应一个处理算核。

步骤603,管理设备根据功效比和能效比从计算设备中确定出目标计算设备。

目标计算设备用于执行预定处理任务。

管理设备根据功效比和能效比,从具有执行数据处理能力的计算设备中确定出目标计算设备。

每种目标计算设备执行一种处理算核对应的预定处理任务。

需要说明的是,步骤602和步骤603可以同时执行,本发明实施例对此不作限定。

步骤604,管理设备将预定处理任务发送至目标计算设备。

管理设备将预定处理任务发送至目标计算设备。

可选的,管理设备将预定处理任务发送至位于集中式运算集群中的至少一个服务器和/或位于分布式运算集群中的至少一个普通计算机。

集中式运算集群中包括至少一个服务器,每个服务器包括至少一种计算卡。分布式运算集群中包括至少一个普通计算机,每个普通计算机包括至少一种计算卡。

可选的,至少一种计算卡包括CPU类计算卡、GPU类计算卡、FPGA类计算卡和DSP类计算卡中的至少一种。

可选的,至少一种计算卡包括CPU类计算卡或GPU类计算卡或FPGA类计算卡或DSP类计算卡,或者,计算卡为CPU+GPU类计算卡,或计算卡为GPU+FPGA类计算卡中的至少一种。

具体地,管理设备将预定处理任务发送至集中式运算集群中的至少一个服务器;或者,管理设备将预定处理任务发送至分布式运算集群中的至少一个普通计算机;或者,管理设备将预定处理任务发送至集中式运算集群中的至少一个服务器和分布式运算集群中的至少一个普通计算机。

具体地,当管理设备将预定处理任务发送至至少两个计算设备时,可以将一种处理算核对应的预定处理任务划分为多个计算任务,并将计算任务分配给各个能够执行该处理算核对应的预定处理任务的计算设备。比如:处理算核为sha1算核,目标计算设备中能够执行sha1算核对应的预定处理任务的计算设备有5个,则将sha1算核对应的预定处理任务划分为5个计算任务,将5个计算任务发送至能够执行sha1算核对应的预定处理任务的5个计算设备;能够执行sha1算核对应的预定处理任务的5个计算设备都在分布式运算集群中,或者,都在集中式运算集群中,或者,一部分在分布式运算集群中,另一部分在集中式运算集群中。

可选的,管理设备向计算设备发送包括预定处理任务和设备标识的通信消息至计算设备。

步骤605,目标计算设备接收预定处理任务,并执行预定处理任务得到处理结果。

可选的,目标计算设备接收计算任务,执行计算任务得到处理结果。

可选的,目标计算设备根据通信消息中的设备标识接收相应的预定处理任务。

可选的,目标计算设备向管理设备发现包括设备标识和处理结果的通信消息。

步骤606,管理设备接收目标计算设备发送的处理结果,并组合处理结果得到最终处理结果。

管理设备接收目标计算设备发送的处理结果,根据处理结果对应的设备标识和组合规则,组合处理结果得到最终处理结果。

管理设备将最终处理结果发送至用户端,用户端显示最终处理结果。

需要说明的是,上述步骤601至步骤604、步骤606可单独实现称为管理设备侧的方法实施例。

综上所述,本发明实施例提供的数据处理方法,通过管理设备根据数据处理任务对应的数据处理算法,从n种计算设备中确定具有执行数据处理任务的能力的计算设备;将数据处理算法分解为至少两个类型的处理算核,并根据处理算核的类型将数据处理任务划分为若干个预定处理任务;根据功效比和能效比从计算设备中确定出目标计算设备,由目标计算设备执行预定处理任务;管理设备将预定处理任务发送至目标计算设备;接收目标计算设备发送的处理结果,并组合处理结果得到最终处理结果;解决了在分配数据处理任务时,从数据处理任务的类型的角度将数据处理任务看作一个整体,只向一个类型的计算设备发送数据处理任务,可能会降低异构系统的计算效率的问题;达到了将一个数据处理任务按其对应的处理算法包括的算核进行拆分,由不同种类的计算设备同时进行数据处理,提高异构系统计算能力和计算效率的效果。

此外,还通过在异构系统中加入分布式运算集群,使得在异构系统中的集中式运算集群的计算设备的运算资源忙碌时,不用增加集中式运算集群中计算设备的数量,只需要调用分布式运算集群中的计算设备就能够满足额外的计算需求,降低了异构系统的运维成本。

在一个示例性的例子中,管理设备接收到数据处理任务,该数据处理任务对应的数据处理算法为算法一,管理设备从n种计算设备中确定具有执行算法一能力的计算设备;管理设备将算法一分解为两个类型的处理算核,分别为aes128算核、sha1算核;由于数据处理算法包括aes128算核、sha1算核,管理设备将数据处理任务划分为两个预定处理任务,一个预定处理任务与aes128算核对应,另一个预定处理任务与sha1算核对应;管理设备根据能效比和功效比从具有执行算法一能力的计算设备中确定出目标计算设备;由于aes128算核适合GPU类计算卡运算,则管理设备将aes128算核对应的预定处理任务发送至包括GPU类计算卡的目标计算设备,由于sha1算核适合FPGA类计算卡运算,管理设备将sha1算核对应的预定处理任务发送至包括FPGA类计算卡的目标计算设备;目标设备执行预定处理任务,得到处理结果并发送至管理设备;管理设备接收处理结果,并组合处理结果得到最终处理结果。

在另一个示例性的例子中,管理设备接收到数据处理任务,该数据处理任务对应的数据处理算法为算法二,管理设备从n种计算设备中确定具有执行算法二能力的计算设备;管理设备将算法二分解为三个类型的处理算核,分别为des算核、sha1算核和md4算核;由于数据处理算法包括des算核、sha1算核和md4算核,管理设备将数据处理任务划分为三个预定处理任务,一个预定处理任务与des算核对应,另一个预定处理任务与sha1算核对应,剩下一个预定处理任务与md4算核对应;管理设备根据能效比和功效比从具有执行算法二能力的计算设备中确定出目标计算设备;由于des算核适合CPU类计算卡运算,则管理设备将des算核对应的预定处理任务发送至包括CPU类计算卡的目标计算设备,由于sha1算核适合FPGA类计算卡运算,管理设备将sha1算核对应的预定处理任务发送至包括FPGA类计算卡的目标计算设备,由于md4算核适合GPU类计算卡运算,则管理设备将md4算核对应的预定处理任务发送至包括GPU类计算卡的目标计算设备;目标设备执行预定处理任务,得到处理结果并发送至管理设备;管理设备接收处理结果,并组合处理结果得到最终处理结果。

请参照图7,其示出了本发明另一个实施例提供的数据处理装置的结构方框图。该在数据处理装置可以通过软件、硬件或者两者的结合实现成为上述可提供数据处理方法的管理设备的全部或者一部分。该装置包括:

第一确定单元710,用于根据数据处理任务对应的数据处理算法,从n种计算设备中确定具有执行数据处理任务的能力的计算设备,n为大于等于2的整数,每个计算设备包括至少一种计算卡;

分解单元720,用于将数据处理算法分解为至少两个类型的处理算核,并根据处理算核的类型将数据处理任务划分为若干个预定处理任务;

第二确定单元730,用于根据功效比和能效比从计算设备中确定出目标计算设备,目标计算设备用于执行预定处理任务;

发送单元740,用于将预定处理任务发送至目标计算设备;

组合单元750,用于接收目标计算设备发送的处理结果,并组合处理结果得到最终处理结果。

综上所述,本发明实施例提供的数据处理装置,通过管理设备根据数据处理任务对应的数据处理算法,从n种计算设备中确定具有执行数据处理任务的能力的计算设备;将数据处理算法分解为至少两个类型的处理算核,并根据处理算核的类型将数据处理任务划分为若干个预定处理任务;根据功效比和能效比从计算设备中确定出目标计算设备,由目标计算设备执行预定处理任务;管理设备将预定处理任务发送至目标计算设备;接收目标计算设备发送的处理结果,并组合处理结果得到最终处理结果;解决了在分配数据处理任务时,从数据处理任务的类型的角度将数据处理任务看作一个整体,只向一个类型的计算设备发送数据处理任务,可能会降低异构系统的计算效率的问题;达到了将一个数据处理任务按其对应的处理算法包括的算核进行拆分,由不同种类的计算设备同时进行数据处理,提高异构系统计算能力和计算效率的效果。

可选的,将发送单元,还用于:

将预定处理任务发送至集中式运算集群中的至少一个服务器和/或分布式运算集群中的至少一个普通计算机;

其中,集中式运算集群中包括至少一种计算卡,分布式运算集群中包括至少一种计算卡。

可选的,至少一种计算卡包括中央处理器CPU类计算卡、图像处理器GPU类计算卡、现场可编程门阵列FPGA类计算卡和数字信号处理DSP类计算卡中的至少一种。

需要说明的是:上述实施例提供的数据处理装置在执行数据处理方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的数据处理装置与数据处理方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1