一种智能计算异构多核处理方法与平台与流程

文档序号:14870359发布日期:2018-07-06 22:34阅读:512来源:国知局

本发明属于智能计算领域,涉及一种智能计算异构多核处理方法与平台。



背景技术:

现阶段的智能计算系统主要采用cpu+gpu或者cpu+fpga结构来实现。gpu对许多机器学习框架的支持都比较好,并行处理能力强,使用cpu+gpu结构的实现方式可以充分利用现有的机器学习框架和gpu的并行处理能力,实现简单且效果非常好,但gpu能直接处理的数据格式有限,难以实现数据的实时采集与处理;fpga具有功耗小,实现方式灵活等优点,采用cpu+fpga的实现方式可以根据具体应用对硬件实现进行优化,支持多格式数据输入,但fpga的计算资源有限,没有现成的机器学习框架可供使用,实现比较复杂。这两种结构有着各自的优点,也存在一定的局限性,这些局限性使得它们的应用范围受到限制,缺乏灵活性。



技术实现要素:

本发明的目的:

本发明根据传统智能计算实现方式存在的问题与局限性,提出了智能计算异构多核处理方法与平台,采用cpu+gpu+fpga结构,支持多格式数据输入,可以实时采集数据并处理,能够根据需要选择合适的子卡模块和工作方式,有效解决了传统实现方式应用范围有限,灵活性差的缺点。

本发明的技术方案:

本发明提出的一种智能计算异构多核处理方法与平台,一是用于智能计算的实时数据处理方法,二是基于该方法实现提出的异构多核处理平台。

一种智能计算异构多核处理方法,该方法采用cpu+gpu+fpga结构;fpga采集数据并对数据进行预处理,将数据转换为gpu算法运行方便处理的数据格式后送给gpu,gpu运行智能算法对数据进行处理,处理完成后的数据根据具体应用场景,可以将处理结果直接显示出来,也可以由cpu控制传给其他外部处理单元处理;流程中的每一步都需要由cpu参与完成任务的控制管理工作。

所述cpu的管理与控制能力比较强,主要用于任务分配和管理调度,还用于和其他外部处理单元的通信,成为该平台与外部处理单元分工合作的桥梁。

所述gpu的并行计算能力强,并且支持很多机器学习框架,主要用于智能算法的实现。

所述fpga的灵活性好,支持多格式数据输入,主要用于数据采集和预处理。

一种实现智能计算异构多核处理方法的平台,该平台由cpu子卡模块、gpu子卡模块、fpga子卡模块和载板四部分组成,载板上集成三个处理器子卡的连接器接口和外围电路,三个处理器以子卡形式插在载板上,规定每个子卡连接器接口上的信号定义,子卡严格遵照规定的信号定义匹配子卡连接器,同一模块上的不同处理能力的子卡之间互相兼容,载板上三个子卡连接器之间通过pcie、rapidio、i2c总线连接,用于三个子卡之间的通信,每个子卡模块包含各自独立的数据接口和通信接口,gpu子卡模块还包含显示接口。

该平台可以根据应用环境需求选择所需要的不同类型的子卡模块,也可以根据计算任务量需求为每种类型的子卡模块配置不同型号、不同处理能力的子卡。三个处理器子卡模块可以单独工作,也可以相互之间协同工作,协同工作可以采用传统的cpu+gpu或者cpu+fpga协同工作模式,也可以采用三者协同工作模式,三者协同典型的应用方式为本发明提出的用于智能计算的实时数据处理方法,该方法中cpu用于控制,gpu用于实现智能算法,fpga用于数据的采集和预处理,三者协同可实现数据的实时采集处理与结果的显示。

本发明具有的优点效果:

本发明提出的智能计算异构多核处理方法与平台采用cpu+gpu+fpga结构,可以实现数据的实时采集与处理,支持多格式数据输入。平台上集成cpu、gpu和fpga三个处理器模块,这三个模块以子卡形式插在载板上,可根据应用场景和计算任务需求选择合适的处理器模块或为每个处理器模块配置相应处理能力的子卡,三个处理器模块可单独工作,也可以协同工作,能够同时发挥fpga灵活自主和gpu并行计算的优点,可以满足不同环境下的多种计算需求,灵活性和通用性较好。

附图说明

图1异构多核处理方法工作流程图;

图2异构多核处理平台系统结构图。

具体实施方式

将该方法与平台应用于无人机航拍与识别,采用三者协同的工作方式进一步详细说明。

本平台的cpu子卡模块采用的是p2020,用于整个过程的控制和地面工作站的交互,fpga模块采用的是xc7z045,用于采集视频图像和对数据的预处理,gpu子卡模块采用的是tx1,用于运行智能识别算法。整个平台搭载在无人机上,处理结果通过无人机上的无线图传模块(即外部处理单元)返回给地面工作站。具体步骤如下:

(1)无人机在空中飞行拍摄,获取原始视频图像信息,并对原始图像进行预处理。该工作主要由fpga完成,fpga通过将摄像头采集到的模拟视频图像转化成数字图像,并完成预处理过程,将数据转换成算法便于处理的数据格式后,通过pcie总线送给gpu。

(2)运行智能识别算法对目标进行识别。该工作主要由gpu完成,gpu上搭载caffe机器学习框架,运行基于该框架实现的识别算法,对视频图像进行实时识别处理。

(3)处理结果显示给地面工作站。该部分主要由cpu配合无人机上的图传模块完成。gpu处理完成后,通过以太网将结果送至图传模块,cpu控制图传模块与地面工作站的交互,完成结果的显示。

(4)整个过程中,系统的管理与任务的分配由cpu完成。cpu将并行度高的算法处理任务交给gpu完成,将其他一般的任务交给fpga完成,此外,cpu还负责与无人机上的无线图传模块进行交互。



技术特征:

技术总结
本发明提出了一种智能计算异构多核处理方法,该方法采用CPU+GPU+FPGA结构;FPGA采集数据并对数据进行预处理,将数据转换为GPU算法运行方便处理的数据格式后送给GPU,GPU运行智能算法对数据进行处理,处理完成后的数据根据具体应用场景,可以将处理结果直接显示出来,也可以由CPU控制传给其他外部处理单元处理;流程中的每一步都需要由CPU参与完成任务的控制管理工作。实现上述方法的平台由CPU子卡模块、GPU子卡模块、FPGA子卡模块和载板四部分组成,载板上集成三个处理器子卡的连接器接口和外围电路,三个处理器以子卡形式插在载板上,可以实现数据的实时采集与处理,满足不同环境下的多种计算需求,灵活性和通用性较好。

技术研发人员:郭锋;文鹏程;白林亭;程陶然;牛伟;路辉
受保护的技术使用者:中国航空工业集团公司西安航空计算技术研究所
技术研发日:2017.12.07
技术公布日:2018.07.06
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1