本申请实施例涉及计算机,特别涉及一种计算设备和任务处理方法。
背景技术:
1、npu(neural network processing unit,神经网络处理器)具有计算速度快,功耗低的特点,因此非常适合视频、图像等数据的处理任务。相关技术中,计算设备中包括多个npu,这多个npu分别用于处理不同类型的任务,由于某些类型的任务数量较少,因此用于执行该类型的任务的npu会出现闲置情况,导致npu的利用效率低。
技术实现思路
1、本申请实施例提供了一种计算设备和任务处理方法,能够提高计算设备中npu的利用效率。技术方案如下:
2、根据本申请实施例的一方面,提供了一种计算设备,所述计算设备包括神经网络处理器npu、第一存储器和第二存储器,所述npu与所述第一存储器直接连接,并且通过总线与所述第二存储器连接;
3、所述第一存储器,用于存储第一类型任务的任务数据;
4、所述第二存储器,用于存储第二类型任务的任务数据,所述第一类型任务要求的处理延时低于所述第二类型任务要求的处理延时;
5、所述npu,用于获取所述第一存储器中的任务数据,并通过所述总线获取所述第二存储器中的任务数据,基于所获取的任务数据处理任务。
6、根据本申请实施例的另一方面,提供了一种任务处理方法,所述方法由计算设备执行,所述计算设备包括神经网络处理器npu、第一存储器和第二存储器,所述npu与所述第一存储器直接连接,并且通过总线与所述第二存储器连接;所述方法包括:
7、通过所述第一存储器,存储第一类型任务的任务数据;
8、通过所述第二存储器,存储第二类型任务的任务数据,所述第一类型任务要求的处理延时低于所述第二类型任务要求的处理延时;
9、通过所述npu,获取所述第一存储器中的任务数据,并通过所述总线获取所述第二存储器中的任务数据,基于所获取的任务数据处理任务。
10、在本申请实施例提供的计算设备中,npu不仅与第一存储器直接连接,还通过总线与第二存储器连接,这样npu不仅能够从第一存储器中获取到第一类型任务的任务数据,还能够通过总线从第二存储器中获取到第二类型任务的任务数据,从而能够处理多种类型的任务,以避免由于某种类型的任务数量较少导致npu出现闲置情况,从而提高npu的利用效率。
1.一种计算设备,其特征在于,所述计算设备包括神经网络处理器npu、第一存储器和第二存储器,所述npu与所述第一存储器直接连接,并且通过总线与所述第二存储器连接;
2.根据权利要求1所述的计算设备,其特征在于,所述npu包括存储模块,所述npu用于:
3.根据权利要求1所述的计算设备,其特征在于,所述计算设备还包括中央处理器cpu;
4.根据权利要求3所述的计算设备,其特征在于,所述npu用于:
5.根据权利要求4所述的计算设备,其特征在于,所述npu用于:
6.根据权利要求4所述的计算设备,其特征在于,所述npu用于:
7.根据权利要求4所述的计算设备,其特征在于,所述任务数据包括神经网络的输入数据和所述神经网络中的多个算子对应的权重参数,所述输入数据包括多个单位输入数据;
8.根据权利要求3所述的计算设备,其特征在于,所述cpu,还用于确定计算量不小于所述计算量阈值的任务,向所述npu发送携带所述任务的第二处理指令;
9.根据权利要求1所述的计算设备,其特征在于,所述计算设备还包括中央处理器cpu;
10.根据权利要求9所述的计算设备,其特征在于,所述npu还用于:
11.根据权利要求1所述的计算设备,其特征在于,所述计算设备还包括中央处理器cpu;
12.一种任务处理方法,其特征在于,所述方法由计算设备执行,所述计算设备包括神经网络处理器npu、第一存储器和第二存储器,所述npu与所述第一存储器直接连接,并且通过总线与所述第二存储器连接;所述方法包括: