一种任务处理系统、方法及芯片与流程

文档序号:26947418发布日期:2021-10-12 19:58阅读:89来源:国知局
一种任务处理系统、方法及芯片与流程

1.本发明实施例涉及芯片技术领域,尤其涉及一种任务处理系统、方法及芯片。


背景技术:

2.芯片,又称微电路(microcircuit)、微芯片(microchip)、集成电路(integrated circuit,ic),是指内含集成电路的硅片,体积很小,常常是计算机或其他电子设备的一部分。人工智能芯片能够有效处理人工智能模型,是芯片领域的重点发展方向。
3.人工智能芯片中通常包含多个计算集群,各计算集群各自独立工作,但是也存在需要相互协作的场景。例如,在正向推断计算中,多个计算集群共享权重数据。如果多个集群同时访问一份权重数据,则芯片需要按照获取权重数据的计算集群的数量为每个计算集群均复制一份权重数据,以供各计算集群使用计算。在反向梯度计算中,如果每个计算集群都计算生成一份梯度数据,那么需要在整个芯片范围内将所有的梯度数据规约成一份。
4.发明人在实现本发明的过程中,发现现有技术存在如下缺陷:如果计算集群参与处理权重复制和梯度合并等相互协作的计算场景,需要推迟后续的数据搬运和计算等芯片处理任务,导致整个芯片的计算时间变长,性能变差。


技术实现要素:

5.本发明实施例提供一种任务处理系统、方法及芯片,以实现计算集群资源的高效利用,提高芯片系统性能。
6.第一方面,本发明实施例提供了一种任务处理系统,配置于芯片,包括主计算集群和辅助计算集群,所述主计算集群和所述辅助计算集群保持通信连接;其中:所述主计算集群用于处理主芯片任务;所述主芯片任务包括主计算集群独立处理的任务;所述辅助计算集群用于处理辅助芯片任务;所述辅助芯片任务包括主计算集群联立处理的任务。
7.第二方面,一种任务处理方法,应用于芯片,包括:通过芯片内的主计算集群处理主芯片任务;通过所述芯片内的辅助计算集群处理辅助芯片任务。
8.第三方面,本发明实施例还提供了一种芯片,其特征在于,所述芯片包括本发明任意实施例所提供的所述任务处理系统。
9.本发明实施例通过在芯片中配置保持通信连接的主计算集群和辅助计算集群,通过主计算集群处理包括主计算集群独立处理任务的主芯片任务,通过辅助计算集群处理包括主计算集群联立处理任务的辅助芯片任务,解决现有芯片在计算集群相互协作的场景中,主芯片任务被推迟导致的计算时间变长、性能变差的技术问题,实现计算集群资源的高效利用,提高芯片系统性能。
附图说明
10.图1为本发明实施例一提供的一种任务处理系统的示意图。
11.图2为现有技术中的一种任务处理系统的架构示意图。
12.图3为现有技术中的任务处理系统的工作流程示意图。
13.图4为本发明实施例一提供的一种任务处理系统的架构示意图。
14.图5为本发明实施例一提供的一种任务处理系统的工作流程示意图。
15.图6为本发明实施例一提供的一种辅助计算集群的示意图。
16.图7为本发明实施例二提供的一种任务处理方法的流程图。
17.图8为本发明实施例三提供的一种芯片的示意图。
具体实施方式
18.下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。
19.另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
20.本发明实施例的说明书和权利要求书及附图中的术语“第一”和“第二”等是用于区别不同的对象,而不是用于描述特定的顺序。此外术语“包括”和“具有”以及他们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有设定于已列出的步骤或单元,而是可包括没有列出的步骤或单元。
21.实施例一图1是本发明实施例一提供的一种任务处理系统的示意图,该任务处理系统可以配置于芯片,可选的,该芯片可以是人工智能芯片,其结构包括:主计算集群110和辅助计算集群120,主计算集群110和辅助计算集群120保持通信连接。
22.其中,主计算集群110用于处理主芯片任务;所述主芯片任务包括主计算集群110独立处理的任务;辅助计算集群120用于处理辅助芯片任务;所述辅助芯片任务包括主计算集群110联立处理的任务。
23.具体的,芯片中配置的主计算集群110的数量通常可以是多个,其具体数量可以根据芯片需要处理的主芯片任务量以及对芯片的性能要求确定。主计算集群110配置于芯片中,可以与芯片的片内总线连接,以与外部进行通信连接。
24.各主计算集群110可以包括一个或多个计算核心,以使其具有处理计算任务的功能,从而可以用于处理主芯片任务。主芯片任务所包括的主计算集群110独立处理的任务,包括可以通过若干主计算集群110彼此独立完成的任务。主计算集群110在处理主芯片任务的过程中,各主计算集群110之间无需进行通信,任意主计算集群110处理主芯片任务的过程不会受其他主计算集群110的影响,可以并行进行。
25.相应的,任意芯片中配置的辅助计算集群120的数量可以是一个或多个,可以根据
芯片需要处理的辅助芯片任务量以及对芯片的性能要求确定。辅助计算集群120配置于芯片中,同样可以与芯片的片内总线连接,以与外部进行通信连接,则通过片内总线可以实现主计算集群110与辅助计算集群120之间的通信连接。
26.辅助计算集群120同样具有处理计算任务的功能,可以用于处理辅助芯片任务。辅助芯片任务所包括的主计算集群110联立处理的任务,可以包括与至少两个主计算集群110中的数据相关联的任务。可选的,主计算集群110联立处理的任务可以是单个芯片内多个主计算集群110联立处理的任务,也可以是不同芯片间多个主计算集群110联立处理的任务,本发明实施例对此并不进行限制。辅助计算集群120可以通过与主计算集群110之间的通信,完成辅助芯片任务中需要与主计算集群110进行数据交互的部分,并独立处理剩余计算任务,则该部分辅助芯片任务不占用主计算集群110的资源,其与主芯片任务之间处理过程互不影响,可以并行处理。
27.相应的,图2为现有技术中的一种任务处理系统的架构示意图,其中,任务处理系统也即芯片内部系统。在现有技术中,如图2所示,每个芯片配置有多个计算集群1~n,同时还可以配置有多个存储模块1~m,以及芯片互联模块,其通过片内总线连接成一个系统。相应的,图3为现有技术中的任务处理系统的工作流程示意图。如图3所示,现有技术提供的芯片内部系统架构中,每个计算集群1~n相对独立工作;在某些时间点,计算集群1~n需要处理辅助任务,例如人工智能训练芯片中的正向权重复制和反向梯度数据规约。由于辅助任务占用了计算集群资源,因此辅助任务和计算集群任务0、任务1和任务2只能串行。对于多个集群之间的数据同步辅助任务,即使只调用了一个计算集群,其他的计算集群处于空闲状态,也必须等待辅助任务完成才能处理随后的任务。而上述实施方式通过配置辅助计算集群120,实现将辅助芯片任务交由辅助计算集群120处理,以实现辅助芯片任务与主计算集群110处理的主芯片任务同步处理。
28.示例性的,图4为本发明实施例提供的一种任务处理系统的架构示意图。如图4所示,在系统中引入辅助计算集群,同样连接在总线上,可以访问存储模块中的数据。相应的,图5为本发明实施例提供的一种任务处理系统的工作流程示意图。如图5所示,辅助计算集群可以处理包括运算量较小的辅助计算或者在不同的存储模块间搬运数据在内的辅助芯片任务。
29.在本发明的一个可选实施例中,所述辅助芯片任务可以包括目标数据复制任务;辅助计算集群120具体可以用于:确定存储目标数据的目标存储模块;读取所述目标存储模块以获取所述目标数据;将所述目标数据依次写入目标主计算集群。
30.其中,目标数据复制任务可以是将多个主计算集群110同步需要的数据复制至该多个主计算集群110中的任务。目标数据可以是多个主计算集群110同步需要的数据。目标存储模块可以是配置于芯片的用于存储目标数据的存储空间。目标主计算集群可以是同步需要目标数据的多个主计算集群110。
31.相应的,芯片中的多个主计算集群110在相互协作的场景下会出现同步需要同一部分数据的情况,若由该多个主计算集群110各自独立地同时访问该部分目标数据的存储空间以获取该部分数据,会导致总线和存储竞争,引起系统性能下降。为了避免此情况,可以通过单次访问该存储空间并读取到该部分数据后,将数据复制至该多个主计算集群110。示例性的,人工智能芯片在正向推断中,多个主计算集群110共享权重数据,则芯片需要将
权重数据为每个主计算集群110复制一份。
32.为实现上述过程,可以生成目标数据复制任务,则目标数据复制任务需要主计算集群110联立处理,为辅助芯片任务,可以通过辅助计算集群120处理。辅助计算集群120可以确定出存储目标数据的目标存储模块,并通过片内总线访问目标存储模块,读取目标存储模块以获取所述目标数据。进一步的,辅助计算集群120可以进行数据复制计算,根据需要目标数据的目标主计算集群的数量,将目标数据为每个目标主计算集群复制一份,依次写入各目标主计算集群。辅助计算集群120将目标数据写入各目标主计算集群的顺序可以根据预设规则确定,在此不做限定。
33.目标数据复制任务若由主计算集群110处理,则会导致处理该主计算集群110中的主芯片任务或任意后续任务被推迟,导致芯片的计算时间变长,性能变差。而在上述实施方式中,由辅助计算集群120处理目标数据复制任务,各目标主计算集群仅在辅助计算集群120将目标数据写入时对目标数据进行存储,在辅助计算集群120对目标数据进行数据复制计算的过程中,各主计算集群110均可以同步处理其各自的主芯片任务。
34.在本发明的一个可选实施例中,所述辅助芯片任务可以包括目标数据规约任务;辅助计算集群120具体可以用于:确定存储目标数据的目标主计算集群;读取各目标主计算集群,以获取各目标主计算集群存储的目标数据;对各所述目标数据按照数据规约处理策略进行数据规约处理。
35.其中,目标数据规约任务可以是将多个主计算集群110中存储的特定部分数据规约成为一份数据的任务。目标数据可以是分别存储于多个主计算集群110并需要被规约成为同一份数据的数据。目标主计算集群可以是存储有目标数据的多个主计算集群110。数据规约处理策略可以是预先设定的用于规定将目标数据规约成为同一份数据的具体操作过程的策略,可以包括对个目标主计算集群的读取顺序。数据规约处理可以是将目标数据规约成为同一份数据的操作。
36.相应的,芯片中的多个主计算集群110在相互协作的场景下,会出现需要将该多个主计算集群110中存储的数据规约成为一份的情况,则可以通过分别通过该多个主计算集群110获取需要规约成为同一份数据的多部分数据,通过相应的数据规约计算将该多部分数据规约成为一份数据。示例性的,人工智能芯片在反向梯度计算中,每个主计算集群110各自计算一份梯度数据,则需要在整个芯片范围内将各部分梯度数据规约成为一份数据。
37.为实现上述过程,可以生成目标数据规约任务,则目标数据规约任务需要主计算集群110联立处理,为辅助芯片任务,可以通过辅助计算集群120处理。辅助计算集群120可以确定出存储目标数据的目标主计算集群,并通过片内总线访问目标主计算集群,读取目标主计算集群以获取所述目标数据。进一步的,辅助计算集群120可以进行数据规约计算,对各目标数据按照数据规约处理策略进行数据规约处理,以将多部分目标数据规约成为一份数据。
38.在本发明的一个可选实施例中,所述辅助芯片任务可以包括目标数据规约任务;主计算集群110具体可以用于:确定存储目标数据的关联主计算集群;联立各所述关联主计算集群,将各所述目标数据按照约定数据发送顺序依次发送至辅助计算集群120;辅助计算集群120具体可以用于:接收各所述目标数据;对各所述目标数据按照数据规约处理策略进行数据规约处理。
39.其中,关联主计算集群可以是存储有目标数据的多个主计算集群110。约定数据发送顺序可以是向辅助计算集群120进行目标数据发送时,各关联主计算集群之间的发送操作执行顺序。
40.相应的,通过辅助计算集群120处理目标数据规约任务时,还可以由其中一个主计算集群110确定出存储目标数据的其他关联主计算集群,从而通过联立各关联主计算集群,使该主计算集群110和各关联主计算集群分别将各自存储的目标数据按照约定数据发送顺序依次发送至辅助计算集群120。进一步的,辅助计算集群120可以接收各目标数据,并进行数据规约计算,对接收到的各目标数据按照数据规约处理策略进行数据规约处理,以将多部分目标数据规约成为一份数据。
41.目标数据规约任务若由主计算集群110处理,则会导致处理该主计算集群110中的主芯片任务或任意后续任务被推迟,导致芯片的计算时间变长,性能变差。而在上述实施方式中,由辅助计算集群120处理目标数据规约任务,主计算集群110仅在辅助计算集群120读取目标数据时进行响应,或将各自存储的目标数据发送至辅助计算集群120,在辅助计算集群120对目标数据进行数据规约计算的过程中,各主计算集群110均可以同步处理其各自的主芯片任务。
42.在本发明的一个可选实施例中,辅助计算集群120还可以用于:在确定不存在所述辅助芯片任务的情况下,与主计算集群110并行处理所述主芯片任务。
43.相应的,若确定不存在辅助芯片任务,说明当前仅由主计算集群110彼此独立地处理主芯片任务即可实现芯片功能。此时,辅助计算集群120没有需要处理的辅助芯片任务,则可以通过总线与外部通信,分担处理部分主计算集群110需要处理主芯片任务,避免辅助计算集群120处于空闲,进一步提高了芯片计算能力的利用率以及芯片性能。
44.在本发明的一个可选实施例中,辅助计算集群120具体可以用于:在确定主计算集群110满足任务并行处理条件的情况下,与主计算集群110按照集群优先级并行处理所述主芯片任务;在确定主计算集群110不满足任务并行处理条件的情况下,与主计算集群110串行处理提前调度主芯片任务。
45.其中,所述任务并行处理条件包括第一任务并行处理条件和/或第二任务并行处理条件;所述第一任务并行处理条件包括主计算集群110存在空闲集群;所述第二任务并行处理条件包括芯片存储带宽未达到满载阈值。
46.具体的,空闲集群可以是当前时刻没有任何任务需要处理的主计算集群110。芯片存储带宽可以是主计算集群110向芯片存储数据时占用的带宽。满载阈值可以是主计算集群110向芯片存储数据时允许占用的最大带宽。集群优先级可以是辅助计算集群120与各主计算集群110并行处理主芯片任务时对芯片资源占用的优先级,集群优先级越高的辅助计算集群120或主计算集群110可以优先占用芯片资源以处理其主芯片任务。提前调度主芯片任务可以是与其他任意任务之间不存在数据依赖的任务。
47.相应的,第一任务并行处理条件可以说明当前时刻主计算集群110存在空闲集群不需要处理任何任务,则主计算集群110产生的外部通信较少,辅助计算集群120不易与主计算集群110发生资源竞争。第二任务并行处理条件可以说明当前时刻芯片中仍有可用存储带宽资源未被占用,则辅助计算集群120不会与主计算集群110发生对存储带宽资源的竞争。因此,若确定主计算集群110满足第一任务并行处理条件和/或第二任务并行处理条件,
则辅助计算集群120可以与主计算集群110并行处理主芯片任务。辅助计算集群120与主计算集群110需要按照集群优先级并行处理主芯片任务,若发生对存储带宽或任意资源的竞争,集群优先级较高的计算集群优先处理其主芯片任务。可选的,可以将主计算集群110设置为高优先级,辅助计算集群120设置为低优先级。
48.若确定主计算集群110不满足任务并行处理条件的情况下,则若辅助计算集群120与主计算集群110并行处理各自的任务,易发生对存储带宽或任意资源的竞争。此时,由于提前调度主芯片任务与其他任意任务之间均不存在数据依赖关系,则辅助计算集群120可以与主计算集群110串行处理提前调度主芯片任务。
49.上述实施方式在辅助计算集群120无需处理辅助芯片任务的情况下,通过辅助计算集群120分担主计算集群110的主芯片任务,并提供了合理的任务处理规则,同时避免了任意计算集群长时间空闲以及计算集群之间的资源或带宽竞争,优先保证主计算集群110的任务处理效率和可靠性,提高系统性能。
50.在本发明的一个可选实施例中,辅助计算集群120还与关联芯片的关联辅助计算集群之间保持通信连接;辅助计算集群120还用于:与所述关联辅助计算集群进行数据交互,以联立所述关联辅助计算集群共同处理所述辅助芯片任务。
51.其中,关联芯片可以是保持通信连接的多个芯片中的任意芯片。关联辅助计算集群可以是关联芯片中配置的辅助计算集群。
52.相应的,若系统中配置有多芯片,且多芯片之间保持通信连接,则辅助计算集群120可以与关联芯片的关联辅助计算集群之间保持通信连接,从而与关联辅助计算集群进行数据交互,以联立关联辅助计算集群共同处理辅助芯片任务,例如在分布式系统中可以通过辅助计算集群120搬运或计算关联芯片的数据。上述实施方式可以进一步提高系统性能。
53.图6为本发明实施例提供的一种辅助计算集群120的示意图。在本发明的一个可选实施例中,如图6所示,辅助计算集群120可以包括计算核心模块1201、缓存模块1202以及dma(direct memory access,直接存储器访问)模块1203。
54.其中,计算核心模块1201与dma模块1203通信连接,用于接收dma模块1203发送的缓存数据,并根据所述缓存数据进行任务处理;dma模块1203与缓存模块1202通信连接,用于从缓存模块1202读取所述缓存数据;缓存模块1202用于存储所述缓存数据。
55.相应的,计算核心模块1201通过接收缓存数据,并根据缓存数据进行任务处理,以使辅助计算集群120具有处理计算任务的能力。dma模块1203通过读取缓存数据,以及缓存模块1202通过存储所述缓存数据,使辅助计算集群120进一步具有处理辅助芯片任务和/或主芯片任务的能力。
56.可选的,辅助计算集群120的工作流程具体可以包括在处理目标数据复制任务场景下的工作流程,以及在处理目标数据规约任务场景下的工作流程。
57.具体的,辅助计算集群120在处理目标数据复制任务场景下,可以通过dma模块1203从指定的系统存储模块或者主计算集群中读入目标数据,复制多份后写入到多个不同的系统存储模块或者主计算集群。辅助计算集群120在处理目标数据规约任务场景下,可以通过dma模块1203从多个系统存储模块或者主计算集群读入目标数据并写入到存储模块1202;通过计算核心模块1201从存储模块1202中读取目标数据做规约计算,计算完成后把
结果写回到存储模块1202;最后通过dma模块1203再从存储模块中读取结果数据并写到指定的存储模块或者主计算集群。
58.本发明实施例的技术方案,通过在芯片中配置保持通信连接的主计算集群和辅助计算集群,通过主计算集群处理包括主计算集群独立处理任务的主芯片任务,通过辅助计算集群处理包括主计算集群联立处理任务的辅助芯片任务,解决现有芯片在计算集群相互协作的场景中,主芯片任务被推迟导致的计算时间变长、性能变差的技术问题,实现计算集群资源的高效利用,提高芯片系统性能。
59.实施例二图7是本发明实施例二提供的一种任务处理方法的流程图,本实施例可适用于的情况,该方法可以由配置有本发明实施例提供任务处理系统的芯片来执行。相应的,如图7所示,该方法包括如下操作:s210、通过芯片内的主计算集群处理主芯片任务。
60.s220、通过所述芯片内的辅助计算集群处理辅助芯片任务。
61.其中,所述主芯片任务包括主计算集群独立处理的任务;所述辅助芯片任务包括主计算集群联立处理的任务。
62.在本发明的一个可选实施例中,所述辅助芯片任务包括目标数据复制任务;通过所述芯片内的辅助计算集群处理辅助芯片任务,可以包括:通过所述芯片内的辅助计算集群确定存储目标数据的目标存储模块;通过所述芯片内的辅助计算集群读取所述目标存储模块以获取所述目标数据;通过所述芯片内的辅助计算集群将所述目标数据依次写入目标主计算集群。
63.在本发明的一个可选实施例中,所述辅助芯片任务包括目标数据规约任务;通过所述芯片内的辅助计算集群处理辅助芯片任务,可以包括:通过所述芯片内的辅助计算集群确定存储目标数据的目标主计算集群;通过所述芯片内的辅助计算集群读取各所述目标主计算集群,以获取各所述目标主计算集群存储的目标数据;通过所述芯片内的辅助计算集群对各所述目标数据按照数据规约处理策略进行数据规约处理。
64.在本发明的一个可选实施例中,所述辅助芯片任务包括目标数据规约任务;通过所述芯片内的辅助计算集群处理辅助芯片任务,可以包括:通过芯片内的主计算集群确定存储目标数据的关联主计算集群;通过芯片内的主计算集群联立各所述关联主计算集群,将各所述目标数据按照约定数据发送顺序依次发送至所述辅助计算集群;通过所述芯片内的辅助计算集群接收各所述目标数据;通过所述芯片内的辅助计算集群对各所述目标数据按照数据规约处理策略进行数据规约处理。
65.在本发明的一个可选实施例中,所述方法还可以包括:通过所述芯片内的辅助计算集群在确定不存在所述辅助芯片任务的情况下,与所述主计算集群并行处理所述主芯片任务。
66.在本发明的一个可选实施例中,通过所述芯片内的辅助计算集群在确定不存在所述辅助芯片任务的情况下,与所述主计算集群并行处理所述主芯片任务,可以包括:通过所述芯片内的辅助计算集群在确定所述主计算集群满足任务并行处理条件的情况下,与所述主计算集群按照集群优先级并行处理所述主芯片任务;通过所述芯片内的辅助计算集群在确定所述主计算集群不满足任务并行处理条件的情况下,与所述主计算集群串行处理提前
调度主芯片任务;其中,所述任务并行处理条件包括第一任务并行处理条件和/或第二任务并行处理条件;所述第一任务并行处理条件包括主计算集群存在空闲集群;所述第二任务并行处理条件包括芯片存储带宽未达到满载阈值。
67.在本发明的一个可选实施例中,所述辅助计算集群还与关联芯片的关联辅助计算集群之间保持通信连接;所述方法还可以包括:通过所述芯片内的辅助计算集群与所述关联辅助计算集群进行数据交互,以联立所述关联辅助计算集群共同处理所述辅助芯片任务。
68.在本发明的一个可选实施例中,所述辅助计算集群包括计算核心模块、缓存模块以及dma模块;其中,所述计算核心模块与所述dma模块通信连接,所述dma模块与所述缓存模块通信连接;通过所述芯片内的辅助计算集群处理辅助芯片任务,可以包括:通过所述芯片内的辅助计算集群的计算核心模块接收所述dma模块发送的缓存数据,并根据所述缓存数据进行任务处理;通过所述芯片内的辅助计算集群的dma模块从所述缓存模块读取所述缓存数据;通过所述芯片内的辅助计算集群的缓存模块存储所述缓存数据。
69.本发明实施例的技术方案,通过在芯片中配置保持通信连接的主计算集群和辅助计算集群,通过主计算集群处理包括主计算集群独立处理任务的主芯片任务,通过辅助计算集群处理包括主计算集群联立处理任务的辅助芯片任务,解决现有芯片在计算集群相互协作的场景中,主芯片任务被推迟导致的计算时间变长、性能变差的技术问题,实现计算集群资源的高效利用,提高芯片系统性能。
70.实施例三图8是本发明实施例三提供的一种芯片的示意图,该芯片配置有本发明实施例提供任务处理系统。相应的,如图8所示,芯片31配置有任务处理系统,该系统包括:主计算集群311和辅助计算集群312,主计算集群311和辅助计算集群312保持通信连接。
71.其中,主计算集群311用于处理主芯片任务;所述主芯片任务包括主计算集群311独立处理的任务;辅助计算集群312用于处理辅助芯片任务;所述辅助芯片任务包括主计算集群311联立处理的任务。
72.在本发明的一个可选实施例中,所述辅助芯片任务包括目标数据复制任务;辅助计算集群312具体可以用于:确定存储目标数据的目标存储模块;读取所述目标存储模块以获取所述目标数据;将所述目标数据依次写入目标主计算集群。
73.在本发明的一个可选实施例中,所述辅助芯片任务包括目标数据规约任务;辅助计算集群312具体可以用于:确定存储目标数据的目标主计算集群;读取各所述目标主计算集群,以获取各所述目标主计算集群存储的目标数据;对各所述目标数据按照数据规约处理策略进行数据规约处理。
74.在本发明的一个可选实施例中,所述辅助芯片任务包括目标数据规约任务;主计算集群311具体可以用于:确定存储目标数据的关联主计算集群;联立各所述关联主计算集群,将各所述目标数据按照约定数据发送顺序依次发送至所述辅助计算集群;辅助计算集群312具体可以用于:接收各所述目标数据;对各所述目标数据按照数据规约处理策略进行数据规约处理。
75.在本发明的一个可选实施例中,辅助计算集群312还可以用于:在确定不存在所述辅助芯片任务的情况下,与所述主计算集群并行处理所述主芯片任务。
76.在本发明的一个可选实施例中,辅助计算集群312具体可以用于:在确定主计算集群311满足任务并行处理条件的情况下,与主计算集群311按照集群优先级并行处理所述主芯片任务;在确定主计算集群311不满足任务并行处理条件的情况下,与主计算集群311串行处理提前调度主芯片任务;其中,所述任务并行处理条件包括第一任务并行处理条件和/或第二任务并行处理条件;所述第一任务并行处理条件包括主计算集群311存在空闲集群;所述第二任务并行处理条件包括芯片存储带宽未达到满载阈值。
77.在本发明的一个可选实施例中,辅助计算集群312还与关联芯片的关联辅助计算集群之间保持通信连接;辅助计算集群312还可以用于:与所述关联辅助计算集群进行数据交互,以联立所述关联辅助计算集群共同处理所述辅助芯片任务。
78.在本发明的一个可选实施例中,辅助计算集群312包括计算核心模块、缓存模块以及直接存储器访问dma模块;其中:所述计算核心模块与所述dma模块通信连接,用于接收所述dma模块发送的缓存数据,并根据所述缓存数据进行任务处理;所述dma模块与所述缓存模块通信连接,用于从所述缓存模块读取所述缓存数据;所述缓存模块用于存储所述缓存数据。
79.本发明实施例的技术方案,通过在芯片中配置保持通信连接的主计算集群和辅助计算集群,通过主计算集群处理包括主计算集群独立处理任务的主芯片任务,通过辅助计算集群处理包括主计算集群联立处理任务的辅助芯片任务,解决现有芯片在计算集群相互协作的场景中,主芯片任务被推迟导致的计算时间变长、性能变差的技术问题,实现计算集群资源的高效利用,提高芯片系统性能。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1