一种算子融合的方法、装置、存储介质及电子设备与流程

文档序号:30595935发布日期:2022-07-01 20:40阅读:来源:国知局

技术特征:
1.一种算子融合方法,其特征在于,包括:遍历中间表征的多个算子;确定所述多个算子之间的执行关系,所述执行关系指示所述多个算子的输入与输出之间的关系;根据所述多个算子的类型,确定所述多个算子的算子标识,所述算子标识包括主算子与后融合算子;基于所述算子之间的执行关系和所述算子标识进行算子融合。2.根据权利要求1所述的方法,其特征在于,所述基于所述算子之间的执行关系和所述算子标识进行算子融合,包括:遍历所述多个算子,第一算子为所述多个算子中的一个,在确定所述第一算子的算子类型为所述主算子时,根据所述执行关系,遍历在所述第一算子之后执行的算子,在所述第一算子之后存在连续的一个或多个算子类型为后融合算子的算子时,将所述连续的一个或多个算子插入到所述第一算子后面,得到融合算子。3.根据权利要求1或2所述的方法,其特征在于,确定多个所述算子之间的执行关系,包括:建立算子的输入映射表和输出映射表,所述输入映射表包括每个算子的算子索引和输入变量的地址信息,所述输出映射表包括每个算子的算子索引与输出变量的地址信息;基于所述输入映射表和所述输出映射表,确定多个所述算子之间的执行关系。4.根据权利要求2所述的方法,其特征在于,所述将所述连续的一个或多个算子插入到所述第一算子后面,得到融合算子之前,包括:建立融合映射表,将所述连续的一个或多个算子依次存储到所述融合映射表,并将所述连续的一个或多个算子从所述中间表征中删除;将存储在所述融合映射表中的所述连续的一个或多个算子插入到所述第一算子之后,得到融合算子。5.根据权利要求1所述的方法,其特征在于,所述对多个所述算子中每个算子进行算子标识,包括:所述多个算子中多元素操作的算子的算子标识为主算子;所述多个算子中单元素操作的算子的算子标识为后融合算子。6.根据权利要求1所述的方法,其特征在于,包括:所述融合算子中所述后融合算子的分片策略与所述融合算子中所述主算子的分片策略相同。7.根据权利要求6所述的方法,其特征在于,包括:所述融合算子中的所述后融合算子根据所述主算子的偏移地址进行计算。8.一种算子融合装置,其特征在于,包括获取单元、存储单元和融合单元:所述获取单元遍历中间表征的多个算子,获取每个算子的算子标识、输入变量和输出变量的地址信息;获取多个算子中每个算子的算子类型,算子类型包括主算子与后融合算子;所述存储单元建立多个算子的输入映射表和输出映射表,输入映射表包括每个算子的算子标识与输入变量的地址信息,输出映射表包括每个算子的算子标识与输出变量的地址
信息;创建融合映射表,将连续的一个或多个算子的算子标识与算子名依次存储到融合映射表;所述融合单元基于输入映射表和输出映射表,确定多个算子之间的执行关系;遍历多个算子,在确定第一算子的算子类型为主算子时,根据执行关系,遍历在第一算子之后执行的算子,在第一算子之后存在连续的一个或多个算子类型为融合算子的算子时,将融合映射表中算子标识指示的算子从中间表征中删除,并将融合映射表中算子标识指示的算子插入到第一算子之后,得到融合算子。9.一种电子设备,其特征在于,包括存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于执行存储器中存储的计算机程序,以实现如权利要求1-7中任一项所述的方法。10.一种计算机可读存储介质,其特征在于,包括程序或指令,当所述程序或指令在计算机设备上执行时,实现如权利要求1-7中任一项所述的方法。

技术总结
本申请提供一种算子融合的方法、装置、存储介质及电子设备,该融合方法包括:建立各算子之间输入输出的关系,对算子进行融合类型标识,根据算子关系查看前后算子的融合类型标识,根据融合类型对前后算子进行融合。融合之前,各个算子需要将数据从片外内存拷贝到片上内存分别进行计算,再将计算结果数据从片上内存拷贝到片外内存。融合后的各算子可以看作为一个大算子,减少了数据的输入输出拷贝次数,提升深度学习性能。提升深度学习性能。提升深度学习性能。


技术研发人员:ꢀ(74)专利代理机构
受保护的技术使用者:安徽寒武纪信息科技有限公司
技术研发日:2020.12.31
技术公布日:2022/6/30
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1