一种GPU加速的批处理同构稀疏矩阵乘满向量的处理方法与流程

文档序号:11133888阅读:来源:国知局
技术总结
本发明公开了一种GPU加速的批处理同构稀疏矩阵乘满向量的处理方法,所述方法包括:(1)在CPU中将所有矩阵A1~Abs存储为行压缩存储格式;(2)CPU将GPU内核函数所需数据传输给GPU;(3)将矩阵A1~Abs的乘满向量任务分配给GPU线程,并优化内存访问模式;(4)GPU中执行批处理同构稀疏矩阵乘满向量内核函数spmv_batch,调用内核函数来批处理并行计算同构稀疏矩阵乘满向量。本发明中CPU负责控制程序的整体流程和准备数据,GPU负责计算密集的向量乘法,利用批处理模式提高了算法并行度和访存效率,大幅降低了批量稀疏矩阵乘满向量的计算时间。

技术研发人员:周赣;孙立成;秦成明;张旭;柏瑞;冯燕钧;傅萌
受保护的技术使用者:东南大学
文档号码:201610814518
技术研发日:2016.09.12
技术公布日:2017.02.15

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1