一种GPU加速的批处理同构稀疏矩阵乘满向量的处理方法与流程

文档序号：11133888阅读：来源：国知局

技术总结
本发明公开了一种GPU加速的批处理同构稀疏矩阵乘满向量的处理方法，所述方法包括：(1)在CPU中将所有矩阵A1～Abs存储为行压缩存储格式；(2)CPU将GPU内核函数所需数据传输给GPU；(3)将矩阵A1～Abs的乘满向量任务分配给GPU线程，并优化内存访问模式；(4)GPU中执行批处理同构稀疏矩阵乘满向量内核函数spmv_batch，调用内核函数来批处理并行计算同构稀疏矩阵乘满向量。本发明中CPU负责控制程序的整体流程和准备数据，GPU负责计算密集的向量乘法，利用批处理模式提高了算法并行度和访存效率，大幅降低了批量稀疏矩阵乘满向量的计算时间。

技术研发人员：周赣;孙立成;秦成明;张旭;柏瑞;冯燕钧;傅萌
受保护的技术使用者：东南大学
文档号码：201610814518
技术研发日：2016.09.12
技术公布日：2017.02.15

完整全部详细技术资料下载

当前第3页1 2 3