一种基于图形处理单元的稀疏表示快速计算方法

文档序号：6629495阅读：200来源：国知局

一种基于图形处理单元的稀疏表示快速计算方法
【专利摘要】本发明涉及视频图像的超分辨率重建【技术领域】，尤其涉及一种基于图形处理单元的稀疏表示快速计算方法，包括：对字典矩阵中的原子进行分类，构造字典树，对所述字典树进行调整，得到连续的字典数组；将所述字典数组和待处理的信号矩阵发送到图形处理单元中；将所述信号矩阵内拆分为若干个并行单元，所述并行单元包括若干个特征向量；在图形处理单元中，为每一个所述特征向量建立一个线程；在每一个所述线程中，遍历所述字典数组，得到所述线程对应的特征向量的稀疏表示，本发明通过并行单元对多个特征向量同时进行处理，有效利用硬件的并行计算能力，提高图像特征提取的速度，从而加快标清图像转高清图像的处理过程。
【专利说明】一种基于图形处理单元的稀疏表示快速计算方法

【技术领域】
[0001] 本发明涉及视频图像的超分辨率重建【技术领域】，尤其涉及一种基于图形处理单元的稀疏表示快速计算方法。

【背景技术】
[0002] 图像超分辨技术可以分为单帧图像超分辨率技术和多帧图像超分辨率技术，前者只需要场景中的一幅图像，而后者需要同一个场景的视频序列。
[0003] 超分辨率重建是一个通过利用低分辨率视频图像的帧间或帧内互补信息获得更高分辨视频图像的过程，近年来，国内外在超分辨率重建研究方面产生了很多研究成果，从研究方法论的角度来看，可以划分为基于插值的方法、基于重建的方法和基于学习的方法。不管哪种方法，都涉及到大量的矩阵运算，因此，要达到实时，必须使用并行处理来加速。
[0004] 近几十年来，CPU的发展降低了计算机的成本，再加上性能的提升促进了整个计算机行业的发展。然而最近十年来，在硬件方面受耗能与散热问题的影响，使得单个CPU的运算能力提升受到限制，因此多核CPU的并行计算应用受到关注，但是多核CPU的并行计算能力依然难以满足目前社会对大数据以及高清、实时数据处理等要求。

【发明内容】

[0005] 本发明的目的在于提出一种基于图形处理单元的稀疏表示快速计算方法，有效利用硬件的并行计算能力，提高图像特征提取的速度。
[0006] 为达此目的，本发明采用以下技术方案：
[0007] -种基于图形处理单元的稀疏表示快速计算方法，包括：
[0008] 步骤110、对字典矩阵中的原子进行分类，构造字典树，对所述字典树进行调整，得到连续的字典数组；
[0009] 步骤120、将所述字典数组和待处理的信号矩阵发送到图形处理单元中；
[0010] 步骤130、将所述信号矩阵内拆分为若干个并行单元，所述并行单元包括若干个特征向量；在图形处理单元中，为每一个所述特征向量建立一个线程；
[0011] 步骤140、在每一个所述线程中，遍历所述字典数组，得到所述线程对应的特征向量的稀疏表示。
[0012] 其中，所述步骤140包括：
[0013] 步骤141、在每一个所述线程中，将所述特征向量赋值给初始残差；
[0014] 步骤142、遍历所述字典数组，从所述字典数组中选择一个与所述初始残差最匹配的原子，构建一个稀疏逼近；
[0015] 步骤143、求出所述稀疏逼近与所述特征向量的残差，判断所述稀疏逼近是否满足预设的条件；若是，则所述特征向量的稀疏表示由从字典数组中选出的原子的线性和所述残差组成；否则，将该残差赋值给所述初始残差，返回步骤142。
[0016] 其中，所述预设的条件为：
[0017] 所述稀疏逼近的迭代次数达到预设的次数；或，
[0018] 所述残差的误差小于预设的阈值。
[0019] 其中，在所述步骤142之后，步骤143之前还包括：
[0020] 步骤1421、对所述最匹配的原子进行正交化处理。
[0021] 其中，所述并行单元的与所述信号矩阵的列数相对应。
[0022] 其中，所述对字典矩阵中的原子进行分类，构造成字典树的步骤具体为：
[0023] 采用K均值聚类算法对字典矩阵中的原子进行分类，得到若干个类节点，所述若干个类节点构造成字典树。
[0024] 其中，所述类节点的数据包括：类中心原子、类节点包含的原子个数、原子在所述字典矩阵中的列数、指针数据。
[0025] 其中，所述类节点包括：中间节点和叶子节点。
[0026] 其中，所述字典数组还包括：用来保存中间节点中类中心原子数据的第一数组、用来存放中间节点的左节点索引值数据的第二数组、用来存放存放叶子节点的索引值数据的第三数组、用来存放叶子节点中的原子在所述字典矩阵的位置数据的第四数组。
[0027] 其中，所述信号矩阵中的数据为低分辨率特征信号；所述字典矩阵中的原子为高分辨率特征信号。
[0028] 本发明的有益效果为：一种基于图形处理单元的稀疏表示快速计算方法，包括：对字典矩阵中的原子进行分类，构造字典树，对所述字典树进行调整，得到连续的字典数组；将所述字典数组和待处理的信号矩阵发送到图形处理单元中；将所述信号矩阵内拆分为若干个并行单元，所述并行单元包括若干个特征向量；在图形处理单元中，为每一个所述特征向量建立一个线程；在每一个所述线程中，遍历所述字典数组，得到所述线程对应的特征向量的稀疏表示，本发明通过并行单元对多个特征向量同时进行处理，有效利用硬件的并行计算能力，提高图像特征提取的速度，从而加快标清图像转高清图像的处理过程。

【专利附图】

【附图说明】
[0029] 图1是本发明【具体实施方式】提供的一种基于图形处理单元的稀疏表示快速计算方法流程图。

【具体实施方式】
[0030] 下面结合图1并通过【具体实施方式】来进一步说明本发明的技术方案。
[0031] 图1是本发明【具体实施方式】提供的一种基于图形处理单元的稀疏表示快速计算方法流程图。
[0032] -种基于图形处理单元的稀疏表示快速计算方法，包括：
[0033] 步骤110、对字典矩阵中的原子进行分类，构造字典树，对所述字典树进行调整，得到连续的字典数组；
[0034] 步骤120、将所述字典数组和待处理的信号矩阵发送到图形处理单元（Graphic ProcessingUnit，简称GPU)中；
[0035] 步骤130、将所述信号矩阵内拆分为若干个并行单元，所述并行单元包括若干个特征向量；在图形处理单元中，为每一个所述特征向量建立一个线程；
[0036] 步骤140、在每一个所述线程中，遍历所述字典数组，得到所述线程对应的特征向量的稀疏表示。
[0037] 在本实施例中，通过并行单元对多个特征向量同时进行处理，有效利用硬件的并行计算能力，提高图像特征提取的速度，从而加快标清图像转高清图像的处理过程。
[0038] 在本实施例中，字典树的数据结构比较复杂，不适合GPU的快速处理，GPU只能针对数据类型比较简单，并且内存空间连续的数据，因此需要将字典树进行调整，得到连续的字典数组。
[0039] 在本实施例中，所述步骤140包括：
[0040] 步骤141、在每一个所述线程中，将所述特征向量赋值给初始残差；
[0041] 步骤142、遍历所述字典数组，从所述字典数组中选择一个与所述初始残差最匹配的原子，构建一个稀疏逼近；
[0042] 步骤143、求出所述稀疏逼近与所述特征向量的残差，判断所述稀疏逼近是否满足预设的条件；若是，则所述特征向量的稀疏表示由从字典数组中选出的原子的线性和所述残差组成；否则，将该残差赋值给所述初始残差，返回步骤142。
[0043] 在本实施例中，所述预设的条件为：
[0044] 所述稀疏逼近的迭代次数达到预设的次数；或，
[0045] 所述残差的误差小于预设的阈值。
[0046] 在本实施例中，在所述步骤142之后，步骤143之前还包括：
[0047] 步骤1421、对所述最匹配的原子进行正交化处理，以使算法的收敛速度更快。
[0048] 在本实施例中，所述并行单元的与所述信号矩阵的列数相对应。
[0049] 在本实施例中，图像处理单元硬件系统中每个二维线程块所包含线程的数量记为：[Tx，Ty]，所述信号矩阵的大小记为：mmn，则每个并行单元需要创建的线程块的个数为：

【权利要求】
1. 一种基于图形处理单元的稀疏表示快速计算方法，其特征在于，包括：步骤110、对字典矩阵中的原子进行分类，构造字典树，对所述字典树进行调整，得到连续的字典数组；步骤120、将所述字典数组和待处理的信号矩阵发送到图形处理单元中；步骤130、将所述信号矩阵内拆分为若干个并行单元，所述并行单元包括若干个特征向量；在图形处理单元中，为每一个所述特征向量建立一个线程；步骤140、在每一个所述线程中，遍历所述字典数组，得到所述线程对应的特征向量的稀疏表示。
2. 根据权利要求1所述的一种基于图形处理单元的稀疏表示快速计算方法，其特征在于，所述步骤140包括：步骤141、在每一个所述线程中，将所述特征向量赋值给初始残差；步骤142、遍历所述字典数组，从所述字典数组中选择一个与所述初始残差最匹配的原子，构建一个稀疏逼近；步骤143、求出所述稀疏逼近与所述特征向量的残差，判断所述稀疏逼近是否满足预设的条件；若是，则所述特征向量的稀疏表示由从字典数组中选出的原子的线性和所述残差组成；否则，将该残差赋值给所述初始残差，返回步骤142。
3. 根据权利要求2所述的一种基于图形处理单元的稀疏表示快速计算方法，其特征在于，所述预设的条件为：所述稀疏逼近的迭代次数达到预设的次数；或，所述残差的误差小于预设的阈值。
4. 根据权利要求2所述的一种基于图形处理单元的稀疏表示快速计算方法，其特征在于，在所述步骤142之后，步骤143之前还包括：步骤1421、对所述最匹配的原子进行正交化处理。
5. 根据权利要求1所述的一种基于图形处理单元的稀疏表示快速计算方法，其特征在于，所述并行单元的与所述信号矩阵的列数相对应。
6. 根据权利要求1所述的一种基于图形处理单元的稀疏表示快速计算方法，其特征在于，所述对字典矩阵中的原子进行分类，构造成字典树的步骤具体为：采用K均值聚类算法对字典矩阵中的原子进行分类，得到若干个类节点，所述若干个类节点构造成字典树。
7. 根据权利要求6所述的一种基于图形处理单元的稀疏表示快速计算方法，其特征在于，所述类节点的数据包括：类中心原子、类节点包含的原子个数、原子在所述字典矩阵中的列数、指针数据。
8. 根据权利要求7所述的一种基于图形处理单元的稀疏表示快速计算方法，其特征在于，所述类节点包括：中间节点和叶子节点。
9. 根据权利要求8所述的一种基于图形处理单元的稀疏表示快速计算方法，其特征在于，所述字典数组还包括：用来保存中间节点中类中心原子数据的第一数组、用来存放中间节点的左节点索引值数据的第二数组、用来存放存放叶子节点的索引值数据的第三数组、用来存放叶子节点中的原子在所述字典矩阵的位置数据的第四数组。
10. 根据权利要求1所述的一种基于图形处理单元的稀疏表示快速计算方法，其特征在于，所述信号矩阵中的数据为低分辨率特征信号；所述字典矩阵中的原子为高分辨率特征信号。
【文档编号】G06T5/00GK104318522SQ201410524734
【公开日】2015年1月28日申请日期:2014年10月8日优先权日:2014年10月8日
【发明者】田岩申请人:苏州新视线文化科技发展有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：田岩
技术所有人：苏州新视线文化科技发展有限公司
我是此专利的发明人

上一篇：基于快闪存储器的存储设备和操作方法
上一篇：将不同的定点二进制数相乘的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。