一种基于图形处理单元的稀疏表示快速计算方法

文档序号:6629495阅读:200来源:国知局
一种基于图形处理单元的稀疏表示快速计算方法
【专利摘要】本发明涉及视频图像的超分辨率重建【技术领域】,尤其涉及一种基于图形处理单元的稀疏表示快速计算方法,包括:对字典矩阵中的原子进行分类,构造字典树,对所述字典树进行调整,得到连续的字典数组;将所述字典数组和待处理的信号矩阵发送到图形处理单元中;将所述信号矩阵内拆分为若干个并行单元,所述并行单元包括若干个特征向量;在图形处理单元中,为每一个所述特征向量建立一个线程;在每一个所述线程中,遍历所述字典数组,得到所述线程对应的特征向量的稀疏表示,本发明通过并行单元对多个特征向量同时进行处理,有效利用硬件的并行计算能力,提高图像特征提取的速度,从而加快标清图像转高清图像的处理过程。
【专利说明】一种基于图形处理单元的稀疏表示快速计算方法

【技术领域】
[0001] 本发明涉及视频图像的超分辨率重建【技术领域】,尤其涉及一种基于图形处理单元 的稀疏表示快速计算方法。

【背景技术】
[0002] 图像超分辨技术可以分为单帧图像超分辨率技术和多帧图像超分辨率技术,前者 只需要场景中的一幅图像,而后者需要同一个场景的视频序列。
[0003] 超分辨率重建是一个通过利用低分辨率视频图像的帧间或帧内互补信息获得更 高分辨视频图像的过程,近年来,国内外在超分辨率重建研究方面产生了很多研究成果,从 研究方法论的角度来看,可以划分为基于插值的方法、基于重建的方法和基于学习的方法。 不管哪种方法,都涉及到大量的矩阵运算,因此,要达到实时,必须使用并行处理来加速。
[0004] 近几十年来,CPU的发展降低了计算机的成本,再加上性能的提升促进了整个计算 机行业的发展。然而最近十年来,在硬件方面受耗能与散热问题的影响,使得单个CPU的运 算能力提升受到限制,因此多核CPU的并行计算应用受到关注,但是多核CPU的并行计算能 力依然难以满足目前社会对大数据以及高清、实时数据处理等要求。


【发明内容】

[0005] 本发明的目的在于提出一种基于图形处理单元的稀疏表示快速计算方法,有效利 用硬件的并行计算能力,提高图像特征提取的速度。
[0006] 为达此目的,本发明采用以下技术方案:
[0007] -种基于图形处理单元的稀疏表示快速计算方法,包括:
[0008] 步骤110、对字典矩阵中的原子进行分类,构造字典树,对所述字典树进行调整,得 到连续的字典数组;
[0009] 步骤120、将所述字典数组和待处理的信号矩阵发送到图形处理单元中;
[0010] 步骤130、将所述信号矩阵内拆分为若干个并行单元,所述并行单元包括若干个特 征向量;在图形处理单元中,为每一个所述特征向量建立一个线程;
[0011] 步骤140、在每一个所述线程中,遍历所述字典数组,得到所述线程对应的特征向 量的稀疏表示。
[0012] 其中,所述步骤140包括:
[0013] 步骤141、在每一个所述线程中,将所述特征向量赋值给初始残差;
[0014] 步骤142、遍历所述字典数组,从所述字典数组中选择一个与所述初始残差最匹配 的原子,构建一个稀疏逼近;
[0015] 步骤143、求出所述稀疏逼近与所述特征向量的残差,判断所述稀疏逼近是否满足 预设的条件;若是,则所述特征向量的稀疏表示由从字典数组中选出的原子的线性和所述 残差组成;否则,将该残差赋值给所述初始残差,返回步骤142。
[0016] 其中,所述预设的条件为:
[0017] 所述稀疏逼近的迭代次数达到预设的次数;或,
[0018] 所述残差的误差小于预设的阈值。
[0019] 其中,在所述步骤142之后,步骤143之前还包括:
[0020] 步骤1421、对所述最匹配的原子进行正交化处理。
[0021] 其中,所述并行单元的与所述信号矩阵的列数相对应。
[0022] 其中,所述对字典矩阵中的原子进行分类,构造成字典树的步骤具体为:
[0023] 采用K均值聚类算法对字典矩阵中的原子进行分类,得到若干个类节点,所述若 干个类节点构造成字典树。
[0024] 其中,所述类节点的数据包括:类中心原子、类节点包含的原子个数、原子在所述 字典矩阵中的列数、指针数据。
[0025] 其中,所述类节点包括:中间节点和叶子节点。
[0026] 其中,所述字典数组还包括:用来保存中间节点中类中心原子数据的第一数组、用 来存放中间节点的左节点索引值数据的第二数组、用来存放存放叶子节点的索引值数据的 第三数组、用来存放叶子节点中的原子在所述字典矩阵的位置数据的第四数组。
[0027] 其中,所述信号矩阵中的数据为低分辨率特征信号;所述字典矩阵中的原子为高 分辨率特征信号。
[0028] 本发明的有益效果为:一种基于图形处理单元的稀疏表示快速计算方法,包括: 对字典矩阵中的原子进行分类,构造字典树,对所述字典树进行调整,得到连续的字典数 组;将所述字典数组和待处理的信号矩阵发送到图形处理单元中;将所述信号矩阵内拆分 为若干个并行单元,所述并行单元包括若干个特征向量;在图形处理单元中,为每一个所述 特征向量建立一个线程;在每一个所述线程中,遍历所述字典数组,得到所述线程对应的特 征向量的稀疏表示,本发明通过并行单元对多个特征向量同时进行处理,有效利用硬件的 并行计算能力,提高图像特征提取的速度,从而加快标清图像转高清图像的处理过程。

【专利附图】

【附图说明】
[0029] 图1是本发明【具体实施方式】提供的一种基于图形处理单元的稀疏表示快速计算 方法流程图。

【具体实施方式】
[0030] 下面结合图1并通过【具体实施方式】来进一步说明本发明的技术方案。
[0031] 图1是本发明【具体实施方式】提供的一种基于图形处理单元的稀疏表示快速计算 方法流程图。
[0032] -种基于图形处理单元的稀疏表示快速计算方法,包括:
[0033] 步骤110、对字典矩阵中的原子进行分类,构造字典树,对所述字典树进行调整,得 到连续的字典数组;
[0034] 步骤120、将所述字典数组和待处理的信号矩阵发送到图形处理单元(Graphic ProcessingUnit,简称GPU)中;
[0035] 步骤130、将所述信号矩阵内拆分为若干个并行单元,所述并行单元包括若干个特 征向量;在图形处理单元中,为每一个所述特征向量建立一个线程;
[0036] 步骤140、在每一个所述线程中,遍历所述字典数组,得到所述线程对应的特征向 量的稀疏表示。
[0037] 在本实施例中,通过并行单元对多个特征向量同时进行处理,有效利用硬件的并 行计算能力,提高图像特征提取的速度,从而加快标清图像转高清图像的处理过程。
[0038] 在本实施例中,字典树的数据结构比较复杂,不适合GPU的快速处理,GPU只能针 对数据类型比较简单,并且内存空间连续的数据,因此需要将字典树进行调整,得到连续的 字典数组。
[0039] 在本实施例中,所述步骤140包括:
[0040] 步骤141、在每一个所述线程中,将所述特征向量赋值给初始残差;
[0041] 步骤142、遍历所述字典数组,从所述字典数组中选择一个与所述初始残差最匹配 的原子,构建一个稀疏逼近;
[0042] 步骤143、求出所述稀疏逼近与所述特征向量的残差,判断所述稀疏逼近是否满足 预设的条件;若是,则所述特征向量的稀疏表示由从字典数组中选出的原子的线性和所述 残差组成;否则,将该残差赋值给所述初始残差,返回步骤142。
[0043] 在本实施例中,所述预设的条件为:
[0044] 所述稀疏逼近的迭代次数达到预设的次数;或,
[0045] 所述残差的误差小于预设的阈值。
[0046] 在本实施例中,在所述步骤142之后,步骤143之前还包括:
[0047] 步骤1421、对所述最匹配的原子进行正交化处理,以使算法的收敛速度更快。
[0048] 在本实施例中,所述并行单元的与所述信号矩阵的列数相对应。
[0049] 在本实施例中,图像处理单元硬件系统中每个二维线程块所包含线程的数量记 为:[Tx,Ty],所述信号矩阵的大小记为:mmn,则每个并行单元需要创建的线程块的个数为:

【权利要求】
1. 一种基于图形处理单元的稀疏表示快速计算方法,其特征在于,包括: 步骤110、对字典矩阵中的原子进行分类,构造字典树,对所述字典树进行调整,得到连 续的字典数组; 步骤120、将所述字典数组和待处理的信号矩阵发送到图形处理单元中; 步骤130、将所述信号矩阵内拆分为若干个并行单元,所述并行单元包括若干个特征向 量;在图形处理单元中,为每一个所述特征向量建立一个线程; 步骤140、在每一个所述线程中,遍历所述字典数组,得到所述线程对应的特征向量的 稀疏表示。
2. 根据权利要求1所述的一种基于图形处理单元的稀疏表示快速计算方法,其特征在 于,所述步骤140包括: 步骤141、在每一个所述线程中,将所述特征向量赋值给初始残差; 步骤142、遍历所述字典数组,从所述字典数组中选择一个与所述初始残差最匹配的原 子,构建一个稀疏逼近; 步骤143、求出所述稀疏逼近与所述特征向量的残差,判断所述稀疏逼近是否满足预设 的条件;若是,则所述特征向量的稀疏表示由从字典数组中选出的原子的线性和所述残差 组成;否则,将该残差赋值给所述初始残差,返回步骤142。
3. 根据权利要求2所述的一种基于图形处理单元的稀疏表示快速计算方法,其特征在 于,所述预设的条件为: 所述稀疏逼近的迭代次数达到预设的次数;或, 所述残差的误差小于预设的阈值。
4. 根据权利要求2所述的一种基于图形处理单元的稀疏表示快速计算方法,其特征在 于,在所述步骤142之后,步骤143之前还包括: 步骤1421、对所述最匹配的原子进行正交化处理。
5. 根据权利要求1所述的一种基于图形处理单元的稀疏表示快速计算方法,其特征在 于,所述并行单元的与所述信号矩阵的列数相对应。
6. 根据权利要求1所述的一种基于图形处理单元的稀疏表示快速计算方法,其特征在 于,所述对字典矩阵中的原子进行分类,构造成字典树的步骤具体为: 采用K均值聚类算法对字典矩阵中的原子进行分类,得到若干个类节点,所述若干个 类节点构造成字典树。
7. 根据权利要求6所述的一种基于图形处理单元的稀疏表示快速计算方法,其特征在 于,所述类节点的数据包括:类中心原子、类节点包含的原子个数、原子在所述字典矩阵中 的列数、指针数据。
8. 根据权利要求7所述的一种基于图形处理单元的稀疏表示快速计算方法,其特征在 于,所述类节点包括:中间节点和叶子节点。
9. 根据权利要求8所述的一种基于图形处理单元的稀疏表示快速计算方法,其特征在 于,所述字典数组还包括:用来保存中间节点中类中心原子数据的第一数组、用来存放中间 节点的左节点索引值数据的第二数组、用来存放存放叶子节点的索引值数据的第三数组、 用来存放叶子节点中的原子在所述字典矩阵的位置数据的第四数组。
10. 根据权利要求1所述的一种基于图形处理单元的稀疏表示快速计算方法,其特征 在于,所述信号矩阵中的数据为低分辨率特征信号;所述字典矩阵中的原子为高分辨率特 征信号。
【文档编号】G06T5/00GK104318522SQ201410524734
【公开日】2015年1月28日 申请日期:2014年10月8日 优先权日:2014年10月8日
【发明者】田岩 申请人:苏州新视线文化科技发展有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1