一种基于H265的视频快速预测方法、快速编码方法和系统与流程

文档序号：25992765发布日期：2021-07-23 21:05阅读：82来源：国知局

本发明涉及视频编码
技术领域：
，具体涉及一种基于h265的视频快速预测方法、快速编码方法和系统。
背景技术：
：视频文件是由是连续的图像帧组成，每一帧位一张静止图像。由于人眼的视觉暂留效应，当图像帧序列以一定的速率播放时，我们就会看到连续的视频展现。由于连相邻的帧与帧之间相似性极高，为便于储存传输，我们需要对原始的视频进行编码压缩，以去除空间、时间维度的冗余。视频编码流程主要分为预测、变换、量化、熵编码四个步骤，其中预测主要分为帧内预测和帧间预测。视频编码的帧内预测是指利用视频空间域的相关性，使用当前图像已编码的像素块预测当前像素块，以达到去除视频空域冗余的目的。帧间预测用于减少时域冗余，它是利用相邻帧之间的相关性进行预测编码，即当前待编码的图像使用其它已编码并重构的图像作为参考帧，当前待编码块在参考帧中搜索相似块作为预测值。hevc/h.265编码结构上使用了四叉树结构和更大的编码单元(cu)，如图3所示，导致编码器的计算复杂度显著提高，编码时间难以满足实时性要求。为了提高压缩效率，h.265编码器具有更加灵活的像素块(cu)划分方式。每一帧图像首先按顺序被依次分割为64×64大小的lcu，从lcu开始，编码深度从0到3，每一cu可以被递归的分割成4种深度的(64×64，32×32，16×16和8×8)的cu，构成四叉树编码结构。即深度为0时，cu相当于lcu。在预测中，每一个像素块都有对应的预测模式，进行残差估算，残差可以是运动估计和运动补偿。h.265的这种预测方式，增加了整个帧间编码过程的复杂度，cu划分过程中，为了确定cu的四叉树结构，需要进行深度l从0到3完全遍历，共计算40+41+42+43＝85次率失真代价，计算过程较复杂。同时，像素块需要遍历所有预测模式，并选择编码代价最小的预测模式，作为最优预测模式。以64×64的lcu为例，预测模式需要遍历1662次-2216次，整个视频编码过程帧间预测模式选择的计算复杂度极高，显然这种遍历计算过程使得编码端的计算复杂度非常高，视频压缩所消耗的编码时间较长，无法满足日益增长的实时性视频压缩需求。由此可见，hevc/h.265的帧间预测过程引入了大量运算复杂度，如何有效降低编码器的运算量成为目前亟待解决的问题。技术实现要素：针对现有技术中存在的上述技术问题，本发明提供一种基于h265的视频快速预测方法、快速编码方法和系统，根据相似度判断像素块的划分深度的情况，跳过一些不必要的遍历计算过程，从而加快深度划分决策的过程，减小了计算量，提高了预测的效率。为方便描述，本发明将hevc/h.265简写为h265。本发明公开了一种基于h265的视频快速预测方法，所述方法包括：获取视频图像的像素块；根据帧间同位置像素块的像素点之间的像素值差，获得像素点的类型，像素点的类型包括背景点或运动点；根据背景点的比例，获取所述像素块的类型，所述像素块的类型包括：背景像素块bcu、静态像素块fcu或动态像素块xcu；获取帧间像素块的差异度，所述差异度包括当前像素块与上一帧同位置像素块之间的像素值绝对差总和p(cui)以及当前像素块与下一帧同位置像素块之间的像素值值绝对差总和p(cui+1)；判断当前像素块是否满足第五条件，所述第五条件包括：像素块的类型为背景像素块、p(cui)≤t5且p(cui+1)≤t5；若满足第五条件，当前像素块的划分深度为最优深度，从第一列表中获取最优预测模式，所述第一列表包括：skip预测模式、inter2n×2n预测模式和上一帧同位置像素块的预测模式；判断当前像素块是否满足第七条件，所述第七条件包括：像素块的类型为背景像素块、t5＜p(cui)≤t7且t5＜p(cui+1)≤t7；若满足第七条件，当前像素块的划分深度为最优深度，从第二列表中获取最优预测模式，所述第二列表包括：skip预测模式、inter2n×2n预测模式、对称运动分割预测模式和上一帧同位置像素块的预测模式；判断当前像素块是否满足第六条件，所述第六条件包括：像素块的类型为静态像素块、p(cui)≤t6且p(cui+1)≤t6；若满足第六条件，当前像素块的划分深度为最优深度，从第一列表中获取最优预测模式；判断当前像素块是否满足第八条件，所述第八条件包括：像素块的类型为静态像素块、t6＜p(cui)≤t8且t6＜p(cui+1)≤t8；若满足第八条件，当前像素块的划分深度为最优深度，从第二列表中获取最优预测模式；其中，t5为第五域值，t6为第六域值，t7为第七域值，t8为第八域值。优选的，获取像素点类型的方法包括：获取当前像素点i与上一帧同位置像素点i-1的像素差di：di＝|fi(x,y)-fi-1(x,y)|；(1)获取当前像素点i与下一帧同位置像素点i+1的像素差di+1：di+1＝|fi+1(x,y)-fi(x,y)|；(2)判断是否满足第一条件，所述第一条件包括：di不超过t1，且di+1不超过t1；若满足第一条件，当前像素点为背景点；若不满足第一条件，当前像素点为运动点；其中，fi(x,y)表示为当前像素点的像素值，t1为第一域值。优选的，获取像素块类型的方法包括：获取像素块中背景点的数量nb和像素块的像素点数量na；若nb与na的比值为1，当前像素块为背景像素块；若nb与na的比值大于或等于第二域值t2，且小于1，当前像素块为静态像素块；若nb与na的比值小于第二域值t2，当前像素块为动态像素块。优选的，若不满足第五条件、第七条件、第六条件和第八条件，获取当前像素块的划分深度；若所述划分深度为三，遍历出最优预测模式；若所述划分深度小于三，将当前像素块进行下一深度的划分。优选的，所遍历的预测模式包括：skip模式、merge模式、矩形运动分割模式square、对称运动分割模式smp、非对称运动分割模式amp和帧间模式intramodes，所述矩形运动分割模式包括inter2n×2n和intern×n；所述对称运动分割模式包括inter2n×n和intern×2n；所述非对称运动分割模式包括inter2n×nu、inter2n×nd、internl×2n和internr×2n；所述帧间模式包括intra2n×2n和intran×n。优选的，判断当前像素块是否满足第四条件，所述第四条件包括：像素块的类型为动态像素块、p(cui)≥t4且p(cui+1)≥t4，若满足第四条件，将当前像素块进行下一深度的划分；若不满足第四条件，遍历预测模式；判断当前像素块的划分深度是否为三；若为三，当前划分深度为最优深度，将代价最低的模型为最优预测模式。本发明还提供一种视频快速编码的方法，根据上述视频快速预测方法获得的像素块及其最优预测模式，获得像素块与上一帧相同位置像素块的预测残差；对所述预测残差进行变换，获得变换系数；对所述变换系数进行量化后，进行熵编码。本发明还提供一种用于实现上述视频快速预测方法的系统，包括获取模块、像素点分型模块、像素块分型模块、差异度分析模块和预测模式筛选模块，所述获取模块用于获取视频图像的像素块；所述像素点分型模块用于根据帧间同位置像素块的像素点的像素值差，获得像素点的类型；所述像素块分型模块用于根据背景点的比例，获取所述像素块的类型；所述差异度分析模块用于获取帧间像素块的差异度；预测模式筛选模块用于：在满足第五条件或第六条件时，当前像素块的划分深度设为最优深度，从第一列表中获取最优预测模式；在满足第七条件或第八条件时，当前像素块的划分深度设为最优深度，从第二列表中获取最优预测模式。优选的，所述系统还包括像素块划分模块，所述预测模式筛选模块还用于：在不满足第五条件、第七条件、第六条件和第八条件时，获取当前像素块的划分深度；若所述划分深度为三，遍历出最优预测模式；若所述划分深度小于三，通过像素块划分模块将当前像素块进行下一深度的划分。优选的，所述系统还包括预测模块、变化模块、量化模块和熵编码模块，所述预测模块用于根据像素块及其最优预测模式，获得像素块与上一帧相同位置像素块的预测残差；所述变化模块用于对所述预测残差进行变换，获得变换系数；所述量化模块用于对所述变换系数进行量化，获得量化数据；所述熵编码模块用于根据所述量化数据进行熵编码。与现有技术相比，本发明的有益效果为：通过对帧间像素块的分类和差异度的分析，分析帧间像素块的相似度，根据相似度判断像素块的划分深度的情况，避免在对帧间相似高的像素块进行下一步划分前，对所有预测模式进行遍历；并根据相似度，从相应的列表中选出最优预测模式，避免了对所有预测模式的代价估算，即跳过一些不必要的遍历计算过程，从而加快深度划分决策的过程，减小了计算量，提高了预测的效率，提高了视频编码的效率。附图说明图1是本发明的视频快速预测方法流程图；图2是像素块变化剧烈的处理方法流程图；图3是四叉树的结构示意图；图4是本发明的视频编码流程图；图5是本发明的系统逻辑框图。具体实施方式为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。下面结合附图对本发明做进一步的详细描述：一种基于h265的视频快速预测方法，如图1所示，所述方法包括：步骤101：获取视频图像的像素块(cu)。步骤102：根据帧间同位置像素块的像素点之间的像素值差，获得像素点的类型，像素点的类型包括背景点或运动点。步骤103：根据背景点的比例，获取所述像素块的类型，所述像素块的类型包括：背景像素块(bcu)、静态像素块(fcu)或动态像素块(xcu)。步骤104：获取帧间像素块的差异度，所述差异度包括当前像素块与上一帧同位置像素块之间的像素值绝对差总和p(cui)以及当前像素块与下一帧同位置像素块之间的像素值值绝对差总和p(cui+1)。步骤105：判断所述像素块是否满足第五条件，所述第五条件包括：像素块的类型为背景像素块、p(cui)≤t5且p(cui+1)≤t5。若满足第五条件，执行步骤106：当前像素块的划分深度为最优深度，从第一列表中获取最优预测模式(pu)，所述第一列表包括：skip预测模式、inter2n×2n预测模式和上一帧同位置像素块的预测模式。t5为第五域值，差异度不超过第五域值时，当前像素块与上一帧同位置像素块以及与下一帧同位置像素块的差异小，即相似度非常高，一方面当前像素块的深度为最优深度，不需要进行一步划分；另一方面，第一列表中的skip预测模式和inter2n×2n预测模式的残差估算计算小，可以满足估算的要求，减少了选择预测模式中的编码代价计算量。步骤107：判断所述像素块是否满足第七条件，所述第七条件包括：像素块的类型为背景像素块、t5＜p(cui)≤t7且t5＜p(cui+1)≤t7。若满足第七条件，执行步骤108：当前像素块的划分深度为最优深度，从第二列表中获取最优预测模式，所述第二列表包括：skip预测模式、inter2n×2n预测模式、对称运动分割模式(smp)和上一帧同位置像素块的预测模式。t7为第七域值，帧间的差异度在第五域值和第七域值之间时，帧间的差异度较小，即相似度较高，第二列表的预测模式可以满足预测需求。步骤109：判断所述像素块是否满足第六条件，所述第六条件包括：像素块的类型为静态像素块、p(cui)≤t6且p(cui+1)≤t6，t6为第六域值。若满足第六条件，执行步骤106：当前像素块的划分深度为最优深度，从第一列表中获取最优预测模式。步骤110：判断所述像素块是否满足第八条件，所述第八条件包括：像素块的类型为静态像素块、t6＜p(cui)≤t8且t6＜p(cui+1)≤t8，t8为第八域值。若满足第八条件，执行步骤108：当前像素块的划分深度为最优深度，从第二列表中获取最优预测模式。通过对帧间像素块的分类和差异度的分析，分析帧间像素块的相似度，根据相似度判断像素块的划分深度的情况，避免在对帧间相似高的像素块进行下一步划分前，对所有预测模式进行遍历；并根据相似度，从相应的列表中选出最优预测模式，避免了对所有预测模式的代价估算，即跳过一些不必要的遍历计算过程，从而加快深度划分决策的过程，减小了计算量，提高了预测的效率，提高了视频编码的效率。步骤102中，获取像素点类型的方法包括：步骤201：获取当前像素点i与上一帧同位置像素点i-1的像素差di：di＝|fi(x,y)-fi-1(x,y)|；(1)步骤202：获取当前像素点i与下一帧同位置像素点i+1的像素差di+1：di+1＝|fi+1(x,y)-fi(x,y)|；(2)步骤203：判断是否满足第一条件，所述第一条件包括：di不超过t1，且di+1不超过t1，即di≤t1,di+1≤t1；若满足第一条件，执行步骤204：当前像素点为背景点；若不满足第一条件，执行步骤204：当前像素点为运动点；其中，fi(x,y)表示为当前像素点的像素值，fi-1(x,y)表示为上一帧同位置像素点的像素值，t1为第一域值。步骤103中，获取像素块类型的方法包括：步骤301：获取像素块中背景点的数量nb和像素块的像素点数量na。步骤302：若nb与na的比值为1，当前像素块为背景像素块。步骤303：若nb与na的比值大于或等于第二域值t2，且小于1，当前像素块为静态像素块。步骤304：若nb与na的比值小于第二域值t2，当前像素块为动态像素块。上述像素块类型分类可以用以下公式进行表述：其中，sort(cu)表示为像素块类型，t2为第二域值，bcu为背景像素块、fcu为静态像素块，xcu为动态像素块。其中，本发明的视频快速预测方法还包括：步骤120：若不满足第五条件、第七条件、第六条件和第八条件，获取当前像素块的划分深度l。步骤121：若所述划分深度为三，当前划分深度为最优深度，遍历出最优预测模式。估算每个预测模型的代价，将代价最小的预测模型作为最优预测模型。所遍历的预测模式包括：skip模式、merge模式、矩形运动分割模式(square)、对称运动分割模式(smp)、非对称运动分割模式(amp)和帧间模式(intramodes)，矩形运动分割模式包括inter2n×2n和intern×n；对称运动分割模式包括inter2n×n和intern×2n；非对称运动分割模式包括inter2n×nu、inter2n×nd、internl×2n和internr×2n；帧间模式包括intra2n×2n和intran×n。步骤122：若所述划分深度小于三，将当前像素块进行下一深度的划分。一个具体实施例中，如图2所示，不满足第五条件、第七条件、第六条件和第八条件包括：像素块变化剧烈。像素块变化剧烈的处理方法包括：131：判断当前像素块是否满足第四条件，所述第四条件包括：像素块的类型为动态像素块、p(cui)≥t4且p(cui+1)≥t4。若满足第四条件，执行步骤132：将当前像素块进行下一深度的划分。其中，t4为第四域值，差值度大于或等于第四域值时，说明当前像素块处于相对剧烈的区域，跳过当前划分深度，直接进行下一层划分。应当指出的是：针对不同划分深度l，l∈[0，3]，t4数值可以根据当前划分深度l而变化，以提升划分准确度。若不满足第四条件，执行步骤133：遍历预测模式。即计算每个预测模式的代价。步骤134：判断当前像素块的划分深度是否为三。若为三，执行步骤135：当前划分深度为最优深度，将代价最低的模型为最优预测模式。若不为三，执行步骤136：进行下一步深度的划分。另一个具体实施例中，不满足第五条件、第七条件、第六条件和第八条件的情况还包括以下情况：步骤141：判断当前像素块是否满足第三条件，所述第三条件包括：像素块的类型为静态像素块，p(cui)≥t3且p(cui+1)≥t3，其中，第三域值t3大于第八域值t8。若满足第三条件，获取当前像素块的划分深度l。若所述划分深度为三，当前划分深度为最优深度，遍历出最优预测模式。若所述划分深度小于三，全搜索遍历预测模型，并将当前像素块进行下一深度的划分。本发明还提供一种视频快速编码的方法，如图4所示，包括以下步骤：步骤501：根据上述获得的像素块及其最优预测模式，获得像素块与上一帧相同位置像素块的预测残差。步骤502：对所述预测残差进行变换，获得变换系数。步骤503：对所述变换系数进行量化后，进行熵编码。熵编码后，输出编码后的视频。其中，t1可以取值4-6，t2可以取值0.80-0.9，t3可以取值5-15％，t4取值30-60％，t5取值10-20％，t6取值8-12％，t7取值20-30％，t8取值15-25％，但不限于此。本发明还提供一种用于实现上述视频快速预测方法的系统，如图5所示，包括获取模块1、像素点分型模块2、像素块分型模块3、差异度分析模块4和预测模式筛选模块5，获取模块1用于获取视频图像的像素块；像素点分型模块2用于根据帧间同位置像素块的像素点的像素值差，获得像素点的类型；像素块分型模块3用于根据背景点的比例，获取所述像素块的类型；差异度分析模块4用于获取帧间像素块的差异度；预测模式筛选模块5用于：在满足第五条件或第六条件时，当前像素块的划分深度设为最优深度，从第一列表中获取最优预测模式；在满足第七条件或第八条件时，当前像素块的划分深度设为最优深度，从第二列表中获取最优预测模式。本发明的系统还可以包括像素块划分模块6、预测模块11、变化模块12、量化模块13和熵编码模块14。预测模式筛选模块5还用于：在不满足第五条件、第七条件、第六条件和第八条件时，获取当前像素块的划分深度；若所述划分深度为三，遍历出最优预测模式；若所述划分深度小于三，通过像素块划分模块6将当前像素块进行下一深度的划分。预测模块11用于根据像素块及其最优预测模式，获得像素块与上一帧相同位置像素块的预测残差；变化模块12用于对所述预测残差进行变换，获得变换系数；量化模块13用于对所述变换系数进行量化，获得量化数据；熵编码模块14用于根据所述量化数据进行熵编码。实施例本实施例采用的环境是windowssever2008r2，处理器为intele5-2620cpu@2.1ghz、单处理器，8核心，ram为32gb。对比多种视频进行了编码测试，根据本发明视频快速编码方法，设计了视频压缩软件hnew，与h.265中hm12.0进行对比，算法性能通过psnr(峰值信噪比，一种客观评价视频编码质量的参数)以及时间变化比δt(δt＝(thm-tnew)/thm×100％)两个参数进行对比，其中thm为hm12.0编码的时间；tnew为hnew编码的时间。各个域值的取值如下：t1＝5，t2＝0.85，t3＝10％，t4＝50％，t5＝15％，t6＝10％，t7＝25％，t8＝20％。测试结果如下表所示：实施例测试序列视频分辨率视频帧率psnr(db)δt(％)实施例1交通监控视频1920×108025fps-0.0727.8％实施例2行车记录仪视频1920×108025fps-0.0929.4％实施例3足球比赛视频1920×108025fps-0.1131.2％实施例4交通监控视频1280×72025fps-0.0524.8％实施例5行车记录仪视频1280×72025fps-0.0726.7％实施例6足球比赛视频1920×72025fps-0.0827.4％平均值-0.0827.9％从表中可以得出，psnr平均仅下降0.08db，视频编码的质量几乎保持不变的情况,大大节约了视频编码时间，平均值δt＝27.9％，说明本发明的视频编码方法在提升cu划分速率和选择预测模型的情况下，对视频进行编码，能够在有效保证编码质量情况下减小视频编码耗时，提高编码效率。以上仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。当前第1页12

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：程志刚
技术所有人：浙江裕瀚科技有限公司
我是此专利的发明人

上一篇：一种密封式节能河道水能发电站的制作方法
上一篇：油松叶提取物协同氟康唑在制备抗真菌药物中的应用的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。