图像帧的压缩方法及装置与流程

文档序号:25992773发布日期:2021-07-23 21:05阅读:97来源:国知局
图像帧的压缩方法及装置与流程

本申请是基于201710476879.0的专利进行的分案申请。

本公开涉及图像处理技术领域,尤其涉及图像帧的压缩方法及装置。



背景技术:

视频是由多个图像帧组成的,在视频的传输过程中,要对视频帧进行压缩再传输,对视频帧进行压缩,能够保证视频适合网络传输的格式,而且能够减小视频的大小,从而减小传输过程中的数据量。

视频压缩分为有损压缩和无损压缩。无损压缩能够保证图像帧清晰完整地显示,但是数据压缩比较低,会导致数据传输量较大;而有损压缩会丢失一些数据,会产生压缩失真,图像帧显示的时候不如无损压缩那样清晰。因此,在对图像帧进行压缩时,可能会导致数据传输量较大,或者图像帧显示不够清晰。



技术实现要素:

本公开实施例提供一种图像帧的压缩方法及装置,能够解决对图像帧进行压缩时,导致数据传输量较大,或者图像帧显示不够清晰的问题。所述技术方案如下:

根据本公开实施例的第一方面,提供一种图像帧的压缩方法,该方法包括:

获取目标图像帧,目标图像帧包括至少一个图像块;

确定目标图像帧中的视觉集中区域,视觉集中区域为目标图像帧向用户呈现时的关键区域;

将目标图像帧中视觉集中区域的图像块进行无损压缩;

将目标图像帧中其他区域的图像块进行有损压缩,其他区域为目标图像帧中除视觉集中区域之外的区域。

视觉集中区域是用户在观看目标图像帧时较为关键的区域,用户注意力会更多的停留在视觉集中区域,对视觉集中区域的图像块进行无损压缩,保证了视觉集中区域的图像块显示的时候清晰度不会降低,满足用户对于图像帧清晰度的要求;同时,对于除视觉集中区域之外的其他区域的图像块进行有损压缩,因为在播放目标图像帧时其他区域不是用户重点关注的区域,因此,清晰度即便降低也不会对用户观看造成较多影响,而对其他区域的图像块进行有损压缩减少了视频传输过程中的数据传输量,节省了占用的网络资源,保证了用户观看视频的流畅性。因此,本公开所提供的图像帧的压缩方法,在保证了图像帧显示具有较高的清晰度的同时,减少了视频传输过程中的数据传输量,节省了网络资源。

在一个实施例中,确定目标图像帧中的视觉集中区域,包括:

计算至少一个图像块中每一个图像块的颜色变化参数,至少一个图像块中目标图像块的颜色变化参数用于指示目标图像块的颜色变化的平滑情况;

将至少一个图像块中颜色变化参数大于预设阈值的图像块组成的区域确定为视觉集中区域。

颜色变化参数越大,图像块的颜色变化的平滑情况越差,也就是说,颜色变化参数越大,图像块中颜色变化越突兀,这样的图像块更能引起用户注意,在用户观看目标图像帧时,注意力更容易集中在颜色变化突兀的区域,因此,将颜色变化参数大于预设阈值的图像块组成的区域确定为视觉集中区域更能满足用户的需求。

在一个实施例中,计算至少一个图像块中每一个图像块的颜色变化参数,包括:

计算至少一个图像块中每个像素的梯度向量,一个图像块包含至少一个像素;

根据每个像素的梯度向量计算至少一个图像块中每一个图像块的结构张量;

将每一个图像块的结构张量中矩阵元素的方差值作为每一个图像块的颜色变化参数。

计算梯度向量,进而根据梯度向量计算结构张量,能够更加客观、准确地反映每一个图像块中颜色变化的情况。

在一个实施例中,计算至少一个图像块中每个像素的梯度向量,包括:

按照第一公式计算至少一个图像块中每个像素的梯度向量,第一公式为:

φx(i)表示目标像素的梯度向量的横向分量,φy(i)表示目标像素的梯度向量的纵向分量,yx,y表示目标像素的色值分量,yx±1,y表示目标像素横向相邻像素的色值分量,yx,y±1表示目标像素纵向相邻像素的色值分量,目标像素是目标图像块中第x行第y列的像素。

分别计算梯度向量横向和纵向的分量值,更为全面的体现了相邻像素之间的颜色差异,更加准确地体现了图像块中像素的颜色变化情况。

在一个实施例中,根据每个像素的梯度向量计算至少一个图像块中每一个图像块的结构张量,包括:

根据每个像素的梯度向量按照第二公式计算至少一个图像块中每一个图像块的结构张量,第二公式为:

其中,t表示目标图像块的结构张量,φx(i)表示目标像素的梯度向量的横向分量,φy(i)表示目标像素的梯度向量的纵向分量,g为高斯算子。

根据第二公式计算的结构张量是一个矩阵,包含4个矩阵元素,更为全面、准确地体现了每一个图像块中像素的颜色变化情况。

在一个实施例中,获取目标图像帧,包括:

对原始图像帧进行初始化处理生成目标图像帧。

初始化处理后的目标图像帧便于确定视觉集中区域,而且减少了处理过程中的运算量。

在一个实施例中,对原始图像帧进行初始化处理生成目标图像帧,包括:

根据第三公式计算原始图像帧中目标像素与预设颜色的色值距离,第三公式为:

其中,s表示目标像素与预设颜色的色值距离,cyi、cui、cvi分别表示目标像素的三个色值分量,cy0、cu0、cv0分别表示预设颜色的三个色值分量;

在目标像素与预设颜色的色值距离小于预设距离时,将目标像素的颜色替换为预设颜色并生成目标图像帧。

根据第三公示计算目标像素与预设颜色的色值距离,如果色值距离小于预设距离,说明目标像素的颜色和预设颜色相近,将目标像素的颜色替换为预设颜色,对于每个像素都进行这样的处理,能够使得颜色相近的像素都变成相同的颜色,使得颜色不相近的像素颜色差异更为明显,在确定视觉集中区域时更加准确便捷,同时,减少了图像帧中的颜色数量,在后续处理过程中,减少了运算量。

在一个实施例中,获取目标图像帧,包括:

获取待压缩视频中的i帧作为目标图像帧。

通常情况下,i帧是较为重要的帧,往往占用大量资源,对i帧利用本公开所提供的图像帧的压缩方法进行压缩,在保证图像帧清晰度的同时能够极大减少资源占用,而对于其他帧(例如p帧、b帧)可以不采取本公开所提供的图像帧的压缩方法,减小压缩时的运算量,提高处理效率。

根据本公开实施例的第二方面,提供一种图像帧的压缩装置,包括:获取模块、视觉集中模块、无损压缩模块和有损压缩模块;

获取模块,用于获取目标图像帧,目标图像帧包括至少一个图像块;

视觉集中模块,用于确定目标图像帧中的视觉集中区域,视觉集中区域为目标图像帧向用户呈现时的关键区域;

无损压缩模块,用于将目标图像帧中视觉集中区域的图像块进行无损压缩;

有损压缩模块,用于将目标图像帧中其他区域的图像块进行有损压缩,其他区域为目标图像帧中除视觉集中区域之外的区域。

在一个实施例中,视觉集中模块包括颜色变化参数子模块和阈值子模块;

颜色变化参数子模块,用于计算至少一个图像块中每一个图像块的颜色变化参数,至少一个图像块中目标图像块的颜色变化参数用于指示目标图像块的颜色变化的平滑情况;

阈值子模块,用于将至少一个图像块中颜色变化参数大于预设阈值的图像块组成的区域确定为视觉集中区域。

在一个实施例中,颜色变化参数子模块包括梯度向量单元、结构张量单元和方差单元;

梯度向量单元,用于将至少一个图像块中颜色变化参数大于预设阈值的图像块组成的区域确定为视觉集中区域。

结构张量单元,用于根据每个像素的梯度向量计算至少一个图像块中每一个图像块的结构张量;

方差单元,用于将每一个图像块的结构张量中矩阵元素的方差值作为每一个图像块的颜色变化参数。

在一个实施例中,梯度向量单元,用于按照第一公式计算至少一个图像块中每个像素的梯度向量,第一公式为:

φx(i)表示目标像素的梯度向量的横向分量,φy(i)表示目标像素的梯度向量的纵向分量,yx,y表示目标像素的色值分量,yx±1,y表示目标像素横向相邻像素的色值分量,yx,y±1表示目标像素纵向相邻像素的色值分量,目标像素是目标图像块中第x行第y列的像素。

在一个实施例中,结构张量单元,用于根据每个像素的梯度向量按照第二公式计算至少一个图像块中每一个图像块的结构张量,第二公式为:

其中,t表示目标图像块的结构张量,φx(i)表示目标像素的梯度向量的横向分量,φy(i)表示目标像素的梯度向量的纵向分量,g为高斯算子。

在一个实施例中,获取模块包括初始化子模块;

初始化子模块,用于对原始图像帧进行初始化处理生成所述目标图像帧。

在一个实施例中,初始化子模块包括色值距离单元和替换单元;

色值距离单元,用于根据第三公式计算目标像素与预设颜色的色值距离,第三公式为:

其中,s表示目标像素与预设颜色的色值距离,cyi、cui、cvi分别表示目标像素的三个色值分量,cy0、cu0、cv0分别表示预设颜色的三个色值分量;

替换单元,用于在目标像素与预设颜色的色值距离小于预设距离时,将目标像素的颜色替换为预设颜色并生成目标图像帧。

在一个实施例中,获取模块,还用于获取待压缩视频中的i帧作为目标图像帧。

根据本公开实施例的第三方面,提供一种计算机可读存储介质,其上存储有计算机指令,用于执行上述第一方面及第一方面的任意一个实施例所提供的图像帧的压缩方法,该指令被处理器执行时可以实现以下步骤:

获取目标图像帧,目标图像帧包括至少一个图像块;

确定目标图像帧中的视觉集中区域,视觉集中区域为目标图像帧向用户呈现时的关键区域;

将目标图像帧中视觉集中区域的图像块进行无损压缩;

将目标图像帧中其他区域的图像块进行有损压缩,其他区域为目标图像帧中除视觉集中区域之外的区域。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。

图1是本公开实施例提供的一种图像帧的压缩方法的流程图;

图2是本公开实施例提供的一种视觉集中区域示意图;

图3是本公开实施例提供的另一种视觉集中区域示意图;

图4是本公开另一实施例提供的一种图像帧的压缩方法的流程图;

图5是本公开实施例提供的一种图像帧的压缩装置的结构图;

图6是本公开实施例提供的一种图像帧的压缩装置的结构图;

图7是本公开实施例提供的一种颜色变化参数子模块的结构图;

图8是本公开实施例提供的一种图像帧的压缩装置的结构图;

图9是本公开实施例提供的一种初始化子模块的结构图。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

本公开实施例提供一种图像帧的压缩方法,应用于图像帧的压缩装置,该图像帧的压缩装置可以是服务器或终端设备,终端设备可以是智能手机、平板电脑等,如图1所示,该图像帧的压缩方法包括以下步骤:

101、获取目标图像帧。

目标图像帧是任意一个图像帧,本公开以目标图像帧为例进行说明。目标图像帧包括至少一个图像块。每一个图像块可以包括至少一个像素,每一个像素可以包括至少一个子像素。通常情况下,一个像素包括三个子像素,三个子像素可以分别表示红绿蓝(英文:redgreenblue,rgb)三种颜色,每个子像素的颜色用一个色值分量表示。需要说明的是,本公开所说的色值分量,可以是rgb色值的色值分量,也可以是yuv色值的色值分量,当然,也可以是其他方式定义的色值的色值分量,色值用于表示一种颜色,色值能够体现该颜色的色相、明度、彩度中的至少一项,对于色值的具体形式,本公开不做限制。

此处,以rgb色值为例,对像素和子像素颜色的构成进行说明:rgb色值通常用六位十六进制数表示,每两位十六进制数表示一个色值分量,比如rgb色值是“ff0000”表示红色,红色的色值分量为“ff”,转换为十进制就是255,表示红色的色彩亮度度达到最大,蓝色和绿色的色值分量均为“00”,表示蓝色和绿色的色彩亮度最低,即没有颜色,rgb三种颜色的子像素就形成了红色的像素。又如,rgb色值是“ffffff”表示白色,红绿蓝三种颜色的色值分量都是最大“ff”,rgb三个子像素的色值分量均为“ff”,三种颜色的子像素就形成了白色的像素。

当然,此处只是以rgb色值为例进行说明,也可以是红黄绿蓝四种子像素构成一个像素,本公开对此不做限制。

需要说明的是,可以直接获取原始图像帧作为目标图像帧进行处理,也可以在获取原始图像帧之后进行初始化处理生成目标图像帧。

以第二种实现方式为例,获取目标图像帧,包括:对原始图像帧进行初始化处理生成目标图像帧。

初始化处理后的目标图像帧便于确定视觉集中区域,而且减少了处理过程中的运算量。

具体的,对原始图像帧进行初始化处理生成目标图像帧,包括:

根据第三公式计算原始图像帧中目标像素与预设颜色的色值距离,第三公式为:

其中,s表示目标像素与预设颜色的色值距离,cyi、cui、cvi分别表示目标像素的三个色值分量,cy0、cu0、cv0分别表示预设颜色的三个色值分量,此处,三个色值分量以yuv色值的三个分量为例,并不代表本公开局限于此;

在目标像素与预设颜色的色值距离小于预设距离时,将目标像素的颜色替换为预设颜色并生成目标图像帧。

根据第三公示计算目标像素与预设颜色的色值距离,如果色值距离小于预设距离,说明目标像素的颜色和预设颜色相近,将目标像素的颜色替换为预设颜色,对于每个像素都进行这样的处理,能够使得颜色相近的像素都变成相同的颜色,使得颜色不相近的像素颜色差异更为明显,在确定视觉集中区域时更加准确便捷,同时,减少了图像帧中的颜色数量,在后续处理过程中,减少了运算量。

在一个实施例中,获取目标图像帧,包括:获取待压缩视频中的i帧作为目标图像帧。

通常情况下,i帧是较为重要的帧,往往占用大量资源,对i帧利用本公开所提供的图像帧的压缩方法进行压缩,在保证图像帧清晰度的同时能够极大减少资源占用,而对于其他帧(例如p帧、b帧)可以不采取本公开所提供的图像帧的压缩方法,减小压缩时的运算量,提高处理效率。

102、确定目标图像帧中的视觉集中区域。

视觉集中区域为目标图像帧向用户呈现时的关键区域。对于如何确定视觉集中区域,可以有多种实现方式,此处列举两种具体的实现方式进行说明:

在第一种实现方式中,视觉集中区域可以是预设的区域,对于每一个图像帧来说,视觉集中区域都是相同的,如图2所示,图2是本公开实施例提供的一种视觉集中区域示意图,目标图像帧的视觉集中区域可以是目标图像帧中最中间的区域,因为在用户观看图像帧时,注意力通常集中在最中间的区域,将每个图像帧的预设的区域都作为视觉集中区域,不需要做太多处理,提高了处理效率。视觉集中区域可以包括若干个图像块,视觉集中区域的形状可以是圆形、矩形、或者其他形状的多边形等,本公开对此不做限制。

在第二种实现方式中,可以通过数学算法计算确定视觉集中区域。例如,确定目标图像帧中的视觉集中区域,包括:

计算至少一个图像块中每一个图像块的颜色变化参数,至少一个图像块中目标图像块的颜色变化参数用于指示目标图像块的颜色变化的平滑情况;将至少一个图像块中颜色变化参数大于预设阈值的图像块组成的区域确定为视觉集中区域。

颜色变化参数越大,图像块的颜色变化的平滑情况越差,也就是说,颜色变化参数越大,图像块中颜色变化越突兀,这样的图像块更能引起用户注意,在用户观看目标图像帧时,注意力更容易集中在颜色变化突兀的区域,因此,将颜色变化参数大于预设阈值的图像块组成的区域确定为视觉集中区域更能满足用户的需求。如图3所示,图3是本公开实施例提供的另一种视觉集中区域示意图。以目标图像帧包含人物为例,在用户图像帧时,注意力容易集中在图像帧中的人物身上,而对于目标图像帧而言,人物和背景之间的颜色变化通常较为突兀,将颜色变化突兀的区域确定为视觉集中区域,用户在观看目标图像帧时,能够更清晰地辨别出人物。

具体的,对于如何计算每一个图像块的颜色变化参数,此处列举一种具体的算法进行说明:

在一个实施例中,计算至少一个图像块中每一个图像块的颜色变化参数,包括:计算至少一个图像块中每个像素的梯度向量,一个图像块包含至少一个像素;根据每个像素的梯度向量计算至少一个图像块中每一个图像块的结构张量;将每一个图像块的结构张量中矩阵元素的方差值作为每一个图像块的颜色变化参数。

计算梯度向量,进而根据梯度向量计算结构张量,能够更加客观、准确地反映每一个图像块中颜色变化的情况。

进一步的,对于如何计算梯度向量和结构张量,此处列举两个示例进行说明:

在第一个示例中,计算至少一个图像块中每个像素的梯度向量,包括:

按照第一公式计算至少一个图像块中每个像素的梯度向量,第一公式为:

φx(i)表示目标像素的梯度向量的横向分量,φy(i)表示目标像素的梯度向量的纵向分量,yx,y表示目标像素的色值分量,yx±1,y表示目标像素横向相邻像素的色值分量,yx,y±1表示目标像素纵向相邻像素的色值分量。目标像素是目标图像块中第x行第y列的像素,与目标像素横向相邻的像素可以是目标图像块中第x-1行第y列的像素或者第x+1行第y列的像素;与目标像素纵向相邻的像素可以是目标图像块中第x行第y-1列的像素或者第x行第y+1列的像素。

分别计算梯度向量横向和纵向的分量值,更为全面的体现了相邻像素之间的颜色差异,更加准确地体现了图像块中像素的颜色变化情况。

在第二个示例中,根据每个像素的梯度向量计算至少一个图像块中每一个图像块的结构张量,包括:

根据每个像素的梯度向量按照第二公式计算至少一个图像块中每一个图像块的结构张量,第二公式为:

其中,t表示目标图像块的结构张量,φx(i)表示目标像素的梯度向量的横向分量,φy(i)表示目标像素的梯度向量的纵向分量,g为高斯算子。

根据第二公式计算的结构张量是一个矩阵,包含4个矩阵元素,更为全面、准确地体现了每一个图像块中像素的颜色变化情况。

103、将目标图像帧中视觉集中区域的图像块进行无损压缩。

对视觉集中区域的图像块无损压缩后,能够在进行解压时完全恢复目标视觉集中区域的图像块而不引起失真,保证了视觉集中区域在显示时的清晰度较高,而视觉集中区域是用户观看目标图像帧时视觉停留时间较长,更容易引起用户关注的区域,保证其清晰度较高就保证了用户体验较高,满足了用户对于清晰度高的需求。

104、将目标图像帧中其他区域的图像块进行有损压缩。

其他区域为目标图像帧中除视觉集中区域之外的区域。

对其他区域的图像块有损压缩后,在解压时不能完全恢复其他区域的图像块,解压后的数据与其他区域的图像块非常相近,但有所不同,有损压缩的方式压缩比较高,在压缩后数据量大大降低,减少了传输过程的数据传输量。因为在播放目标图像帧时其他区域不是用户重点关注的区域,因此,清晰度即便降低也不会对用户观看造成较多影响,而对其他区域的图像块进行有损压缩减少了视频传输过程中的数据传输量,节省了占用的网络资源,保证了用户观看视频的流畅性。

需要说明的是,步骤103和步骤104可以没有先后顺序。

本公开实施例提供的图像帧的压缩方法,获取目标图像帧;确定目标图像帧中的视觉集中区域;将目标图像帧中视觉集中区域的图像块进行无损压缩;将目标图像帧中其他区域的图像块进行有损压缩。视觉集中区域是用户在观看目标图像帧时较为关键的区域,用户注意力会更多的停留在视觉集中区域,对视觉集中区域的图像块进行无损压缩,保证了视觉集中区域的图像块显示的时候清晰度不会降低,满足用户对于图像帧清晰度的要求;同时,对于除视觉集中区域之外的其他区域的图像块进行有损压缩,因为在播放目标图像帧时其他区域不是用户重点关注的区域,因此,清晰度即便降低也不会对用户观看造成较多影响,而对其他区域的图像块进行有损压缩减少了视频传输过程中的数据传输量,节省了占用的网络资源,保证了用户观看视频的流畅性。因此,本公开所提供的图像帧的压缩方法,在保证了图像帧显示具有较高的清晰度的同时,减少了视频传输过程中的数据传输量,节省了网络资源。

基于上述图1对应的实施例提供的图像帧的压缩方法,本公开另一实施例提供一种图像帧的压缩方法。本实施例以发送视频为例进行说明,参照图4所示,本实施例提供的图像帧的压缩方法包括以下步骤:

401、获取待压缩视频。

待压缩视频包括至少一个图像帧,图像帧可以是i帧、p帧、b帧等。获取待压缩视频之后,可以对待压缩视频中的图像帧逐一进行处理,也可以多个同时处理。

402、判断原始图像帧的类型是否为i帧。

此处以一个原始图像帧为例进行说明。如果原始图像帧不是i帧,则将该原始图像帧直接加入普通压缩编码的序列,进行普通压缩编码的处理,普通压缩编码可以是有损压缩编码;如果该原始图像帧是i帧,则执行步骤403。

403、对原始图像帧进行初始化处理生成目标图像帧。

对原始图像帧进行的初始化处理可以是色阶初始化处理,计算原始图像帧中目标像素与预设颜色的色值距离,在目标像素与预设颜色的色值距离小于预设距离时,将目标像素的颜色替换为预设颜色并生成目标图像帧。进行初始化处理后的目标图像帧替换了原来的原始图像帧,将颜色相近的像素统一变更为相同的颜色,减少目标图像帧的颜色数量,减少了处理过程中的运算量。

例如,可以设置10种预设颜色,以原始图像帧中的目标像素为例,目标像素是原始图像帧中的任意一个像素。10种预设颜色中,第2种预设颜色与目标像素的颜色最为相近,则可以计算目标像素与第2种预设颜色的色值距离,在目标像素与第2种预设颜色的色值距离小于预设距离时,将目标像素的颜色替换为第2种预设颜色。当然,也可以直接计算目标像素与每一种预设颜色的色值距离,将目标像素的颜色替换为与其色值距离最小的预设颜色。当然,10种预设颜色只是示例性说明,也可以有更多种,本公开对此不作限制。

404、计算目标图像帧内每个图像块中每个像素的梯度向量。

图像块的划分可以按照横纵两个方向进行均分,例如将目标图像帧划分为4×4的16个图像块,或者8×8的64个图像块,本公开对此不作限制。

具体的,以目标图像帧内目标图像块中的目标像素为例进行说明:

按照第一公式计算目标像素的梯度向量,第一公式为:

φx(i)表示目标像素的梯度向量的横向分量,φy(i)表示目标像素的梯度向量的纵向分量,yx,y表示目标像素的色值分量,yx±1,y表示目标像素横向相邻像素的色值分量,yx,y±1表示目标像素纵向相邻像素的色值分量,目标像素是目标图像块中第x行第y列的像素。

如果以每一个像素的长宽作为单位长度,则第一公式其实就是对目标像素的色值分量进行求导,第一公式的形式也可以表示成如下形式:

其中,y(i)=yx,y(i),表示目标像素的色值分量,yx±δx,y(i)表示目标像素横向相邻像素的色值分量,yx,y±δy(i)表示目标像素纵向相邻像素的色值分量。本公开中以色值分量是yuv色值中的y分量为例进行说明,并不代表本公开局限于此。在计算每个像素的梯度向量时,可以将每个像素不同色值分量的梯度向量都进行计算。

405、根据每个像素的梯度向量计算目标图像帧内每一个图像块的结构张量,并计算每一个图像块的结构张量的方差。

406、将目标图像帧内结构张量的方差大于预设阈值的图像块组成的区域确定为视觉集中区域。

此处将结构张量的方差作为颜色变化参数进行说明,并不代表本公开局限于此,颜色变化参数也可以是其他形式的参数。

407、将目标图像帧中视觉集中区域的图像块加入无损压缩编码的序列,将目标图像帧中其他区域的图像块加入普通压缩编码的序列。

408、对无损压缩编码的序列中的图像块进行无损压缩编码,对普通压缩编码的序列中的图像块进行有损压缩编码,并输出码流。

本公开实施例提供的图像帧的压缩方法,获取目标图像帧;确定目标图像帧中的视觉集中区域;将目标图像帧中视觉集中区域的图像块进行无损压缩;将目标图像帧中其他区域的图像块进行有损压缩。视觉集中区域是用户在观看目标图像帧时较为关键的区域,用户注意力会更多的停留在视觉集中区域,对视觉集中区域的图像块进行无损压缩,保证了视觉集中区域的图像块显示的时候清晰度不会降低,满足用户对于图像帧清晰度的要求;同时,对于除视觉集中区域之外的其他区域的图像块进行有损压缩,因为在播放目标图像帧时其他区域不是用户重点关注的区域,因此,清晰度即便降低也不会对用户观看造成较多影响,而对其他区域的图像块进行有损压缩减少了视频传输过程中的数据传输量,节省了占用的网络资源,保证了用户观看视频的流畅性。因此,本公开所提供的图像帧的压缩方法,在保证了图像帧显示具有较高的清晰度的同时,减少了视频传输过程中的数据传输量,节省了网络资源。

基于上述图1和图4对应的实施例中所描述的图像帧的压缩方法,下述为本公开装置实施例,可以用于执行本公开方法实施例。

本公开实施例提供一种图像帧的压缩装置,如图5所示,该图像帧的压缩装置50包括:获取模块501、视觉集中模块502、无损压缩模块503和有损压缩模块504;

获取模块501,用于获取目标图像帧,目标图像帧包括至少一个图像块;

视觉集中模块502,用于确定目标图像帧中的视觉集中区域,视觉集中区域为目标图像帧向用户呈现时的关键区域;

无损压缩模块503,用于将目标图像帧中视觉集中区域的图像块进行无损压缩;

有损压缩模块504,用于将目标图像帧中其他区域的图像块进行有损压缩,其他区域为目标图像帧中除视觉集中区域之外的区域。

在一个实施例中,如图6所示,视觉集中模块502包括颜色变化参数子模块5021和阈值子模块5022;

颜色变化参数子模块5021,用于计算至少一个图像块中每一个图像块的颜色变化参数,至少一个图像块中目标图像块的颜色变化参数用于指示目标图像块的颜色变化的平滑情况;

阈值子模块5022,用于将至少一个图像块中颜色变化参数大于预设阈值的图像块组成的区域确定为视觉集中区域。

在一个实施例中,如图7所示,颜色变化参数子模块5021包括梯度向量单元50211、结构张量单元50212和方差单元50213;

梯度向量单元50211,用于将至少一个图像块中颜色变化参数大于预设阈值的图像块组成的区域确定为视觉集中区域。

结构张量单元50212,用于根据每个像素的梯度向量计算至少一个图像块中每一个图像块的结构张量;

方差单元50213,用于将每一个图像块的结构张量中矩阵元素的方差值作为每一个图像块的颜色变化参数。

在一个实施例中,梯度向量单元50211,用于按照第一公式计算至少一个图像块中每个像素的梯度向量,第一公式为:

φx(i)表示目标像素的梯度向量的横向分量,φy(i)表示目标像素的梯度向量的纵向分量,yx,y表示目标像素的色值分量,yx±1,y表示目标像素横向相邻像素的色值分量,yx,y±1表示目标像素纵向相邻像素的色值分量,目标像素是目标图像块中第x行第y列的像素。

在一个实施例中,结构张量单元50212,用于根据每个像素的梯度向量按照第二公式计算至少一个图像块中每一个图像块的结构张量,第二公式为:

其中,t表示目标图像块的结构张量,φx(i)表示目标像素的梯度向量的横向分量,φy(i)表示目标像素的梯度向量的纵向分量,g为高斯算子。

在一个实施例中,如图8所示,获取模块501包括初始化子模块5011;

初始化子模块5011,用于对原始图像帧进行初始化处理生成所述目标图像帧。

在一个实施例中,如图9所示,初始化子模块5011包括色值距离单元50111和替换单元50112;

色值距离单元50111,用于根据第三公式计算目标像素与预设颜色的色值距离,第三公式为:

其中,s表示目标像素与预设颜色的色值距离,cyi、cui、cvi分别表示目标像素的三个色值分量,cy0、cu0、cv0分别表示预设颜色的三个色值分量;

替换单元50112,用于在目标像素与预设颜色的色值距离小于预设距离时,将目标像素的颜色替换为预设颜色并生成目标图像帧。

在一个实施例中,获取模块501,还用于获取待压缩视频中的i帧作为目标图像帧。

本公开实施例提供的图像帧的压缩装置,获取目标图像帧;确定目标图像帧中的视觉集中区域;将目标图像帧中视觉集中区域的图像块进行无损压缩;将目标图像帧中其他区域的图像块进行有损压缩。视觉集中区域是用户在观看目标图像帧时较为关键的区域,用户注意力会更多的停留在视觉集中区域,对视觉集中区域的图像块进行无损压缩,保证了视觉集中区域的图像块显示的时候清晰度不会降低,满足用户对于图像帧清晰度的要求;同时,对于除视觉集中区域之外的其他区域的图像块进行有损压缩,因为在播放目标图像帧时其他区域不是用户重点关注的区域,因此,清晰度即便降低也不会对用户观看造成较多影响,而对其他区域的图像块进行有损压缩减少了视频传输过程中的数据传输量,节省了占用的网络资源,保证了用户观看视频的流畅性。因此,本公开所提供的图像帧的压缩方法,在保证了图像帧显示具有较高的清晰度的同时,减少了视频传输过程中的数据传输量,节省了网络资源。

基于上述图1和图4对应的实施例中所描述的图像帧的压缩方法,本公开实施例还提供一种计算机可读存储介质,例如,非临时性计算机可读存储介质可以是只读存储器(英文:readonlymemory,rom)、随机存取存储器(英文:randomaccessmemory,ram)、cd-rom、磁带、软盘和光数据存储装置等。该存储介质上存储有计算机指令,用于执行上述图1和图4对应的实施例中所描述的图像帧的压缩方法,此处不再赘述。

本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。

应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1