图像处理方法、装置、电子设备及计算机可读存储介质与流程

文档序号:21786215发布日期:2020-08-07 20:31阅读:134来源:国知局
图像处理方法、装置、电子设备及计算机可读存储介质与流程

本申请涉及图像处理技术领域,尤其涉及一种图像处理方法、装置、电子设备及计算机可读存储介质。



背景技术:

在现有的计算机视觉技术中,图像预处理是必不可少的一步。目前常用的图像预处理方式为:针对待处理图像中的每一个像素点,依次进行数据格式整理、rgb转化、数据归一化等流程。但此方式会耗费较多的处理时间,造成处理速度慢。



技术实现要素:

本申请实施例提供一种图像处理方法、装置、电子设备及计算机可读存储介质,以解决现有图像预处理方式的处理速度慢的问题。

为了解决上述技术问题,本申请是这样实现的:

第一方面,本申请实施例提供了一种图像处理方法,包括:

获取待处理图像;

将所述待处理图像转化为三通道yuv图像;

对所述三通道yuv图像中的y通道图像、u通道图像和v通道图像进行卷积运算,分别生成r通道图像、g通道图像和b通道图像,得到三通道rgb图像;

对所述三通道rgb图像进行预处理。

这样,在图像预处理过程中,可以借助卷积运算对转化得到的三通道yuv图像中的y通道图像、u通道图像和v通道图像进行处理,以生成三通道rgb图像,并对该三通道rgb图像进行预处理,从而缩短将yuv图像转化为rgb图像的时间,从而提升图像预处理速度。

可选的,所述将所述待处理图像转化为三通道yuv图像,包括:

将所述待处理图像划分为第一y通道图像和uv通道图像;

对所述第一y通道图像进行调整,得到维度为(n,1,w,h)的y通道图像;

对所述uv通道图像进行分离,得到维度为(n,1,w*0.5,h*0.5)的u通道图像和维度为(n,1,w*0.5,h*0.5)的v通道图像;

分别对所述维度为(n,1,w*0.5,h*0.5)的u通道图像和所述维度为(n,1,w*0.5,h*0.5)的v通道图像进行2倍采样,得到维度为(n,1,w,h)的u通道图像和维度为(n,1,w,h)的v通道图像;

将维度为(n,1,w,h)的y通道图像、u通道图像和v通道图像进行合并,得到维度为(n,3,w,h)的yuv图像;

其中,所述n表示所述待处理图像的个数,所述1表示所述y通道图像、所述u通道图像或所述v通道图像为1个通道,所述3表示所述yuv图像为3个通道,所述w等于所述待处理图像的宽度,所述h等于所述待处理图像的高度。

这样,借助上述分离、采样和合并的过程,可以高效地获得满足后续卷积运算需求的三通道yuv图像。

可选的,所述对所述uv通道图像进行分离,得到维度为(n,1,w*0.5,h*0.5)的u通道图像和维度为(n,1,w*0.5,h*0.5)的v通道图像,包括:

将所述uv通道图像调整为维度为(n,2,w*h*0.25)的uv通道图像;

对所述维度为(n,2,w*h*0.25)的uv通道图像进行分离,得到维度为(n,1,w*h*0.25)的u通道图像和维度为(n,1,w*h*0.25)的v通道图像;

将所述维度为(n,1,w*h*0.25)的u通道图像调整为所述维度为(n,1,w*0.5,h*0.5)的u通道图像,和将所述维度为(n,1,w*h*0.25)的v通道图像调整为所述维度为(n,1,w*0.5,h*0.5)的v通道图像。

这样,可以准确实现uv通道图像的分离。

可选的,所述分别对所述维度为(n,1,w*0.5,h*0.5)的u通道图像和所述维度为(n,1,w*0.5,h*0.5)的v通道图像进行2倍采样,得到维度为(n,1,w,h)的u通道图像和维度为(n,1,w,h)的v通道图像,包括:

利用nearest插值函数,分别对所述维度为(n,1,w*0.5,h*0.5)的u通道图像和所述维度为(n,1,w*0.5,h*0.5)的v通道图像进行2倍的最邻近上采样,得到所述维度为(n,1,w,h)的u通道图像和所述维度为(n,1,w,h)的v通道图像。

这样,利用nearest插值函数进行2倍的最邻近上采样,可以准确采样得到的所需的u通道图像和v通道图像。

可选的,所述对所述三通道rgb图像进行预处理,包括:

利用批归一化函数对所述三通道rgb图像进行预处理。

这样,借助批归一化函数可以实现对三通道rgb图像的统一预处理,从而加速预处理过程。

可选的,所述批归一化函数为:

其中,所述output表示预处理后图像的像素值,所述input表示预处理前图像的像素值,所述scale表示缩放系数,所述bias表示偏置值,所述mean表示均值,所述variance表示方差,所述epsilon表示预设的除法数值稳定系数。

可选的,所述得到三通道rgb图像之后,所述方法还包括:

对所述三通道rgb图像的尺寸进行调整;

所述对所述三通道rgb图像进行预处理,包括:

对调整尺寸后的三通道rgb图像进行预处理。

第二方面,本申请实施例还提供了一种图像处理装置,包括:

获取模块,用于获取待处理图像;

转化模块,用于将所述待处理图像转化为三通道yuv图像;

运算模块,用于对所述三通道yuv图像中的y通道图像、u通道图像和v通道图像进行卷积运算,分别生成r通道图像、g通道图像和b通道图像,得到三通道rgb图像;

预处理模块,用于对所述三通道rgb图像进行预处理。

可选的,所述转化模块包括:

划分单元,用于将所述待处理图像划分为第一y通道图像和uv通道图像;

调整单元,用于对所述第一y通道图像进行调整,得到维度为(n,1,w,h)的y通道图像;

分离单元,用于对所述uv通道图像进行分离,得到维度为(n,1,w*0.5,h*0.5)的u通道图像和维度为(n,1,w*0.5,h*0.5)的v通道图像;

采样单元,用于分别对所述维度为(n,1,w*0.5,h*0.5)的u通道图像和所述维度为(n,1,w*0.5,h*0.5)的v通道图像进行2倍采样,得到维度为(n,1,w,h)的u通道图像和维度为(n,1,w,h)的v通道图像;

合并单元,用于将维度为(n,1,w,h)的y通道图像、u通道图像和v通道图像进行合并,得到维度为(n,3,w,h)的yuv图像;

其中,所述n表示所述待处理图像的个数,所述1表示所述y通道图像、所述u通道图像或所述v通道图像为1个通道,所述3表示所述yuv图像为3个通道,所述w等于所述待处理图像的宽度,所述h等于所述待处理图像的高度。

可选的,所述分离单元包括:

第一调整子单元,用于将所述uv通道图像调整为维度为(n,2,w*h*0.25)的uv通道图像;

分离子单元,用于对所述维度为(n,2,w*h*0.25)的uv通道图像进行分离,得到维度为(n,1,w*h*0.25)的u通道图像和维度为(n,1,w*h*0.25)的v通道图像;

第二调整子单元,用于将所述维度为(n,1,w*h*0.25)的u通道图像,调整为所述维度为(n,1,w*0.5,h*0.5)的u通道图像,和将所述维度为(n,1,w*h*0.25)的v通道图像调整为所述维度为(n,1,w*0.5,h*0.5)的v通道图像。

可选的,所述采样单元具体用于:利用nearest插值函数,分别对所述维度为(n,1,w*0.5,h*0.5)的u通道图像和所述维度为(n,1,w*0.5,h*0.5)的v通道图像进行2倍的最邻近上采样,得到所述维度为(n,1,w,h)的u通道图像和所述维度为(n,1,w,h)的v通道图像。

可选的,所述预处理模块具体用于:利用批归一化函数对所述三通道rgb图像进行预处理。

可选的,所述批归一化函数为:

其中,所述output表示预处理后图像的像素值,所述input表示预处理前图像的像素值,所述scale表示缩放系数,所述bias表示偏置值,所述mean表示均值,所述variance表示方差,所述epsilon表示预设的除法数值稳定系数。

可选的,所述装置还包括:

调整模块,用于对所述三通道rgb图像的尺寸进行调整;

所述预处理模块具体用于:对调整尺寸后的三通道rgb图像进行预处理。

第三方面,本申请实施例还提供了一种电子设备,包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的图像处理方法。

第四方面,本申请实施例还提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行如上所述的图像处理方法。

上述申请中的一个实施例具有如下优点或有益效果:可以在图像预处理过程中,借助卷积运算对转化得到的三通道yuv图像中的y通道图像、u通道图像和v通道图像进行处理,以生成三通道rgb图像,并对该三通道rgb图像进行预处理,从而缩短将yuv图像转化为rgb图像的时间,从而提升图像预处理速度。因为采用了获取待处理图像,将所述待处理图像转化为三通道yuv图像,对所述三通道yuv图像中的y通道图像、u通道图像和v通道图像进行卷积运算,分别生成r通道图像、g通道图像和b通道图像,得到三通道rgb图像,并对所述三通道rgb图像进行预处理技术手段,所以克服了现有图像预处理方式的处理速度慢的技术问题,进而达到提升图像预处理速度的技术效果。

上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。

附图说明

附图用于更好地理解本方案,不构成对本申请的限定。其中:

图1是本申请实施例的图像处理方法的流程图;

图2是本申请具体实例中卷积运算过程的示意图;

图3是本申请具体实例的图像转化及预处理过程的流程图;

图4是用来实现本申请实施例的图像处理方法的图像处理装置的框图;

图5是用来实现本申请实施例的图像处理方法的电子设备的框图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例可以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

请参见图1,图1是本申请实施例提供的一种图像处理方法的流程图,该方法应用于电子设备,如图1所示,该方法包括如下步骤:

步骤101:获取待处理图像。

本实施例中,本申请的待处理图像可以通过摄像装置采集得到,也可以直接从其他设备比如服务端设备获取。对于待处理图像的类型,本申请不做限制,示例性的,可以为人脸图像、物体图像、风景图像等。

一种实施方式中,在获取到待处理图像之后,可以对待处理图像的格式进行调整,比如将待处理图像的格式调整为维度为(w*h*1.5),数据类型为8位无符号整型(uint8)的数组。其中,w等于待处理图像的宽度,h等于待处理图像的高度。

步骤102:将所述待处理图像转化为三通道yuv图像。

其中,此步骤中转化得到的yuv图像可为维度为(n,3,w,h)的yuv图像。n表示待处理图像的个数,3表示该yuv图像为3个通道,w表示该yuv图像的宽度(等于待处理图像的宽度),h表示该yuv图像的高度(等于待处理图像的高度)。

对于yuv图像的格式,可包括多种比如yuv444、yuv422、yuv420、nv12等。不同的yuv图像格式具有不同的像素排布方式。比如,本实施例中yuv图像格式可选用yuv420,其像素排布方式为所有y通道像素和uv通道像素按列交替排布。

步骤103:对所述三通道yuv图像中的y通道图像、u通道图像和v通道图像进行卷积运算,分别生成r通道图像、g通道图像和b通道图像,得到三通道rgb图像。

本实施例中,此步骤中可以利用如下卷积函数(conv2d)对三通道yuv图像进行卷积运算,以分别生成r通道图像、g通道图像和b通道图像,得到三通道rgb图像:

其中,rgb_img表示三通道rgb图像,yuv_img表示三通道yuv图像,w和b表示确定的参数矩阵,表示卷积符号。对于此部分的卷积运算,卷积核的维度为(1,1,3,3),即卷积核大小为1*1,输入通道数为3,输出通道数为3。

一种实施方式中,上述w参数矩阵可选为:[[1,0,1.13983],[1,-0.39465,-0.58060],[1,2.03211,0]],上述b参数矩阵可选为:[-128*1.13983,128*0.39465+128*0.58060,-128*2.03211]。此情况下,如图2所示,对应的卷积运算过程(输入为三通道yuv图像,输出为三通道rgb图像)可以包括:

r=y+1.13983*(v-128);

g=y-0.39465*(u-128)-0.58060*(v-128);

b=y+2.03211*(u-128)。

步骤104:对所述三通道rgb图像进行预处理。

本实施例中,预处理后的图像可用于图像目标检测、视频目标检测及分析等。该预处理可包括图像归一化处理。此步骤中预处理过程可为:利用批归一化函数对该三通道rgb图像进行预处理。这样,借助批归一化函数可实现对三通道rgb图像的统一预处理,从而加速预处理过程。

可选的,该批归一化函数可为:其中,output表示预处理后图像的像素值,input表示预处理前图像的像素值,scale表示缩放系数,bias表示偏置值,mean表示均值,variance表示方差,epsilon表示预设的除法数值稳定系数。该scale、bias、mean、variance和epsilon可以预先设置。

作为一种可选的实施方式,上述批归一化函数中参数设置具体可为:scale等于[1/σ,1/σ,1/σ],bias等于[μ1/σ,μ2/σ,μ3/σ],mean等于[0,0,0],variance等于[0.999995,0.999995,0.999995],epsilon等于1e-5。进一步的,μ值可为128,σ值可为256。而将epsilon设置为1e-5的原因为有些情况不允许epsilon小于1e-5。

可选的,所述得到三通道rgb图像之后,所述方法还包括:对所述三通道rgb图像的尺寸进行调整,以调整到指定的尺寸。而上述对所述三通道rgb图像进行预处理可包括:对调整尺寸后的三通道rgb图像进行预处理。这样,可以保证调整图像的尺寸统一,提高预处理速度。

作为一种可选的实施方式,在对三通道rgb图像进行预处理之前,可首先调用resize函数对该三通道rgb图像的尺寸进行调整,即将该三通道rgb图像调整到指定的尺寸。而对于该resize函数的具体形式,可选用现有常用形式,在此不进行限制。

本申请实施例的图像处理方法,在图像预处理过程中,可以借助卷积运算对转化得到的三通道yuv图像中的y通道图像、u通道图像和v通道图像进行处理,以生成三通道rgb图像,并对该三通道rgb图像进行预处理,从而缩短将yuv图像转化为rgb图像的时间,从而提升图像预处理速度。

本申请实施例中,上述步骤102中将待处理图像转化为三通道yuv图像的过程可以包括:

将待处理图像划分为第一y通道图像和uv通道图像;其中,此划分过程可理解为指针重定向;该第一y通道图像的维度可为(w*h),该uv通道图像的维度可为(w*h*0.5);

对所述第一y通道图像进行调整,得到维度为(n,1,w,h)的y通道图像;其中,n表示待处理图像的个数,1表示该y通道图像为1个通道,w表示该y通道图像的宽度,h表示该y通道图像的高度;可选的,本实施例可以调用reshape函数对第一y通道图像进行调整;

对所述uv通道图像进行分离,得到维度为(n,1,w*0.5,h*0.5)的u通道图像和维度为(n,1,w*0.5,h*0.5)的v通道图像;其中,1表示该y通道图像或v通道图像为1个通道,该w*0.5表示该y通道图像或v通道图像的宽度,该h*0.5表示该y通道图像或v通道图像的高度;可选的,本实施例可以调用split函数对uv通道图像进行分离;

分别对所述维度为(n,1,w*0.5,h*0.5)的u通道图像和所述维度为(n,1,w*0.5,h*0.5)的v通道图像进行2倍采样,得到维度为(n,1,w,h)的u通道图像和维度为(n,1,w,h)的v通道图像;其中,1表示该y通道图像或v通道图像为1个通道,该w表示该y通道图像或v通道图像的宽度,该h表示该y通道图像或v通道图像的高度;

将维度为(n,1,w,h)的y通道图像、u通道图像和v通道图像进行合并,得到维度为(n,3,w,h)的yuv图像;其中,3表示该yuv通道图像为3个通道,该w表示该yuv图像的宽度,该h表示该yuv图像的高度;可选的,本实施例可以调用concat函数将维度为(n,1,w,h)的y通道图像、u通道图像和v通道图像进行合并,得到维度为(n,3,w,h)的yuv图像。

这样,借助上述分离、采样和合并的过程,可以高效地获得满足后续卷积运算需求的三通道yuv图像。

需指出的,上述reshape函数可以采用现有调用格式,可将指定的矩阵变换成特定维数矩阵,且矩阵中元素个数不变,可以重新调整矩阵的行数、列数、维数。上述split函数可以采用现有调用格式,可将uv通道图像进行分离,以得到u通道图像和v通道图像。上述concat函数可以采用现有调用格式,通常用于连接两个或多个数组,以得到新的数组。

可选的,为了准确实现uv通道图像的分离,上述对uv通道图像进行分离,得到维度为(n,1,w*0.5,h*0.5)的u通道图像和维度为(n,1,w*0.5,h*0.5)的v通道图像的过程可为:

将所述uv通道图像调整为维度为(n,2,w*h*0.25)的uv通道图像;其中,w*h*0.25表示该uv通道图像的宽度为w*0.5和该uv通道图像的高度为h*0.5;2表示该uv通道图像的2个通道;

对所述维度为(n,2,w*h*0.25)的uv通道图像进行分离,得到维度为(n,1,w*h*0.25)的u通道图像和维度为(n,1,w*h*0.25)的v通道图像;其中,w*h*0.25表示该u通道图像的宽度为w*0.5和该u通道图像的高度为h*0.5,或者表示该v通道图像的宽度为w*0.5和该v通道图像的高度为h*0.5;1表示该u通道图像或v通道图像为1个通道;可选的,本实施例可以调用split函数对维度为(n,2,w*h*0.25)的uv通道图像进行分离;

将所述维度为(n,1,w*h*0.25)的u通道图像调整为维度为(n,1,w*0.5,h*0.5)的u通道图像,和将所述维度为(n,1,w*h*0.25)的v通道图像调整为维度为(n,1,w*0.5,h*0.5)的v通道图像;可选的,本实施例可以调用reshape函数对维度为(n,1,w*h*0.25)的u通道图像或v通道图像进行调整。

可选的,上述分别对维度为(n,1,w*0.5,h*0.5)的u通道图像和维度为(n,1,w*0.5,h*0.5)的v通道图像进行2倍采样的过程可为:利用nearest插值函数,分别对维度为(n,1,w*0.5,h*0.5)的u通道图像和维度为(n,1,w*0.5,h*0.5)的v通道图像进行2倍的最邻近上采样,得到维度为(n,1,w,h)的u通道图像和维度为(n,1,w,h)的v通道图像。这样,利用nearest插值函数进行2倍的最邻近上采样,可以准确采样得到的所需的u通道图像和v通道图像。

下面,结合图3对本申请具体实例的图像转化及预处理过程进行说明。

本申请具体实例中,以待处理图像的个数为1为例,待处理图像的大小为1080*1920,通过调用神经网络预测库中函数实现图像转化及预处理过程,并借助神经网络框架(比如paddlepaddle)进行说明。如图3所示,该神经网络框架包括输入层、模块1、模块2、模块3(卷积层)、模块4和模块5(批归一化层),对应的过程可包括:

对于输入层:首先,将待处理图像1080*1920依序分为两部分,即维度为(1080*1920)的y通道图像和维度为(540*960*2)的uv通道图像;然后,调用reshape函数对维度为(1080*1920)的y通道图像进行调整,得到维度为(1,1,1080,1920)的y通道图像,作为输入节点1的输入,同时将维度为(1,1,540*960*2)的uv通道图像作为输入节点2的输入。

对于模块1:首先,调用split函数对输入节点2处uv通道图像进行分离,得到维度为(1,1,540*960)的u通道图像和维度为(n,1,540*960)的v通道图像;然后,调用reshape函数将维度为(1,1,540*960)的u通道图像调整为维度为(1,1,540,960)的u通道图像,和调用reshape函数将维度为(1,1,540*960)的v通道图像调整为维度为(1,1,540,960)的v通道图像。

对于模块2:首先,利用nearest插值函数,分别对维度为(1,1,540,960)的u通道图像和维度为(1,1,540,960)的v通道图像进行2倍的最邻近上采样,得到维度为(1,1,1080,1920)的u通道图像和维度为(1,1,1080,1920)的v通道图像,然后,调用concat函数,对维度为(1,1,1080,1920)的y通道图像、u通道图像和v通道图像进行合并,得到维度为(1,3,1080,1920)的yuv图像。

对于模块3:调用卷积函数conv2d,对维度为(1,3,1080,1920)的yuv图像进行卷积运算,分别生成r通道图像、g通道图像和b通道图像,得到维度为(1,3,1080,1920)的rgb图像。

对于模块4:调用resize_bilinear函数,调整此维度为(1,3,1080,1920)的rgb图像的尺寸大小,调整为维度为(1,3,216,384)的rgb图像。

对于模块5:利用批归一化函数batch_norm,对该维度为(1,3,216,384)的rgb图像进行预处理,得到维度为(1,3,216,384)的归一化rgb图像。

这样,通过调用神经网络预测库中函数,可以显著提升图像预处理的速度。

请参见图4,图4是本申请实施例提供的一种图像处理装置的结构示意图,如图4所示,该图像处理装置40包括:

获取模块41,用于获取待处理图像;

转化模块42,用于将所述待处理图像转化为三通道yuv图像;

运算模块43,用于对所述三通道yuv图像中的y通道图像、u通道图像和v通道图像进行卷积运算,分别生成r通道图像、g通道图像和b通道图像,得到三通道rgb图像;

预处理模块44,用于对所述三通道rgb图像进行预处理。

可选的,所述转化模块42包括:

划分单元,用于将所述待处理图像划分为第一y通道图像和uv通道图像;

调整单元,用于对所述第一y通道图像进行调整,得到维度为(n,1,w,h)的y通道图像;

分离单元,用于对所述uv通道图像进行分离,得到维度为(n,1,w*0.5,h*0.5)的u通道图像和维度为(n,1,w*0.5,h*0.5)的v通道图像;

采样单元,用于分别对所述维度为(n,1,w*0.5,h*0.5)的u通道图像和所述维度为(n,1,w*0.5,h*0.5)的v通道图像进行2倍采样,得到维度为(n,1,w,h)的u通道图像和维度为(n,1,w,h)的v通道图像;

合并单元,用于将维度为(n,1,w,h)的y通道图像、u通道图像和v通道图像进行合并,得到维度为(n,3,w,h)的yuv图像;

其中,所述n表示所述待处理图像的个数,所述1表示所述y通道图像、所述u通道图像或所述v通道图像为1个通道,所述3表示所述yuv图像为3个通道,所述w等于所述待处理图像的宽度,所述h等于所述待处理图像的高度。

可选的,所述分离单元包括:

第一调整子单元,用于将所述uv通道图像调整为维度为(n,2,w*h*0.25)的uv通道图像;

分离子单元,用于对所述维度为(n,2,w*h*0.25)的uv通道图像进行分离,得到维度为(n,1,w*h*0.25)的u通道图像和维度为(n,1,w*h*0.25)的v通道图像;

第二调整子单元,用于将所述维度为(n,1,w*h*0.25)的u通道图像,调整为所述维度为(n,1,w*0.5,h*0.5)的u通道图像,和将所述维度为(n,1,w*h*0.25)的v通道图像调整为所述维度为(n,1,w*0.5,h*0.5)的v通道图像。

可选的,所述采样单元具体用于:利用nearest插值函数,分别对所述维度为(n,1,w*0.5,h*0.5)的u通道图像和所述维度为(n,1,w*0.5,h*0.5)的v通道图像进行2倍的最邻近上采样,得到所述维度为(n,1,w,h)的u通道图像和所述维度为(n,1,w,h)的v通道图像。

可选的,所述预处理模块44具体用于:利用批归一化函数对所述三通道rgb图像进行预处理。

可选的,所述批归一化函数为:

其中,所述output表示预处理后图像的像素值,所述input表示预处理前图像的像素值,所述scale表示缩放系数,所述bias表示偏置值,所述mean表示均值,所述variance表示方差,所述epsilon表示预设的除法数值稳定系数。

可选的,所述装置还包括:

调整模块,用于对所述三通道rgb图像的尺寸进行调整;

所述预处理模块44具体用于:对调整尺寸后的三通道rgb图像进行预处理。

可理解的,本申请实施例的图像处理装置40,可以实现上述图1所示方法实施例中实现的各个过程,以及达到相同的有益效果,为避免重复,这里不再赘述。

根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。

如图5所示,是用来实现本申请实施例的图像处理方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图5所示,该电子设备包括:一个或多个处理器501、存储器502,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示gui的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图5中以一个处理器501为例。

存储器502即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的图像处理方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的图像处理方法。

存储器502作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的图像处理方法对应的程序指令/模块(例如,附图4所示的获取模块41、转化模块42、运算模块43和预处理模块44)。处理器501通过运行存储在存储器502中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的图像处理方法。

存储器502可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储电子设备的使用所创建的数据等。此外,存储器502可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器502可选包括相对于处理器501远程设置的存储器,这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

图像处理方法的电子设备还可以包括:输入装置503和输出装置504。处理器501、存储器502、输入装置503和输出装置504可以通过总线或者其他方式连接,图5中以通过总线连接为例。

输入装置503可接收输入的数字或字符信息,以及产生与图像处理方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置504可以包括显示设备、辅助照明装置(例如,led)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(lcd)、发光二极管(led)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用asic(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(pld)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声音输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

根据本申请实施例的技术方案,可以在图像预处理过程中,借助卷积运算对转化得到的三通道yuv图像中的y通道图像、u通道图像和v通道图像进行处理,以生成三通道rgb图像,并对该三通道rgb图像进行预处理,从而缩短将yuv图像转化为rgb图像的时间,从而提升图像预处理速度。

应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。

上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1