一种图像的预处理方法、系统、设备以及介质与流程

文档序号:22738861发布日期:2020-10-31 09:20阅读:87来源:国知局
一种图像的预处理方法、系统、设备以及介质与流程

本发明涉及图像领域,具体涉及一种图像的预处理方法、系统、设备以及存储介质。



背景技术:

在当今人类社会日常生活中,图像识别与验证具有十分重要的作用,例如在人脸识别、无人驾驶、物体检测、物体分类等领域,图象识别都是不可或缺的技术。

进行图像识别时,图像的采集方便,采集设备可以使用中低档摄像头,价格低廉,具有很强的实用性。

然而由于大部分图像处于高维,图像是非刚体,存在诸多变化;摄像头采集到的图像受光照、成像角度、成像距离等影响,因此图像信号存在极大的不确定性,这些不确定性对于物体的原貌相当于是噪声,会降低物体检测过程的准确率,增加过拟合的风险,降低模型的鲁棒性。



技术实现要素:

有鉴于此,为了克服上述问题的至少一个方面,本发明实施例提出一种图像的预处理方法,包括以下步骤:

获取图像并对其进行灰度化处理;

对进行灰度化处理后的图像进行颜色空间的标准化处理;

利用hog算法对进行标准化处理后的图像进行特征提取并得到第一维度的图像特征;

利用lda算法对所述第一维度的图像特征进行降维处理。

在一些实施例中,利用hog算法对进行标准化处理后的图像进行特征提取并得到第一维度的图像特征,进一步包括:

计算所述图像的每一个像素的梯度;

将所述图像划分为多个单元,并统计每个单元内的梯度直方图,以得到每个单元的特征;

将若干个单元组成一个block,并将所述block内所有单元的特征串联以得到所述block的特征;

将所有的block的特征进行串联以得到最终的图像特征。

在一些实施例中,计算所述图像的每一个像素的梯度,进一步包括:

计算每一个像素点的梯度的大小和方向。

在一些实施例中,统计每个单元内的梯度直方图,进一步包括:

统计不同梯度的个数。

基于同一发明构思,根据本发明的另一个方面,本发明的实施例还提供了一种图像的预处理系统,包括:

灰度模块,所述灰度模块配置为获取图像并对其进行灰度化处理;

标准化处理模块,所述标准化模块配置为对进行灰度化处理后的图像进行颜色空间的标准化处理;

提取模块,所述提取模块配置为利用hog算法对进行标准化处理后的图像进行特征提取并得到第一维度的图像特征;

降维模块,所述降维模块配置为利用lda算法对所述第一维度的图像特征进行降维处理。

在一些实施例中,所述提取模块还配置为:

计算所述图像的每一个像素的梯度;

将所述图像划分为多个单元,并统计每个单元内的梯度直方图,以得到每个单元的特征;

将若干个单元组成一个block,并将所述block内所有单元的特征串联以得到所述block的特征;

将所有的block的特征进行串联以得到最终的图像特征。

在一些实施例中,所述提取模块还配置为:

计算每一个像素点的梯度的大小和方向。

在一些实施例中,所述提取模块还配置为:统计不同梯度的个数。

基于同一发明构思,根据本发明的另一个方面,本发明的实施例还提供了一种计算机设备,包括:

至少一个处理器;以及

存储器,所述存储器存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时执行如上所述的任一种图像的预处理方法的步骤。

基于同一发明构思,根据本发明的另一个方面,本发明的实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时执行如上所述的任一种图像的预处理方法的步骤。

本发明具有以下有益技术效果之一:本发明提出的方案通过利用hog算法对图像样本数据进行预处理,能够消除客观因素给图像原貌带来的不确定性,提取能代表图像原貌的“特征”,有助于提高样本数据的精度,进而提高模型分辨器的识别精度;并且利用lda算法对hog特征处理后的高维特征数据进行降维处理,去除冗余的数据集特征,提高模型精度、增强模型的鲁棒性及加速模型的训练和识别过程。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。

图1为本发明的实施例提供的图像的预处理方法的流程示意图;

图2为本发明的实施例提供的图像的预处理系统的结构示意图;

图3为本发明的实施例提供的计算机设备的结构示意图;

图4为本发明的实施例提供的计算机可读存储介质的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。

需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。

根据本发明的一个方面,本发明的实施例提出一种图像的预处理方法,如图1所示,其可以包括步骤:

s1,获取图像并对其进行灰度化处理;

s2,对进行灰度化处理后的图像进行颜色空间的标准化处理;

s3,利用hog算法对进行标准化处理后的图像进行特征提取并得到第一维度的图像特征;

s4,利用lda算法对所述第一维度的图像特征进行降维处理。

本发明提出的方案通过利用hog算法对图像样本数据进行预处理,能够消除客观因素给图像原貌带来的不确定性,提取能代表图像原貌的“特征”,有助于提高样本数据的精度,进而提高模型分辨器的识别精度;并且利用lda算法对hog特征处理后的高维特征数据进行降维处理,去除冗余的数据集特征,提高模型精度、增强模型的鲁棒性及加速模型的训练和识别过程。

在一些实施例中,利用hog算法对进行标准化处理后的图像进行特征提取并得到第一维度的图像特征,进一步包括:

计算所述图像的每一个像素的梯度;

将所述图像划分为多个单元,并统计每个单元内的梯度直方图,以得到每个单元的特征;

将若干个单元组成一个block,并将所述block内所有单元的特征串联以得到所述block的特征;

将所有的block的特征进行串联以得到最终的图像特征。

在一些实施例中,计算所述图像的每一个像素的梯度,进一步包括:

计算每一个像素点的梯度的大小和方向。

在一些实施例中,统计每个单元内的梯度直方图,进一步包括:

统计不同梯度的个数。

具体的,先将图像进行灰度化处理(将图像看做一个x,y,z(灰度)的三维图像);然后采用gamma校正法对输入图像进行颜色空间的标准化(归一化);目的是调节图像的对比度,降低图像局部的阴影和光照变化所造成的影响,同时可以抑制噪音的干扰;接着计算图像每个像素的梯度(包括大小和方向);主要是为了捕获轮廓信息,同时进一步弱化光照的干扰。接着将图像划分成小cells(例如6*6像素/cell),并统计每个cell的梯度直方图(不同梯度的个数),即可形成每个cell的descriptor;接着将每几个cell组成一个block(例如3*3个cell/block),一个block内所有cell的特征descriptor串联起来便得到该block的hog特征descriptor。最后将图像image内的所有block的hog特征descriptor串联起来就可以得到该image(你要检测的目标)的hog特征descriptor了。这个就是最终的可供分类使用的特征向量了。

线性判别分析(lineardiscriminantanalysis,lda),它充分利用了训练样本己知的类别信息,寻找最有助于判别分类的投影方向子空间,属于监督学习方法。它的目的是从高维特征空间中提取出最具有判别能力的低纬特征,这些特征能帮助将同一个类别的所有样本聚集在一起,不同类别的样本尽量分开,即选择使得样本类间离散度sb和样本类内离散度sw的比值最大的特征。类内离散度矩阵是对每一类的训练样本求类内平均值,再用每一样本减去各自所属类的均值。。样本类间离散度矩阵sb和样本类内离散度矩阵sw的定义,见下面两式:

其中,c是类别数,pi是先验概率,μi是第ci类样本的均值,μ是总体样本的均值,xk是第i类样本的第k个特征,ci是属于第i类的样本。

投影后在低纬空间不同类别的样本尽可能分得越开越好,同时希望每个类别内部样本尽量密集,也就是说,样本类间离散度越大越好,而样本类内离散度越小越好。因此,如果sw是非奇异矩阵,最优的投影方向w就是使得样本类间离散度矩阵和样本类内离散度矩阵的行列式比值最大的那些正交特征向量。因此,最佳映射函数定义为:

通过线性代数理论可知,w就是满足如下等式的解:

sbwi=λiswwi(i=1,2,...,m)

也就是对应于矩阵较大的特征值λi的特征向量。

本发明采用hog算法,通过计算和统计图像局部区域的梯度方向直方图来构成特征。在一副图像中,局部目标的表象和形状能够被梯度或边缘的方向密度分布很好地描述。(本质:梯度的统计信息,而梯度主要存在于边缘的地方)。从而提取出能代表图像特点的纹理特征,有助于提高样本数据的精度,进而提高最终模型分辨器的识别精度。

然而上述处理过程会导致样本数据集扩大、存储困难、数据特征冗余以及维度灾难,进而会造成模型训练速度降低、模型过拟合及鲁棒性差等问题;对此采用lda算法,该方法基本思想是将高维的数据样本投影到最佳判别的矢量空间,以达到提取分类信息和压缩特征空间维数的效果,投影后保证数据样本在新的子空间类间距离最大和类内距离最小,即样本数据在该空间中有最佳的可分离性,以此来完成“特征”的降维处理,加速模型训练和识别过程。

因此,本发明提出的方案通过利用hog算法对图像样本数据进行预处理,能够消除客观因素给图像原貌带来的不确定性,提取能代表图像原貌的“特征”,有助于提高样本数据的精度,进而提高模型分辨器的识别精度;并且利用lda算法对hog特征处理后的高维特征数据进行降维处理,去除冗余的数据集特征,提高模型精度、增强模型的鲁棒性及加速模型的训练和识别过程。

基于同一发明构思,根据本发明的另一个方面,本发明的实施例还提供了一种图像的预处理系统400,如图2所示,包括:

灰度模块401,所述灰度模块401配置为获取图像并对其进行灰度化处理;

标准化处理模块402,所述标准化模块402配置为对进行灰度化处理后的图像进行颜色空间的标准化处理;

提取模块403,所述提取模块403配置为利用hog算法对进行标准化处理后的图像进行特征提取并得到第一维度的图像特征;

降维模块404,所述降维模块404配置为利用lda算法对所述第一维度的图像特征进行降维处理。

在一些实施例中,所述提取模块403还配置为:

计算所述图像的每一个像素的梯度;

将所述图像划分为多个单元,并统计每个单元内的梯度直方图,以得到每个单元的特征;

将若干个单元组成一个block,并将所述block内所有单元的特征串联以得到所述block的特征;

将所有的block的特征进行串联以得到最终的图像特征。

在一些实施例中,所述提取模块403还配置为:

计算每一个像素点的梯度的大小和方向。

在一些实施例中,所述提取模块403还配置为:统计不同梯度的个数。

基于同一发明构思,根据本发明的另一个方面,如图3所示,本发明的实施例还提供了一种计算机设备501,包括:

至少一个处理器520;以及

存储器510,存储器510存储有可在处理器上运行的计算机程序511,处理器520执行程序时执行如上的任一种图像的预处理方法的步骤。

基于同一发明构思,根据本发明的另一个方面,如图4所示,本发明的实施例还提供了一种计算机可读存储介质601,计算机可读存储介质601存储有计算机程序指令610,计算机程序指令610被处理器执行时执行如上的任一种图像的预处理方法的步骤。

最后需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。

此外,应该明白的是,本文的计算机可读存储介质(例如,存储器)可以是易失性存储器或非易失性存储器,或者可以包括易失性存储器和非易失性存储器两者。

本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,已经就各种示意性组件、方块、模块、电路和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个系统的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现的功能,但是这种实现决定不应被解释为导致脱离本发明实施例公开的范围。

以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。

应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。

上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。

所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1