一种由大规模特征集的图像识别的方法与流程

文档序号:21824782发布日期:2020-08-11 21:45阅读:281来源:国知局
一种由大规模特征集的图像识别的方法与流程

【技术领域】

本发明属于图像处理领域中的一种由大规模特征集的图像识别的方法。

当前,人脸识别领域的技术竞争成为人工智能的主战场,其竞争的程度已达到非常激烈的程度。有日本电气公司公开了题为:“模式识别方法”(专利文献1)。在这个专利里公开了一个将人脸五官位置的30个特征值组成的特征向量,然后用于训练同一人的人脸特征向量的集合内与不同人脸特征向量集合间的协方差,最后通过马氏距离(mahalanobisdistance)公式,得出样本特征向量与登录后的不同的人脸特征向量之间最小距离的特征向量所对应的人脸数据设定为识别结果。

作为拥有日本最高水平的人脸识别技术的日本电气公司之后又公开了:“人脸特征数据生成方法及装置,并且人脸类似度的算出方法与装置”(专利文献2)。这个专利在上一个专利的基础上进一步对于每一个人脸图像的识别增加了一个信赖度指标的处理。这个信赖度指标是来自特征向量间的向量差的正态分布,特征向量的差向量的特征值间的方差,把人脸特征间的差向量的事后分布作为混合分布,从混合分布的对数尤度中导出来的等等,按照信赖度将模式之间的类似度算出,从而可以提高人脸识别的精度。

还是日本电气公司同韩国三星电子,在2004年又公开了一个人脸识别的专利:“人脸识别以及用于检索的特征向量抽出方法及其装置”(专利文献3)。在这个专利中公开了针对整体的人脸图像的第1正规化向量,第2正规化向量,通过傅立叶变换生成整体的傅立叶变换特征向量,再针对中心部位的人脸图像的第3正规化向量,第4正规化向量,通过傅立叶变换生成中心部位的傅立叶变换特征向量。对于整体的人脸图像生成整体的强度特征向量,对于所定的局部区域的人脸图像生成局部的强度特征向量。上述第1正规化向量,第2正规化向量与全体的强度特征向量结合生成整体特征向量,上述第3正规化向量,第4正规化向量与局部的强度特征向量结合生成局部特征向量。以此构成用于检索的特征向量。

针对上述的发明日本电气公司在2006年又公开了题为:“人脸特征数据的生成方法与装置,以及人脸识别方法与系统”的专利(专利文献4)。该专利在专利文献3的基础上,又提出了通过图像的对比度不同生成信赖度值,以及通过图像的像素最大灰度值与最小灰度值的不同生成信赖度值,以及通过图像的像素分散与标准方差的不同生成信赖度值,以及通过图像的非对称指标的不同生成信赖度值,以及通过提取图像和反转图像之间的差分图像的像素值的相乘或相加所得到的值的不同生成信赖度值等的反映原图像状态的信赖度的新的计算方法。

经过十几年后日本电气公司就人脸识别技术又公开了最新的专利:“人脸识别装置,人脸识别方法,人脸识别程序,显示控制装置,显示控制方法以及显示控制程序”(专利文献5)。这个专利提出了按照人脸图像的局部进行识别的方法,根据人脸局部图像的类似度的阀值得出各个人脸局部图像之间的类似,模棱两可,不类似三个结果,按照每一个人脸局部图像的这三个结论作为整体人脸图像的识别的依据。

【公开文献】

【专利文献1】特開平9-134432号公告

【专利文献2】特開平2003-187229号公告

【专利文献3】特開平特開2004-139596(p2004-139596a)

【专利文献4】特開2006-344236(p2006-344236a)

【专利文献5】特開2018-49655(p2018-49655a)

上述的专利文献1中记述的方法,用于训练同一人的人脸特征向量的集合内与不同人脸特征向量集合间的协方差,并且用马氏距离获得最终的识别结果,虽然可以把概率统计的公式性的算法应用于人脸识别,从而可以比传统图像识别方法具有很大的进步,但是在人脸识别图像中存在着大量的随机干扰,如何做到超越概率统计的公式性算法,滤除人脸图像以及特征值的噪声,使预测识别结果达到接近母体的程度距离甚远。再有马氏距离只能考虑特征向量之间的类似关系,不能直接用可以统一欧几里德空间与概率空间的距离,进行高精度的计算不同特征向量之间的尺度关系,成为一个影响识别精度提高的问题。

上述的专利文献2中记述的方法,对于每一个人脸图像的识别增加了一个信赖度指标的处理,这种方法无疑可以提高人脸识别的精度,但是信赖度的定义缺乏严密的科学性,不能做到最佳化的识别结果。

上述的专利文献3中记述的方法,提出了用傅立叶变换的频谱作为人脸图像的特征向量,由于人脸图像的旋转对频谱影响较大,以及频谱信息对人脸图像的特征信息的反映不是很灵敏,而且充斥着大量噪声的特征值,严重影响识别率的提高。

上述的专利文献4中记述的方法,通过生成可以反映原图像状态的信赖度,来增加人脸识别的精度,但是,信赖度的生成不够严谨。

上述的专利文献5中记述的方法,按照人脸图像的局部进行逐个识别的方法,最终信赖度的处理用三个信赖度阀值作为判断基准缺乏严密性,而且在人脸局部图像的识别上仍然存在上述的诸问题。



技术实现要素:

本发明的第一个目的是:提供一种适合于亿万级的大规模的特征向量的产生的图像识别的信息抽出方法,可以解决被识别图像的错位问题,可以最有效的提取被识别图像的特征信息。

本发明的第二个目的是:提供一个可以解决在大规模的图像特征向量中,如何在大量的被识别图像的特征值中,获得高信赖值的特征值数据的筛选问题。

本发明的第三个目的是:提出一个小数据训练可以产生超越传统的深度学习数据集数量的,大数据特征向量的新一代人工智能模型的构成方法。

本发明的第四个目的是:提出一个图像处理与图像识别多目的自动机器学习的模型。

本发明的第五个目的是:提出一个无需训练的自动机器学习的3d物体识别的方法。

本发明的第六个目的是:提出一个针对雷达数据实现数据深度挖掘,机器理解的处理方法。

本发明为解决其技术问题是采取以下技术方案实现的:

一种由大规模特征集的图像识别的方法,其特点是:

(1)对图像信息进行深度抽出;

(2)对上述抽出的图像信息进行图像深度识别。

而且,所述对图像信息进行深度抽出是指:对样本图像信息进行大规模图像分割的方法;或者针对至少一个分割图像通过图像变换的方法对图像信息进行深度抽出的方法。

而且,所述图像深度识别的方法是指:考虑被登录的大规模特征集对于识别结果的作用的方法,或者是考虑特征向量间的最小距离与特征向量的各个特征值的最大几率空间的尺度的累加值之间的比例值的方法,或者是考虑复数特征值的共同概率分布信息的方法,或者是考虑样本特征值处于被登录的特征值的概率分布的位置上的概率分布信息的方法;或者是考虑样本特征值处于被登录的复数特征值的共同概率分布,与被登录的特征值的概率分布的共同的位置上的共同的概率分布信息的方法,或者是考虑样本特征向量与被登录的特征向量之间最大几率的概率信息的方法,或者是考虑对登录特征向量的特征值的概率分布进行分割的方法中至少一种深度图像识别的方法。

而且,所述图像进行大规模的图像变换的方法还指:就是把样本图像通过包括傅立叶变换(dft,discretefouriertransform),离散余弦变换(dct,discretecosinetransform),沃尔什变换(wt,walsh,transform),哈达玛变换(st,hadamardtransform),k-l变换(k-l,karhunen-loevetransform)协变换(st,slanttransform),离散小波变换(dwt,discretewavelettransform)在内的一种正交变换的方法;或者是主成分分析(pca,principalcomponentanalysis),线性判别分析(lda,lineardiscriminantanalysis),以及gabor变换(gt,gabor,transform)在内的一种图像变换的方法。

而且,所述图像进行大规模的图像变换的方法还指:利用可对图像识别产生有利效果的复数种图像处理方法,对至少一个样本图像进行图像处理;获得复数个样本图像的展开图像;将复数个展开图像作为该图像的一组样本数据;使一个图像也可产生样本特征值的概率分布的方法。

而且,所述图像深度识别是指:对于图像进行正向识别,或反向识别,或双向识别方法中的一种。

本发明的优点和积极效果是:

可以定量的对人脸识别进行评价,把可通过图像的深度信息抽出,与深度的图像识别将信息全部利用上,从而实现图像识别的精度评鉴的定量,与识别结果的化最佳化。

可针对身份证上的人脸照片直接产生复数个仿真多场景拍照的图像,从而提高图像的识别精度。

本说明书中出现的专用名词做如下的定义:

所谓最大几率:超越传统的统计学的公式性算法的可以最大限度的接近母体的机器学习处理的结果。

所谓概率尺度自组织:以最大概率为尺度的自组织迭代处理,可获得最大几率值,最大几率空间的尺度。

所谓多目的自动机器学习:复数个目的的无需训练就可获得目标函数的最佳解。

所谓sdl(superdeeplearning)模型:是一种以函数概率分布为主导,用复数机器学习进行节点间连接的新型的神经网络所构成的人工智能模型。

所谓的epd距离:可以统一欧几里的空间与概率空间的距离尺度。

所谓的fpm测度:可以统一欧几里的空间与概率空间的模糊事件概率测度。

【附图说明】

图1是给定的被识别对象图像

图2是幅值谱图像的示意图

图3是数据进行中心化的处理方法示意图

图4是对图2数据进行对调对角线数据示意图

图5是二维相位谱(phase)的变换的示意图

图6是可处理大规模特征向量的sdl模型的示意图

图7是灰度值调整图像处理方法

图8是强调边框信息的图像处理方法

图9是另一种强调边框信息的图像处理方法

图10是单一照片图像对单一识别图像的示意图

图11是具有仿真多场景的相片图像对单张拍摄的图像识别的示意图

图12是多场景拍摄对单张照片图像识别的示意图

图13是多场景拍摄与仿真多场景拍摄的单张相片图像识别示意图

图14是将一个概率空间分割成复数个的概率空间的示意图

图15是在欧几里得空间中的两个概率空间的示意图

图16是利用共同概率分布信息的模式识别方法的示意图

图17是考虑总体概率的一个新的概率值的定义方法示意图

图18是多目的自动机器学习的处理流程图

图19是机器理解雷达数据处理的方法流程图

【具体实施方式】

以下结合附图对本发明实施例做进一步详述,但本发明所述的实施例是说明性的,而不是限定性的。

本发明解决其技术问题是采取以下技术方案实现的,根据说明书附图对发明的实施例进行说明。

首先,提出对图像信息进行深度抽出的方法。

图1是给定的被识别对象图像。

针对图1的图像可以用如下公式进行二维图像的离散傅里叶变换(dft)。

【公式1】

其中,f(x,y)是大小为m*n的数字图像,u,v用于确定他们的频率,频域系统是由其所生成的坐标系。

离散傅里叶逆变换(idft)由下式给出:

【公式2】

对图1的图像变换之后的数据(original):

【数据1】

f(0,0),f(0,1),...f(0,n)

f(1,0),f(1,1),...f(1,n)

...

...

f(m,0),f(0,0),...f(m,n)

幅值谱计算方式(magnitude)

令r和i分别表示f的实部和虚部,则幅值谱公式如下:

【公式3】

由于频域数值差异较大,无法直接显示,由下列公式4进行转换,白色代表高值。

【公式4】

m1=log(1+m)

图2为幅值谱图像的示意图。

如图2所示;对图1图像数据应用公式3、公式4得到如图2所示的幅值谱图像,这里,白色代表高值实验结果。

图3是数据进行中心化的处理方法示意图。

如图3所示;对图2数据进行对调对角线数据1与3交换,2与4交换,就可将直流分量移至频谱移到中心得到图4的图像。

图5是二维相位谱(phase)的变换的示意图。

如图5所示;令r和i分别表示f的实部和虚部,则相位谱公式如下:

公式5

相位谱里面里的面值的具体含义为弧度,范围是:-3.14159~3.14159。

利用傅立叶变换的频谱作为人脸识别已是公知的技术,一般的傅立叶变换频谱在人脸图像平移时不会受到影响,但是在人脸图像旋转时,由于超出了傅立叶变换的离散窗,因此使傅立叶变换的结果出现错误,为此需要进行将人脸图像即使在旋转后仍能包含在离散窗内的处理。

上述特征值抽出方法是图像变换的其中一个方法,除此之外作为考虑图像正交变换的方法,还可以考虑离散余弦变换(dct,discretecosinetransform),沃尔什变换(wt,walsh,transform),哈达玛变换(st,hadamardtransform),k-l变换(k-l,karhunen-loevetransform)协变换(st,slanttransform),离散小波变换(dwt,discretewavelettransform)等等。

除此之外,还可以考虑主成分分析(pca,principalcomponentanalysis),线性判别分析(lda,lineardiscriminantanalysis),周期性的参数估计方法(ars由yukihirokamiya提出),以及gabor变换(gt,gabor,transform)等方法。

图6是可处理大规模特征向量的sdl模型的示意图。

如图6所示;这是一个由感知层,神经层以及脑皮层组成的新型的三层神经网络,是一个可处理大规模特征向量的sdl模型。

这里,提出图像进行大规模的图像变换的方法,可以把图像进行大规模的分割,再把每一个图像的分割,再进行图像变换,从而可以获得数百万,以致数亿个以上的特征集,以达到超越传统深度学习的高精度的图像识别的结果。

如图6所示;(fp1)是人脸图像的一部分,例如是人眼部位的图像。(fp2)是人脸图像的其他部位的图像,例如是人的鼻子部位的图像。还可以把人脸图像分成n个区域,(fpn)是人脸图像的最后一部分图像,例如是人的嘴的部位的图像。对人脸图像分割得越细致识别人脸的精度就会越大。

在对人脸图像进行分割时,还可以把人脸图像的位置信息作为人脸的定位信息进行图像分割,可解决由于图像的移位,旋转而影响识别结果的精度的问题。

(it1),(it2)~(itm)是图像变换的一种,包括傅立叶变换(dft,discretefouriertransform),离散余弦变换(dct,discretecosinetransform),沃尔什变换(wt,walsh,transform),哈达玛变换(st,hadamardtransform),k-l变换(k-l,karhunen-loevetransform)协变换(st,slanttransform),离散小波变换(dwt,discretewavelettransform),主成分分析(pca,principalcomponentanalysis),线性判别分析(lda,lineardiscriminantanalysis),周期性的参数估计方法(ars由yukihirokamiya提出),以及gabor(gt,gabor,transform)变换等的方法。

如图6所示;(ml1’)是概率尺度自组织机器学习单元,承担着从复数个特征信息中获得最大几率的特征值输入到感知层的节点(n1’)上,当特征值的数量为单数时(ml1’)可以不要,直接把特征值输入到感知层的节点(n1’)上。

在这个可处理大规模特征向量的sdl模型里,感知层(p1’)与神经层(p2’)的节点(n1’)和(n2’)可以增加到无穷(n1(1)’)~(n1(n)’),(n2(1)’)~(n2(n)’),这里n→∞。因此随着节点数的增加,概率尺度自组织机器学习单元也成为(ml1(1)’)~(ml1(n)’),(ml2(1)’)~(ml2(n)’),同样n→∞。

经过研究深度学习的机理,发现深度学习的应用效果就是靠巨大的数据集的规模,但是由于深度学习增加数据集的代价是o(nn),这种计算复杂度限制了深度学习不可能无限的扩大数据集的规模。相比之下,sdl模型具有无论如何增加特征向量的规模,计算复杂度o(n2)不变的特点,因此总可以通过扩大感知层(p1’)与神经层(p2’)上的节点(n1’)和(n2’)的数量,实现用函数的概率分布的小数据训练特点,以及可以获得大规模的特征向量的特点,实现超越深度学习的应用效果。

同已公开的sdl模型不同的是,传统的sdl模型被识别的图像是通过物理学模型展开成映射图像,这种方法很难使特征向量成为百万级,甚至亿万级的规模,通过图像变换(it1)~(itm)再结合sdl模型,可以使特征向量的规模容易获得巨大的增长。其目的是要超越深度学习的数据集的规模,从而产生超越深度学习的应用效果。

在实际应用中,往往人脸图像的数据中,每一个人只保存着从身份证得到的一张照片图像,如何通过这一张照片的图像,产生一个概率分布的具有最大概率值的,以及最大概率尺度的数据库,这是导入sdl模型提高人脸识别的关键。

本发明提出使用可以提高图像识别效果的图像处理方法,将一张人脸图像,变换成复数个人脸图像,这里提出的具体图像处理的方法,仅仅是一个例子,将一个图像通过使用可以提高图像识别效果的各种图像处理的方法,变换成复数个图像,用于图像识别时产生一个样本特征向量的概率分布,都属于本发明的范围之内。

以下提出灰度值调整图像处理方法。

如图7的(a)是原人脸图像中的任意3*3像素的原灰度值。如图7的(b)将3*3像素的原灰度值中的最大灰度值与中心灰度中心灰度值交换。如图7的(c)将3*3像素的原灰度值中的最小灰度值与中心灰度中心灰度值交换。如图7的(d)将3*3像素的原灰度值中的各个灰度值用概率尺度自组织求出对大概率值替换中心灰度值交换。如图7的(e)将3*3像素的原灰度值中的最大灰度值与中心灰度中心灰度值交换。

仿照上述方法还可以将图7(a)的3*3像素的原灰度值的对角线,中心十字线,将2-4个像素用3*3像素的原灰度值中的最大灰度值,最小灰度值,用概率尺度自组织求出最大概率值代替。

图8是强调边框信息的图像处理方法。

如图8的(a)所示;将图像分别进行x方向和y方向的求导,然后再用图8(a)的左右两个3*3格子中的常数,按照各个像素的对应,进行相乘的结果替换原像素的灰度值。同样,如图8的(b)所示;将图像分别进行x方向和y方向的求导,然后再用图8(b)的左右两个3*3格子中的常数相乘的结果替换原像素的灰度值。

图9是另一种强调边框信息的图像处理方法。

同图8相同,如图9的(a)所示,把x方向求导结果用这个模版进行相乘,就可得到水平边框滤波器的处理效果。如图9的(b)所示,把y方向求导结果用这个模版进行相乘,就可得到水平边框滤波器的处理效果。

这里除了可以将一张人脸图像变换成复数个图像,同时还要强调可以提高图像的质量。

在图像处理中,为提高图像的视感质量,采用图像亮度的变换,彩色变换,图像增强,抑制某成分,几何变换等。

再有就是通过强化图像的高频分量,可以使图像中的人脸五官清晰细节明显,通过强化图像的低频分量可以去除图像中的噪声。

还可以通过图像滤波将图像分成复数个图像,可以在提高图像质量的基础上,实现特征向量的规模提高。

例如,基于灰度值变换函数的有:图像的对数变换,伽马变换,分段线性变换,直方图变换等。

基于空间滤波的有:平滑空间滤波,统计排序滤波,锐化空间滤波,非锐化隐蔽和高提升滤波,梯度锐化等。

基于频率滤波有:理想低通滤波,理想高通滤波,布特尔低通滤波,布特尔高通滤波,高斯低通滤波,高斯高通滤波,钝化模版,高提升滤波,高频强调滤波,同态滤波,选择性滤波,2陷阱滤波。

噪声概率密度函数的处理有:高斯噪声,瑞利噪声,爱尔兰噪声,指数噪声均匀噪声,双基脉冲噪声等等。

空间滤波还原噪声有:均值滤波器,算数均值滤波器,几何均值滤波器,谐波均值滤波器,逆谐波均值滤波器,统计排序滤波器,自适应滤波,频率域消除周期噪声等等。

为了提高人脸识别的精度,本发明还提出如下有关识别条件的方法。

图10是单一照片图像对单一识别图像的示意图。

如图10所示;将数据库的万张以上的人脸图像,每人一个人脸图像,用上述图像变换方法或人脸五官位置的方法,或同时用两种方法,或更多的方法抽取一个特征向量(pvmax1~n),进行特征向量的登录,然后用摄像头拍摄一个已登陆照片的人脸图像,用上述图像变换方法或人脸五官位置的方法,或同时用两种方法,或更多的方法抽取一个特征向量(sp_pvmax1~n),进行人脸识别。

这里,提出对于图像进行正向识别的方法。

图11是具有仿真多场景的相片图像对单张拍摄的图像识别的示意图

如图11所示;将数据库的万张以上的人脸图像,针对每人一个图像,使用上述图像处理的方法,仿真多场景拍摄的图像,可以得到若干个仿真不同场景的图像,再分别用上述图像变换方法或人脸五官位置的方法,或同时用两种方法,或更多的方法,抽取一组特征向量,进行特征向量的概率尺度自组织的处理,得到概率尺度自组织产生的最大几率值(pvmax1~n)即统计学上的最大几率空间的期望值,最大几率空间的尺度(psmax1~n)即最大几率空间的方差,登录数据库。然后用摄像头拍摄一个已登陆照片的人脸图像,用上述图像变换方法或人脸五官位置的方法,或同时用两种方法,或更多的方法抽取一个特征向量(sp_pvmax1~n),进行人脸识别。

或者通过直接对一个人进行多次拍照,可以得到若干个不同场景的图像,再分别用上述图像变换方法或人脸五官位置的方法,或同时用两种方法,或更多的方法抽取一组特征向量,进行特征向量的概率尺度自组织的处理,得到概率尺度自组织产生的最大几率值(pvmax1~n),最大几率空间的尺度(psmax1~n)即最大几率空间的方差,登录数据库。然后用摄像头拍摄一个已登陆照片的人脸图像,用上述图像变换方法或人脸五官位置的方法,或同时用两种方法,或更多的方法抽取一个特征向量(sp_pvmax1~n),进行人脸识别。

这里,提出对于图像进行反向识别的方法。

图12是多场景拍摄对单张照片图像识别的示意图。

如图12所示;将数据库的万张以上的人脸图像,针对每人一个人脸图像,用上述图像变换方法或人脸五官位置的方法,或同时用两种方法,或更多的方法抽取一个特征向量(pvmax1~n),进行特征向量的登录。然后识别数据库的万张以上的人脸图像中的一位真人的人脸图像,用摄像头连续拍摄被识别人的人脸,得到若干个被识别人的人脸图像,再分别用上述图像变换方法或人脸五官位置的方法,或同时用两种方法,或更多的方法抽取一组特征向量,进行特征向量的概率尺度自组织的处理,得到概率尺度自组织产生的最大几率值(sp_pvmax1~n),即统计学上的最大几率空间的期望值,最大几率空间的尺度(sp_psmax1~n)即最大几率空间的方差,进行人脸识别。该方法也可以称为反向识别方法。

这里,提出对于图像进行双向识别的方法。

图13是多场景拍摄与仿真多场景拍摄的单张相片图像识别示意图

如图13所示;拍摄用摄像头同时或不在一个场景下拍摄若干个被识别的人脸,所形成的被识别人的若干个人脸图像,或将数据库的万张以上的人脸图像,针对每人一个图像,使用上述图像处理的方法,仿真多场景拍摄的图像,可以得到若干个仿真不同场景的图像,再分别用上述图像变换方法或人脸五官位置的方法,或同时用两种方法,或更多的方法,抽取一组特征向量,进行特征向量的概率尺度自组织的处理,得到概率尺度自组织产生的最大几率值(pvmax1~n)即,最大几率空间的尺度(psmax1~n)即最大几率方差登录数据库。

然后识别数据库的万张以上的人脸图像中的一位真人,用摄像头连续拍摄被识别人的人脸,得到若干个被识别人的人脸图像,再分别用上述图像变换方法或人脸五官位置的方法,或同时用两种方法,或更多的方法抽取一组特征向量,进行特征向量的概率尺度自组织的处理,得到概率尺度自组织产生的最大几率值(sp_pvmax1~n),最大几率空间的尺度(sp_psmax1~n)即最大几率方差,进行人脸识别。该方法也可以称为双向识别方法。

以下针对定量化模式识别,提出考虑对登录特征向量的特征值的概率分布进行分割的方法。

图14是将一个概率空间分割成复数个的概率空间的示意图。

如图14所示;图14(a)是一个特征值的完整的概率空间φ,可以用最大几率空间的尺度,按照σ’3~σ’2、σ’2~-σ’1、σ’1~σ1、σ1~σ2、σ2~σ3、分成如图14(b)的φ1,φ2,φ3,φ4以及φ5五个概率空间,每一个概率空间,通过概率尺度自组织机器学习的处理,又可分别产生μ1,μ2,μ3,μ4以及μ5五个最大几率值,以及最大几率空间的尺度。

这里,φ3概率空间的概率分布值为68.2%,φ2与φ4概率空间的概率分布值为27.2%,φ1与φ5概率空间的概率分布值为4.3%。

在图14(a)的一个完整的概率空间里,如果概率分布值仅仅为4.3%的识别结果出现时,也会被识别成是属于图14(a)的概率空间所对应的识别结果,这时很容易出现识别结果的错误,将一个特征值的概率分布,分成5个概率分布,在识别时如果样本特征值落在φ1与φ5概率空间就可以拒绝识别结果的产生,通过重新识别可以得到概率值更高的识别结果。

针对一个特征向量的识别结果的概率分布值,可以将属于样本特征向量的各个特征值,落到所属特征向量的信赖度或质量的评价结果的概率分布值,再对该值进行概率尺度自组织的机器学习的处理,可以获得该特征向量的最大几率的识别结果概率值。按照这个识别结果样本数据所落的的最大概率空间的概率分布值,就可得到识别结果的概率分布值,就可以根据概率分布值的大或小,判断是否拒绝识别。

下面,针对学习后的被登录的特征向量数据,提出计算识别结果的精度的方法。

设数据库中有m个特征向量,每一个特征向量有n个特征值,经过t次训练所得到的数据,利用概率尺度自组织机器学习,就可得到如下的最大几率矩阵p:

(公式6)

以及最大几率空间的尺度矩阵m:

(公式7)

利用可以统一欧几里的空间与概率空间的距离尺度的(epd距离)公式就可以对上述两个矩阵进行分析。

图15是在欧几里德空间中的两个概率空间的示意图。

如图15所示:(∈)是涵盖两个概率空间的欧几里德空间。在欧几里德空间中有两个概率空间以及1)是概率空间的最大几率值。(ρ2)是概率空间的最大几率值。另外,(σ1)是概率空间的最大几率空间的尺度,(σ2)是概率空间的最大几率空间的尺度,概率空间的第一个最大几率空间的概率值概率空间的第二个最大几率空间的概率值概率空间的第三个最大几率空间的概率值概率空间的第一个最大几率空间的概率值概率空间的第二个最大几率空间的概率值概率空间的第三个最大几率空间的概率值

再有,设概率空间以及的最大概率几率值为(ρ1)和(ρ2)为两个数据集合的要素wj∈w和vj∈v。再设在最大概率几率值为(ρ1)和(ρ2)之间连接一条直线,在直线的中间有任意一点样本数据βj∈b,求样本数据集合βj∈b是属于那个数据集合的w或v可通过如下epd距离公式得出:

公式8

上述统一欧几里德空间与概率空间的距离满足如下条件:

(1)非负性:

(2)非退化性:d(w,v)=0,则w=v;

(3)对称性:

(4)三角不等式:

为了提高人脸识别的精度,还可以引入可以把模糊信息与概率信息完全考虑进去,更加精准的尺度,一种跨越不同空间的模糊事件概率测度的定义方法,其特征在于:在考虑数据之间的空间距离的同时还要考虑数据在概率空间所处的概率分布的概率值。

设集合w属于概率空间的集合v的模糊事件概率测度的(fpm测度)公式可由如下公式得出:

公式9

这里,pfj(vj)集合要素wj∈w(j=1,2,...,n)处在集合要素vj∈v(j=1,2,...,n)的概率空间中所处的位置的概率分布值;

同理,pfj(wj)为集合要素vj∈v(j=1,2,...,n)处在集合要素wj∈w(j=1,2,...,n)的概率空间中所处的位置的概率分布值。

dmax是wj到vj的最大距离。

上述模糊事件概率测度的隶属函数的公式可包括任意的可将目标函数按照人为给定的一定规则构成结果为0-1的模糊数值。类似的隶书函数的定义方法有各种各样,凡是涉及模糊事件概率测度的定义方法的,都属于本发明的范围之类。

上述模糊事件概率测度的空间信息是基于可统一欧几里德空间与概率空间的距离,并满足如下距离条件;

(1)非负性:

(2)非退化性:f(w,v)=0,则w=v;

(3)对称性:

(4)三角不等式:

这里,为提高人脸识别的精度,提出考虑特征向量间的最小距离与特征向量的各个特征值的最大几率空间的尺度的累加值之间的比例值的方法。

利用上述epd距离公式,可以得到特征向量间的距离矩阵:

(公式11)

这里,设dij=dji,dii=djj=0。

利用上述fpm测度公式,可以得到特征向量间的测度矩阵:

(公式12)

这里,设dij=dji,dii=djj=0,以及fij=f,fii=fjj=0。

这里可以得到最小epd距离所对应的两个特征向量,或者可以得到最大fpm测度所对应的两个特征向量。

再计算这两个最近的epd距离值dmin,以及对应两个最近的epd距离值的两个特征向量的最大几率空间尺度的累加值:

(公式13)

根据公式10以及公式12可以得出,人脸识别可以获得最高识别精度的充分必要条件是:

(公式14)

dmin≥mmin或

这里可以定量的把人脸识别的精度通过登录的特征向量的数据集就可以计算出来了,有了这样的结果,如果需要提高人脸识别精度,首先要解决人脸图像的特征信息抽出质量,质量越高dmin与mmin的比值越大,反之就越小甚至小于1,其识别精度就越差。

这里,考虑被登录的大规模特征集对于识别结果的作用的方法,提出可以增加特征向量的质量的平均距离法。

增加特征向量的质量,也就是提高(公式14)的数值,一方面对于采用的图像变换的算法需要选择,采用一些可以实现较高的特征向量的质量的图像变换的算法,另一方面在确定了一个图像变换的算法之后,采取平均距离法,对于属于特征向量所包含的各个特征值的最大几率空间的尺度的集合,进行概率尺度自组织的机器学习的处理,以概率尺度自组织的机器学习的处理所得到一个可信赖的高质量的特征值的最大几率空间的尺度为基准,按照符合这个尺度保留不符合的剔除进行筛选特征值,就可得到一个高信赖的高质量的特征值集合,用这个集合来作为人脸识别最终比对的特征向量,并且把哪个特征向量为高信赖高质量的特征值哪个不是,用一个二进制代码表示出,“1”为高信赖的高质量的特征值,“0”为被剔除的特征值,并存放在数据库中。再有,由于每一个特征向量所得出的高信赖高质量的特征值的个数不同,因此采用平均距离法,来统一各个特征向量的尺度。

这里为提高人脸识别的精度,提出考虑复数特征值的共同概率分布信息的方法,以及考虑样本特征值处于被登录的复数特征值的共同概率分布,与被登录的特征值的概率分布的共同的位置上的共同的概率分布信息的方法。

图16是利用共同概率分布信息的模式识别方法的示意图。

如图16所示;在模式识别中经常要计算两个最大几率的特征值ω4和ω8与样本特征值τ哪个距离最近,利用上述的epd距离公式,以及fpm测度公式,可以直接进算出来。但是这里在计算ω4与τ的距离或fpm测度时,没有考虑ω4和ω8的共同的概率分布的信息。这里训练数据时,可以得到特征向量的要素间的共同的最大几率值的矩阵:

(公式15)

同样可以得到特征向量的要素间的共同的最大几率空间的尺度的矩阵:

(公式16)

在训练特征向量的最大几率值,以及最大几率空间的尺度的同时,再训练两个特征向量的共同的最大几率值,以及共同的最大几率空间的尺度,如图16所示;设φ1和φ3是任意两个不同特征向量中任意一个独立的特征向量的概率分布,φ2是φ1和φ3的共同的概率分布,ω4是概率分布φ1的最大几率值所对应的位置,ω8是概率分布φ3的最大几率值所对应的位置,ω6是φ1和φ3的共同的概率分布φ2的最大几率值所对应的位置,由(公式8)可以得到与φ1和φ3所对应的样本特征值τ,其结果从τ的位置到ω4位置的epd距离为ε1,从τ的位置到ω6位置的epd距离为ε2,则考虑了特征值的共同概率分布信息的由τ的位置到ω4位置的新的距离公式为:

(公式17)

同样考虑了特征值的共同概率分布信息的由τ的位置到ω8位置的新的距离公式为:

(公式18)

这里,还可假设样本图像也是一个由不同环境所读取到的复数个图像,样本特征向量的每一个特征值也可产生概率分布,在这种情况下可以看成样本特征向量的特征值的概率分布为φ3,要解决φ1与φ3是否属于一个概率分布?利用φ1与φ3的共同的概率分布信息φ2就更容易得到最佳的识别结果。这时ε1=ω6-ω4,ε2=ω8-ω6,以及ε3=ω8-ω4,则

(公式19)

的值越大φ1与φ3之间的隶属关系越密切。

设样本特征值τ的位置所处于特征向量的概率分布φ1的概率分布值为δ1,样本特征值τ的位置所处于两个特征向量的共同的概率分布φ2的概率分布值为δ2,同样,样本特征值τ的位置所处于特征向量的概率分布φ3的概率分布值为δ3,则引入两个特征值的共同概率分布信息后,样本特征值τ所处于特征向量的概率分布φ1的位置上的概率分布值应为:

(公式20)

p(φ1)=p(δ1∩δ2)=p(δ1)p(δ2/δ1)

则引入两个特征值的共同概率分布信息后,样本特征值τ所处于特征向量的概率分布的φ3的位置上的概率分布值应为:

(公式21)

p(φ3)=p(δ3∩δ2)=p(δ3)p(δ2/δ3)

引入两个特征值的共同概率分布信息后,由τ与ω4之间的新的模糊事件概率测度公式为:

(公式22)

引入两个特征值的共同概率分布信息后,由τ与ω8之间的新的模糊事件概率测度公式为:

(公式23)

为了提高人脸识别精度,针对模糊事件概率测度的概率信息,除了考虑样本特征值sj落到某登录特征向量所对应的特征值fj的概率分布的区域,该区域的概率分布值。再有就是引入两个特征值的共同概率分布信息。更为重要的是考虑样本特征向量的各个特征值sj(j=1,2,…,n),落入所对应的特征向量的各个特征值fj(j=1,2,…,n)的概率分布区域上的概率分布值,或者引入两个特征向量的各个特征值的共同概率分布信息后,所得到的概率值。

这里,提出考虑样本特征向量s的特征值sj∈s(j=1,2,…,n)属于某已登录特征向量fi(w)所对应的特征值fij(w)的最大几率的概率信息的定义方法。

图17是考虑总体概率的一个新的概率值的定义方法示意图。

设样本特征向量s的特征值sj∈s(j=1,2,…,n),分别在属于某已登录特征向量wi所对应的特征值wij的概率分布上的位置上的概率值为pfij(j=1,2,…,n),通过概率尺度自组织对pfij(j=1,2,…,n)进行机器学习,得到一个最大几率值pfi_max(w),把这个概率值作为样本特征值sj与特征值fij(w)的从属度的概率值,由于是从整体上考虑了两个特征向量之间的关系,因此可以提高图像的识别精度。

由此可以得到样本特征向量s,属于某已登录特征向量wi的模糊事件概率测度为:

(公式24)

这里,σ1是wij的概率空间的最大几率的尺度,σ2是vij的概率空间的最大几率的尺度。从(公式23)可以看出,如果特征向量s→wi则fpmi(w)→100,反之fpmi(w)→0。

同理,再设样本特征向量s的特征值sj∈s(j=1,2,…,n),分别在属于某已登录特征向量vi所对应的各个特征值vij的概率分布上的位置上的概率值为pfij(v)(j=1,2,…,n),通过概率尺度自组织对pfij(v)(j=1,2,…,n)进行机器学习,得到一个最大几率值pfi_max(v)。也可以把pfi_max(v)值作为样本特征值sj∈s(j=1,2,…,n)属于所有特征向值vij的概率值。

仿照公式23,样本特征向量s属于某已登录特征向量vi的模糊事件概率测度为:

(公式25)

从(公式24)可以看出,如果s→vi则fpmi(v)→100,反之fpmi(v)→0。

借助(公式17),(公式18)以及(公式19),sj-vij,sj-wij以及wij-vij,可以变换成考虑了特征值的共同概率分布信息的距离。以及(公式20)以及(公式21)的概率信息的定义方法,带入上述的距离公式,从而获得模糊事件概率测度的解。也可以直接用(公式22)以及(公式23)直接构成模糊事件概率测度的解。

特征向量集的规模要大,人脸识别的图像数量增加,比如将人脸按照五官位置,同时在每一个位置上再分割若干区域,每增加一个区域就会指数性的增加特征向量的规模,利用sdl模型的特征向量数据集的增减,复杂度为0(n2)接近线性的特点,可以无限的增加特征向量的数据集规模。

无限的增加特征向量数据集的方法;一是如图6所示;采用图像变换的方法将图像映射到较大的特征数据集,另一方面,对图像进行无限的分割,将每一个分割对应一个图像变换,从而获得巨大的特征数据集,其结果可以获得最高的识别结果。这种方法不仅适于人脸识别以及图像识别,同时也适于声音识别,以及其他的应用。

这里给出概率尺度自组织的机器学习模型,所定概率分布的数列p1,p2,...pmpi∈g的集合的要素(i=1,2,...,m),其最大几率值为a(g),最大几率值a(g)的最大几率空间的尺度为m[g,a(g)],那么,根据第n-1次的自组织化的迭代处理,计算出的中最大几率值a(g(n-1))的最大几率空间尺度m[g(n-1),a(g(n-1))]以内如果存在着k个概率分布数列p(n)1,p(n)2,...p(n)k,p(n)i∈g(n)(i=1,2,...,k),则第n次概率尺度的自组织的结果为:

(公式26)

a(n)=a(g(n))

m(n)=m[g(n),a(g(n))]

g(n)=g{a(g(n-1)),m[g(n-1),a(g(n-1))]}

上述概率尺度自组织的机器学习模型的迭代结果,可针对给定的含有随机信息的数列p1,p2,...pm,经过迭代处理后,可以获得一个可以表示这组数列的最大几率值,以及在这个数列中所存在的最大几率空间,以及可以表示这个空间的最大几率的尺度。

在进行二维空间,或三维空间的概率尺度自组织的机器学习时,只要把二维空间,或三维空间的最大几率值,用二维空间,或三维空间的力学重心,二维空间或三维空间的最大几率空间的尺度,用二维或三维的方差,按照上述的迭代方法就可实现。

针对目标函数进行多目的处理时,复数个目的往往都会希望在最大几率的空间中可以获得最佳解,特别是,复数的目具有相互可以促进最佳解的获得的相乘特性,并且往往在需要现场特征信息时,由于是处在共同的一个最大几率空间,通过相互推进自动的产生现场特征,可以实现不用训练的自动的机器学习效果。同时在最大几率空间的迭代过程中,也会促进复数个目的的趋近最佳解,这里提出多目的自动机器学习的。

这里给出进行图像逼近的应用例子,导入上述概率尺度自组织机器学习,在获得图像逼近的最大几率空间的图像中,可进行为了图像逼近所需要的图像处理,例如二值化处理等,因为可以把处理图像的范围缩小到更加接近被逼近的图像,会得到更加理想的图像处理结果,这样更加有利于下一个迭代可以获得更加逼近最大几率空间的图像,以及可以获得图像更加逼近的解,无需对所要逼近的图像进行事先的机器学习,自动的得到图像逼近的最佳解。

图18是多目的自动机器学习的处理流程图。

如图18所示;多目的自动机器学习的处理流程图,需要经过由s1初始化步骤,s2获得最大几率空间步骤,s3进行目的1的处理步骤,s3+1进行目的2的处理步骤,...,s3+n进行目的n的处理步骤,s4判断步骤,s5结束步骤组成。

初始化步骤s1:设定迭代的初始条件,比如图像的初始处理方法,以及通过初始输入的概率分布的数据,可以获得该数据的初始的最大几率空间尺度,或直接给出一个预估的最大几率空间尺度。迭代效果的评价函数,为防止无穷的迭代的发生,设定最大迭代次数等等。

获得最大几率空间步骤s2:针对一个最大几率空间,可以获得该空间的最大几率空间的尺度,用这个尺度就可以筛选出更大几率的空间,在得到新的最大几率空间后,又可以在新的最大几率空间中产生新的最大几率空间的尺度,用于下一个迭代产生更大概率的最大几率空间。

进行目的1的处理步骤s3:按照多目的的目标函数的在最大几率空间中的处理结果之间的依存关系,选择最为优先的目的1的目标函数在本步骤中进行处理。

进行目的2的处理步骤s3+1:在进行目的1的处理步骤后,为进行目的2的处理步骤提供了更加适于获得最佳解的条件,使目的2的目的的目标函数获得更为突出的最佳解。

...

进行目的n的处理步骤s3+n:在进行目的n-1的处理步骤后,为进行目的n的处理步骤提供了最为适于获得最佳解的条件,使目的n的目的的目标函数最终获得最为突出的最佳解。

判断步骤判s4:通过迭代效果的评价函数,以及最大迭代次数对迭代结果是否完成进行判断,如果没完成跳转获得最大几率空间步骤s2,如果完成就转下一步骤。

结束步骤:程序结束,或返回主程序。

在自动驾驶中雷达传感器起着重要的作用。但是目前的雷达应用,只是单纯的读取雷达数据,由此判断自动驾驶汽车周围的障碍物,由于雷达信息是离散的数据,而且每一个数据又具有严重的随机特性,机器又不能直接理解,因此用雷达数据进行自动驾驶的障碍物判断可靠性很低。

这里,提出一个可以让机器理解的雷达数据的处理方法。

图19是机器理解雷达数据处理的方法流程图。

如图19所示;机器理解雷达数据处理的方法分为,获得雷达数据步骤s1,进行函数插值步骤s2,进行视频变换步骤s3,以及图像识别步骤s4组成的。

获得雷达数据步骤s1:获取雷达完成一次扫描周围障碍物的数据,一般16线数据,就是有16条线组成的可以反映周围障碍物距离的数据。

进行函数插值步骤s2:雷达的线数的增加可以对周围的障碍物的观察具有提高精度的效果,但是造价却是与所增加的线数成倍数的提高。如何使用较低的雷达精度,获得较高精度的应用效果?这里提出为了提高雷达数据的精度,用较少的线数雷达获得较高线数的应用效果,可以把雷达数据进行函数插值,通常可以使用b样条函数,普通样条函数,拉格朗日插值,埃尔米特插值,三角多项式插值,高斯三角插值,辛克插值,多元回归,最小二乘法,邻点插值法,双线性插值,双平方插值,双立方插值,三次内插值等等。

进行视频变换步骤s3,在这个步骤中,将离散的雷达数据,通过函数插值,变成较高精度的雷达数据,再经过视频变换,就可以得到一个以障碍物的距离为灰度值的雷达视频图像。

图像识别步骤s4:将上一步骤得到的雷达视频图像,同图像传感器得到的以图像距离为灰度值的距离视频图像一样,各种障碍物在不同的距离位置上了,因此很容易进行各种障碍物的分离,再有各种障碍物在图像的空间中的所对应的位置上呈现高密度的分布,或可以认为是高概率的分布,这种分布可以是三维圆椎状分布,或三维矩形分布等,利用这个特点,导入上述的二维空间或三维空间的概率尺度自组织,就可以直接将三维圆椎状分布,或三维矩形分布的障碍物识别出来,供机器理解。

通过双目摄像头的两个在一定间隔下拍摄的同一图像会出现错位,利用错位的大小就可以判断物体的距离,或单目摄像头利用在汽车行走时,距离的不断变化,也是利用前后拍摄的图像具有错位的信息,可以将错位信息的大小变换成距离信息,因此通过双目摄像头,或单目摄像头也可以实现距离为灰度的距离图像,同样具有很容易进行各种障碍物的分离,以及障碍物在距离空间中呈现三维圆椎状分布,三维矩形分布。同样可以直接将三维圆椎状分布,或三维矩形分布的障碍物识别出来,供机器理解。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1