一种图像质量无关的深度学习人脸模型训练方法与流程

文档序号:14572148发布日期:2018-06-01 22:58阅读:1131来源:国知局

本发明属于视频监控技术领域,涉及一种图像质量无关的深度学习人脸模型训练方法。



背景技术:

人脸识别是人脸信息处理中的一个焦点问题,它在基于内容的检索、数字视频处理、公安刑侦等领域有着极为广泛的价值,而目前对于人脸检索方法的研究,主要集中在以下几个方面:

对于人脸特征的研究;人脸特征算法决定了最终检索的效果,传统方法例如专利《人脸识别方法及人脸识别系统》[201010034359.2],将人脸划分成若干子区域来提取纹理特征。

对于检索速度的研究;例如专利《一种大规模人脸图像检索方法》[201210527836.8],通过对人脸图像数据库中的所有人脸图像建立倒排索引,并利用重排序算法对候选人脸图像集合进行重排序,从而实现大规模人脸库上快速的检索。

利用深度神经网络来进行端到端的人脸识别,例如专利《一种人脸识别装置》[201520986440.9]。

特别的,对于基于深度学习的人脸识别方法,由于采用了端到端的策略,神经网络中所学习到的特征很大程度上会受到训练样本的影响。例如,当同一个人脸ID的样本中绝大部分都是黑白图像时,神经网络就会倾向于学习图像的颜色特征来区分这个ID的人脸,而图像的颜色特征,并不是一个真正意义上有效的人脸特征,利用这种特征来进行人脸识别,就会导致黑白的人脸之间相似度会比较高,这样的模型就无法做到颜色无关。



技术实现要素:

本发明针对上述技术问题,提出了一种新的训练方法,对于训练样本进行预处理,使得在端到端的深度学习过程中,神经网络会尽量避免学习到与图像质量有关的特征,从而使得人脸识别模型最终能够做到图像质量无关。

本发明中假设训练样本共有N类,每类共有M个样本,对每一类中的M个样本进行如下操作:

随机将其中的一部分转化为灰度图像,并且最终使得该类样本中,灰度图像数量为M/2个。若原本灰度图像数量就已经超过M/2时,则将该类的所有样本从训练集中剔除。

随机将其中M/2个样本进行降低图像质量处理,具体是:假设原图分辨率为W*H,降质比例为r,则降质后的图像分辨率为(W*r)*(H*r),再将降质后的图像放大至原始图像分辨率,这样就使得在保持图像尺度不变的情况下,降低了图像的有效分辨率。

随机对其中M/2个样本加入高斯噪声,具体是:假设高斯噪声满足分布:

对于每个像素,按此分布生成一个随机数,并在乘以一定值后与原像素值相加。

本发明的有益效果:

1、对图像质量特征(例如颜色、低质、噪声等)具备无关性;

2、能将计算量更有效的集中在人脸特征上,提高计算效率;

3、对人脸特征学习更加充分,提升整体识别性能。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他的实施例,都属于本发明保护的范围。

当使用深度学习进行端到端人脸识别模型训练时,神经网络所训练得到的特征完全是以降低Loss为目的的,所以当同一个人脸ID的类内数据存在一些图像质量相关的特性时(例如黑白图像较多,或者都比较模糊,或者都有比较大的噪声),神经网络就会去学习这些图像质量相关,但与人脸本身无关的特征。这样会带来两个坏处:第一,使得模型对图像质量敏感,类似质量的人脸会有更高的相似度,影响识别效果;第二,消耗了模型容量,大量的计算被浪费在人脸无关的特征上。

因此,为了防止神经网络学习这些人脸无关的特征,本发明提出了一种训练集的预处理方法,使得这些图像质量相关的特征,对于区分不同ID的人脸不再有价值,那么Loss也就不再会指导网络去学习这些特征。

假设训练样本共有N类,每类共有M个样本,我们对每一类中的这M个样本进行如下操作:

随机将其中的一部分转化为灰度图像,并且最终使得该类样本中,灰度图像数量为M/2个。若原本灰度图像数量就已经超过M/2时,则将该类的所有样本从训练集中剔除。

彩色图转为灰度图的公式为:

Gray = (R*299 + G*587 + B*114 + 500) / 1000

其中R、G、B分别为彩色图中某个像素的RGB通道值,Gray为该像素转换后的灰度值。

通过此预处理方式,同一ID的人脸样本中,有一半是灰度图像,另一半是彩色图像,此时图像的灰度特征就不再能够区分不同人脸ID,神经网络也将不再会学习到灰度特征。

随机将其中M/2个样本进行降低图像质量处理,具体方法为:假设原图分辨率为W*H,降质比例为r,则降质后的图像分辨率为(W*r)*(H*r),最后再将降质后的图像放大至原始图像分辨率,这样就使得在保持图像尺度不变的情况下,降低了图像的有效分辨率。其中降质比例r是在[0.6,0.9]范围内的一个随机数。

通过此预处理方式,同一ID的人脸样本中,有一半是降质图像,另一半原始质量图像,此时图像的低分辨率特征就不再能够区分不同人脸ID,神经网络也将不再会学习到低分辨率特征。

随机对其中M/2个样本加入高斯噪声,具体方法为:假设高斯噪声满足分布:

对于每个像素,按此分布生成一个随机数,并在乘以32后与原像素值相加。

通过此预处理方式,同一ID的人脸样本中,有一半是加噪图像,另一半原始图像,此时图像的噪声特征就不再能够区分不同人脸ID,神经网络也将不再会学习到噪声特征。

实施例:

假设训练样本共有10000类,每类150个样本。

对于10000类中的每一类,例如第1类,先按技术方案中的第1点,随机将其中的75个样本转换成灰度图像。

再利用技术方案中的第2点,随机将其中的75个样本进行低质处理:假设原图分辨率为96*112,降质比例为0.6,则降质后的图像分辨率为57.6*67.2,然后再将其放大回96*112,完成降质处理。最后利用第3点,随机对其中的75个样本进行加噪处理。

至此,对于第1类的所有训练数据预处理完成,依次再对剩余的9999类数据进行预处理。

依据上述方法,当用一张黑白人脸进行识别时,并不会出现黑白人脸相似度更高的情况;当用一张模糊人脸进行识别时,也不会出现模糊人脸相似度更高的情况。

综上,本发明不依赖于神经网络的结构,任何使用深度学习端到端的人脸识别模型都能在此训练方法中获益。

以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围,应当理解,本发明并不限于这里所描述的实现方案,这些实现方案描述的目的在于帮助本领域中的技术人员实践本发明。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1