本发明涉及生物识别技术领域,特别涉及一种基于模糊理论的人脸图像识别方法、装置、设备及计算机可读存储介质。
背景技术:
近年来,生物识别技术快速发展,人脸识别、指纹解锁、声音唤醒等技术均被应用在多个领域。其中,人脸识别具有无需接触、隐蔽性好等特点,这使得人脸识别技术得到了更加广泛地应用。
现有的人脸识别技术需要提前采集多种不同身份标签的训练人脸图像(不同人的人脸图像为不同标签的人脸图像),在对训练图像进行预处理后,利用主成分分析(principalcomponentsanalysis,pca)、线性判别分析(lineardiscriminantanalysis,lda)、方向梯度直方图(histogramoforientedgradient,hog)和局部二值化(localbinarypattern,lbp)等技术对训练人脸图像进行特征提取。在获取到待识别图像后,提取待识别图像的特征并与训练人脸图像的特征进行比对,以对待识别图像进行识别。现有技术的鲁棒性较低,因此在进行人脸图像识别时对待识别图像的要求较高,在识别时可能需要采集多张待识别图像,因此识别速度较慢。在火车站进站口、机场安检口等人流量大的地点使用人脸识别时,容易造成人员拥堵。
因此,如何提高人脸识别算法的鲁棒性,进而提高识别速度,是本领域技术人员需要解决的技术问题。
技术实现要素:
本发明的目的是提供一种基于模糊理论的人脸图像识别方法、装置、设备及计算机可读存储介质,以提高人脸识别算法的鲁棒性,进而提高识别速度,解决现有技术识别速度慢的问题。
为解决上述技术问题,本发明提供一种基于模糊理论的人脸图像识别方法,包括:
获取具有不同身份标签的训练人脸图像,并对所述训练人脸图像进行分割得到训练子图像;
计算各个所述训练子图像与所述训练人脸图像之间的同类距离以及异类距离,并利用所述同类距离和所述异类距离构建模糊隶属度矩阵;
获取待识别图像,对所述待识别图像进行分割得到待识别子图像,并获取所述待识别子图像的近邻子图像;
利用所述模糊隶属度矩阵和所述近邻子图像获取所述待识别子图像的子图像类隶属度,并利用所述子图像类隶属度确定所述待识别图像的身份。
可选的,获取所述待识别子图像的近邻子图像,包括:
利用k近邻算法从所有的所述训练子图像中获取所述近邻子图像。
可选的,在对所述训练人脸图像进行分割得到训练子图像之后,还包括:
将所述训练人脸图像矩阵化,得到训练人脸图像矩阵;
将所述训练子图像矩阵化,得到训练子图像矩阵。
可选的,所述计算各个所述训练子图像与所述训练人脸图像之间的同类距离,包括:
利用具有相同身份标签的所述训练子图像矩阵和所述训练人脸图像矩阵计算同类人脸图像评估系数;
利用所述同类人脸图像评估系数和所述训练子图像矩阵计算所述训练子图像与所述训练人脸图像之间的所述同类距离。
可选的,所述计算各个所述训练子图像与所述训练人脸图像之间的异类距离,包括:
利用具有不同身份标签的所述训练子图像矩阵和所述训练人脸图像矩阵计算异类人脸图像评估系数;
利用所述异类人脸图像评估系数和所述训练子图像矩阵计算所述训练子图像与所述训练人脸图像之间的所述异类距离。
可选的,利用所述同类距离和所述异类距离构建模糊隶属度矩阵,包括:
利用所述同类距离计算所述训练子图像的同类隶属度,利用所述异类距离计算所述训练子图像的异类隶属度,并利用所述同类隶属度和所述异类隶属度构建所述模糊隶属度矩阵。
可选的,利用所述模糊隶属度矩阵和所述近邻子图像获取所述待识别子图像的子图像类隶属度,并利用所述子图像类隶属度确定所述待识别图像的身份,包括:
查询所述模糊隶属度矩阵得到所述近邻子图像的类隶属度,并利用所述类隶属度计算所述待识别子图像的所述子图像类隶属度;
利用所述子图像类隶属度计算所述待识别图像与各个所述训练人脸图像之间的模糊类隶属度概率;
获取所述模糊类隶属度概率的最大值,并判断所述最大值是否大于判断阈值;
若所述最大值大于所述判断阈值,则确定所述待识别图像与所述最大值对应的所述训练人脸图像的身份标签相同;
若所述最大值小于或等于所述判断阈值,则确定所述待识别图像与所有所述训练人脸图像的身份标签均不相同。
本发明还提供一种基于模糊理论的人脸图像识别装置,包括:
图像分割模块,用于获取具有不同身份标签的训练人脸图像,并对所述训练人脸图像进行分割得到训练子图像;
矩阵构建模块,用于计算各个所述训练子图像与所述训练人脸图像之间的同类距离以及异类距离,并利用所述同类距离和所述异类距离构建模糊隶属度矩阵;
近邻获取模块,用于获取待识别图像,对所述待识别图像进行分割得到待识别子图像,并获取所述待识别子图像的近邻子图像;
身份确定模块,用于利用所述模糊隶属度矩阵和所述近邻子图像获取所述待识别子图像的子图像类隶属度,并利用所述子图像类隶属度确定所述待识别图像的身份。
本发明还提供一种基于模糊理论的人脸图像识别设备,包括存储器和处理器,其中:
所述存储器,用于保存计算机程序;
所述处理器,用于执行所述计算机程序,以实现上述的基于模糊理论的人脸图像识别方法。
本发明还提供一种计算机可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现上述的基于模糊理论的人脸图像识别方法。
可见,本方法获取具有不同身份标签的训练人脸图像,并对训练人脸图像进行分割得到训练子图像。计算各个训练子图像与训练人脸图像之间的同类距离以及异类距离,并利用同类距离和异类距离构建模糊隶属度矩阵。获取待识别图像,对待识别图像进行分割得到待识别子图像,并获取待识别子图像的近邻子图像。利用模糊隶属度矩阵和近邻子图像获取待识别子图像的子图像类隶属度,并利用子图像类隶属度确定待识别图像的身份。本方法利用子图像类隶属度计算待识别图像的多个模糊类隶属度概率,当模糊类隶属度概率中的最大值大于标签阈值时认为待识别图像与最大值所对应的训练人脸图像的身份标签相同,即为同一个人的人脸图像。本方法比现有技术的鲁棒性更高,对待识别图像的质量要求较低,因此识别速度更快,克服了现有技术识别速度慢的问题,在火车站进站口、机场安检口等人流量大的地点应用时,可以快速地进行人脸图像识别,缓解人员拥堵的情况。
此外,本发明还提供了一种基于模糊理论的人脸图像识别装置、设备及计算机可读存储介质,同样具有上述有益效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例所提供的一种基于模糊理论的人脸图像识别方法的流程图;
图2为本发明实施例所提供的另一种基于模糊理论的人脸图像识别方法的流程图;
图3为本发明实施例所提供的另一种基于模糊理论的人脸图像识别方法的流程图;
图4为本发明实施例所提供的一种基于模糊理论的人脸图像识别装置的结构示意图;
图5为本发明实施例所提供的一种基于模糊理论的人脸图像识别设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1为本发明实施例所提供的一种基于模糊理论的人脸图像识别方法的流程图。该方法包括:
s101:获取具有不同身份标签的训练人脸图像,并对训练人脸图像进行分割得到训练子图像。
具体的,获取不同的人的人脸图像作为训练人脸图像,本实施例并不限定获取训练人脸图像的具体方式。其中,不同人的人脸图像具有不同的身份标签,即同一个人的多张人脸图像具有相同的身份标签,不同人的人脸图像的身份标签不同。本实施例并不限定身份标签的具体形式,例如可以为一段代码;或者可以为一个标识。本实施例并不限定需要获取多少种不同身份标签的训练人脸图像,进一步,本实施例也不限定每种身份标签的训练人脸图像的张数。
优选的,在本实施例中,每种不同身份标签的训练人脸图像各获取一张,这样可以降低对存储训练人脸图像的数据库或存储器的要求;同时对训练人脸图像进行编号,将训练人脸图像的号码作为其身份标签。
本实施例并不限定对训练人脸图像进行分割的分割方法,例如可以分割成多个均匀的训练子图像;或者是分割成多个不均匀的训练子图像。本实施例中优选的,将各个训练人脸图像分割成均匀大小的矩形训练子图像。
s102:计算各个训练子图像与训练人脸图像之间的同类距离以及异类距离,并利用同类距离和异类距离构建模糊隶属度矩阵。
请参考图2,图2为本发明实施例所提供的另一种基于模糊理论的人脸图像识别方法的流程图,包括:
s201:将训练人脸图像矩阵化,得到训练人脸图像矩阵。
本实施例中,各个训练人脸图像每一行的像素个数与所对应的训练人脸图像矩阵每一行的元素个数相同,训练人脸图像每一列的像素个数与所对应的训练人脸图像矩阵每一列的元素个数相同。将训练人脸图像中各个像素的像素值填入训练人脸图像矩阵中与像素对应的元素位置,以此构建训练人脸图像矩阵。
s202:将训练子图像矩阵化,得到训练子图像矩阵。
与构建训练人脸图像矩阵的过程类似,将训练子图像中各个像素的像素值填入训练子图像矩阵中对应元素位置,以此构建训练子图像矩阵。
具体的,每个训练人脸图像矩阵表示为
s203:利用具有相同身份标签的训练子图像矩阵和训练人脸图像矩阵计算同类人脸图像评估系数;利用同类人脸图像评估系数和训练子图像矩阵计算训练子图像与训练人脸图像之间的同类距离。
本实施例并不限定评估系数的计算方法,优选的,采用线性拟合的方法计算同类人脸图像评估系数和异类人脸图像评估系数。
具体的,去除训练人脸图像矩阵中的某个训练子图像矩阵,可得到与该训练子图像矩阵对应的缩减矩阵。本实施例中,用
利用
利用
计算
s204:利用具有不同身份标签的训练子图像矩阵和训练人脸图像矩阵计算异类人脸图像评估系数;利用异类人脸图像评估系数和训练子图像矩阵计算训练子图像与训练人脸图像之间的异类距离。
具体的,利用
利用
分别计算
s205:利用同类距离计算训练子图像的同类隶属度,利用异类距离计算训练子图像的异类隶属度,并利用同类隶属度和异类隶属度构建模糊隶属度矩阵。
具体的,利用u={uij}∈rc×n构建模糊隶属度矩阵,u表示模糊隶属度矩阵,uij表示模糊隶属度矩阵中第i行,第j列元素的元素值,c(j)表示训练子图像的类别,即训练子图像的身份标签。当c(j)=i时,uij为同类隶属度,利用
故此,模糊隶属度矩阵中各个元素的元素值的大小为:
s103:获取待识别图像,对待识别图像进行分割得到待识别子图像,并获取待识别子图像的近邻子图像。
本实施例并不限定获取待识别图像的具体方式,例如可以利用摄像头获取。本实施例中,待识别图像的分割方式需与训练人脸图像的分割方式相同。其中,利用y表示待识别图像,y=[y1,y2,…yt],ys为第s张待识别子图像,s=1,2,…,t。
近邻子图像从训练子图像的集合中获取,对于获取近邻子图像的具体方法,本实施例不做限定,优选的,可以使用k近邻算法获取近邻子图像,数量阈值k被提前设定好,用来确定每个待识别子图像的近邻子图像的数量。本实施例并不限定数量阈值k的具体大小。利用
s104:利用模糊隶属度矩阵和近邻子图像获取待识别子图像的子图像类隶属度,并利用子图像类隶属度确定待识别图像的身份。
请参考图3,图3为本发明实施例所提供的另一种基于模糊理论的人脸图像识别方法的流程图,包括:
s301:查询模糊隶属度矩阵得到近邻子图像的类隶属度,并利用类隶属度计算待识别子图像的子图像类隶属度。
具体的,通过查询模糊隶属度矩阵,可得到待识别子图像的子图像类隶属度。利用
计算待识别子图像的子图像类隶属度。其中
s302:利用子图像类隶属度计算待识别图像与各个训练人脸图像之间的模糊类隶属度概率。
利用
计算模糊类隶属度概率。其中,σi表示模糊类隶属度概率。
s303:获取模糊类隶属度概率的最大值,并判断最大值是否大于判断阈值。
利用
获取模糊类隶属度概率的最大值。其中,σl为最大值。本实施例中预设有判断阈值,判断阈值用于与最大值进行比较,以确定待识别图像的身份,即判断最大值所对应的训练人脸图像与待检测图像的身份标签是否相同,即判断待检测图像上的人与最大值对应的训练人脸图像上的人是否为同一个人。本实施例并不限定判断阈值的具体大小,可根据具体情况进行设置,在不同的应用场合,对判断阈值进行调整可以起到更好的识别效果。依据试验检测,判断阈值取0.65时,有较好的识别效果,故本实施例中优选的,将判断阈值设置为0.65。
s304:确定待识别图像与最大值对应的训练人脸图像的身份标签相同。
当最大值大于判断阈值时,说明待检测图像与最大值对应的训练人脸图像的身份标签相同,即确定待检测图像与最大值对应的训练人脸图像为同一个人的人脸图像。
s305:确定待识别图像与所有训练人脸图像的身份标签均不相同。
当最大值小于判断阈值时,说明待识别图像中地身份标签与所有的训练人脸图像的身份标签均不相同,即待识别图像与任何一张训练人脸图像都不是同一个人的人脸图像。
应用本发明实施例所提供的基于模糊理论的人脸图像识别方法,获取具有不同身份标签的训练人脸图像,并对训练人脸图像进行分割得到训练子图像。计算各个训练子图像与训练人脸图像之间的同类距离以及异类距离,并利用同类距离和异类距离构建模糊隶属度矩阵。获取待识别图像,对待识别图像进行分割得到待识别子图像,并获取待识别子图像的近邻子图像。利用模糊隶属度矩阵和近邻子图像获取待识别子图像的子图像类隶属度,并利用子图像类隶属度确定待识别图像的身份。本方法利用子图像类隶属度计算待识别图像的多个模糊类隶属度概率,当模糊类隶属度概率中的最大值大于标签阈值时认为待识别图像与最大值所对应的训练人脸图像的身份标签相同,即为同一个人的人脸图像。本方法比现有技术的计算过程简单,因此识别速度快,克服了现有技术识别速度慢的问题,在火车站进站口、机场安检口等人流量大的地点应用时,可以快速地进行人脸图像识别,缓解人员拥堵的情况。
同时,应用本实施例提供的基于模糊理论的人脸图像识别方法,不需要对待识别图像进行特征提取操作,因此不同身份标签的训练人脸图像仅需一张,即每一类训练人脸图像仅需一张,因此可以减轻对训练人脸图像数据库的压力。
下面对本发明实施例提供的基于模糊理论的人脸图像识别装置、设备及计算机可读存储介质进行介绍,下文描述的基于模糊理论的人脸图像识别装置、设备及计算机可读存储介质与上文描述的基于模糊理论的人脸图像识别方法可相互对应参照。
请参考图4,图4为本发明实施例所提供的一种基于模糊理论的人脸图像识别装置的结构示意图,包括:
图像分割模块100,用于获取具有不同身份标签的训练人脸图像,并对训练人脸图像进行分割得到训练子图像;
矩阵构建模块200,用于计算各个训练子图像与训练人脸图像之间的同类距离以及异类距离,并利用同类距离和异类距离构建模糊隶属度矩阵;
近邻获取模块300,用于获取待识别图像,对待识别图像进行分割得到待识别子图像,并获取待识别子图像的近邻子图像;
身份确定模块400,用于利用模糊隶属度矩阵和近邻子图像获取待识别子图像的子图像类隶属度,并利用子图像类隶属度确定待识别图像的身份。
应用本发明实施例所提供的基于模糊理论的人脸图像识别装置,获取具有不同身份标签的训练人脸图像,并对训练人脸图像进行分割得到训练子图像。计算各个训练子图像与训练人脸图像之间的同类距离以及异类距离,并利用同类距离和异类距离构建模糊隶属度矩阵。获取待识别图像,对待识别图像进行分割得到待识别子图像,并获取待识别子图像的近邻子图像。利用模糊隶属度矩阵和近邻子图像获取待识别子图像的子图像类隶属度,并利用子图像类隶属度确定待识别图像的身份。本装置利用子图像类隶属度计算待识别图像的多个模糊类隶属度概率,当模糊类隶属度概率中的最大值大于标签阈值时认为待识别图像与最大值所对应的训练人脸图像的身份标签相同,即为同一个人的人脸图像。本装置比现有装置的计算过程简单,因此识别速度快,克服了现有装置识别速度慢的问题,在火车站进站口、机场安检口等人流量大的地点应用时,可以快速地进行人脸图像识别,缓解人员拥堵的情况。
同时,应用本实施例提供的基于模糊理论的人脸图像识别装置,不需要对待识别图像进行特征提取操作,因此不同身份标签的训练人脸图像仅需一张,即每一类训练人脸图像仅需一张,因此可以减轻对训练人脸图像数据库的压力。
可选的,近邻获取模块300,包括:
k近邻获取单元,用于利用k近邻算法从所有的训练子图像中获取近邻子图像。
可选的,还包括:
训练人脸图像矩阵构建模块,用于将训练人脸图像矩阵化,得到训练人脸图像矩阵;
训练子图像矩阵构建模块,用于将训练子图像矩阵化,得到训练子图像矩阵。
可选的,矩阵构建模块200,包括:
同类评估系数计算单元,用于利用具有相同身份标签的训练子图像矩阵和训练人脸图像矩阵计算同类人脸图像评估系数;
同类距离计算单元,用于利用同类人脸图像评估系数和训练子图像矩阵计算训练子图像与训练人脸图像之间的同类距离。
可选的,矩阵构建模块200,包括:
异类评估系数计算单元,用于利用具有不同身份标签的训练子图像矩阵和训练人脸图像矩阵计算异类人脸图像评估系数;
异类距离计算单元,用于利用异类人脸图像评估系数和训练子图像矩阵计算训练子图像与训练人脸图像之间的异类距离。
可选的,矩阵构建模块200,包括:
构建单元,用于利用同类距离计算训练子图像的同类隶属度,利用异类距离计算训练子图像的异类隶属度,并利用同类隶属度和异类隶属度构建模糊隶属度矩阵。
可选的,身份确定模块400,包括:
子图像类隶属度计算单元,用于查询模糊隶属度矩阵得到近邻子图像的类隶属度,并利用类隶属度计算待识别子图像的子图像类隶属度;
模糊类隶属度概率计算单元,用于利用子图像类隶属度计算待识别图像与各个训练人脸图像之间的模糊类隶属度概率;
判断单元,用于获取模糊类隶属度概率的最大值,并判断最大值是否大于判断阈值;
第一确定单元,用于若最大值大于判断阈值,则确定待识别图像与最大值对应的训练人脸图像的身份标签相同;
第二确定单元,用于若最大值小于或等于判断阈值,则确定待识别图像与所有训练人脸图像的身份标签均不相同。
请参考图5,图5为本发明实施例所提供的一种基于模糊理论的人脸图像识别设备的结构示意图,该基于模糊理论的人脸图像识别设备包括存储器和处理器,其中:
存储器10,用于保存计算机程序;
处理器20,用于执行计算机程序,以实现如上述的基于模糊理论的人脸图像识别方法。
本发明还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述的基于模糊理论的人脸图像识别方法的步骤。
该计算机可读存储介质可以包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置、设备及计算机可读存储介质而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来利用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系属于仅仅用来将一个实体或者操作与另一个实体或者操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其他任何变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
以上对本发明所提供的基于模糊理论的人脸图像识别方法、装置、设备及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。