一种基于单次erp检测的快速人脸识别方法

文档序号:6526523阅读:331来源:国知局
一种基于单次erp检测的快速人脸识别方法
【专利摘要】本发明公开了一种基于单次ERP检测的快速人脸识别方法,该快速人脸识别方法通过设定目标图像后,以一定的规律向用户呈现一组人脸图片,通过采集呈现个人脸图片的脑电信号,并转化为各个人脸图片的ERP信号,以该ERP信号的作为相应人脸图片的特征向量,然后通过分类器对获取的特征向量进行识别,从而识别出该人脸图片是否为目标人脸图片。本发明利用人脸图片诱发的单次ERP信号进行人脸识别,根据检测用户对目标人脸刺激和非目标人脸刺激所诱发的单次ERP信号之间的不同,快速、准确地识别出用户所需要的目标人脸图片。
【专利说明】—种基于单次ERP检测的快速人脸识别方法
【技术领域】
[0001]本发明涉及人脸识别方法,具体涉及一种基于单次ERP检测的快速人脸识别方法。
【背景技术】
[0002]人脸因为具有较强的特殊性,在很多领域,特别是在计算机领域和认知神经科学领域中,都一直备受关注。
[0003]在计算机领域,因为人脸识别方法在军事、安防、金融等领域上有着广泛的应用背景,所以一直深受计算机视觉和模式识别领域研究人员的关注,并经过十几年的发展,已经取得了一定的成果。但是在自然环境下,光照强度、人脸姿势等的变化,大大增加了人脸识别的难度。因此现有的方法很难准确地对自然环境下的人脸进行识别,使得人脸识别方法在现阶段生活中的使用效果大打折扣。
[0004]在认知神经科学领域中,人脸也备受关注。研究者们发现,和普通物体相比,当人在观察人脸时,在认知过程中会出现一些特殊的反应,这些反应可以在脑电信号中表现出来,其中在ERP (事件相关电位,Event-Related Potential)波形上有明显的特征。在早期的研究中,实验通过对观察人脸和非人脸图片刺激产生的ERP信号进行记录和分析。在这些实验中,有大量结果发现在人脸图片刺激出现后的100ms-200ms之间,大脑某些脑域的ERP信号会出现一个较大的负峰,而其余物体图片则不存在这种负峰,这个负峰被研究者们命名为N170。很多研究者认为N170很可能反应了大脑对人脸结构进行预编码过程。经过后续的研究,发现还有一些ERP波形成分也反应了大脑对人脸的编码过程。比如刺激发生后100ms-200ms之间头顶部会出现很大的正波VPP(顶叶正波,Vertex Positive Potential)。
[0005]随着认知领域中对ERP研究的深入,相应的在脑机接口(Brain-ComputerInterface,BCI)领域,研究者们利用ERP信号发明了很多的BCI应用系统。其中P300 (目标出现后300ms左右,脑电信号出现一个正波)打字机即为一种非常典型的BCI应用。P300打字机应用让使用者坐在屏幕面前,在屏幕中显示字母表,利用字母表中字母的不断闪烁,使得使用者的脑电信号产生一种P300信号,然后通过对这种P300信号的叠加平均,可以检测出所需要字母,从而实现打字的效果。
[0006]Zhang Yu等人在2012年,利用人脸在认知过程中的特殊性(人脸认知过程中会产生一些特殊的ERP波形成分,如N170,VPP等),将人脸图片作为检测目标,将人脸和非人脸图片进行呈现,实现了一个八目标的BCI人脸检测系统,其中主要利用人脸相关的VPP、N170成分和P300成分进行单次ERP人脸检测分析,准确率达到88.7%。
[0007]从以上的研究报道可知,人脑对人脸具有特殊的识别能力,且在单次ERP信号中有一定的体现。因此根据人脑对人脸的敏感性,利用人本身的人脸识别能力来设计一个BCI应用下的人脸识别方法,可能是现阶段解决人脸识别难题的一种思路。

【发明内容】
[0008]本发明提供了一种基于单次ERP检测的快速人脸识别方法,通过采集用户对不同人脸图片刺激相应的脑电信号,并根据脑电信号的单次ERP信号进行实现快速、准确的人脸识别方法。
[0009]一种基于单次ERP检测的快速人脸识别方法,包括以下步骤:包括以下步骤:
[0010](I)设定目标人物和刺激参数,所述的刺激参数包括呈现人脸图片时,人脸图片与用户的距离,每张人脸图片呈现的时间,以及呈现相邻人脸图片的时间间隔;
[0011](2)按照步骤(I)设定的刺激参数,将一组含有目标人物的人脸图片依次呈现在用户眼前,并采集每张人脸图片呈现时用户的原始脑电信号和眼电信号;
[0012](3)依次对原始脑电信号和眼电信号进行放大和滤波,然后进行模数转换,得到离散脑电信号和离散眼电信号;
[0013](4)根据离散眼电信号,对离散脑电信号进行预处理,得到预处理后的脑电信号;
[0014](5)根据人脸图片呈现的时间和呈现相邻人脸识别图像的时间间隔,将预处理后的脑电信号划分为若干个ERP信号,一张人脸图片对应一个ERP信号,然后进行基线校准,并根据基线校准后ERP信号的幅值获取该人脸图片的特征向量;
[0015](6)利用分类器判别函数对各张人脸图片的特征向量进行识别,得到目标人脸图片,该目标图片中的人物即为目标人物,所述的分类器判别函数通过训练得到。
[0016]分类器的判别函数的确定需要根据事先训练过程中的脑电信号特征和类标进行计算得到。训练的流程与实际的人脸识别流程基本一致。
[0017]本发明基于单次ERP检测的快速人脸识别方法主要是通过在头皮脑电中检测大脑对快速闪过的人脸图片的ERP信号,从而识别出该人脸图片是否为目标人脸图片。目标人脸图片是一个人在不同姿势、背景、造型下的人脸图片,而不仅仅特指某一张人脸图片。在正式开始人脸识别前给用户一定的调整时间,有助于得到特征明显的脑电ERP信号,从而提高人脸识别的准确性。
[0018]所述步骤(2)中采集每张人脸图片呈现时用户的原始脑电信号和眼电信号为多路,并通过步骤(3)?(5)分别对各路信号进行处理,根据所有的ERP信号得到特征向量,一张人脸图片只对应一个特征向量。
[0019]人脸图片相对于用户的距离以及呈现时间、呈现相邻人脸图片之间的时间间隔对人脸识别的准确性相关,为保证识别的准确性和可靠性,所述步骤(I)中设定的人脸图片与用户的距离为0.8?lm,每张人脸图片呈现的时间为200?500ms,呈现相邻人脸识图片的时间间隔为200?500ms。作为优选,设定的人脸图片与用户的距离为lm,每张人脸图片呈现的时间为500ms,呈现相邻人脸识图片的时间间隔为500ms。
[0020]所述步骤(3)采用上限为200Hz的模拟低通滤波器进行滤波。原始脑电信号和眼电信号主要集中在低频带(小于200Hz)。
[0021]所述步骤(3)进行模数转换时的采样率为1000Hz。在进行模数转换将模拟信号转换为数字信号的过程中,当采样频率大于信号中最高频率的2倍时,采样之后的数字信号完整地保留了原始信号中的信息,一般实际应用中保证采样频率为信号最高频率的5?10倍,本发明中优选为1000Hz,即为模拟低通滤波器的频率上限的5倍。
[0022]所述步骤(4)中的预处理包括以下步骤:
[0023](4-1)对离散脑电信号进行样条插值;[0024](4-2)根据眼电信号,采用相关消减算法去除经样条插值后的离散脑电信号中的眼电干扰;
[0025](4-3)采用带通滤波器对经过步骤(4-2)的脑电信号进行滤波。
[0026]通过样条插值去除分区离散信号中的基线漂移。由于一阶样条插值方法只能插值出直线,而二阶样条插值方法比三阶样条插值方法的结果稳定,因此作为优选,所述步骤(4-1)对分区离散信号进行二阶样条插值。
[0027]所述步骤(4-3)中采用的带通滤波器为2阶巴特沃兹带通滤波器,其通带为0.3?30Hz。ERP信号的有效波段主要集中在0.3?30Hz范围中。
[0028]本发明中的人脸识别方法和传统的人脸识别方法不同,主要是基于人对人脸图片的敏感性实现的。虽然范式较为简单,但是利用人脑的单次ERP信号进行人脸识别可以实现和传统计算机方法相同的功能,在自然环境下人脸图片的识别中凸现出人的智能的优势,具有一定的潜在价值。
【具体实施方式】
[0029]下面结合具体实施例对本发明的基于单次ERP检测的快速人脸识别方法做详细的说明。
[0030]本实施例的基于单次ERP检测的快速人脸识别方法基于人脸识别系统完成,该人脸识别系统包括:
[0031]显示屏,用于显示人脸图片;
[0032]脑电信号采集装置,用于采集显示不同人脸图片时用户的原始脑电信号;
[0033]数据处理模块,用于提取原始脑电信号的特征向量,并根据特征向量确定目标图片,完成人脸识别;
[0034]本实施例中数据处理模块为PC机,显示屏和脑电信号采集装置与PC机通过数据线连接。本实施例中脑电信号采集装置为电极帽,该电极帽是国际标准的64导联的电极帽,即该电极帽具有64个电极通道。
[0035]本实施例中,该电极帽的参考电极贴于鼻尖处,2个眼电电极分位于左眼眼球正上方和正下方用于采集眼电信号,其脑电电极与用户头皮接触,用于采集脑电信号,脑电电极与用户头皮之间存在接触电阻,一般要求接触电阻阻抗控制在20kQ以下,从而获得较高信噪比的脑电信号。本实施例中该电极帽采集得到60路原始脑电信号。
[0036]本实施例的人脸识别方法中选取了 36位不同性别、不同国籍、不同人种的明星作为人脸识别的目标。这36位明星中有10位为欧洲人或美国人,6位日本人,20为中国明星,且男女人数各占一半。这些明星的原始图片都来自Google Image,每位明星各有15张不同造型、不同姿势、不同场合下的图片。每次识别前,从36位明星中随机选取16位明星,并从选择的16位明星选定一位明星的图片作为目标图片。每位明星随机选取10张图片,得到的16*10=160张图片作为该次实验的人脸识别图集,其中目标人脸图片为10张。160张图片分10组,按组轮流进行随机呈现。每一组中每位明星的人脸图片出现I次。图片呈现的顺序可以依据需要进行设定,同一个人的人脸图片不会连续出现。
[0037]为了排除不必要的干扰,这些原始图片都需要经过裁剪和缩放,使得大小为200X200像素,并使人脸居于图片中间。为了便于用户在搜索过程中集中注意力,显示人脸图片的屏幕背景呈浅灰色。且将人脸图片呈现在屏幕的中央,从而保证用户在进行人脸识别过程中不会因为焦点的位置不同而造成头部转动,减少头部肌电对ERP信号的干扰。
[0038]需要指出的是,本发明的人脸识别性能与用户的主观参与度十分相关,一旦用户出现疲劳而无法集中注意力的状况,应该停止该实验,待休息足够长的时间后再重新开始。在给用户呈现人脸图片刺激之前,为了让用户集中注意力并保持静止状态,需要一定的准备时间,故在施加人脸图片刺激之前,给予一点的缓冲时间。本实施例中设定缓冲时间为5s,并通过显示屏进行倒计时显示。
[0039]一种基于单次ERP检测的快速人脸识别方法,包括以下步骤:
[0040](I)设定目标人物和刺激参数,所述的刺激参数包括呈现人脸图片时,人脸图片与用户的距离,每张人脸图片呈现的时间,以及呈现相邻人脸图片的时间间隔;
[0041 ] 本实施例中将选定的目标图片呈现给用户,进行设定目标图像。
[0042]本实施例中设定的人脸图片与用户的距离为lm,每张人脸图片呈现的时间为500ms,呈现相邻人脸识图片的时间间隔为500ms。
[0043](2)按照步骤(I)设定的刺激参数,将一组含有目标人物的人脸图片依次呈现在用户眼前,并采集每张人脸图片呈现时用户的原始脑电信号和眼电信号(本实施例的电极帽采集得到60路原始脑电信号,一路眼电信号);
[0044](3)对眼电信号和每一路原始脑电信号进行放大,滤波,然后进行模数转换,得到离散脑电信号和离散眼电信号,其中硬件滤波是上限为200Hz的模拟低通滤波器滤除高频干扰,模数转换采样率一般设为1000Hz ;
[0045](4)根据离散眼电信号,对每一路离散脑电信号进行预处理,得到预处理后的脑电信号,预处理过程包括以下步骤:
[0046](4-1)对离散信号进行二阶样条插值去除信号中的基线漂移;
[0047](4-2)根据眼电信号,采用相关消减算法去除经步骤(4-11)处理后的离散信号中的眼电干扰;
[0048](4-3)采用0.3-30Hz的2阶巴特沃兹(Butterworth)带通滤波器对经过步骤(4-2)进行滤波;
[0049](5)根据人脸图片呈现的时间和呈现相邻人脸识别图像的时间间隔,将每一路预处理后的脑电信号划分为若干个ERP信号,一路原始脑电信号中,一张人脸图片对应一个ERP信号(因此本实施例中一张人脸图像对应60个ERP信号),然后对各个ERP信号进行基线校准,并根据各个基线校准后ERP信号的幅值获取该人脸图片的特征向量(将各个ERP信号连接起来得到的数据即为特征向量);
[0050]该处的特征向量不需要根据图片类别对ERP信号叠加平均得到,而是一种单次的ERP信号特征。所述过程具体如下:
[0051](5-1)每个人脸图片的呈现总时间包括呈现时间和相邻人脸图片的时间间隔,因此实施例每个人脸图片的呈现总时间为1000ms,从初始时间开始,以IOOOms为单位,按照时间将预处理后的脑电信号划分为若干个部分,每个部分即为ERP信号(对于一路原始信号),一张人脸图片对应一个ERP信号,本实施例中将预处理后的脑电信号划分为160个ERP信号,与各个人脸图片相对应;
[0052](5-2)对ERP信号进行基线校正,然后将各个ERP信号拼接,拼接后的信号对应的数据段即为该人脸图片的特征向量,其中基线校正过程如下:
[0053]截取分区脑电信号的时间上前一部分作为基线信号段,其余部分作为有效信号段,以基线信号段的所有数据的平均值对有效信号段进行基线校正,即将有效信号段中的数据减去基线信号段的数据的平均值。
[0054]本实施例中截取分区脑电信号O?200ms部分内的数据作为基线信号,以201?IOOOms内的数据作为有效信号。
[0055](6)利用分类器判别函数对各张人脸图片的特征向量进行识别,得到目标人脸图片,该目标图片中的人物即为目标人物,所述的分类器判别函数由事先训练得到。
[0056]分类器的判别函数的确定需要根据事先训练过程中的脑电信号特征和类标进行计算得到。训练的流程与实际的人脸识别流程基本一致。
[0057]以上所述,仅为本发明的【具体实施方式】,但本发明的保护范围并不局限于此,任何熟悉本【技术领域】的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
【权利要求】
1.一种基于单次ERP检测的快速人脸识别方法,其特征在于,包括以下步骤: (1)设定目标人物和刺激参数,所述的刺激参数包括呈现人脸图片时,人脸图片与用户的距离,每张人脸图片呈现的时间,以及呈现相邻人脸图片的时间间隔; (2)按照步骤(I)设定的刺激参数,将一组含有目标人物的人脸图片依次呈现在用户眼前,并采集每张人脸图片呈现时用户的原始脑电信号和眼电信号; (3)依次对原始脑电信号和眼电信号进行放大和滤波,然后进行模数转换,得到离散脑电信号和离散眼电信号; (4)根据离散眼电信号,对离散脑电信号进行预处理,得到预处理后的脑电信号; (5)根据人脸图片呈现的时间和呈现相邻人脸识别图像的时间间隔,将预处理后的脑电信号划分为若干个ERP信号,一张人脸图片对应一个ERP信号,然后对ERP信号进行基线校准,并根据基线校准后ERP信号的幅值获取该人脸图片的特征向量; (6)利用分类器判别函数对各张人脸图片的特征向量进行识别,得到目标人脸图片,该目标图片中的人物即为目标人物,所述的分类器判别函数通过训练得到。
2.如权利要求1所述的基于单次ERP检测的快速人脸识别方法,其特征在于,所述步骤(4)中的预处理包括以下步骤: (4-1)对离散脑电信号进行样条插值; (4-2)根据眼电信号,采用相关消减算法去除经样条插值后的离散脑电信号中的眼电干扰; (4-3)采用带通滤波器对经过步骤(4-2)的脑电信号进行滤波。
3.如权利要求2所述的基于单次ERP检测的快速人脸识别方法,其特征在于,设定的人脸图片与用户的距离为I?1.5m,每张人脸图片呈现的时间为200?500ms,呈现相邻人脸识图片的时间间隔为200?500ms。
4.如权利要求3所述的基于单次ERP检测的快速人脸识别方法,其特征在于,所述步骤(3)进行模数转换时的采样率为1000Hz。
5.如权利要求4所述的基于单次ERP检测的快速人脸识别方法,其特征在于,所述步骤(3)采用上限为200Hz的模拟低通滤波器进行滤波。
6.如权利要求5所述的基于单次ERP检测的快速人脸识别方法,其特征在于,所述步骤(4-1)对离散信号进行二阶样条插值。
7.如权利要求6所述的基于单次ERP检测的快速人脸识别方法,其特征在于,所述步骤(4-3)中采用的带通滤波器为2阶巴特沃兹带通滤波器,其通带频率为0.3?30Hz。
【文档编号】G06K9/66GK103886280SQ201310743578
【公开日】2014年6月25日 申请日期:2013年12月30日 优先权日:2013年12月30日
【发明者】王怡雯, 蔡邦宇, 肖思远, 蒋磊, 张嘉璐, 郑筱祥 申请人:浙江大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1