一种基于呼吸过程中鼻子图像特征的人员识别方法与流程

文档序号:12178019阅读:359来源:国知局

本发明涉及人脸识别,特别涉及一种基于呼吸过程中鼻子图像特征的人员识别方法。



背景技术:

对人员的自动识别通常是基于他们的生理和行为特征进行的,例如基于特定人员的声音或说话方式、脸、虹膜、视网膜、指纹、掌形等特征进行识别。在选择一个自动识别系统的时候,通常要考虑如下因素:抵御欺诈的能力、使用方便性、对被识别人的干扰性、对于特殊人群的适用性、识别的速度、模型(特征信息)的大小、生物特征的长期稳定性、使用成本等等。没有一种识别方式在所有上述方面都能够胜出,因此需要根据某个应用的具体要求,选择较合适的识别方式。例如,虹膜识别和视网膜识别的设备价格非常高,对被识别者的干扰也较大。但是由于虹膜识别和视网膜识别是最准确的两种识别方法,因此它们仍然是许多高度重视安全性的场合中的首选。这样的场合有核电站和重要的军事基地等。

除了上述的对安全性非常重视的应用之外,还存在大量对识别准确性要求相对较低,但要求对用户干扰小的应用场合。在此方面,虹膜、视网膜、指纹、掌形等识别方式都是接触式的,需要被识别者的较多配合,因此不适用于这些场合。可以考虑如下例子:在智能化的远程视频会议中,需要根据讲话人的身份自动生成讲话记录,因此要求能够自动地获取讲话者的身份,但是不能为了获取身份信息而打扰讲话者;在智能门厅场合,需要识别特定人员的身份,进而决定是否打开大门,而无需行人停下脚步(刷指纹等识别方式会给用户带来额外负担,因为用户的两手可能都被占用)。接触式识别方式存在卫生方面的问题,且一定数量的人员因为将指纹/掌形与犯罪联系起来而不愿接受这种识别方式。与上述识别对比,有希望满足上述需求的一种身份识别技术是人脸识别。人脸识别的优点有直观、普遍存在、容易提取等。但是,人脸识别存在以下问题:1. 识别的效果受照明条件影响大,当合适的照明条件不具备时(例如当设备的体积受限、供电能力受限时),就无法实施可靠的人脸识别;2. 人脸表情的不同会影响数据的采集和提取;3. 饰物遮挡以及损伤问题:如果被识别的对象带有墨镜、帽子等饰物,或者人的脸上存在损伤或污物,就会造成信号数据的缺失;4. 双胞胎的问题;5. 面部化装和整容技术的成熟和使用,给人脸带来更大的可变性,目前的识别系统几乎难以解决。



技术实现要素:

本发明的目的是提出一种基于呼吸过程中鼻子图像特征的人员识别方法及系统,通过对人员鼻孔呼吸出现的不同热反应图像进行分析,对人员进行识别,是对静止人员人脸的识别,是对目前人脸识别的一种补充。

为了实现上述目的,本发明的技术方案是:一种基于呼吸过程中鼻子图像特征的人员识别方法,包括通过红外热成像仪实时采集鼻子呼吸特征,将实时采集的鼻子呼吸特征与在数据库中预先采集的鼻子呼吸特征进行比较,当比较结果达到一个设定的相似度阈值时,则认为二者为同一人,其中,所述鼻子呼吸特征的比较是连续多个呼吸周期的鼻子静态呼吸参数特征的比较和鼻子动态呼吸参数特征的比较。

方案进一步是:

所述鼻子静态呼吸参数包括:左侧鼻翼的温度、右侧鼻翼的温度、左侧鼻唇沟的温度、右侧鼻唇沟的温度、鼻小柱的温度、鼻尖的温度、鼻梁下半部分的温度;

鼻子动态呼吸参数包括:多个呼吸周期内左鼻孔出现温度最低值或最高值的频率、左鼻孔的最低温度、左鼻孔的最高温度、右鼻孔出现温度最低值或最高值的频率、右鼻孔的最低温度、右鼻孔的最高温度、左鼻孔的最大低温区域、右鼻孔的最大低温区域、左鼻孔最大低温区域宽度与鼻小柱宽度之比、右鼻孔最大低温区域宽度与鼻小柱宽度之比、左右两侧鼻孔达到最高温度或最低温度的时间差。

方案进一步是:所述鼻子静态呼吸参数特征是对多个呼吸周期的鼻子静态呼吸参数与当前环境温度进行差值计算,将差值的平均值作为鼻子静态呼吸参数特征;

所述鼻子动态呼吸参数特征是对多个呼吸周期的鼻子动态呼吸参数进行聚类分析,将聚类分析后生成的动态呼吸形位聚类作为鼻子动态呼吸参数特征。

方案进一步是:所述连续多个呼吸周期至少是10个。

方案进一步是:所述动态呼吸形位聚类包括主形位聚类和子形位聚类,其中:

所述主形位聚类是将所述多个呼吸周期的鼻子动态呼吸参数组成向量进行聚类分析得到的多个一次形位聚类;

所述子形位聚类是将多个一次形位聚类再次进行聚类分析得到的多个二次形位聚类。

方案进一步是:所述的相似度阈值至少是70%。

方案进一步是:所述聚类分析是采用K均值聚类方法或采用模糊C均值聚类方法进行的聚类分析。

本发明具有如下优点:因为基于形位聚类的呼吸特征参数反映了一个人的呼吸的本质特征,这些特征独立于具体的呼吸模式,且不随外界环境和该人员的暂时性生理反应而变化,因此本识别方法的鲁棒性强,可以识别出以任意模式呼吸的人员。另外,本发明的人员的呼吸状态参数是基于鼻子部位的热红外图像获得的,而采集热红外图像无需人与设备的直接接触,可以在相对较远的距离进行,因此识别过程对于被识别人的干扰较小。可以识别出以任意模式呼吸的人员,是对目前人脸识别的一种补充。

具体实施方式

一种基于呼吸过程中鼻子图像特征的人员识别方法,包括通过红外热成像仪实时采集鼻子呼吸特征,将实时采集的鼻子呼吸特征与在数据库中预先采集的鼻子呼吸特征进行比较,当比较结果达到一个设定的相似度阈值时,则认为二者为同一人,其中,所述鼻子呼吸特征的比较是连续多个呼吸周期的鼻子静态呼吸参数特征的比较和鼻子动态呼吸参数特征的比较。

实施例中:所述鼻子静态呼吸参数包括:左侧鼻翼的温度、右侧鼻翼的温度、左侧鼻唇沟的温度、右侧鼻唇沟的温度、鼻小柱的温度、鼻尖的温度、鼻梁下半部分的温度;

所述鼻子动态呼吸参数包括:多个呼吸周期内左鼻孔出现温度最低值或最高值的频率、左鼻孔的最低温度、左鼻孔的最高温度、右鼻孔出现温度最低值或最高值的频率、右鼻孔的最低温度、右鼻孔的最高温度、左鼻孔的最大低温区域、右鼻孔的最大低温区域、左鼻孔最大低温区域宽度与鼻小柱宽度之比、右鼻孔最大低温区域宽度与鼻小柱宽度之比、左右两侧鼻孔达到最高温度或最低温度的时间差。

其中:所述鼻子静态呼吸参数特征是对多个呼吸周期的鼻子静态呼吸参数与当前环境温度进行差值计算,将差值的平均值作为鼻子静态呼吸参数特征;

所述鼻子动态呼吸参数特征是对多个呼吸周期的鼻子动态呼吸参数进行聚类分析,将聚类分析后生成的动态呼吸形位(形状、位置)聚类作为鼻子动态呼吸参数特征。

其中:所述连续多个呼吸周期至少是10个。

实施例中:所述动态呼吸形位聚类包括主形位聚类和子形位聚类,其中:

所述主形位聚类是将所述多个呼吸周期的鼻子动态呼吸参数组成向量进行聚类分析得到的多个一次形位聚类;

所述子形位聚类是将多个一次形位聚类再次进行聚类分析得到的多个二次形位聚类。

其中:所述的相似度阈值至少是70%,即:至少有70%相同,或误差小于一个设定的阈值、非常接近。所述聚类分析是采用K均值聚类方法或采用模糊C均值聚类方法进行的聚类分析。

实施例中提出了主形位聚类和子形位聚类,具体说:所述主形位聚类是:根据特定准则,由所有的动态呼吸参数(向量)所形成的互不交叉的若干个集合,这个集合完整覆盖所有动态呼吸参数向量,且基于广义的呼吸模型,提供对于周期性呼吸过程的描述和辨识。

注意:针对属于某个人的若干个连续呼吸周期的一组动态呼吸参数(向量)集合,所进行的第一次聚类分析。按照特定的准则,把所有动态呼吸参数划分到一个广义的(或者说“规范化的”)呼吸周期中的多个特定状态(或者说“阶段”),其中每个状态(分布)都含有多个动态呼吸参数(向量)。另外,属于不同状态(阶段)的向量是互不交叉的。主形位提供对于呼吸的周期性变化过程的描述和辨识。这个描述和辨识对于不同的人是通用的,即每个人的呼吸都遵循这个模型。

所述子形位聚类是:针对由第一次聚类分析所得到的所有主呼吸形位,所进行的第二次聚类分析。对于每个主形位所包含的所有动态呼吸参数(向量),按照特定的准则,将它们划分为互不交叉的若干个类别,这些类别完整覆盖该呼吸形位中的所有动态参数向量,且提供对于该呼吸形位的数值统计特征的描述和辨识。

注意:在第一次聚类分析所得到的多个主形位的基础上,所进行的第二次聚类分析。对于每个主形位所包含的所有动态呼吸参数(向量),基于各个动态参数向量的数值,按照特定的准则,将它们划分为互不交叉的多个类别,每个类别都包含多个动态呼吸参数(向量),这些向量具有相同或相似的数值。根据一个呼吸形位所得到的所有类别将完全覆盖该呼吸形位中的所有动态参数向量,且属于不同类别的向量是互不交叉的。子形位提供对于各个呼吸形位的统计特征的精细的描述和辨识。对于不同的人而言,即使是相同的主呼吸形位,其子呼吸形位的数值分布也是不一样的。另外对于同一个人而言,其主呼吸形位和子呼吸形位的数值分布特征又具有长时间的稳定性,可以用来进行人员识别。

本实施例涉及到基于呼吸过程中的鼻子的热红外图像特征来识别人员的方法。实施例中的识别的基本原理是:在一个人的多个呼吸周期中,其鼻子的温度的在时间域和空间域的分布特点,包含着该人员的生理和行为特征。根据鼻子上特定位置的静态温度分布和动态温度变化,可以提取该人员所特有的呼吸特征参数,进而识别出相应人员的身份。上述的呼吸特征参数包含两个方面的内容:在静止情况下,一个人员的鼻子的不同位置的温度存在差异,不同人员的这种温度分布具有其自身特征,这种特征的提取相对简单,可以通过红外热成像仪直接获得;一个人在呼吸时鼻孔部位所表现出来的动态变化特征,这需要通过考察该人员在多个呼吸周期中的呼吸形位及子呼吸形位的统计特征获得。对呼吸形位、子呼吸形位的详细说明,将在后文中进行。

本实施例中的识别不同人员的生理学基础,是不同人的呼吸活动会表现出不同的特性。对人的呼吸的说明,有助于理解这个事实。人体通过持续的呼吸活动,吸入外界氧气,呼出二氧化碳,以保证自身的正常生命活动。人体的呼吸系统主要由呼吸道和肺组成,人体的呼吸活动具有周期性。在不同的呼吸周期中,肺将依次经历多个固定的生理状态。吸气时,由呼吸肌带动胸腔的骨骼和横膈膜向外运动,胸腔扩大,肺随之膨胀,空气被吸入。吸气动作结束时,肺内压和大气压相平衡。此后,胸腔的各个组成结构因弹性而回缩,胸腔缩小,肺内气体流出体外,此过程为呼气过程。在呼气过程结束后,人体将开始下一个吸气过程。

人体对肺活动的调节是由相关的神经器官完成的。这样的神经器官包括呼吸中枢和肺内呼吸反射装置。其中,呼吸中枢位于延髓,由吸气中枢和呼气中枢两部分,吸气中枢和呼气中枢交替兴奋和抑制,从而形成有规律的呼吸动作。另外一种调节肺的活动的神经器官是肺内的呼吸反射装置。肺内的呼吸反射是通过迷走神经和肺内感受器完成的。肺内存在肺牵张感受器、J感受器、刺激感受器三种形式的肺内感受器,它们分别负责肺的节律性舒缩,以及特殊情况下对肺的活动的调节。

由于不同的人的呼吸器官和神经组织的生理结构和动态响应特性不同,以及不同的人具有不同的呼吸习惯,因此不同的人的呼吸具有不同的特性。这些特性有如下几方面的表现:1. 在相同或基本相同的条件下,不同的人的呼吸具有其自身的特性,观察者可以察觉到它们之间的差异,这里的条件可能包括外界环境、运动状态、呼吸模式等;2.对于同一个人而言,在不同的条件下,其呼吸活动会发生变化,但是由于其自身的生理结构是固定的,因此其不同模式下的呼吸活动仍具有一定的相似性,这个相似性可以被识别并提取出来;3.同一个人的呼吸所表现出来的独特的生物学特征具备长时间的稳定性,不会随着年龄的增长而减弱。根据以上事实,通过提取某个人的特有的本质的呼吸特征,可有效地进行人员识别。

上述的呼吸特征包括静态温度分布和动态温度变化两个方面,这都可以由呼吸过程中的鼻子区域的热红外图像反映出来。这种现象可以由鼻子的生理学结构,以及热红外成像的物理原理两方面来理解。

人的鼻子可以分为外鼻、鼻腔、鼻窦三个部分,与本发明有关的部分为外鼻和鼻腔。其中的外鼻是鼻子的明显可见的部分,它位于面部中央,形如基底在下方的三边锥体。外鼻具有如下的可识别部分:鼻根、鼻尖、鼻梁、鼻背、鼻翼、鼻唇沟、鼻底、鼻小柱、左、右前鼻孔。外鼻主要由软骨支架和外鼻肌肉组成,同时外鼻周围有丰富的血管、神经和淋巴。外鼻的形状和大小具有明显的个体差异、种族和地区差异,作为示例,给出白种人、黑种人和黄种人的外鼻的差异。白种人鼻梁高,鼻根窄,鼻尖小,呈鹰嘴样鼻;黑种人鼻梁低,鼻根宽,鼻尖大,像扁平朝天鼻;黄种人居于二者之间。不同人的鼻子具有不同的形状、生理结构,且具有不同的产热和传热特性,导致不同人的鼻子在热红外图像中表现出明显的不同。另外,对于同一个人,当他保持静止或慢速运动时,其鼻子在热红外图像中的形状(温度分布)具有内在的长期稳定性。这种因人而异,但对于同一个人具有稳定性的温度分布特征,可以作为特征应用于人员识别。此处将这种温度分布特征称为静态呼吸特征,提取出来的特征表现为一组静态呼吸特征参数。

另一个与本实施例有关的鼻子结构是鼻腔。人的鼻腔的组成结构中,鼻腔分为为左右两腔,每侧鼻腔的外部(前部)开口称为前鼻孔。另外,以鼻阈为界,鼻腔分为鼻前庭和固有鼻腔。从前鼻孔向内看时,可以看到鼻前庭,以及部分鼻腔粘膜。与肺的活动类似,在各个呼吸周期中,鼻子也会周期性的依次经历多种固定生理状态。此外,由于鼻子是人体与外部交换气体的第一个环节,因此在呼吸中鼻子的状态变化比较明显。从外界吸入的空气,以及从肺部呼出的空气,都会流经鼻腔和前鼻孔,进而造成这两个部分的温度明显的降低或升高。不同的人的鼻孔部位在呼吸过程中的温度变化具有不同的特点,这也是不同的人的呼吸的独特性的一种表现。

热红外成像的物理原理是:现实世界中的任何物体(包括人体)都在不断地向周围辐射电磁能量(自发辐射)。在常温下,物体的自发辐射主要是红外辐射,又称红外线,它是人眼看不见的光线,具有强烈的热作用。红外线与可见光、紫外线、X射线、γ射线和微波等无线电磁波一起,构成了一个无限连续的电磁波波谱,热红外成像系统利用目标与环境之间由于温度辐射及发射率的差异所产生的不同的热对比度,探测红外辐射能量密度分布并加以显示。在各种热红外成像场合中,通常需要检测的是与物体自身辐射以及物体表面温度分布有关的信息。这种检测方式不需要任何形式的人工照明,因此经常被称为被动成像。

在状态检测和数据获取方面,热红外成像系统具有以下优势:1) 红外成像属于非接触式检测,可以获取较远距离的目标信息,实现较大范围的监测;2)可以将探测的数据精确量化,测量精度通常在±2℃以内,温度分辨率在0.01℃级别;3)智能化程度高,可以实现无人值守情况下的长时间持续运行;4)依靠物体自身辐射工作,不需要辅助信号源,不会对人体产生辐射;5)红外线透过雾、霾的能力比可见光强,因此热红外成像具备一定程度的全天时、全天候工作能力;6) 目前有很多坚实、轻巧、易于携带和部署的热红外成像设备。目前,热红外成像设备在军事和民用方面都有广泛的应用。随着热红外成像技术的成熟,出现了很多低成本适用于民用的红外热像仪,这些设备均可以应用于本发明中所提出的人员识别。

如前所述,不同人的呼吸存在个体差异。这种个体差异的一个体现为,不同人的呼吸过程中鼻子的状态的变化具有不同特性。在使用热红外成像设备观察时,可以在鼻孔部位看到若干状态的周期性更替。红外图像中鼻孔区域的周期性的变化过程包括:第一阶段,人体的胸腔扩张,吸气过程开始,外界空气进入鼻腔。由于外界的空气的温度较低,因此这个过程将使鼻腔内的温度降低。在热红外图像中,表现为鼻孔部位持续变暗,暗区域的面积增大,这种变化一直持续到胸腔扩张到最大时停止(此时吸气停止);第二阶段,胸腔收缩,呼气过程开始,气体由人的肺部经由鼻子流出人体,由于这些气体的温度较高,因此使鼻腔内的温度上升,在热红外图像中,表现为鼻孔部位持续变亮,暗区域的面积减小,这种变化一直持续到胸腔收缩到最小时停止(此时呼气停止)。上述的在呼吸活动中的鼻孔区域变化过程,对于不同人而言存在相似性。但是由于人的呼吸存在个体差异,因此上述的变化又具有因人而异的特性。

为了描述在热红外图像中的鼻孔区域的变化,可以将鼻孔的演变过程归纳为若干种典型状态,每种典型状态称为一种呼吸形位,每种呼吸形位对应于鼻孔区域的一种图像状态(温度分布)。在一个呼吸周期中,鼻孔区域的图像依次出现若干种不同的状态,而每种状态都对应于一个特殊的呼吸形位。例如,当热红外图像中鼻孔部位最暗(表示鼻腔内温度最低,吸气刚停止)时,对应着“吸气停止”形位。当鼻孔部位最亮(表示鼻腔内温度最高,呼气刚停止)时,对应着“呼气停止”形位。除了“吸气停止”、“呼气停止”形位之外,一个人的呼吸中还包含多种不同的呼吸形位。可以将一个人的所有的呼吸周期都看作由类似于上述的“吸气停止”、“呼气停止”形位的多种不同的呼吸形位组成。而在不同的呼吸周期中,存在的是同一种呼吸形位的不同实例。在一个呼吸周期中,不同呼吸形位的实例以固定的顺序依次出现。不同人的呼吸周期中所包含的呼吸形位的数量是相同的,反映了不同人的呼吸活动中的相似的成分。同时,不同的人的同一种呼吸形位具有不同的统计特征,这反映了不同人的呼吸活动中的因人而异的成分。

另外,即使是同一个人的同一种呼吸形位的不同实例,它们之间也通常存在若干细微区别,不同特性的实例出现的概率也不同,为了更加精细地考察一个人的呼吸活动,需要将同一种呼吸形位的实例进一步细分,这样的细分被称为子呼吸形位。与呼吸形位相似,不同人的同一种呼吸形位中的子呼吸形位的数量是一样的,但是不同人的同一种呼吸形位中的子呼吸形位的特性参数不同。

如上所述,由于人的呼吸存在个体差异,因此在热红外图像中鼻孔区域的动态变化也表现出因人而异的特性。在这些因人而异的动态变化特性中,存在着对一个人而言较稳定的呼吸特征,此处将其称为动态呼吸特征参数,以区别于前述的静态呼吸特征参数。这些动态呼吸特征的稳定性表现在,它们不受外界条件、主体的生理状态,以及具体呼吸模式的影响。动态呼吸特征是在一个人员的多个呼吸周期中表现出来的,且与该人员的呼吸形位和子呼吸形位在多个呼吸周期中的统计特征具有内在的关系。通过考察该人员在多个呼吸周期中的呼吸形位和子呼吸形位的统计特征,可以获得独立于呼吸周期的动态呼吸特征参数。

本方法是基于呼吸特征参数来识别不同人员的,因此提取呼吸特征参数是一个很重要的过程。提取呼吸特征参数的过程包含如下步骤:获取被识别人的呼吸数据样本;根据呼吸数据样本得到静态呼吸特征向量和动态呼吸特征向量;生成呼吸主形位聚类和子呼吸形位聚类;生成用于识别该人员的呼吸特征参数。下面将对这个过程进行详细描述。

为了提取一个人的呼吸特征参数,首先需要捕捉该人员的呼吸数据样本。一个呼吸数据样本是由呼吸记录装置捕捉的一组呼吸数据帧。这些呼吸数据帧对应于一个人的连续多个呼吸周期,可以用于提取该人员的呼吸特征参数。在本实施例中,某个人的原始的呼吸数据是由某种形式的热红外成像设备得到的,数据的形式为鼻孔部位的温度分布。此处用于获取呼吸数据的设备可以有多种形式,统称为呼吸记录装置。所获得的呼吸数据是在各个采样时刻的鼻子区域的热红外图像,称为呼吸数据帧。后文将对呼吸记录装置和呼吸数据帧进行详细说明。在进行特定人员登记时,可能需要捕捉该人员的多个呼吸数据样本,并对每个样本施行提取呼吸特征参数的处理,以降低单独一个呼吸数据样本的随机性。另外,在进行人员登记时,可能需要捕捉被登记人员以不同模式呼吸时的多个呼吸数据样本,并提取出该人员在不同呼吸模式下所共有的呼吸特征参数,以降低日后识别时对于呼吸模式的依赖。

此后,对该人员的呼吸数据样本进行处理。数据处理过程可能涉及到同一个人员的一个或多个呼吸数据样本。同时处理同一个人员的多个呼吸数据样本,将改善对于该人员的识别性能,因为这将提取出多组呼吸特征参数,而多组呼吸特征参数可以更加完整准确地反映该人员的呼吸特征。但是,即使是只有一个呼吸数据样本,本系统也仍然能够完成人员的登记或识别。另外,对于单独一个呼吸数据样本的处理,是对多个呼吸数据样本进行处理的基础。因此,这里将重点介绍在只有一个呼吸数据样本时的处理。

对于来自某个人员的一个呼吸数据样本,为其中每个呼吸数据帧提取一个静态呼吸参数向量和一个动态呼吸参数向量。所得到的每个静态呼吸参数向量包含多个静态呼吸参数,每个动态呼吸参数向量包含多个动态呼吸参数。在一个例子中,上述的静态呼吸参数可能包括:左侧鼻翼的温度、右侧鼻翼的温度、左侧鼻唇沟的温度、右侧鼻唇沟的温度、鼻小柱的温度、鼻尖的温度、鼻梁下半部分的温度、当前环境的空气温度等。上述的动态呼吸参数可能包括但不限于:左鼻孔出现温度最低值(或最高值)的频率、左鼻孔的最低温度、左鼻孔的最高温度、右鼻孔出现温度最低值(或最高值)的频率、右鼻孔的最低温度、右鼻孔的最高温度、左鼻孔的最大低温区域的紧密度(圆度)、右鼻孔的最大低温区域的紧密度(圆度)、左鼻孔低温区域(最大时的)宽度与鼻小柱宽度之比、右鼻孔低温区域(最大时的)宽度与鼻小柱宽度之比、左右两侧鼻孔达到最高温度(最低温度)的时间差等。在一个呼吸数据样本中,所有静态呼吸参数向量和动态呼吸参数向量的分布呈现出一定的随机性,可以看作是在高维空间中的具有一定概率分布特性的点云。

此后,基于某个预定的聚类方法,对该呼吸数据样本的所有动态呼吸参数向量进行聚类分析,形成多个呼吸形位聚类,其中每个呼吸形位聚类对应于预定要识别的一个呼吸形位。如前所述,一个呼吸形位代表着鼻孔部位的热红外图像的一种特殊的状态,进而反映呼吸周期中的一个特定阶段。通过对一个呼吸数据样本中的所有动态呼吸参数向量进行聚类分析,可以实现对呼吸特征的概括,并从中提取出该人员的呼吸的固有特征。聚类完成后,所有的动态呼吸参数向量被划分成若干个预定义的呼吸形位聚类。这些呼吸形位互不交叉,即每个动态呼吸参数向量都属于且只属于一种呼吸形位聚类。呼吸形位的划分,提供了一个对呼吸的动态过程的基本描述。

如前所述,一个呼吸形位可能由多个子呼吸形位组成。因此,对属于一个呼吸数据样本中的所有呼吸形位聚类都进行如下操作:基于一个预定的聚类方法,对每个呼吸形位聚类中的所有动态呼吸参数向量再次进行聚类分析,形成多个子呼吸形位聚类,其中每个子呼吸形位聚类对应于预定要识别的一个子呼吸形位。这样,属于某种呼吸形位的一个动态呼吸参数向量,进一步属于某个子呼吸形位。将每种呼吸形位细分为子呼吸形位后,得到对人员呼吸的特征的更加精细的描述。对于上述的呼吸形位聚类,取下方中间的一个呼吸形位聚类并做进一步聚类分析,得到若干的子呼吸形位聚类。

此后,基于呼吸形位和子呼吸形位的统计特征,确定待识别人员的一组呼吸特征参数。该组呼吸特征参数包含如下指标:每个子呼吸形位聚类所包含的所有动态呼吸参数向量的中心,以及每个呼吸形位聚类所包含的所有静态呼吸参数向量的均值。以这种方式得到的呼吸特征参数是因人而异的,且对同一个人而言具有内在的稳定性。

在本实施例中,完整的人员识别过程分为登记和识别两个阶段。这两个阶段分别是在系统中增加新的人员信息,以及将待识别人员的呼吸特征参数与系统中已有信息进行对比的过程。

在登记阶段,系统按照上述的流程采集某个人员的一个或多个呼吸数据样本,然后从中提取对应的呼吸特征参数,进而基于这些呼吸特征参数生成该人员的模型。模型即呼吸特征的某种形式的表示。根据系统采用的识别方式不同,系统中的模型可能是显式的或隐式的。相应地,系统的模型库也可能是显式的或隐式的(系统中多个被登记人员的模型构成模型库)。显式模型和隐式模型相比,在保持相同的响应速度时,显式模型要求的计算能力要远大于隐式模型,因此本系统更倾斜于采用隐式的识别方式。一种隐式的识别方式为使用某个分类器(例如一个基于神经网络的分类器,属于计算机科学中的公知技术,参见[模式分类].(美)Richard O.Duda等著,李宏东等译.2003.机械工业出版社.p230-p283)来识别实时采集的呼吸特征参数。此时,一个人的模型可能体现为分类器的一组权值,设置了该组权值的分类器,能在身份正确时给出很高的输出值,而在身份错误时给出低的输出值。上述权值可能是通过使用属于多个人的多组呼吸特征参数对该分类器加以训练得到的,其中每个人至少有一组呼吸特征参数。训练过程可能涉及到新加入的呼吸特征参数,以及系统中已有的呼吸特征参数。训练的目标是使分类器对于来自不同人员的呼吸特征参数具有良好的区分能力,例如对于来自人员A的呼吸特征参数,分类器将在人员A的类别处给出较高的输出值,在人员B处给出较低的输出值,而对于来自人员B的呼吸特征参数,分类器则给出正好相反的结果。训练的过程可能涉及到各种方法,例如基础的反向传播算法、径向基函数、匹配滤波器、深度学习等。训练好的分类器将用于在日后识别该人员。

在登记阶段,为了改善识别效果,有时需要使用属于同一个人员的多组呼吸特征参数来训练上述的分类器。其原因在于,由于噪声的存在,即使是由同一个呼吸记录装置所获得的同一个人的不同的呼吸数据样本,所获得的呼吸特征参数也可能存在一定的差异。这样的差异可能降低人员识别的性能。而(根据来自同一个人的多个呼吸数据样本得到的)多组呼吸特征参数则更加准确完整地反映一个人的本质的呼吸特征,以这样的多组呼吸特征参数来完成上述的分类器训练,可以减弱噪声的影响,得到充分反映一个人的个性呼吸特征的模型。

系统的识别过程包含如下步骤:采集待识别人员的一个呼吸数据样本,并基于该呼吸数据样本提取该人员的呼吸特征参数;将新获得的呼吸特征参数与系统中已有的模型(一般是多个)进行对比,得到对应于每个模型的定量化的符合程度;然后基于这些符合程度,由某个决策逻辑进行判决分析,决定被识别人员的身份。判决分析的基本原则,是计算结果中符合程度高的模型,更可能是真实的身份。当使用分类器进行识别时,首先将来自某个人员的呼吸特征参数输入已经训练好的分类器,该分类器对系统中已有的人员身份都产生一个定量化的响应值,并且对应正确人员身份的响应值,要高于对其他身份的响应值。

这里的识别具有鉴别和确认两种形式:鉴别是指在对被识别人的身份没有任何假设的情况下识别其身份,这种识别方式需要检查新获得的呼吸特征参数与系统中所有模型的符合情况,并以符合程度最高的模型为鉴别结果。而确认则是指先由要识别的人员做身份声明,然后系统获取该人员的呼吸特征参数,并检查其与所声称的模型的符合情况,如果符合程度高于某个阈值,则认为该人员具有所声称的身份。通常而言,鉴别对识别系统的要求较高。

在识别中,系统的决策根据系统进行的测试种类而有所不同:在闭集测试中,被识别人员一定是已经在系统中登记,即系统默认不会有冒名者,只需要找出模型库中与当前人最相似的人作为识别的结果;而在开集测试中,说话人可能未在系统中登记,即不排除有人冒名的可能性,系统不仅要找出模型库中与之最相似的人,还要考察这个相似程度,以判断说话人是否是冒名者。

本实施例中的基于呼吸的人员识别方法具有如下优点:一个人的呼吸特征参数反映的是一个人的呼吸的本质特征,这些特征独立于具体的呼吸模式,且不随外界环境和该人员的暂时性生理反应而变化,因此本识别方法的鲁棒性强。另外,在本系统中,人员的呼吸状态是基于鼻子部位的热红外图像获得的,而采集热红外图像无需人与设备的直接接触,可以在相对较远的距离进行,因此识别过程对于被识别人的干扰较小。

本实施例中的人员识别系统可以基于不同的计算设备(任意数量)、传输环境和/或配置实现。其中的计算设备可以是笔记本电脑、桌面电脑、工作站、大型机、服务器、平板电脑、智能手机、智能家电等。系统根据人员的呼吸特征,对其进行识别。

系统中包括一个呼吸记录装置。对于处于其视野中的人员,呼吸记录装置捕捉其一个或多个呼吸数据样本。其中每个呼吸数据样本都包含一定数量的呼吸数据帧,涵盖一个人员在连续多个呼吸周期中的鼻子部位的温度变化过程。由呼吸记录装置捕捉的呼吸数据样本,将由系统进行处理。这里所说的呼吸记录装置可以有多种实现方式,但不同实现方式所得到的结果是一样的,得到呼吸数据帧。

上述呼吸记录装置的第一个实现,为一台热红外成像设备。由该设备采集位于其正前方的一个静止的人员的呼吸数据,进而识别该人员。通过调整该热红外成像设备的位置、朝向和焦距,可以使其以预定的角度捕捉到该人员的鼻子,且使得图像中的鼻子具有较高的分辨率。识别的过程包含如下步骤:第一步,由某种初始化装置和/或电脑中的初始化例程,启动该热红外成像装置的连续图像采集,所采集的图像中包含了待识别人员的鼻子。该初始化装置或例程具备低耗电或CPU占用率低的特征,可以持续不间断地运行;第二步,在所有热红外图像中,确定人员的鼻子区域,并将图像裁剪到该区域,裁剪后的热红外图像即为上述的呼吸数据帧。此后,按照前述的方法,对该人员的所有呼吸数据帧进行处理,最终得到该人员的一组呼吸特征参数,并基于这些特征参数完成人员识别。

在热红外图像中定位鼻子,以及将图像裁剪到该区域的过程,是依靠计算机自动完成的。基本的操作是确定鼻子的状态(位置、大小、朝向等),这可以使用计算机视觉中的目标跟踪技术实现,目标跟踪是计算机视觉领域中的一种基础技术。在热红外图像中跟踪鼻子的过程包含如下步骤:第一步,在第一帧热红外图像中,手动或自动检测到鼻子。对于自动检测鼻子的情况中,系统事先获取大量不同人员的鼻子的热红外图像的样本,并从这些样本中提取出鼻子的一般性特征,进而实现基于该一般性特征的鼻子检测。这里所说的一般性特征,可以是外观结构特征,如鼻孔处的两个近似圆形、鼻翼处的半圆形暗块等,也可以是其他任何合适的特征。第二步,以在第一帧图像中检测到的鼻子的状态作为初始状态,获取鼻子的特征,构造鼻子的描述模型。这里的特征可以是全局特征(例如目标模型、统计直方图、轮廓等,也可以是局部特征(如角点、边缘、Harr特征等)。第三步,在后续的图像中,利用鼻子的描述模型,采用某种方法,如统计滤波或密度估计,来估计鼻子的当前状态,同时利用鼻子的当前状态更新目标模型。如果跟踪过程中鼻子丢失了,则利用检测结果重新定义跟踪的初始状态。在确定各个时刻鼻子的状态的基础上,由计算机自动对热红外图像进行裁剪,得到合格的呼吸数据帧。

在一个实现中,上述人员识别系统包括一个呼吸建模器和一个识别器。系统从呼吸记录装置接收人员的若干个呼吸数据样本,其中每个呼吸数据样本都包含一定数量的呼吸数据帧,涵盖一个人员在连续多个呼吸周期中的鼻子部位的温度变化过程。每个这样的呼吸数据样本都将被提供给呼吸建模器,由呼吸建模器对其进行处理。如前所述,对于每个呼吸数据样本,呼吸建模器将依次完成:呼吸参数向量提取;呼吸形位聚类和子呼吸形位聚类;动态呼吸特征参数和静态呼吸特征参数提取等步骤,最终得到一组呼吸特征参数。对应所有呼吸数据样本的呼吸特征参数最终将提供给识别器。识别器主要有两个功能:在登记阶段,使用上述若干组呼吸特征参数来训练一个分类器,使该分类器具备对已登记人员的良好区分能力;在识别阶段,使用该分类器进行人员识别。

在一个实现中,系统包含处理器。处理器可能是一个或多个微处理器、微机、微控制器、数字信号处理器、中央处理单元、状态机、逻辑电路、和/或任何基于操作指令来操作信号的设备。处理器可以获取存储在存储器中的软件指令,并执行这些指令。

系统包括接口。这里的接口可以是各种基于软件指令的接口或基于硬件的接口。使用这些接口,系统可以与其他设备(服务器、数据源和外部数据仓库等)进行通信。此外,系统可以通过一个通信网络与其他通信设备通信。

系统包含一个存储器。存储器可以连接到处理器。存储器可以是任何计算机可读介质,包括易失性存储器和/或非易失性存储器:前者如静态随机存取存储器(SRAM)和动态随机存取存储器(DRAM);后者如只读存储器(ROM)、可擦只读存储器(EROM)、可擦可编程只读存储器、闪存、硬盘、光盘、磁带等。

系统包括模块和数据。模块和数据,可能被连接到处理器。模块中可能包括用于执行特定任务或实现特定的数据类型的各种例程、程序、对象、组件、数据结构。模块可能基于各种硬件来实现,这些硬件可能包括:信号处理器、状态机、逻辑电路,以及任何根据操作指令操作数据的设备或组件。数据用来存储由模块所获取、接收或生成的数据。

模块可以是硬件,也可以是一组软件指令,或者是硬件和软件的组合。对于模块是硬件的情况,模块被实现为若干计算机、处理器、状态机、逻辑阵列等设备或器件。在模块是软件指令的情况中,模块是一组由某个处理单元执行的一组指令,当该处理单元执行这些指令时,会执行任何所需的功能。上述的软件指令可能存储在各种存储设备中。另外根据需要,软件指令可以通过网络下载。

在一个实现中,模块包括特征提取器、呼吸建模器、识别器和其他模块。这些模块均由系统执行。数据模块包括呼吸数据、提取出的特征数据、聚类数据、分类器数据,以及其他数据。这些数据模块都用于存储来自模块的数据。

下面将描述系统对人员的识别过程,这个识别过程的核心是对呼吸形位和子呼吸形位的聚类分析,以及进而提取出动态呼吸特征参数和静态呼吸特征参数。

如前所述,对于在呼吸记录装置的视野中的人员,呼吸记录装置将捕捉其若干数量的呼吸数据样本。这样的每个样本均包含一定数量的多个呼吸数据帧,涵盖了一个人的连续多个呼吸周期。这些呼吸数据样本将被发送给系统。在一个例子中,呼吸记录装置对人员进行数据捕捉并生成一个呼吸数据样本并提供给系统,该样本中包含3000个呼吸数据帧。这些呼吸数据帧可以表示为f1、f2、f3、…、f3000。由系统将对这些呼吸数据帧作进一步的处理。

在系统收到该呼吸数据样本后,特征提取器212将对该样本中所有的呼吸数据帧进行处理,从每个呼吸数据帧中提取一个静态呼吸参数向量和一个动态呼吸参数向量。每一帧中的静态呼吸参数向量包含多个静态呼吸参数,动态呼吸参数向量包含多个动态呼吸参数。鼻子温度数据、静态呼吸参数向量、动态呼吸参数向量,分别被存储在鼻子温度及呼吸参数数据216中。

在一个例子中,一个静态呼吸参数向量包含个静态呼吸参数,记为[ds1 … ds12];一个动态呼吸参数向量包含14个动态呼吸参数,记为[df1 … df14]。这样,对于上述的样本中的3000个呼吸数据帧(从f1到f3000),有3000个静态呼吸参数向量和3000个动态呼吸参数向量。可以将所有的这些静态呼吸参数向量和动态呼吸参数向量表示为一个二维矩阵,其秩为[3000 x(14 + 12)]。

下面介绍呼吸形位和子呼吸形位的建模过程。由呼吸建模器对由呼吸数据样本所得到的所有动态呼吸参数向量进行聚类分析,形成多个呼吸形位聚类,其中的呼吸形位聚类的数量的可能范围是从2到10。

在一个例子中,需要识别的呼吸形位的数量是3。呼吸建模器,对于f1到f3000帧的所有动态呼吸参数向量,执行K均值聚类算法,创建3个聚类。对于多维空间中的所有的动态呼吸参数向量,呼吸建模器110随机选择三个动态呼吸参数向量(VA、VB、VC)作为初始聚类中心,并计算其他动态呼吸参数向量与VA、VB、VC的欧氏距离D(Vi,VA)、D(Vi,VB)、D(Vi,VC),其计算方法为D(Vi,V’k)=(Σ(Vij-V’kj)^2)^0.5,其中Vi表示待分类的某个动态呼吸参数向量(i=1,…3000),V’k为某个初始聚类中心(k=1,2,3),Vij表示Vi的第j个维度的分量(j=1,…14),V’kj表示V’k的第j个维度的分量(j=1,…14)。所有的欧氏距离计算完毕后,围绕三个初始聚类中心创建聚类,即对于每个待分类的动态呼吸参数向量Vi,寻找与其距离最近的初始聚类中心,并将Vi划分为属于该初始聚类中心对应的类。在初始的划分完成后,所有的动态呼吸参数向量被分为三个聚类。此后,呼吸建模器110计算每个聚类的所有动态呼吸特征向量的均值中心Mk,其计算方法为Mk=(ΣVi)/Nk,其中Vi为第k个聚类中所含有的某个动态呼吸参数向量(i=1,…Nk),Nk为第k个聚类中的动态呼吸参数向量的总数(k=1,2,3)。三个初始聚类中心V’k,被替换为计算出的三个均值。在修改了聚类中心之后,呼吸建模器110围绕三个修改后的聚类中心再次创建聚类。按照上述方式,呼吸建模器110不断修改三个聚类中心,并围绕修改后的聚类中心创建修改后的聚类,直到聚类中心不再改变为止。以此方法将得到三个聚类,每个聚类对应一个可以识别出来的呼吸形位。同时,每个聚类中都含有若干个点,这些点都代表着被分开的动态呼吸参数向量。

为了更精细的描述人员104的呼吸情况,进一步由呼吸建模器对每个呼吸形位聚类再次进行聚类分析,最终在每个呼吸形位聚类中形成多个子呼吸形位聚类。在一个实现中,子呼吸形位的数量的可能范围是从2到10。

在一个例子中,要识别的子呼吸形位的数量是8。对于每个呼吸形位聚类,呼吸建模器都对其中的动态呼吸参数向量执行 K均值聚类算法,以创建8个子聚类。这样,对于3个呼吸形位聚类,共得到24个子呼吸形位聚类。所得到的每个子聚类,都对应于一个可以在某个呼吸形位中识别出来的子呼吸形位。同时,每个子聚类中都包含了一定数量的动态呼吸参数向量。

上述的呼吸形位聚类和子呼吸形位聚类过程可以使用任何聚类方法,包括但不限于:K均值聚类方法、模糊C均值聚类方法。与上述呼吸形位聚类和子呼吸形位聚类相关的数据,被存储在聚类数据中。

在创建了聚类和和子聚类之后,由呼吸建模器确定待识别人员的一组呼吸特征参数。其具体方法为:对于上述的每个子呼吸形位聚类,计算其包含的所有动态呼吸参数向量的中心。一个子呼吸形位聚类的中心,可以表示成一个14维的向量,设为VDij,其中i为该向量所属的呼吸形位聚类的编号,j为该向量所属子呼吸形位聚类在本呼吸形位聚类的编号。因此,如果一个呼吸形位聚类中有8个子呼吸形位聚类,则这些子呼吸形位聚类的中心,可以表示成一个[8 x 14]的二维矩阵,设为WDi,其中i为该呼吸形位聚类的编号。WDi由8个向量组成,即[VDi1 VDi2 … VDi8],WDi即为对应第i个呼吸形位的动态呼吸特征参数。另外,由呼吸建模器计算每个呼吸形位聚类中的静态呼吸参数向量的均值。对于每个呼吸形位聚类,其均值可以表示成一个12维的向量,设为VSi,其中i为该呼吸形位聚类的编号。VSi即为对应第i个呼吸形位的静态呼吸特征参数。为每个呼吸形位聚类计算这个均值,然后将其附加到该聚类的动态呼吸参数向量VDi中。这给出对应于每个呼吸形位聚类的数据集,它可以表示为一个二维矩阵,设为Wi,其中i为该呼吸形位聚类的编号。可知Wi的秩为[8x(14 + 12)]。进一步,假设一个人员有3个呼吸形位聚类,则该人员的完整的呼吸数据集可以表示成一个二维矩阵,其秩为[3 x 8 x(14 + 12)],即[24 x 26]。这个数据集包含了对应该呼吸数据样本的动态呼吸特征参数和静态呼吸特征参数,称为呼吸特征参数。一般来说,一组完整的呼吸特征参数可以表示成一个二维矩阵,其秩为[(要被识别的呼吸形位的数量)x(在一个呼吸形位中要被识别的子呼吸形位数量)x(静态呼吸参数向量中的参数总数+动态呼吸参数向量中的参数总数)]。与呼吸特征数据相关的数据,被存储在特征分类器数据中。

综上所述,呼吸建模器110获取呼吸特征参数的方法包括:对于由特征提取器提供的动态呼吸参数向量进行聚类分析,创建预定数量的呼吸形位聚类;针对每个呼吸形位聚类,对于其中的所有动态呼吸参数向量再次进行聚类分析,形成预定数量的子呼吸形位聚类;为该呼吸数据样本计算如下指标,来确定对应该样本的呼吸特征参数:每个子呼吸形位聚类的所有动态呼吸参数向量的中心(用于生成动态呼吸特征参数),以及每个呼吸形位聚类中的静态呼吸参数向量的均值(用于生成静态呼吸特征参数)。如前所述,一个完整的呼吸特征参数是一个二维矩阵,其秩为[(要被识别的呼吸形位的数量)x(在每个呼吸呼吸形位中要被识别的子呼吸形位数量)x(静态呼吸参数向量中的参数总数+动态呼吸参数向量中的参数总数)]。

上述的实现呼吸形位聚类和子呼吸形位聚类的方法,可能是K均值聚类方法、模糊C均值聚类方法,或任何其他聚类方法。

通过对一个待识别人员重复上述的采集呼吸数据样本—提取呼吸参数向量—聚类分析—提取呼吸特征参数的过程,可以获得该人员的多组呼吸特征参数,它们都反映了该人员的个性呼吸特征。提取多组呼吸特征参数的意义在于:任何数据采集过程都无法完全避免噪声的影响,本系统的获取呼吸特征参数的过程也不例外。如果只依靠一个人的单独一组呼吸特征参数来生成用于表征某个人员的模型,则模型中呼吸特征参数生成过程中的噪声的影响可能比较明显,而依靠一个人的多组呼吸特征参数来生成该人员的模型的话,则生成的模型能更好地消除噪声和偶然因素,具有更好的代表性和稳定性,进而提升识别系统的性能。

在呼吸建模器为一个待识别的人员确定了一组或多组呼吸特征参数之后,由识别器112基于这些呼吸特征参数训练一个分类器,以使该分类器对已登记的人员具备良好的区分能力。完成训练即意味着完成了对该人员的登记,此后识别器可以使用该分类器来实时的识别该人员。该分类器可能包括一个有监督学习算法,如支持向量机(SVM)分类器、贝叶斯估计、决策树、神经网络等。对于多个人员的登记,按照上述流程依次进行。

一旦完成了对一个人员的登记,系统可以在之后任何时间对其进行识别。本系统中人员的现场实时识别是由识别器112(根据待识别人员的呼吸特征参数)进行的。提取待识别人员呼吸特征参数的过程包括如下步骤:由呼吸记录装置记录待识别人员的一个呼吸数据样本;由特征提取器212提取该呼吸数据样本的静态呼吸参数和动态呼吸参数;由呼吸建模器110获取该呼吸数据样本的一组呼吸特征参数;最后将这组呼吸特征参数输入识别器112,由其来计算提取到的呼吸特征参数与数据库中各个已有模型的符合程度。

本发明的一个应用场景为对车辆司机的自动识别。具体实施办法为:在汽车的特定位置(例如挡风玻璃的下方)安装有若干个热红外成像设备,作为呼吸记录装置。通过事先调整上述一个(或多个)热红外成像设备的位置和焦距,使得该热红外成像装置能够采集到正站立于车前方特定位置的人的鼻子部位。识别系统中的处理器中存在一个初始化例程,该初始化例程可能是基于上述的热红外成像设备工作,其原理是监测环境中的温度分布,当温度分布符合一定条件(例如存在大面积的较高温度的区域,诸如人脸的温度)时,初始化例程认为检测到了一个人,此时热红外成像设备启动目标(鼻子)检测,并进行后续的识别工作。例如,当一个人想要对车解锁时,首先走到预定的位置,面向上述热红外成像设备站立。初始化例程会检测到人员的存在,并启动热红外成像设备,获取一段时间的多个连续的热红外图像,其中包含了待识别人的鼻子区域。然后,系统自动对这些热红外图像进行处理,提取呼吸特征,进而将提取出的特征与数据库中保存的多个呼吸特征模型进行比对。找出比对的符合程度最高的一个模型,可以确定当前驾驶座椅上的人员的身份。以这种方式,可以避免以可见光图像进行人脸识别时受光照影响大的问题。另外,可以有效规避以可见光方式进行人脸识别的潜在风险。在人员识别完成之后,可以进行若干智能化的操作,例如自动汽车解锁或自动座椅调节等。

本实施例的另一个应用场景是手机用户识别。具体实施方法为:在手机的屏幕一侧的上端或下端,安装一个小型热红外成像设备。通过事先调整上述热红外成像设备的位置和焦距,使得该热红外成像装置能够采集到持握手机的人员的鼻子部位。当一个人想要对手机进行解锁时,需要采集包含一段时间的呼吸情况的热红外图像。然后,系统自动对这些热红外图像进行处理,提取呼吸特征,进而将提取出的呼吸特征与数据库中的模型进行比对。比对的符合程度最高的模型,可能被确定为当前人员的身份。以这种方式,可以避免以可见光图像进行人脸识别时受光照影像大的问题,还可以有效规避以可见光方式进行人脸识别的潜在风险。

需要注意,上面的对人员识别系统和相关方法的描述,只是相关基本原理的具体实现,这里描述的特征或方法,并不对本发明产生限制。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1