非接触式声纹与掌纹掌静脉的多模态身份识别系统和方法

文档序号:31808505发布日期:2022-10-14 20:48阅读:51来源:国知局
非接触式声纹与掌纹掌静脉的多模态身份识别系统和方法

1.本发明涉及生物特征识别技术领域,特别一种非接触式声纹与掌纹掌静脉的多模态身份识别系统和方法。


背景技术:

2.随着全球信息产业化的迅猛发展,如何在数字化环境中进行快速、准确、安全的身份识别和验证,是近年来备受关注的热点话题。传统的身份认证容易出现丢失、遗忘、伪造的情况,使得生物特征识别技术受到越来越多的关注。生物特征识别是通过采集人体的生理特征和行为特征,在经过系统的处理后对身份信息的真实性进行鉴别的过程[1]。目前比较成熟或者应用广泛的生物特征识别技术有人脸、语音、指纹、虹膜、指静脉、dna、签名、步态等[2,3,4]。但单模态生物特征识别由于传感器噪声、特征提取或者匹配方法的不适合而导致准确率下降,也可能因为特征被伪造而存在安全性问题,例如,假指模纹。进而,多模态生物识别进入人们的视线。对于同一个对象的不同的描述方式或者视角称为模态,而多模态表征是使用来自多个这样的实体信息来共同实现对特定任务的表征[3]。一般多模态生物识别系统是在不同的层次上融合两种或两种以上的生物特征,可以分为传感器层、特征层、分数层和决策层[5,6,7]。多模态融合认证的研究难点是如何有效的对多源异构数据特征的进行采集、提取、比对。
[0003]
表征学习技术是指根据任务将原始复杂的数据分布转换成机器可以有效识别和应用的一种技术集合,即从数据中抽取有用信息从而学习到数据表征,从而大大提高算法模型的有效性和预测器的准确度。基于多模态数据环境下的表征学习技术研究,使得表征学习能够建立处理和关联多种模式信息的模型,进行多模态信息融合,从而提高身份认证的准确率以及安全性。多模态表征学习的目标是从多种异质模态的数据中提取数据对象(用户)的表征,一个典型的方法是将各个模态的独立表征拼接在一起,形成一个联合表征,然后在这个联合表征上进行后续任务的学习[8]。数据表征的融合、统一多个数据源的数据,除了克服数据之间的异构性,还可以从多个数据源中汲取互补的信息,从而使融合后的表征拥有着比单模态下更丰富、更有效的信息。
[0004]
现有技术一
[0005]
指纹识别就是利用手指末端正表面皮肤上的凹凸不平的纹路特征来进行身份识别,指纹具有唯一性和稳定性,通过指纹和数据库中预先保存的指纹进行比较,从而实现真实身份的验证。在各种生物特征身份识别技术中,指纹识别仍然是最成熟的身份识别技术,指纹鉴定在很多国家已被官方接受,成为司法部门用于鉴别身份的一种有效手段,并且在许多其他行业领域中也得到了广泛的应用,指纹识别已经成为生物鉴定的代名词以及事实上的标准。指纹识别技术主要涉及指纹图像采集、指纹图像预处理、指纹特征提取、指纹图像数据库的建立、指纹特征值的比对与匹配等过程。经过有关人员多年的研究,目前已经产生了多种多样的指纹识别方法,其中最成熟、应用最广泛的是基于细节点的指纹识别方法。实验室中采用的图像是利用实验室现有装置完成采集的,具体内容包括:

指纹图像方向
图的获取;

指纹图像的分割;

指纹图像增强;

指纹图像的二值化及其后处理;

指纹图像的细化;

指纹图像的特征提取;

指纹图像的匹配。
[0006]
现有技术一的缺点
[0007]

对环境要求高,对手指的湿度、清洁度很敏感,脏、油水都会造成识别不了或影响识别结果;
[0008]

对于有伤痕、蜕皮等低质量指纹存在识别困难、识别率低的问题;
[0009]

指纹识别时的操作规范要求较高;
[0010]

设备上可能会残留指纹印痕,而这些痕迹存在被用来复制指纹的可能性。
[0011]
现有技术二
[0012]
掌纹掌静脉融合识别技术属于多模态识别技术的一种,相比与其他的生物识别技术,掌纹和掌静脉融合识别有着较高的识别精度、便捷性和稳定性,有助于提高人们生活的便捷性并在一定程度上提高了个人信息的安全性。
[0013]
掌纹、掌静脉纹路不随年龄变化,掌纹特征识别具有纹理特征丰富、用户易于接受、安全稳定性较高等优点。
[0014]
现有技术二的缺点
[0015]
(1)手掌静脉与掌纹图像采集环境的影响。掌静脉的采集主要有接触式采集和非接触式采集,无论利用哪种采集方式,采集过程都会受到光照、采集背景和温度等因素的影响。
[0016]
(2)掌静脉关键区域定位分割的影响。为获取静脉特征丰富的区域,需对手掌感兴趣区域(roi)图像定位分割,研究人员一般采用香港理工大学数据库的掌静脉图像进行静脉识别研究,库中的掌静脉图像由于采集时需要固定手掌而在中指与无名指之间的指谷位置安装了硬件设备,从而使掌静脉roi图像难以定位分割。由于缺乏适宜的roi定位分割方法,导致特征提取的准确性较低,识别率不高。
[0017]
(3)手掌静脉与掌纹互相干扰。掌静脉图像带有掌纹,现有的算法仍然不能够完全去除掌纹的干扰,如利用模糊阈值判定以及全局灰度值匹配提高算法的鲁棒性,但没有更好地去除掌纹的干扰,使掌静脉的识别效果不佳。
[0018]
(4)非接触的采集方式主要存在掌纹样本图像的位置偏移、距离漂移、图像失焦、亮度波动等几个方面的问题。对于掌纹识别的防伪冒来说,主要存在硅胶假体、掌纹膜等仿冒手段。这些因素是非接触掌纹识别系统的精度低于接触式掌纹识别系统精度的主要原因,也是限制非接触掌纹识别系统投入实用的主要原因。
[0019]
参考文献
[0020]
[1]刘倩颖,刘季.生物特征识别技术在身份验证领域发展趋势[j].电子世界,2020(05):23-24;
[0021]
[2]谢璐,俞飞.基于多模态生物识别的安全身份认证技术[j].保密科学技术,2016(01):36-40;
[0022]
[3]周晨怡.基于融合算法和深度学习的多模态生物特征识别研究[d].南方医科大学,2020;
[0023]
[4]张露,王华彬,陶亮,周健.基于分类距离分数的自适应多模态生物特征融合[j].计算机研究与发展,2018,第55卷(1):151-162;
[0024]
[5]马茹茹.基于指纹和心电信号的双模态身份认证研究[d].天津理工大学,2021;
[0025]
[6]张岳.多模态生物特征识别技术的算法研究[d].长春工业大学,2017;
[0026]
[7]丁璇.多模态生物特征识别技术及其标准化动态[j].电脑知识与技术,2017,第13卷(36):153-154;
[0027]
[8]蹇松雷,卢凯.复杂异构数据的表征学习综述[j].计算机科学,2020,47(02):1-9。


技术实现要素:

[0028]
本发明针对现有技术的缺陷,提供了一种非接触式声纹与掌纹掌静脉的多模态身份识别系统和方法。将以基于智能数据表征理论的多模态身份认证为核心内容,把相关技术融合在网络安全场景中,是具有较高安全性、方便性、可靠性的身份认证多模态生物特征识别方法。
[0029]
为了实现以上发明目的,本发明采取的技术方案如下:
[0030]
一种非接触式声纹与掌纹掌静脉的多模态身份识别系统,包括:供电模块、固定波长红外led光源模块、图像采集ccd模块、语音采集模块、存储模块和多模态身份识别模块;
[0031]
供电模块:用于对整个多模态身份识别系统供电
[0032]
固定波长红外led光源模块:通过红外led光源照射人体手部,协助图像采集ccd模块进行人体掌纹、掌静脉信息特征的采集;
[0033]
图像采集ccd模块:进行人体掌纹、掌静脉信息特征的采集;
[0034]
语音采集模块:利用mfcc特征提取语音信息;
[0035]
存储模块:用于存储语音采集模块和图像采集ccd模块采集的数据。
[0036]
多模态身份识别模块:通过图片预处理,图片特征提取,特征融合比对,输出结果。
[0037]
一种非接触式声纹与掌纹掌静脉的多模态身份识别方法,包括:
[0038]
步骤1,图像预处理;预处理主要包括三个步骤,首先是采用低通滤波对红外采集手掌图像进行去噪,其次是图像增强部分通过sauvola算法提取出手掌区域的二值图形,最后是roi定位部分先将掌纹和掌静脉进行灰度变换,使手掌边缘突出,再将canny算子用于检测手掌边缘,最后对图像进行裁剪,得到感兴趣的手掌区域图像。
[0039]
步骤2,特征提取;特征提取分为两个部分,第一部分为提取语音特征,第二部分为提取掌纹、掌静脉两个手部特征。采用resnet作为主体结构,引入se模块,构建出se-resnet网络结构,将预处理的图片输入至se-resnet网络结构,通过加入一个全局池化层来生成特征分布,并以此完成信息编码的提取。为了获得各通道之间的相关性,结合了relu激活函数和sigmoid门控制机制来完成特征的重标定。
[0040]
步骤3,特征融合;采用多层特征融合机制,通过分解双线性模型进行融合获取手部和音频不同模态之间的相互作用,将成对的音频、手部特征输入融合模型,在全连接层上通过softmax输出最终结果。
[0041]
步骤4,特征比对;利用改进的fast角点检测算法初步提取的特征点利用shi-tomasi算法计算每点的角点响应函数,根据角点响应函数取前n个响应值最大的点确定为特征点。筛选出的特征点的周围至少存在2个不同方向的强边界。对于二进制特征描述向量
的匹配,采用汉明距离作为描述符之间的相似性度量。
[0042]
步骤5,输出交互。采用联合判别稀疏编码算法判断三个模态的模内样本特征点,使类内的距离最小,同时使类间的距离最大;根据实际场景要求,设定适合的阈值,如果两个匹配的样本属于相同的类且在声纹、掌纹和掌静脉都匹配成功,则界面显示认证成功,否则提示认证失败。
[0043]
进一步地,步骤2具体为:对于任意给定的信息进入网络模块后进行如式(1)所示的转换:
[0044][0045]
x是输入的图片,u是提取的特征。
[0046]
se将全局空间信息压缩成一个通道描述符,通道描述符含了通道维度上特征响应的全局分布情况,利用全局平均池化层得到一个通道维度上的统计数据。统计值是由式(2)压缩具有空间维度h
×
w的u得到的:
[0047][0048]
变换输出u被解释为一个局部描述符的集合,通道描述符的统计信息可以表达整幅图像。
[0049]
利用压缩操作得到的聚合信息,完整捕获通道维度上的依赖性。选择了一个带有sigmoid激活函数的简单的门限机制(3):
[0050]
s=f
ex
(z,w)=σ(g(z,w))=σ(w2δ(w1z))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0051]
式中,δ表示relu激活函数,和
[0052]
为了限制模型的复杂度和帮助模型泛化,把非线性周围的两个全连接层(fc)组成瓶颈(bottleneck)结构来参数化门限机制,块的最终输出是使用激活函数式(4)重新缩放变换输出u得到的:
[0053][0054]
式中,f
scale(
uc,sc)表示特征图和标量sc的对应通道的乘积。s这个激活函数的作用是根据输入特征的描述符z来给每个通道赋予权重。
[0055]
进一步地,步骤3具体如下:
[0056]
分解双线性模型通过线性变换考虑每个特征对:
[0057]
zi=x
t
wiy+biꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
[0058]
其中x∈rn和y∈rm是来自手部和音频不同模态的输入特征向量,wi是权重矩阵,bi是偏置量。
[0059]
将权重矩阵wi分解为两个低阶矩阵,即其中wi=u
ivit
,其中ui∈rn×d和vi∈rm×d对维度d施加约束d≤min(n,m)。公式(5)可以进一步改写为:
[0060]
zi=x
tuivit
y+biꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)
[0061]
捕获两种异构模式之间的固有相关性,公式(7):
[0062]
[0063]
其中1∈rd表示1的列向量,而表示hadamard或逐元素乘积。
[0064]
为了获得输出特征向量z,需要两个三阶张量:u=[u1,

,uo]∈rn×d×o和v=[v1,

,vo]∈rm×d×o。用线性投影p∈rd×o替换列向量,向量z表示为:
[0065][0066]
其中b∈ro是偏差矢量。
[0067]
在每个线性映射之后添加非线性激活函数,向量z进一步表示为:
[0068][0069]
其中σ表示任意非线性激活函数,设x和y分别代表手部注意向量和音频特征向量,则x的值都大于0,而y在[-1,1]的范围内。
[0070]
进一步添加relu函数以规范网络的输出,最终向量z可以表示为:
[0071][0072]
将成对的音频、手部特征输入融合模型,在全连接层上通过softmax输出最终结果。
[0073]
进一步地,步骤4具体如下:
[0074]
采用了改进后的fast算法,具体改进为:取一个像素点p周围24个像素点为检测模板,p点的灰度值为ip,设定阈值t,如果24个像素点中有连续14个像素点的灰度值大于ip+t或小于ip-t,则p为角点。
[0075]
使用shi-tomasi算法进行特征点的优选,shi-tomasi算法取两个特征值中较小的一个同给定的最小阈值比较,若大于最小阈值,则会得到强角点。
[0076]
shi-tomasi算法通过计算局部小窗口w(x,y)在各个方向移动后的灰度情况检测角点。将窗口平移[u,v]产生灰度变化e[u,v]为
[0077][0078]
式中m为2
×
2的自相关矩阵,由图像的导数计算
[0079][0080]
对矩阵m的两个特征中λ
max
和λ
min
进行分析,因为曲率较大的不确定度取决于小的角点,定义角点响应函数为λ
min
。对于利用改进的fast角点检测算法初步提取的特征点利用shi-tomasi算法计算每点的角点响应函数λ
min
,根据λ
min
取前n个响应值最大的点确定为特征点。筛选出的特征点的周围至少存在2个不同方向的强边界,这样的特征点易于识别且稳定。
[0081]
对于二进制特征描述向量的匹配,采用汉明距离作为描述符之间的相似性度量。设描述符的两个特征向量为f1,f2,则f1,f2的汉明距离为:
[0082][0083]
通过确定汉明距离的阈值,判断特征向量是否匹配。
[0084]
进一步地,步骤5具体如下:
[0085]
联合判别稀疏编码算法具体如下:给定三种模态的特征矩阵x、y和z,联合学习三
个投影矩阵px、py和pz,将三个峰值特征映射到稀疏矩阵vx∈rd
×
n、vy∈rd
×
n和vz∈rd
×
n,可以精确地逼近原始矩阵x、y、z,如vx≈pxx、vy≈pyy、vz≈pzz。
[0086]
由三种模态得到特征表示vx、vy、vz后,将其量化为
[0087]cx
=sgn(v
x
);cy=sgn(vy);c
x
=sgn(v
x
);
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(13)
[0088]
其中sgn()为元级符号函数,得到稀疏二值编码,cx(cy/cy)=[c1,c2,

],cn]∈rl
×
n,ci∈{0,1}l表示学习到的第i类的稀疏二进码,l(=1,2,

,12)为二进码的长度。
[0089]
利用两个投影矩阵对投影特征表示vx和vy施加稀疏性约束来减小投影误差,使用frobenius范数作为代价函数,工程误差可以表示为
[0090][0091]
其中a、b》0,a+b∈(0,1)是平衡三种不同模态的权衡参数。
[0092]
对投影稀疏特征进行了两个约束:1)对于每个模态的模内样本,使类内的距离最小,同时使类间的距离最大;2)对于类内样本,使特征点之间的信息相关性最大,因此距离最小。通过约束使投影稀疏特征具有更强的分辨力和紧凑性。
[0093]
与现有技术相比,本发明的优点在于:
[0094]
(1)采用非接触式的方式采集声纹、掌纹和掌静脉特征,提高了认证的安全性,同时适用于疫情等情况下对卫生环境要求较高的场景。
[0095]
(2)特征提取采用深度学习方式,减少人工提取特征的繁琐,抗噪声干扰能力增强,提高了系统的鲁棒性和可移植性。
[0096]
(3)将声纹识别融入掌纹掌静脉识别中,采用三种模态的特征融合用于身份认证,提高认证的安全性、准确性和鲁棒性。
附图说明
[0097]
图1是本发明实施例多模态身份识别系统架构图;
[0098]
图2是本发明实施例多模态身份识别系统工作流程图;
[0099]
图3是本发明实施例se-resnet网络结构图;
[0100]
图4是本发明实施例多层特征融合模型结构图;
[0101]
图5是本发明实施例特征匹配流程图。
具体实施方式
[0102]
为使本发明的目的、技术方案及优点更加清楚明白,以下根据附图并列举实施例,对本发明做进一步详细说明。
[0103]
语音、手部多模态信息采集装置是进行人体身份识别的重要装置,其采集原理如图1所示。本系统设计的语音、手部多模态身份识别通过将人体手部放置于红外led光源环境下,利用ccd装置进行人体掌纹、掌静脉信息特征的采集,利用mfcc特征提取语音信息,将提取的语音、手部多模态特征与验证图进行比对,从而达到人体身份识别的目的。
[0104]
本系统整体架构设计如图1所示,主要包括硬件部分和软件部分。其中硬件部分主要用于多模态语音、手部特征信息的采集,软件部分主要用于多模态信息处理识别。系统流程图如图2,硬件部分具体包括供电模块、固定波长红外led光源模块、图像采集ccd模块、语音采集模块以及存储模块;软件部分包括图像预处理、特征提取算法、特征融合比对及用户
交互界面。
[0105]
特征提取分为两个部分,第一部分为提取语音特征,第二部分为提取掌纹、掌静脉两个手部特征。本发明采用resnet作为主体结构,在此基础上引入se模块,构建出se-resnet网络结构,如图3所示。通过加入一个全局池化层来生成特征分布,并以此完成信息编码的提取。为了获得各通道之间的相关性,结合了relu激活函数和sigmoid门控制机制来完成特征的重标定。另外,为了简化模型参数的复杂性,还在relu函数的两端分别采用了1
×
1的全连接层。
[0106]
se(squeeze-and-excitation networks)模块是一个可由任意给定的变换组成的计算单元,对于任意给定的信息进入网络模块后进行如(1)所示的转换:
[0107][0108]
x是输入的图片,u是提取的特征。为了使较低级别层也可以获得来自网络的全局感受野的信息,se将全局空间信息压缩成一个通道描述符,这个描述符包含了通道维度上特征响应的全局分布情况,利用全局平均池化层得到一个通道维度上的统计数据。统计值是由(2)压缩具有空间维度h
×
w的u得到的:
[0109][0110]
变换输出u可以被解释为一个局部描述符的集合,这些描述符的统计信息可以表达整幅图像。为了能够利用压缩操作得到的聚合信息,下一步的目标是完整捕获通道维度上的依赖性。选择了一个带有sigmoid激活函数的简单的门限机制(3):
[0111]
s=f
ex
(z,w)=σ(g(z,w))=σ(w2δ(w1z))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0112]
式中,δ表示relu激活函数,和为了限制模型的复杂度和帮助模型泛化,把非线性周围的两个全连接层(fc)组成瓶颈(bottleneck)结构来参数化门限机制,例如一个参数为w1的维度降低层,可以把参数量减少r倍,一个relu激活函数和一个参数为w2的维度增加层。块的最终输出是使用激活函数(4)重新缩放变换输出u得到的:
[0113][0114]
式中,f
scale(
uc,sc)表示特征图和标量sc的对应通道的乘积。s这个激活函数的作用是根据输入特征的描述符z来给每个通道赋予权重。
[0115]
多层特征融合机制的技术路线和实施方案
[0116]
一般来说级联或逐元素求和是异构特征融合最常用的方案。由于音频和手部特征的分布通常会发生很大变化,并且它们的特征尺寸大小通常会有所不同,因此这些简单的融合方案的表示能力可能不足以实现可靠的说话人命名性能。通过分解双线性模型(factorized bilinear model,fbm)进行融合能够更好地获取两种不同模态之间的相互作用,并且通常优于简单的融合方法(例如串联),如图4所示。
[0117]
分解双线性模型通过线性变换考虑每个特征对:
[0118]
zi=x
t
wiy+biꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
[0119]
其中x∈rn和y∈rm是来自两种不同模态的输入特征向量(例如,手部和音频的高级
特征),wi是权重矩阵,bi是偏置量。尽管双线性模型可以捕获两个模态之间的成对的相互关系,但它通常会引入大量参数,从而可能导致计算成本增高。为了解决个问题,一种有效的方法是将权重矩阵wi分解为两个低阶矩阵,即其中wi=u
ivit
,其中ui∈rn×d和vi∈rm×d对维度d施加约束d≤min(n,m)。因此,公式(5)可以进一步改写为:
[0120]
zi=x
tuivit
y+biꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)
[0121]
通常,等式右边的第一项可以进一步用hadamard乘积或逐元素乘法进行转换,以捕获两种异构模式之间的固有相关性:
[0122][0123]
其中1∈rd表示1的列向量,而表示hadamard或逐元素乘积。为了获得输出特征向量z,需要两个三阶张量:u=[u1,

,uo]∈rn×d×o和v=[v1,

,vo]∈rm×d×o。用线性投影p∈rd×o替换列向量,所以向量z可以表示为:
[0124][0125]
其中b∈ro是偏差矢量。非线性激活函数的应用通常有助于增加双线性模型的表示能力。因此,在每个线性映射之后添加非线性激活函数,所以向量z可以进一步表示为:
[0126][0127]
其中σ表示任意非线性激活函数,例如relu,sigmoid或tanh。假设x和y分别代表手部注意向量和音频特征向量,则x的值都大于0,而y在[-1,1]的范围内。为了避免信息丢失,可以利用不同的非线性激活函数将值映射到有限区间。由于引入了逐元素乘法以获取两种模态之间的相关性,因此输出神经元的大小可能会发生巨大变化。为了降低这种变化造成的影响,进一步添加relu函数以规范网络的输出,最终向量z可以表示为:
[0128][0129]
在训练过程中,可以通过反向传播来更新和优化fbm的融合参数。将成对的音频、手部特征输入融合模型,在全连接层上通过softmax输出最终结果。
[0130]
特征匹配的技术路线和实施方案
[0131]
fast算法是目前速度较快的角点检测算法,但是其对一些边缘点会产生误检测,导致一些伪角点的存在。为了排除边缘点对检测结果的干扰,本发明对采用了改进后的fast算法,具体改进为:取一个像素点p周围24个像素点为检测模板,p点的灰度值为ip,设定阈值t,如果24个像素点中有连续14个像素点的灰度值大于ip+t或小于ip-t,则p为角点。本发明使用shi-tomasi算法进行特征点的优选,shi-tomasi算法取两个特征值中较小的一个同给定的最小阈值比较,若大于最小阈值,则会得到强角点。
[0132]
shi-tomasi算法通过计算局部小窗口w(x,y)在各个方向移动后的灰度情况检测角点。将窗口平移[u,v]产生灰度变化e[u,v]为
[0133][0134]
式中m为2
×
2的自相关矩阵,可由图像的导数计算
[0135]
[0136]
对矩阵m的两个特征中λ
max
和λ
min
进行分析,因为曲率较大的不确定度取决于小的角点,定义角点响应函数为λ
min
。对于利用改进的fast角点检测算法初步提取的特征点利用shi-tomasi算法计算每点的角点响应函数λ
min
,根据λ
min
取前n个响应值最大的点确定为特征点。筛选出的特征点的周围至少存在2个不同方向的强边界,这样的特征点易于识别且稳定。
[0137]
对于二进制特征描述向量的匹配(如图5所示),一般采用汉明距离作为描述符之间的相似性度量。汉明距离是指两个等长的二进制字符串中,将其中一个变为另一个所需要作的最小替换次数。假设描述符的两个特征向量为f1,f2,则f1,f2的汉明距离为:
[0138][0139]
通过确定汉明距离的阈值,判断特征向量是否匹配。
[0140]
上述根据本发明的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如cd rom、ram、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如asic或fpga)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,ram、rom、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此描述的处理方法。此外,当通用计算机访问用于实现在此示出的处理的代码时,代码的执行将通用计算机转换为用于执行在此示出的处理的专用计算机。
[0141]
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的实施方法,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1