用于认证加密的方法以及用于认证生物计量数据的系统的制作方法_2

文档序号:9333000阅读:来源:国知局
统通过确保用户没有发现存储在数据库中的任何生物计量数据来保护 隐私。数据库和认证服务器没有发现用户的生物计量数据,并且冒充用户的外部对手不能 发现存储在数据库中的特征生物计量数据。
[0025] 为了改进认证的性能,一些实施方式考虑针对认证所提出的生物计量数据的识别 性和一致的特征(consistentfeatures)。为了保护隐私,各种实施方式在加密域中考虑了 识别性和一致的特征。实施方式通过向对手隐藏识别性和一致的特征的位置并且不允许对 手利用一致的特征获得未授权的访问,来改进认证性能。
[0026] 符号和术语
[0027] 在下面的表格中给出关注的数学符号:
[0028]
[0029] 性能测量
[0030] 在一些实施方式中,使用下面的度量来测量认证系统的性能:
[0031] 1、错误拒绝的概率,或者错误拒绝率(FRR)。这是给出Alice的生物计量数据的特 征矢量,而系统认证失败的概率。例如,如果Alice的登记矢量与探针矢量之间的距离大于 预定的阈值,则这种情况将发生。
[0032] 2、错误接受的概率,或者错误接受率(FAR)。这是给出Alice以外的用户的特征矢 量,而系统发现与Alice的特征矢量匹配的概率。例如,如果Alice的登记矢量与数据库中 的任何其他用户的探针矢量之间的距离小于预定的阈值,则这种情况将发生。
[0033] 针对给出的用户的数据库,FRR和FAR的值取决于先前解释的距离阈值。使用较 小的距离阈值减小FAR,但是增加FRR。使用较大的距离阈值减小FRR,但是增加FAR。通过 在值的范围上扫描(swe印)距离阈值,获得了FRR相对于FAR的曲线。曲线上的FRR等于 FAR的点被称为等错误率(EER)。认证系统的设计者的目标是具有最小可能EER。
[0034] 识别性特征
[0035] 在大部分的生物计量数据提取算法中,一些特征比其它特征在确定真正的匹配以 及拒绝错误匹配时更有用。这样的特征被说成是更加"识别性的",因为它们允许系统更好 地区分真正的用户和冒名顶替者。例如,在指纹匹配中,发现基于细节点(minutiaepoint) 的特征比基于脊线波长(ridgewavelength)的特征更识别性。
[0036] 在针对登记用户构造特征矢量的同时希望使用最识别性特征。如果Alice的特征 矢量的元素是识别性的,则这些元素的比较针对Alice可以导致低FRR和低FAR。然而,识 别性特征经常因人而异。因此,例如,对于Alice来说,从手指的中心提取的特征可以是最 识别性的,但是对于Bob来说,从手指的侧部提取的特征可以是最识别性的。因此,与针对 数据库中的所有登记用户的一组共同的识别性特征对比,希望使用针对特定用户的特定的 识别性特征。
[0037] 虽然识别性特征在改进FAR相对于FRR的权衡时是有用的,但是识别性特征能够 在实际系统设计中存在两个难点。第一,在可以从登记的人收集多个样本的登记时才能够 确定识别性特征,并且执行这些特征矢量的统计分析。在认证的时候,来自询问的人的仅一 个特征矢量是可用的。第二,识别性特征的位置是私密的。如果冒名顶替者Bob找出Alice 的识别性特征的位置,则Bob可以尝试使用该信息合成人造特征矢量。
[0038] 一致的特征
[0039] 在从一次测量到另一次测量基本上不改变的生物计量数据的特征被认为是一致 的特征。一致的特征对于随时间获取的测量是可重现的,并且有助于更低的FRR。在由实施 方式采用的一些生物计量数据提取方法中,将实数值和整数值信号与阈值(或者阈值的矢 量)比较,以提供二进制或者整数值的特征。这种提取方法对已以下系统是有利的,在所述 系统中,生成的特征矢量在被存储在数据库之前或者在被发送到数据库用于认证之前被加 密。在这种情况下,一致性可以取决于阈值点与生物计量数据的值之间的绝对距离。具体 地,距离越大,特征被量化为不同值的概率越小,由此特征更一致。
[0040] 在一些实施方式中,识别性特征的一致性由一致性矢量表示,该一致性矢量是大 小与特征矢量中的对应元素在多次测量中保持不变的概率成比例的元素的矢量。与生物计 量数据的识别性元素的位置不同,特征矢量和一致性矢量的元素中的这种相关性在安全协 议中更难以被对手利用。
[0041] 按照定义,识别性特征是一致的,但是一致的特征不一定是识别性的。为了成为识 别性的,生物计量数据中的一致的特征必须满足附加要求,即,其他用户的生物计量数据中 的该特征的值几乎均匀分布在它的范围内。例如,如果从Alice的指纹的中心提取的特定 比特总是取值〇,则该比特在由Alice提供的不同的测量中是一致的,但是仅在从数据库中 的任何其他用户的中心提取的相同比特同样可能取值〇或者1时,该比特才是识别性的。
[0042] 例如,在一个实施方式中,矢量x和y是二进制的并且包括N个比特,并且每个比 特的一致性在量化生物计量信号的过程期间获得。例如,假设通过将从Alice的生物计量 数据提取的第i个信号的值与从用于登记和训练的所有生物计量数据提取的第i个信号值 的中值比较,来确定Alice的生物计量数据的第i个特征比特。在这种情况下,一致性是该 中值与针对Alice获得的信号值之间的距离的函数。距离越大,每次测量的第i个特征比 特不一致的概率越小。相反地,距离越小,每次测量的第i个特征比特变化的概率越大。
[0043] 在一个实施方式中,一致性被定义为从Alice的生物计量数据提取的第i个特征 的值与从在登记和训练中使用的所有生物计量数据所提取的第i个特征的值的中值之间 的距离的整数值的函数。在各种实施方式中,针对在登记和训练期间获得的多达N个特征 的一致性信息被利用以防止对手被错误认证。
[0044] 为了明确一致性的概念,考虑一个简单的示例,其中,在登记期间从单个用户获 得的生物计量信号是矢量[4, 5,-10, 12, 3]。假设该信号矢量的每个元素的中值是4,其 中,在所有登记的用户中来测量所述中值。在这种情况下,信号值与中值的绝对距离是 [0, 1,14, 8, 1]。考虑既然提取的生物测量特征矢量是二进制的,并且根据如下简单规则获 得:如果信号矢量元素小于或等于中值,则特征元素取值〇,并且当信号矢量元素大于中值 时,特征元素取值1。使用该规则,与针对每次测量具有中值4的信号[4, 5, -10, 12, 3]对应 的特征矢量是[0, 1,0, 1,0]。
[0045] 然而,在上述示例中,五个比特不是同样一致的。这是因为一些信号矢量元素接近 中值(例如,值4、5和3的测量),而其它信号矢量元素远离中值(例如,值-10和12的测 量)。这是很重要的,因为每次测量的生物计量信号轻微地改变。由于第一信号矢量元素、第 二信号矢量元素和第五信号矢量元素接近中值,所以特征矢量中的对应比特不是一致的, 并且它们可以在每次测量时改变。与此相反,第三信号矢量元素和第四信号矢量元素远离 中值,并且特征矢量中的对应比特是非常一致的,这是因为它们在每次测量时不可能改变。
[0046] -致的信号矢量元素的位置对于不同用户是不同的。此外,一致的信号矢量元素 的位置不一定与识别性元素的位置相同。该事实被利用在本发明中。具体地,给出特征提 取算法,对手将能够利用识别性元素,即使他不知道它们的位置。然而,特征提取算法没有 给对手关于特征比特的一致性的信息。如果自称为登记的用户的人的特征比特的一致性与 合法地登记的用户的特征比特的一致性差异量大于阈值,则我们提议不许认证。
[0047] 同态加密
[0048] 由于增加的隐私关注,生物计量数据的成对比较以安全的方式执行。在一些实施 方式中,为了保护数据库中的登记的用户的隐私和安全,在加密域中执行在认证时提出并 存储在服务器中的生物计量数据之间的距离的计算。
[0049] 传统的公共密钥加密算法不允许加密域计算。同态密码系统是特定的公共密钥密 码系统,其允许在加密域中进行诸如加法和/或乘法的简单的运算。这些密码系统的示例 包括由Paillier和Damgard-Jurik描述的加法同态系统、由ElGamal描述的乘法同态系 统、由Boneh等描述的二次同态系统以及
当前第2页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1