基于马尔可夫链的多生物特征排序级融合方法与流程

文档序号:31835728发布日期:2022-10-18 21:13阅读:136来源:国知局
基于马尔可夫链的多生物特征排序级融合方法与流程

1.本发明涉及多生物特征识别结果融合处理技术领域,具体而言,涉及一种基于马尔可夫链的多生物特征排序级融合方法。


背景技术:

2.当单个算法的输出是按照匹配分数降序(或距离分数升序)排序时,多生物特征识别系统可以使用排序级融合方法。目前常用的排序级融合方法有最高序号融合法、波达计数排序融合法和逻辑回归排序融合法等。为了便于介绍这几种方法,假设有n个用户的生物特征信息注册形成各个特征模板库,同时有k种算法进行识别比对,每名用户均存在所需生物特征且在对应算法下分别注册形成特征模板库。对某一待测用户,采集其生物特征分别使用各个算法进行识别比对,得到相应初始排序列表,组成排序矩阵其中,r
nk
,n=1,2,

,n;k=1,2,

,k表示比对出的注册用户n在第k种算法输出的排序列表中的排序。不同排序级融合方法的处理方式如下:
3.(1)最高序号融合法:该方法根据用户在各个排序列表中的最高序号(即序号值最小或排名最靠前)对身份进行排序,得到共识排序表,共识排序排名得分rn计算为:排名得分rn越小,共识排序列表排名越靠前。这种方法能够利用每一个算法的优势,即使只有一个算法给正确的用户分配最高序号,重新排序后正确的用户仍然极有可能获得最高序号。但是最终排序可能会出现很多平局,当平局被随机打破时,有可能会接受最弱算法的不正确决策,同时另一缺点是只考虑任何初始排序列表的顶部位置,这可能导致多生物特征识别系统产生不可靠的决策,所以这种方法并不是安全可靠的。通常需要引入一个扰动因子,尝试打破平局问题,将公式修正为:其中,这里的m是一个很大的取值,用于产生小的扰动项ε(n),并且ε(n)结合了与某个特定用户n相关联的所有初始排序排名信息。
4.(2)波达计数排序融合法:该方法假设条件为各初始排序列表是相互独立的,并且算法的性能是相似的。该方法不需要训练阶段,很容易实现,但没有考虑单个算法的识别性能差异,而所有算法运行效果一样好这一假设通常是苛刻的,这使得波达计数排序融合法极易受到弱算法的影响。该方法根据用户在各个排序列表中的序号计算出波达总分数bn,按照升序对bn进行排序得到共识排序表,bn值越小共识排序越靠前。计算每一个身份的波达总分数公式为:该方法性能还可以通过舍弃所有算法输出中最差的一个排序来改善,即
5.(3)逻辑回归排序融合法:逻辑回归法是波达计数法的推广,通过计算各个排序表
排序的加权和,按照加权和升序排序得到共识排序表,加权和越小排名越靠前,计算加权和ln(ω)的公式为:其中,这里的ωk为第k种算法的权重。在训练阶段,需通过多次系统试运行和应用尝试不断优化,并使用逻辑回归模型,了解各个算法识别性能,分配相应权重,权重值越小,算法识别性能越优越。不同算法在识别精度上一般存在明显差异,因此该方法实用性较好。但由于单一生物特征识别算法性能会随输入不同质量的样本集而变化,因此其权重分配过程更具挑战且非常耗时,不合理的权重分配可能会降低多生物特征识别系统的整体识别性能,因此,在某些情况下,该方法不能很好地用于排序级融合。
6.多生物特征识别系统排序级融合类似于投票机制,每一种单独算法被认为是一个独立投票人,初始排序列表是每个投票人的投票结果。投票系统最重要的就是保证公平性,孔多塞标准能够保证其公平性。因此,在设计多生物特征信息的排序级融合系统时,应寻找一种能够满足公平排序过程孔多塞标准的合适方法,但是通过上述几种现有方法得到的共识排序可能会违背孔多塞标准,因此需要一种能够满足孔多塞标准的方法且能提高共识排序准确性。


技术实现要素:

7.本发明提供一种基于马尔可夫链的多生物特征排序级融合方法,其采用了按照满足孔多塞标准的状态转移规则构建马尔可夫链计算共识排序列表的方式对多生物特征识别比对结果进行排序级融合,既能满足孔多塞标准,也比单个算法或其它排序级融合方法识别准确性更高。
8.为达到上述目的,本发明提供了一种基于马尔可夫链的多生物特征排序级融合方法,应用于多生物特征识别系统中,其包括:
9.步骤s1:将待测用户相应生物特征信息输入到不同的单生物特征识别算法中,分别得到该用户每种算法的初始排序列表;
10.步骤s2:所有算法初始排序列表比出的用户身份集合,作为状态空间s,根据满足孔多塞标准的状态转移规则约定,构建马尔可夫链{xn|n=0,1,2,

};
11.步骤s3:检查每种算法的初始排序列表中用户身份数量,若存在未列出的用户身份,则在对应列表中对未列出的用户身份进行补齐;
12.步骤s4:将所有补齐后的初始排序列表进行排序级融合,计算状态转移矩阵p;
13.步骤s5:根据状态转移矩阵p得到共识排序列表。
14.在本发明一实施例中,其中,步骤s1中每一单生物特征识别算法得到单生物特征的初始排序列表的具体过程为:
15.步骤s11:通过对应算法对待测用户的生物特征信息进行特征提取;
16.步骤s12:将提取的特征与模板库进行匹配,并输出匹配结果;
17.步骤s13:根据输出匹配结果得到对应生物特征的初始排序列表。
18.在本发明一实施例中,其中,步骤s2中在对应状态转移规则约定具体为:
19.步骤s21:假设当前状态为i,i∈s,等概率随机选择身份j,其中j∈s,s为状态空间;
20.步骤s22:若各个算法输出的初始排序列表超过半数列表中对j的排序高于i,即j比i的排序靠前,则下一状态跳转到j;否则,下一状态仍停留在i;
21.同时,设用户身份在状态空间s上做随机选择,假设它只在时刻n发生身份状态改变,且按照以上状态转移规则约定进行用户身份选择,若以xn表示在时刻n的用户身份选择情况,则这样构建的{xn|n=0,1,2,

}是一个马尔可夫链。
22.在本发明一实施例中,其中,步骤s3中在对应列表中对未列出的用户身份进行补齐的方法为以下任一种:
23.采用随机插入法,在对应初始排序列表的表尾随机依次插入未列出的用户身份;或
24.采用位置插入法,在未列出的用户身份的相对位置,将对应的用户身份插入,以形成完整排序列表。
25.在本发明一实施例中,其中,步骤s4的具体过程为:
26.步骤s41:对状态空间s中的任一状态i,i∈s,根据状态转移规则得到除状态i自身以外所有符合状态转移规则的状态集合j(i);
27.步骤s42:根据等概率随机性采用下式求解p
ij

28.∑
j∈s
p
ij
=1
[0029][0030][0031]
其中,p
ij
为当前状态为i的情况下下一状态为j的概率,p
ii
为当前状态为i的情况下下一状态仍为i的概率;
[0032]
进一步得到
[0033]
步骤s43:对状态空间s中所有状态重复步骤s41~步骤s42,得到整个状态转移矩阵p。
[0034]
在本发明一实施例中,其中,步骤s5中第1种计算共识排序列表的方式具体为:
[0035]
步骤s511:对于任一状态j,j∈s,通过状态转移矩阵p的第j列元素之和与第j行元素之和之间的差值得到共识排序列表得分sj,或者通过计算状态转移矩阵p对应的转移图中第j个节点的入度与出度的差值得到共识排序列表得分sj,具体计算公式为:
[0036]
sj=∑
i∈s
p
ij-∑
i∈s
p
ji
=∑
i∈s
p
ij-1;
[0037]
步骤s512:对所有状态j进行计算,并将得到的所有共识排序列表得分sj按照从大到小的顺序排列,得到共识排序列表。
[0038]
在本发明一实施例中,其中,步骤s5中第2种计算共识排序列表的方式具体为:
[0039]
步骤s521:对于任一状态j,j∈s,通过计算矩阵w的第j列元素之和与第j行元素之和之间的差值,即状态转移矩阵p对应的转移图中以第j个节点作为终点的边数与以第j个节点作为起点的边数之间的差值,得到共识排序列表得分sj,具体计算公式为:
[0040]
sj=∑
i∈s
ω
ij-∑
i∈s
ω
ji

[0041]
其中,任一元素记作矩阵
[0042]
步骤s522:对所有状态j进行计算,并将得到的所有共识排序列表得分sj按照降序排列,得到共识排序列表。
[0043]
本发明的基于马尔可夫链的多生物特征排序级融合方法,与现有的排序级融合方法相比,能够很好处理初始排序列表为注册模板库中一小部分注册用户的情况,提供候选用户之间更加全面的比较,当各个初始排序列表结果非常不同时也能进行处理比较,且准确性更高,因此,它在多生物识别系统排序级融合方面具有更加广泛的应用场景。
附图说明
[0044]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0045]
图1为本发明一实施例进行排序集融合的流程示意图;
[0046]
图2为采用本发明的方法与3种单生物特征识别算法的cmc曲线比较图;
[0047]
图3为采用本发明的方法与其他排序级融合算法的cmc曲线比较图。
具体实施方式
[0048]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0049]
为了能够清楚的说明本发明中,下面将本发明涉及的几个基本原理说明如下:
[0050]
(一)马尔可夫链:
[0051]
假设离散随机过程为{xn|n=0,1,2,

},其离散状态空间为s={s1,s2,

},若对任意整数n和任意的状态i0,i1,

,i
n-1
∈s,且条件概率满足:p{x
n+1
=i
n+1
|x0=i0,x1=i1,

,xn=in}=p{x
n+1
=i
n+1
|xn=in},则称{xn|n=0,1,2,

}为马尔可夫链。
[0052]
(二)孔多塞标准:
[0053]
孔多塞标准,即如果存在一种能够在成对的投票反对对方中胜出的选择,那么应该认为是投票选举的赢家,这种选择被称为孔多塞赢家。具体过程可以概述为所有备选方案都进行成对比较,决策群体先随机选取两种方案进行表决,获得过半数赞成的方案再同余下所有方案进行成对比较,依次表决直至选出孔多塞赢家。
[0054]
图1为本发明一实施例进行排序集融合的流程示意图,如图1所示,本发明提供了一种基于马尔可夫链的多生物特征排序级融合方法,应用于多生物特征识别系统中,其包括:
[0055]
步骤s1:待测用户相应生物特征信息输入到不同的单生物特征识别算法中,分别得到该用户每种算法的初始排序列表;其中,单生物特征识别算法可以采用现有技术中针对每种生物特征进行识别的算法,本发明不对其进行限定。
[0056]
图1的实施例是在假设不同生物特征或算法彼此独立的前提下,为了确保数据安全性和隐私性构建的实验数据,其中选取相同数量的3种生物特征建立一一的对应关系,构建虚拟用户样本,作为本次实验测试用户集。本实施例的生物特征种类的数量(3种)仅用于进行实验,并非用于限制本发明用户样本的生物特征的数量。
[0057]
图1中将用户测试样本分别输入对第1种生物特征、第2种生物特征及第3种生物特征进行识别的三种算法中,即算法1、算法2和算法3。在本发明一实施例中,其中,步骤s1中每一单生物特征识别算法得到单生物特征的初始排序列表的具体过程为:
[0058]
步骤s11:通过对应算法对待测用户的生物特征信息进行特征提取;
[0059]
步骤s12:将提取的特征与模板库进行匹配,并输出匹配结果;
[0060]
步骤s13:根据输出匹配结果得到对应生物特征的初始排序列表。
[0061]
参见图1,通过算法1输出的第1种生物特征匹配结果,得到初始排序列表1;通过算法2输出的第2种生物特征匹配结果,得到初始排序列表2;通过算法3输出的第3种生物特征匹配结果,得到初始排序列表3。
[0062]
步骤s2:所有算法初始排序列表比出的用户身份集合,作为状态空间s,根据满足孔多塞标准的状态转移规则约定,构建马尔可夫链{xn|n=0,1,2,

};在本实施例中,为了比较融合算法和单个算法间的识别性能差异,所选取的测试样本的3种初始排序列表对应比对结果均是存在有一定差异的,且至少有1种算法在其初始排序列表中能够比中。
[0063]
在本发明一实施例中,其中,步骤s2中在对应状态转移规则约定具体为:
[0064]
步骤s21:假设当前状态为i,i∈s,等概率随机选择身份j,其中j∈s,s为状态空间;
[0065]
步骤s22:若各个算法输出的初始排序列表超过半数列表中对j的排序高于i,即j比i的排序靠前,则下一状态跳转到j;否则,下一状态仍停留在i;
[0066]
同时,设用户身份在状态空间s上做随机选择,假设它只在时刻n发生身份状态改变,且按照以上状态转移规则约定进行用户身份选择,若以xn表示在时刻n的用户身份选择情况,则这样构建的{xn|n=0,1,2,

}是一个马尔可夫链。
[0067]
步骤s3:检查每种算法的初始排序列表中用户身份数量,若存在未列出的用户身份,则在对应列表中对未列出的用户身份进行补齐;由于最后得到的共识排序列表长度为所有初始排序列表中比出的用户身份的数量,因此,在此需要对未列出的用户身份进行补齐。
[0068]
在本发明一实施例中,其中,步骤s3中在对应列表中对未列出的用户身份进行补齐的方法为以下任一种:
[0069]
采用随机插入法,在对应初始排序列表的表尾随机依次插入未列出的用户身份;或
[0070]
采用位置插入法,在未列出的用户身份的相对位置(例如可采用波达分数排序等方法),将对应的用户身份插入,以形成完整排序列表。在本实施例中,可以优先采用位置插入法,当比对出现平局时采用随机插入法进行随机插入。
[0071]
本实施例在对用户测试样本的1种算法初始排序列表进行补齐时,采用在其末尾依次将另外两种算法的比对结果插入,同一比对结果只选取一个序号最小的,这样每一个补齐后的初始排序列表均会比中用户测试样本,因此在本次实验中虚拟用户测试样本均为
正样本。
[0072]
步骤s4:将所有补齐后的初始排序列表进行排序级融合,计算状态转移矩阵p;
[0073]
在本发明一实施例中,其中,步骤s4的具体过程为:
[0074]
步骤s41:对状态空间s中的任一状态i,i∈s,根据状态转移规则得到除状态i自身以外所有符合状态转移规则的状态集合j(i);
[0075]
步骤s42:根据等概率随机性采用下式求解p
ij

[0076]

j∈s
p
ij
=1
[0077][0078][0079]
其中,p
ij
为当前状态为i的情况下下一状态为j的概率,p
ii
为当前状态为i的情况下下一状态仍为i的概率;
[0080]
进一步得到
[0081]
步骤s43:对状态空间s中所有状态重复步骤s41~步骤s42,得到整个状态转移矩阵p。
[0082]
步骤s5:根据状态转移矩阵p得到共识排序列表。
[0083]
在本发明一实施例中,其中,步骤s5中第1种计算共识排序列表的方式具体为:
[0084]
步骤s511:对于任一状态j,j∈s,通过状态转移矩阵p的第j列元素之和与第j行元素之和之间的差值得到共识排序列表得分sj,或者通过计算状态转移矩阵p对应的转移图中第j个节点的入度与出度的差值得到共识排序列表得分sj,具体计算公式为:
[0085]
sj=∑
i∈s
p
ij-∑
i∈s
p
ji
=∑
i∈s
p
ij-1;
[0086]
步骤s512:对所有状态j进行计算,并将得到的所有共识排序列表得分sj按照从大到小的顺序排列,得到共识排序列表。
[0087]
在本发明一实施例中,其中,步骤s5中第2种计算共识排序列表的方式具体为:
[0088]
步骤s521:对于任一状态j,j∈s,通过计算矩阵w的第j列元素之和与第j行元素之和之间的差值,即状态转移矩阵p对应的转移图中以第j个节点作为终点的边数与以第j个节点作为起点的边数之间的差值,得到共识排序列表得分sj,具体计算公式为:
[0089]
sj=∑
i∈s
ω
ij-∑
i∈s
ω
ji

[0090]
其中,任一元素记作矩阵
[0091]
步骤s522:对所有状态j进行计算,并将得到的所有共识排序列表得分sj按照降序排列,得到共识排序列表。本实施例中,步骤s511~s512与步骤s521~s522为两种得到共识排序列表的不同计算方法。
[0092]
图2为采用本发明的方法与3种单生物特征识别算法的cmc曲线(cumulative match characteristic,累积匹配曲线)比较图,如图2所示,算法1、2、3分别为图1中的算法1、2、3,markov法1对应经过步骤s511~s512得到共识排序列表的方法,markov法2对应经过步骤s521~s522得到共识排序列表的方法。如图2所示,本实施例使用前k名命中率top(k)
作为每种算法的评价指标,根据测试样本集补齐后的初始排序列表和各个算法得到的共识排序列表绘示的cmc曲线可以看到,markov法1与markov法2的首位命中率分别为94.76%和94.37%,3种单独生物特征识别算法的首位命中率分别为81.55%、74.76%和85.05%,因此证明基于马尔可夫链的排序级融合方法的识别性能优于3种单独算法。
[0093]
图3为采用本发明的方法与其他排序级融合算法的cmc曲线比较图。如图3所示,最高序号法、波达计数法和逻辑回归法的首位命中率分别为91.07%、92.04%和93.40%,略小于markov法1与markov法2的首位命中率94.76%和94.37%,通过比较不同排序级融合算法的cmc曲线趋势,本实验中排序级融合算法的识别性能从高到低依次为基于马尔可夫链的方法、逻辑回归法、波达计数法和最高序号法。这里基于马尔可夫链的方法两种形式间个别测试样本识别结果稍有差距,因此markov法1与markov法2的两条cmc曲线几乎相同但不完全重合。本发明的方法从马尔可夫链的定义出发,构建满足孔多塞标准的状态转移规则,并通过具体实验验证了基于马尔可夫链的方法相较于其它3种排序级融合方法和3种单独生物特征识别算法的性能优势。
[0094]
本发明的基于马尔可夫链的多生物特征排序级融合方法,能够很好处理初始排序列表为注册模板库中一小部分注册用户的情况,提供候选用户之间更加全面的比较,当各个初始排序列表结果非常不同时也能进行处理比较,且准确性较高,因此,它在多生物识别系统排序级融合方面具有更加广泛的应用场景。
[0095]
本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
[0096]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1