基于最大位平均熵的sift描述子二值化及相似度匹配方法

文档序号：6517848阅读：319来源：国知局

基于最大位平均熵的sift描述子二值化及相似度匹配方法
【专利摘要】基于最大位平均熵的SIFT描述子二值化及相似度匹配方法涉及图像匹配领域。SIFT算子匹配能力较强，但是SIFT算子带来的数据量是巨大的。所以要对SIFT算子进行二值化，如果对所有算子进行统一二值化，势必也会导致存在数据冗余或者信息丢失。本发明通过对SIFT算子进行二值化，然后对各层二值化结果进行位平均熵的计算，来自适应的选择不同的二值化层数，提取出新的二值化描述子，然后用汉明距离代替欧式距离计算两个描述子之间的距离，将其跟设定阈值进行比较。本发明保留了原始特征的信息并大大减少了数据存储量，降低了计算的复杂度，可更好实现实时性的要求。并且可以取得等同于原始SIFT描述子的匹配结果，远优于统一二值化进行匹配的结果。
【专利说明】基于最大位平均熵的SIFT描述子二值化及相似度匹配方法
【技术领域】
[0001]本发明涉及图像匹配【技术领域】，具体涉及一种基于最大位平均熵的SIFT描述子二值化方法及其相似度匹配方案。
【背景技术】
[0002]随着现代计算机技术的发展，人脸识别技术在安全认证、人机交流、公安系统等方面得到了广泛的使用，并且在视频会议、档案管理、医学医疗等方面也发挥着很大的作用。在美国911恐怖袭击事件以及网络CSDN用户信息遭泄露事件发生之后，生物特征识别技术更加受到大家关注，而人脸生物特征的识别一直是生物特征识别领域研究的热点，人脸识别在可控的情况下可以获得很好的识别性能，但在实际应用中，人脸识别往往受到很多因素影响，当人脸姿态发生变化，表情发生变化，外界光照发生变化，人脸存在遮挡(戴围巾，墨镜)等情况时，人脸识别的性能将会下降很多，这就制约了人脸识别在实际中的应用。因此，很多的研究学者致力于人脸识别方法的研究，各种人脸识别方法层出不穷。
[0003]SIFT (Scale-1nvariant Feature Transform)特征匹配算法是目前国内外特征点匹配算法研究的热点与难点，它是在1999年由加拿大的David G.Lowe提出初步思想的局部特征描述子，并于2004年在原基础上进行了更深入的发展并加以完善。SIFT描述子是一种图像的局部描述子，具有尺度、旋转、平移的不变性，而且对光照变化、仿射变换和3维投影变换具有一定的鲁棒性。在Mikolajczyk对包括SIFT描述子在内的十种局部描述子所做的不变性对比实验中，SIFT及其扩展算法已被证实在同类描述子中具有最强的健壮性。SIFT描述子匹配能力较强，对大多数图像变换具备很强的不变性，特别适合于处理两幅图像间发生平移、旋转、仿射变换时的匹配问题，其稳定的特征匹配能力甚至可对任意角度拍摄的图像应用。SIFT特征还具有很好的独特性，适于在海量特征数据库中进行比较快速、准确的匹配。但是，用SIFT来表示人脸图像的数据量是很巨大的。一般一幅人脸图像有3000个SIFT点，每个SIFT由128个描述子构成，每个描述子由8比特表示，总的数据量为3072000比特。Wang等人提出了二值化SIFT描述子的思想。本发明是在对SIFT描述子进行二值化的时候，以最大位平均熵为准则来确定二值化的层数，形成新的二值化描述子，然后用汉明距离代替欧式距离计算两个描述子之间的距离，将其跟设定阈值进行比较，最终得到匹配结果。这样极大的减少了数据量，降低了计算的复杂度，可以更好实现实时性的要求。并且二值化后的描述子在进行匹配运算时可以得到原始SIFT描述子基本一致的匹配结果，远远优于将SIFT描述子进行统一二值化进行匹配的结果。本发明提出了一种基于最大位平均熵的SIFT描述子二值化方法及相似度匹配方案。

【发明内容】

[0004]本发明提供了一种基于最大位平均熵准则的SIFT描述子二值化方法及相似度匹配方案，该方法可以利用位平均熵最大来有效的确定二值化进行的层数，形成新的二值化描述子，然后用汉明距离代替欧式距离计算两个描述子之间的距离，将其跟设定阈值进行比较，最终得到匹配结果。可以保留大量原始SIFT描述子信息，在很大程度上减少数据量，降低了计算的复杂度，可以更好实现实时性的要求。并且可以保证匹配结果和使用原始SIFT描述子得到的匹配结果基本一致，远远优于将SIFT描述子进行统一二值化进行匹配的结果。
[0005]对SIFT描述子进行二值化，如果仅仅进行一层二值化，那么会丢失很多信息，保留原特征的信息量会很少。在进行多层二值化时，包含四种二值化策略:(I)在做完第一层二值化之后，得到O和1，然后一直对O部分进行二值化。(2)在做完第一层二值化之后，得到O和1，选择O部分进行二值化得到O和1，然后一直对I部分进行二值化。(3)在做完第一层二值化之后，得到O和1，选择I部分进行二值化得到O和I，然后一直对O部分进行二值化。(4)在做完第一层二值化之后，得到O和1，然后一直对I部分进行二值化。因为SIFT描述子中包含很多个O,对于每一层二值化结果,一直对I进行二值化的策略信息熵总是最大的，所以采取第四种策略进行多层二值化。熵可以用来度量信息量的大小。SIFT描述子进行二值化层数增加，信息熵会随之增大。但是，与之相随的是数据量的大大增加。而且，如果对提取的所有SIFT描述子进行统一层数的二值化，那么会包含下面两种情况:(I)本身不需要二值化进行到指定层数，位平均熵已经达到最大。比如做两层二值化后的位平均熵是最大的，则只需要保留两层的结果。如果做三层或更多层，会增大数据冗余，冗余的数据可能会引起匹配的错误；(2)在做完指定层数的二值化后，位平均熵还未达到最大，这样会导致二值化后的描述子不能充分的保留原始SIFT描述子携带的信息，会导致误匹配度的增加。但是，从数据量上来考虑，最多保留四层二值化结果。本发明提出了基于最大位平均熵的二值化SIFT描述子方法及相似度匹配方案，通过对每一个描述子进行位平均熵的计算，来自适应的选择不同的二值化层数，形成新的二值化描述子，然后用汉明距离代替欧式距离计算两个描述子之间的距离，将其跟设定阈值进行比较，最终得到匹配结果。本发明提出的算法在很大程度上保留了原始特征的信息并大大减少了数据存储量，降低了计算的复杂度，可以更好实现实时性的要求。并且可以取得等同于原始SIFT描述子的匹配结果，远远优于将SIFT描述子进行统一二值化进行匹配的结果。因此，本发明具有一定的应用价值和意义。
[0006]为了实现上述问题，本发明提出了一种基于最大位平均熵的SIFT描述子二值化的方法及相似度匹配方案，该方法具体包括:
[0007]A、二值化阶段，对于每一幅人脸图像，首先提取SIFT特征描述子，然后对SIFT描述子进行多层二值化，求得各个层次的信息熵，根据各层O和I出现的概率和保留的总比特数，求得位平均熵，然后找出最大位平均熵对应的二值化层数，保留这几层二值化结果，形成新的二值化特征描述子。
[0008]B、匹配阶段，对于任意两幅人脸图像，分别提取其新的二值化特征描述子之后，然后用汉明距离代替欧式距离计算两个描述子之间的距离，将其跟设定阈值进行比较，如果汉明距离小于等于设定阈值，则认为匹配成功；否则，则认为匹配不成功。对于提取的不同层次的二值化特征描述子，需要选择不同的阈值。
[0009]所述步骤A具体包括:
[0010]Al、对于每一幅人脸图像，首先提取SIFT特征描述子；[0011]A2、对于每一幅人脸图像的每一个SIFT描述子进行二值化；
[0012]A3、统计O和I的个数，分别为n10和nn ；
[0013]Α4、标记为I的那些字节对应的描述子，继续进行二值化，统计此时O和I的个数，分别为η2(ι和n21，继续进行上述二值化过程，依次得到n3(l和n31，n40和n41
[0014]A5、分别计算做一层、二层、三层、四层二值化的信息熵；
[0015]A6、根据二值化后保留的总比特数，位平均熵可以由信息熵除以比特数得到；
[0016]A7、求得最大位平均熵所对应的层数，保留对应层数的二值化结果，形成新的二值化描述子。
[0017]所述步骤B具体包括:
[0018]B1、对于任意两幅人脸图像，提取其新的二值化描述子；
[0019]B2、对于每两个描述子，计算其汉明距离disH ；
[0020]B3、提取不同层次的二值化描述子，选择的阈值T也不相同，做一层、二层、三层和四层二值化的阈值分别为:!\，T2, T3, T4
[0021]B4、如果disH小于等于阈值，则认为匹配成功；否则，认为匹配不成功。本发明与现有技术相比，具有以下明显的优势和有益效果:
[0022](I)本发明对SIFT描述子进行二值化，是根据最大位平均熵原则来自适应的根据每一个描述子来确定二值化层数，与进行统一二值化相比，不仅减少了数据冗余，而且在很大程度上保留原始SIFT描述子携带的信息。
[0023](2)本发明自适应得到新的二值化描述子，通过汉明距离来进行匹配，计算简单快捷，复杂度降低，可以更好的满足实时性的要求。
[0024](3)本发明通过最大位平均熵得到的二值化SIFT描述子来进行匹配，经实验分析，匹配结果等同于原始SIFT描述子的匹配结果，远远优于将SIFT描述子进行统一二值化进行匹配得到的结果。
【专利附图】

【附图说明】:
[0025]图1是技术方案的整体流程图。
[0026]图2 (a)是二值化策略I (左左)
[0027]图2 (b)是二值化策略I (左右)
[0028]图2 (C)是二值化策略I (右左)
[0029]图2 (d)是二值化策略I (右右)
[0030]图3是相似度匹配结果比较图。
【具体实施方式】:
[0031]本发明技术方案的整体流程如说明书附图1所示。我们的方法大大减少了数据存储量，降低了计算的复杂度，可以更好实现实时性的要求。并且可以取得等同于原始SIFT描述子的匹配结果，远远优于将SIFT描述子进行统一二值化进行匹配的结果。
[0032]A、对于每一幅人脸图像，首先提取SIFT特征描述子，然后对SIFT描述子进行二值化，求得各个层次的信息熵，根据各层O和I出现的概率和保留的总比特数，求得位平均熵，然后找出最大位平均熵对应的二值化层数，保留这几层二值化结果，最终形成新的二值化描述子。具体步骤包括:
[0033]Al、对于每一幅人脸图像，首先提取SIFT特征描述子
[0034]
【权利要求】
1.一种基于最大位平均熵的SIFT描述子二值化方法及相似度匹配方案，包括以下步骤: A、二值化阶段，对于每一幅人脸图像，首先提取SIFT特征描述子，然后对SIFT描述子进行多层二值化，求得各个层次的信息熵，根据各层O和I出现的概率和保留的总比特数，求得位平均熵，然后找出最大位平均熵对应的二值化层数，保留这几层二值化结果，形成新的二值化特征描述子；所述步骤A具体包括: Al、对于每一幅人脸图像，首先提取SIFT特征描述子
【文档编号】G06K9/00GK103617431SQ201310539961
【公开日】2014年3月5日申请日期:2013年11月5日优先权日:2013年11月5日
【发明者】毋立芳, 侯亚希, 周鹏, 许晓, 曹航明, 颜凤辉, 曹瑜, 漆薇申请人:北京工业大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：毋立芳;侯亚希;周鹏;许晓;曹航明;颜凤辉;曹瑜;漆薇
技术所有人：北京工业大学
我是此专利的发明人

上一篇：一种基于bp神经网络的map标定方法
上一篇：电容式触摸屏及其制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。