一种基于比特空间的多路径深度编码的信息指纹提取方法

文档序号:10489330阅读:217来源:国知局
一种基于比特空间的多路径深度编码的信息指纹提取方法
【专利摘要】本发明公开了一种基于比特空间的多路径深度编码的信息指纹提取方法,包括以下步骤:步骤一、构建比特窗口;步骤二、构建比特平面;步骤三、降维构造比特链;步骤四、对比特链进行编码:针对上述构造的降维比特链进行遍历统计,依次获取连续的0和连续的1的个数,构成1个新的十进制数列:针对所得十进制数列再进行二进制化获得一个新的首位非0的二进制比特链,对所得比特链再重复上述遍历统计计数操作,依次循环迭代直至新获得的十进制数列中的元素为1个为止,记录最终得到的元素的值和循环迭代次数为信息指纹特征空间的一个特征值;步骤五、指纹比对。本发明具有提高了相同信息检测时的效率等优点。
【专利说明】
一种基于比特空间的多路径深度编码的信息指纹提取方法
技术领域
[0001] 本发明涉及一种计算机及通信技术,特别涉及一种基于比特空间的多路径深度编 码的?目息指纹提取方法。
【背景技术】
[0002] 理想的信息指纹遵循两个基本原则:第一、从原始数据中提取的指纹信息量越少 越好,以节省指纹信息本身的所占空间;第二、通过指纹比对,能够准确判决信息的一致性。 信息指纹提取与比对技术主要解决两类问题:1)如果指纹不一致,断定待判内容与原始内 容的不一致性;2)如果指纹一致,断定待判内容与原始内容的一致性。目前现有的信息指纹 提取技术,主要有针对数据的MD5指纹,针对图像的直方图、特征值以及特征采样点等指纹 类型,在信息比对方面有布隆滤波器(Bloom Filter)技术,已有的这些方法,在解决以上所 述的第1类问题方面,效果良好;但在第2类问题面前,均未表现出好的性能。当前信息指纹 技术处理第2类问题即指纹一致但是无法确定内容是否真的一致的问题的脆弱性导致必须 进行原始信息比对的大量计算开销,且指纹比对本身构成一次冗余,因而迫切需要新的指 纹提取技术提升其解决第二类问题的能力;尤其是国际流行的MD5被我国科学家成功破解 之后,这个问题更显迫切。
[0003] 基于此,本发明提供一种基于比特空间的多路径深度编码的信息指纹提取方法 (简称:MDB),可以满足其对信息判决的一致性要求,即就是,不但指纹不一致可以断定内容 肯定不一致,而且只要指纹一致,则内容具备高概率的一致性。为了提高指纹比对的效率, 本发明也提供基于所述方法的快速指纹比对技术。为快速的信息比对和信息检索提供新的 方法(MDB-M1和MDB-M2)。本发明的应用对于数据尤其是大数据传输与存储、信息中心网 Cache机制、CCN内容中心网以及粒通信等领域的冗余内容检测也具有重要意义。

【发明内容】

[0004] 本发明的目的在于克服现有技术的缺点与不足,提供一种基于比特空间的多路 径深度编码的信息指纹提取方法,该方法是一种基于比特空间的多路经深度编码的信息指 纹提取与比对方法(MDB)。
[0005] 本发明的目的可以通过下述技术方案实现:一种基于比特空间的多路径深度编码 的信息指纹提取方法,包括以下步骤:
[0006] 步骤一、构建比特窗口;
[0007] 步骤二、构建比特平面:将比特窗口按照某一宽度对比特重新分割,排列成一个比 特平面;
[0008] 步骤三、降维构造比特链:按多种行程路径方式进行降维排列,构建不同的比特链 BC,并记录相应的排列方式的编码;
[0009] 步骤四、对比特链进行编码:针对上述构造的降维比特链进行遍历统计,依次获取 连续的〇和连续的1的个数,构成1个新的十进制数列:针对所得十进制数列再进行二进制化 获得一个新的首位非O的二进制比特链,对所得比特链再重复上述遍历统计计数操作,依次 循环迭代直至新获得的十进制数列中的元素为1个为止,记录最终得到的元素的值和循环 迭代次数为信息指纹特征空间的一个特征值;
[0010] 步骤五、指纹比对。
[0011] 在步骤一中,根据可以唯一表征原始信息字节流的有效比特位构造比特窗口,比 特窗口的大小为任意不大于原始信息总比特数(Tb)的正整数m,针对不同的系统或字节流, m的取值可以变化,尤其m = 8,16,32,64等为2的整数次幂的情况;在步骤二中,将原始信息 字节流窗口按m比特的宽度分割并逐一并排排列,最低位为0,最高位为m-1,获得一个m行*n 列的比特平面;所述m整除Tb为η,如果不能整除则对余数进行省略或补0处理。
[0012] 在步骤三中,按下述行程路径方式进行降维排列,构建不同的比特链,并记录相应 的排列方式编码:
[0013] a)将上述比特平面以m为固定步长,从第一行的高位开始,从该行的高位列至低位 列,低位行的尾位比特与高位行的首位比特相连,将二维比特平面转换为一个长度为m*n的 一维比特链,并记录该排序方式的编码值;
[0014] b)将上述比特平面以m为固定步长,从第一行的尾位开始,从该行的低位列至高位 列,低位行的高位比特与高位行的尾位比特相连,将二维比特平面转换为一个长度为m*n的 一维比特链,并记录该排序方式的编码值;
[0015] c)将上述比特平面以η为固定步长,从第一行的高位列开始,从该列的低位行至高 位行,低位列的低位行比特与高位列的高位行比特相连,将二维比特平面转换为一个长度 为n*m的一维比特链,并记录该排序方式的编码值;
[0016] d)将上述比特平面以η为固定步长,从第一行的尾位列开始,从该列的低位行至高 位行,低位列的高位行比特与高位列的低位行比特相连,将二维比特平面转换为一个长度 为n*m的一维比特链,并记录该排序方式的编码值;
[0017] e)将上述比特平面以η为固定步长,从第一行的尾位列开始,从该列的低位行至高 位行,低位列的高位行比特与高位列的高位行比特相连,直至低位列的最低位行比特与高 位列的最低位行比特相连,依次类推,将二维比特平面转换为一个长度为n*m的一维比特 链,并记录该排序方式的编码值;
[0018] f)将上述比特平面以η为固定步长,从最后一行的首位列开始,从该列的高位行至 低位行,高位列的低位行比特与低位列的低位行比特相连,直至高位列的最低位行比特与 低位列的最低位行比特相连,依次类推,将二维比特平面转换为一个长度为n*m的一维比特 链,并记录该排序方式的编码值。
[0019] 所述步骤四包括以下步骤:
[0020] 步骤41、对比特链进行初步编码;将所述降维比特链进行首位编码,即记录上述比 特链的第1个比特,如果是〇,则编码为〇;如果是1,则编码为1;首位编码代表相应比特链的 起始位是0,还是1;
[0021] 步骤42、对形成的所述降维比特链进行精简行程编码,即从头到尾顺序统计连续 的0/1出现的次数,获得一个所对应比特链的非零整数序列,并设置初始编码深度值,然后 进行深度编码;
[0022] 步骤43、对比特链进行深度编码;
[0023] 所述对比特链进行深度编码的方法包括以下步骤:
[0024] 步骤A、将所得的非零整数序列再进行二进制化,省略每个整数对应的二进制数字 的第一个1前面的〇,构建形成新的0/1比特链;
[0025] 步骤B、并统计该比特链的长度,并将循环迭代深度值加1;
[0026] 步骤C、将新获得的比特链替代权利要求4所生成的原始比特链再进行精简行程编 码,统计连续出现的0/1的次数构成新的非零整数序列。
[0027] 循环执行步骤A至步骤C,直到新获得的非零整数序列的长度为1为止,即只有1个 计数值,并记录这个值为终止编码值,同时记录最终的编码深度值,即上述循环迭代次数。 [0028]按不同排序方式所构造的多种比特链重复运行步骤41至43,直到获得六个排序方 式的三元组〈首位值,终止编码值,编码深度值〉为止,所述六个排序方式的三元组包括第一 种排序方式构造的三元组、第二种排序方式构造的三元组、第三种排序方式构造的三元组、 第四种排序方式构造的三元组、第五种排序方式构造的三元组和第六种排序方式构造的三 元组;由所述六个三元组构成该原始信息的特征空间即为该信息的指纹。
[0029] 生成所述信息的指纹的逐位比对方法,包括以下步骤:
[0030] (1)首位比对:对于同一比特链构造模式,优先比对相应的首位比特值,如果有任 何一个对应的首位比特值不同,则说明两者指纹不匹配,结束比对;如果相同,则转下一步;
[0031] (2)编码值比对:如果首位比特值相同,则继续比对对应的最终编码值,如果有任 何一个对应的最终编码值不同,则说明两者指纹不匹配,结束比对;如果相同,则转下一步;
[0032] (3)编码深度值比对:如果首位和最终编码值都相同,则继续比对对应的编码深度 值,即迭代次数值,如果有任何一个对应的编码深度值不同,则说明两者指纹不匹配,结束 比对;如果相同,则认为两者指纹匹配。
[0033] 把所生成所述信息的指纹的联合统一对比;所述联合统一对比的方法为:将权利 要求6中第一种排序方式构造的三元组按照权利要求7中的方法进行比对,如若相同,再将 权利要求6中第二种排序方式构造的三元组按权利要求7中的方法进行比对,依此类推,直 到第六种排序方式进行比对为止;若按照相同排序模式构造出的路径所形成的六个排序方 式的三元组都一致,则指纹全部一致,则认为信息一致,否则,认为信息不一致。
[0034] 本发明的目的也可以通过以下技术方案实现:一种基于比特空间的多路径深度编 码的信息指纹提取方法,包括以下步骤:
[0035] Sl、构建比特窗口 :根据可以唯一表征原始信息字节流的有效比特位构造比特窗 口,字节流的比特窗口 wb的宽度为m比特,m不大于原始信息的总比特数Tb,即总共有η = ceil(Tb/m)个wb;如果不能整除,最后一个窗口的宽度为余数,即113-〇6;[1(1'13/111)*111,这里 ceiI(Tb/m)表示Tb/m向上取整。为了操作方便,m的取值一般为4或8的整数倍。
[0036] S2、构造比特平面:将字节流窗口wb按m比特的宽度逐一并排排列,最低位为0,最 高位为m-Ι,获得一个m行*n列的比特平面。
[0037] S3、降维构造比特链:按多种行程路径方式进行降维排列,构建不同的比特链BC, 并记录相应的排列方式的编码:
[0038] a)将上述比特平面以m为固定步长,从第一行的高位开始,从该行的高位列至低位 列,低位行的尾位比特与高位行的首位比特相连,将二维比特平面转换为一个长度为m*n的 一维比特链BC0。记录该排序方式RM的编码值为0;
[0039] b)将上述比特平面以m为固定步长,从第一行的尾位开始,从该行的低位列至高位 列,低位行的高位比特与高位行的尾位比特相连,将二维比特平面转换为一个长度为m*n的 一维比特链BCl。记录该排序方式RM的编码值为1;
[0040] c)将上述比特平面以η为固定步长,从第一行的高位列开始,从该列的低位行至高 位行,低位列的低位行比特与高位列的高位行比特相连,将二维比特平面转换为一个长度 为n*m的一维比特链BC2。记录该排序方式RM的编码值为2;
[0041] d)将上述比特平面以η为固定步长,从第一行的尾位列开始,从该列的低位行至高 位行,低位列的高位行比特与高位列的低位行比特相连,将二维比特平面转换为一个长度 为n*m的一维比特链BC3。记录该排序方式RM的编码值为3;
[0042] e)将上述比特平面以η为固定步长,从第一行的尾位列开始,从该列的低位行至高 位行,低位列的高位行比特与高位列的高位行比特相连,直至低位列的最低位行比特与高 位列的最低位行比特相连,依次类推,将二维比特平面转换为一个长度为n*m的一维比特链 BC4。记录该排序方式RM的编码值为4;
[0043] f)将上述比特平面以η为固定步长,从最后一行的首位列开始,从该列的高位行至 低位行,高位列的低位行比特与低位列的低位行比特相连,直至高位列的最低位行比特与 低位列的最低位行比特相连,依次类推,将二维比特平面转换为一个长度为n*m的一维比特 链BC5。记录该排序方式RM的编码值为5。
[0044] S4、首位编码:将上述比特链进行首位编码Fb,即记录上述比特链的第1个比特,如 果是〇,则编码为〇;如果是1,则编码为1;首位编码代表相应比特链的起始位是〇,还是1。
[0045] S5、精简行程编码:将形成的比特链进行精简行程编码,即从头到尾顺序统计连 续的0/1出现的次数,获得一个所对应比特链的非零整数序列。并设置BRLC深度值depth_ of_BRLC=l;
[0046] S6、深度编码:将所得的序列BRLC进行二进制化,省略每个整数对应的二进制数字 的第一个1前面的〇,构建形成新的〇/1比特链NBC,并统计该比特链的长度Leng th_of _BRLC, 并将循环迭代深度值depth_of_BRLC+= I,将新获得的比特链NBC进行精简行程编码,统计 连续出现的〇/1的次数构成信的BRLC。
[0047] S7、重复步骤6,直到新获得的Length_of_BRLC为1。
[0048] S8、记录上述循环终止时候的depth_of_BRLC以及最终获得的BRLC值。
[0049] S9、指纹提取:对步骤3所提的由原始信息所构造的六种比特链均匀上述步骤3至 步骤8重复获得6个三元组《13,8此(:,(16?让_(^_8此0,由此6个三元组(6*3个特征元素)构 成该信息的指纹。
[0050] 为了进行指纹比对,本发明MDB提供两种比对方法,方法一、(简称:MDB-M1)为逐位 比对,方法二(简称:MDB-M2)为联合统一比对。以下步骤为方法一 MDB-Ml采用上述过程至步 骤S9提取的指纹进行逐位比对的方法包括以下步骤:
[0051 ] S10、首位比对:对于同一比特链构造模式RM,优先比对相应的Fb值,如果有任何一 个对应的Fb值不同,则说明两者指纹不匹配,结束比对;如果相同,则转下一步;
[0052] Sll、编码值比对:如果Fb相同,则继续比对对应的BRLC值,如果有任何一个对应的 BRLC值不同,则说明两者指纹不匹配,结束比对;如果相同,则转下一步;
[0053] S12、编码深度值比对:如果BRLC相同,则继续比对对应的depth_of_BRLC值,如果 有任何一个对应的depth_of_BRLC值不同,则说明两者指纹不匹配,结束比对;如果相同,则 认为两者指纹匹配。
[0054] S13、如果按步骤3种第一种路径构造的三元组经过上述比对步骤11至步骤14均相 同,则开始第二种路径构造的三元组比对,依次类推至第六种路径进行比对。全部一致,则 认为信息一致,如有任何不同,则信息不一致。
[0055] 方法二、(MDB-M2)进行统一比对的技术特征如下:
[0056] S14、根据以上指纹提取步骤10所生成的经过压缩的6*3信息指纹的比特链CIFB 值,直接进行比特位比对,如有任意比特位不同,则认为信息不一致,终止比对;如果全部比 特位一致,则认为信息一致。
[0057]以上步骤从Sl至S5是本发明所提出的基于比特空间多路径深度编码的信息指纹 提取方法的基本步骤,为了进一步提高系统的可靠性和/或适用性,S6-S10为本发明提供高 级扩展步骤,这个步骤可以和前面的基本步骤S3中的一种或多种组合构成不同精度的比特 指纹提取方案。S3所述的6种模式也可以进一步扩展为任意确定性比特空间遍列的比特链 构建模式,不影响本发明的实质,比如从外至内包围,或从中间向四周发散,或ZigZag之字 形等方式。针对0/1比特链只包含〇和1两个元素的特征,本发明所提精简行程编码只需1个 单元代替了经典行程编码的三个基本单元(即符号、重复次数、位置),因为本发明将符号与 0/1奇偶替换关系以及顺序排列方式,隐含了符号和位置两个特征,因而在比特链构造时候 只需连续依次记录重复次数即可,这节省了 RLC的开销。关于步骤7所述循环BRCL编码的终 止条件也可以是depth_of_BRLC或BRCL值某一个给定的阈值,该设置也不影响本发明的实 质。SlO至S12为指纹比对步骤,首位比对用于快速指纹检测,其它比对参数的大小和数量经 过上述指纹提取过程,已经获得精简,因此比对的信息量很小,能够大大提高比对效率。同 时,因为该指纹提取方法直接针对每一个比特,且隐含比特位置信息和周期变化性,经过S3 所述6个维度的构建方式,故比对能够很高概率满足对第2类问题的解决。
[0058]综上所述,本发明提供的基于比特空间的多路径深度编码的信息指纹提取方法, 其主要步骤包括:比特窗口、比特平面与比特链的构造,首位编码,精简行程编码,深度编码 (循环纵深使用二进制精简行程编码),指纹提取(六个三元组),指纹压缩,指纹比对(首位、 编码值、编码深度)等步骤。该发明的主要作用是减少比对信息量,增强比对准确性,本发明 主要应用于网络和通信领域中所涉及信息指纹的提取和比对。
[0059] 本发明所述的比特链构造的起始位置和遍历方式的调整以及特征值的选择方式 的变化,并不改变本发明的实质,即其相关变种与本发明构成实质性一致。
[0060] 本发明通过对原始信息比特流按照特定窗口进行比特分割重构比特平面,进行0/ 1遍历统计,依次获取连续0和连续1的个数,构成新的十进制数列;针对所得十进制数列再 进行二进制化获得新的首位非0的二进制比特链,对所得比特链再重复上述遍历统计计数 操作;依此法则循环迭代直至新获得的十进制数列中的元素为1个为止,记录最终得到的元 素值为编码值,循环迭代次数为编码深度值;采用不同的比特平面构造方法和遍历方式,重 复运用上述方法所得的一系列不同的编码值和编码深度值,构成信息指纹的完整特征。对 所述信息指纹的比对采用逐位比对和整体比对方法。
[0061] 本发明相对于现有技术具有如下的优点及效果:
[0062] 1、本发明的聚焦点是通过多路径的深度编码对信息指纹进行提取,包括比特链的 构造,比特链的首位编码和精简行程编码,指纹对比。
[0063] 2、本发明所提出的基于比特空间的多路径深度编码的思想来源是,在计算机中, 任何信息都能以二进制的方式进行存储,而在存储过程中,〇或1往往是连续出现或者是以 周期的形式出现的,因此在传输过程中,信息自身就存在一定量的冗余。本发明的思想则是 将信息中有较大冗余的比特经过重新编码,以减少比特的位数,在进行信息比对时,只需要 对提取出的信息指纹进行比对,无需对原有信息进行大量检测,极大提高了信息对比时的 工作效率。虽然目前有很多对信息指纹进行提取并进行检测的方法,但目前为止,并未有基 于比特空间对信息指纹进行提取及比对的相关研究和专利。本发明提出的方法可以对大量 的冗余信息进行缩减,可以应用在信息的传输可相同信息的检测方面。同时,为了减少信息 内冗余程度,本发明还提出了深度编码方式,对信息不断的进行迭代编码,提高相同信息检 测时的效率。
[0064] 3、本发明所提出的基于比特空间的多路径深度编码的信息指纹提取方法,其核心 是将原信息指纹以比特窗口的形式重新构建成比特平面,通过选取不同的路径降维构造比 特链,再通过首位编码和精简行程编码对路径降维构造的比特链进行重新编码。在指纹对 比方面,通过本发明提出的两种快速指纹检测方法对压缩后的比特链进行比较。相较于传 统的信息指纹对比方法,该方法对比的信息量更少,对原信息判别的准确率更高。本发明方 法的实施不需要过于复杂的编码方式,并且可以在原有信息指纹上进行重新编码,并且能 够与现有的指纹提取方法实现无缝结合,应用前景广泛,能广泛应用于网络和通信领域。对 于大数据的传输和迀移意义重大,尤其对于冗余量大的数据,本发明提出的指纹提取方法 有着更重要的意义。
【附图说明】
[0065]图1为本发明MDB的基本工作原理示意图。
[0066]图2为本发明MDB所述的详细工作原理流程示意图。
[0067]图3a为本发明实施例一Mag i c (3)按模式a构建比特链的图。
[0068]图3b为本发明实施例一 Magic(3)按模式b构建比特链的图。
[0069] 图3c为本发明实施例一 Magic(3)按模式c构建比特链的图。
[0070] 图3d为本发明实施例一Mag i c (3)按模式d构建比特链的图。
[0071] 图3e为本发明实施例一 Magic(3)按模式e构建比特链的图。
[0072] 图3f为本发明实施例一 Magic(3)按模式f构建比特链的图。
[0073]图4a为本发明按照逐位比对法比对指纹工作流程图。
[0074]图4b为本发明按照整体比对法比对指纹工作流程图。
【具体实施方式】
[0075]下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限 于此。
[0076] 实施例
[0077]如图1所示,表示本发明所提出的基于比特空间的多路径深度编码的信息指纹提 取方法的全部流程。首先构造比特空间及比特平面;再按照不同的路径选取方式构造比特 链;对比特链进行初始编码和深度扩展编码,其中,初始编码包括对比特链进行首位编码和 精简行程编码,深度扩展编码是在初始编码的基础上进行多次迭代编码,直至比特链的长 度为1停止;当指纹提取完毕后再对指纹进行比对。
[0078] 如图2所示,表示本发明提出的指纹提取具体方法。对比特平面按照不同的排序方 式构造比特链,将每种排序方式最后形成的三元组进行组合,形成一个6*3的指纹信息,将 该指纹信息进行压缩得到最终提取到的指纹信息CIFB。
[0079] 如图4a所示,表示本发明提出对指纹进行逐位比对的具体工作流程。首先进行首 位比对,即对于同一比特链构造模式RM,优先比对相应的Fb值,如果有任何一个对应的Fb值 不同,则说明两者指纹不匹配,结束比对;如果相同,则继续比对对应的BRLC值,如果有任何 一个对应的BRLC值不同,则说明两者指纹不匹配,结束比对;如果相同,则继续比对对应的 depth_of_BRLC值,如果有任何一个对应的d印th_of_BRLC值不同,则说明两者指纹不匹配, 结束比对;如果相同,则认为两者指纹匹配。
[0080] 如图4b所示,表示本发明提出对指纹进行整体比对的具体工作流程。将压缩后的 6*3信息指纹的比特链CIFB值直接进行比特位比对,如有任意比特位不同,则认为信息不一 致,终止比对;如果全部比特位一致,则认为信息一致。
[0081] 在本实例中,要处理的对象是一个标准的Magic(3)矩阵,这里为了描述方便且基 于页面所限该矩阵的大小只取3*3,矩阵)
;通过降维处理,该矩阵化为一个1维 数列,该1维数列为:(8 3 4 1 5 9 6 7 2);对该1维数列中的十进制元素进行二进制化,得 到一个二进制0/1比特链,该二进制0/1比特链为:(1000 0011 0100 0001 0101 1001 0110 0111 0010);针对图3C的比特链,以m = 4的比特窗口大小进行分段重新排列,获得的比特平 面为
针对所得比特平面,分别以不同的起始位置和遍历路径,重新构造出6 条不同比特链,其中,如图3a所示,按排序方式RM=O构造出的比特链具体结构为:
[0082] (100000110100000101011001011001110010),按排序方式 RM=I 构造出的比特链 具体结构如图3b所示:(000111000010100010101001011011100100),按排序方式RM=2构造 出的比特链具体结构如图3c所示:
[0083] (100001000001010110010000111010111010),按排序方式RM = 3构造出的比特链 具体结构如图3(1所示:(010111010010000111001010110100001000),按排序方式RM=4构造 出的比特链具体结构如图3e所示:(100001000011010100010000111010111010),按排序方 式RM=5构造出的比特链具体结构如图3f所示:(000100001001010110111000010010111010)。 针对图3a,本发明所提出方法模式a的深度信息指纹提取具体流程为:
[0085]以上流程所输出的指纹特征码为〈1,6,8>;
[0086]如图3b所示,本发明所提出方法模式b的深度信息指纹提取具体流程为:
[0088] 以上流程所输出的指纹特征码为〈0,4,11>;
[0089] 如图3c所示,本发明所提出方法模式c的深度信息指纹提取具体流程为:
[0091] 以上流程所输出的指纹特征码为〈1,6,6>;
[0092] 如图3d所示,本发明所提出方模式d的深度信息指纹提取具体流程为:
L0094」以上流程所输出的指纹特征码为〈1,3,11>;
[0095]如图3e所示,本发明所提出方法模式e的深度信息指纹提取具体流程为:
[0097]以上流程所输出的指纹特征码为〈1,5,7>;
[0098]如图3f所示,本发明所提出方法模式f的深度信息指纹提取具体流程为:
[0100]以上流程所输出的指纹特征码为〈1,4,8>;
[0101] 综合以上六个模式所生成的特征码,则原数据的信息指纹如下:
[0102] (1,6,8;0,4,11;1,6,6;1,3,11;1,5,7;1,4,8),
[0103] 在本实例中,逐位比对方法:首先将待比对信息的特征指纹的首位逐一比对,SP顺 序比对〈1; 0; I; I; 1; 1>是否一致?如果一致则顺序比对〈6; 4; 6; 3; 5; 4>是否一致?如果一致 则继续顺序比对〈8,11,6,11,7,8>是否一致?如果一致则认为指纹一致;任何一个数值不对 则认为指纹不一致。
[0104] 在本实例中,整体比对方法:首先计算第一种比特平面构成与遍历方式(a),生成 一个信息指纹的特征值与带比对的相应特征值进行比对,如果按本实例的计算结果则第1 次比对信息为〈1,6,8>,如果比对结果一致,则取第2个值〈0,4,11>,如果一致,依次类推,直 至比较完所有的特征值,全部一致,则认为两者的信息指纹一致,任何一个元素比对不一 致,则认为两者指纹不一致。
[0105] 上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的 限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化, 均应为等效的置换方式,都包含在本发明的保护范围之内。
【主权项】
1. 一种基于比特空间的多路径深度编码的信息指纹提取方法,其特征在于,包括以下 步骤: 步骤一、构建比特窗口; 步骤二、构建比特平面:将比特窗口按照某一宽度对比特重新分割,排列成一个比特平 面; 步骤三、降维构造比特链:按多种行程路径方式进行降维排列,构建不同的比特链BC, 并记录相应的排列方式的编码; 步骤四、对比特链进行编码:针对上述构造的降维比特链进行遍历统计,依次获取连续 的0和连续的1的个数,构成1个新的十进制数列:针对所得十进制数列再进行二进制化获得 一个新的首位非〇的二进制比特链,对所得比特链再重复上述遍历统计计数操作,依次循环 迭代直至新获得的十进制数列中的元素为1个为止,记录最终得到的元素的值和循环迭代 次数为信息指纹特征空间的一个特征值; 步骤五、指纹比对。2. 根据权利要求1所述的基于比特空间的多路径深度编码的信息指纹提取方法,其特 征在于:在步骤一中,根据可以唯一表征原始信息字节流的有效比特位构造比特窗口,比特 窗口的大小为任意不大于原始信息总比特数(Tb)的正整数m,针对不同的系统或字节流,m 的取值可以变化;在步骤二中,将原始信息字节流窗口按m比特的宽度分割并逐一并排排 列,最低位为〇,最高位为m-Ι,获得一个m行*n列的比特平面;所述m整除Tb为n,如果不能整 除则对余数进行省略或补〇处理。3. 根据权利要求1所述的基于比特空间的多路径深度编码的信息指纹提取方法,其特 征在于,在步骤三中,按下述行程路径方式进行降维排列,构建不同的比特链,并记录相应 的排列方式编码: a) 将上述比特平面以m为固定步长,从第一行的高位开始,从该行的高位列至低位列, 低位行的尾位比特与高位行的首位比特相连,将二维比特平面转换为一个长度为m*n的一 维比特链,并记录该排序方式的编码值; b) 将上述比特平面以m为固定步长,从第一行的尾位开始,从该行的低位列至高位列, 低位行的高位比特与高位行的尾位比特相连,将二维比特平面转换为一个长度为m*n的一 维比特链,并记录该排序方式的编码值; c) 将上述比特平面以η为固定步长,从第一行的高位列开始,从该列的低位行至高位 行,低位列的低位行比特与高位列的高位行比特相连,将二维比特平面转换为一个长度为 n*m的一维比特链,并记录该排序方式的编码值; d) 将上述比特平面以η为固定步长,从第一行的尾位列开始,从该列的低位行至高位 行,低位列的高位行比特与高位列的低位行比特相连,将二维比特平面转换为一个长度为 n*m的一维比特链,并记录该排序方式的编码值; e) 将上述比特平面以η为固定步长,从第一行的尾位列开始,从该列的低位行至高位 行,低位列的高位行比特与高位列的高位行比特相连,直至低位列的最低位行比特与高位 列的最低位行比特相连,依次类推,将二维比特平面转换为一个长度为n*m的一维比特链, 并记录该排序方式的编码值; f) 将上述比特平面以η为固定步长,从最后一行的首位列开始,从该列的高位行至低位 行,高位列的低位行比特与低位列的低位行比特相连,直至高位列的最低位行比特与低位 列的最低位行比特相连,依次类推,将二维比特平面转换为一个长度为n*m的一维比特链, 并记录该排序方式的编码值。4. 根据权利要求1所述的基于比特空间的多路径深度编码的信息指纹提取方法,其特 征在于,所述步骤四包括以下步骤: 步骤41、对比特链进行初步编码;将所述降维比特链进行首位编码,即记录上述比特链 的第1个比特,如果是0,则编码为0;如果是1,则编码为1;首位编码代表相应比特链的起始 位是0,还是1; 步骤42、对形成的所述降维比特链进行精简行程编码,即从头到尾顺序统计连续的0/1 出现的次数,获得一个所对应比特链的非零整数序列,并设置初始编码深度值,然后进行深 度编码; 步骤43、对比特链进行深度编码; 所述对比特链进行深度编码的方法包括以下步骤: 步骤A、将所得的非零整数序列再进行二进制化,省略每个整数对应的二进制数字的第 一个1前面的0,构建形成新的0/1比特链; 步骤B、并统计该比特链的长度,并将循环迭代深度值加1; 步骤C、将新获得的比特链替代权利要求4所生成的原始比特链再进行精简行程编码, 统计连续出现的0/1的次数构成新的非零整数序列。5. 根据权利要求4所述的基于比特空间的多路径深度编码的信息指纹提取方法,其特 征在于,循环执行步骤A至步骤C,直到新获得的非零整数序列的长度为1为止,即只有1个计 数值,并记录这个值为终止编码值,同时记录最终的编码深度值,即上述循环迭代次数。6. 根据权利要求3所述的基于比特空间的多路径深度编码的信息指纹提取方法,其特 征在于,按不同排序方式所构造的多种比特链重复运行步骤41至43,直到获得六个排序方 式的三元组〈首位值,终止编码值,编码深度值〉为止,所述六个排序方式的三元组包括第一 种排序方式构造的三元组、第二种排序方式构造的三元组、第三种排序方式构造的三元组、 第四种排序方式构造的三元组、第五种排序方式构造的三元组和第六种排序方式构造的三 元组;由所述六个三元组构成该原始信息的特征空间即为该信息的指纹。7. 根据权利要求6所述的基于比特空间的多路径深度编码的信息指纹提取方法,其特 征在于,生成所述信息的指纹的逐位比对方法,包括以下步骤: (1) 首位比对:对于同一比特链构造模式,优先比对相应的首位比特值,如果有任何一 个对应的首位比特值不同,则说明两者指纹不匹配,结束比对;如果相同,则转下一步; (2) 编码值比对:如果首位比特值相同,则继续比对对应的最终编码值,如果有任何一 个对应的最终编码值不同,则说明两者指纹不匹配,结束比对;如果相同,则转下一步; (3) 编码深度值比对:如果首位和最终编码值都相同,则继续比对对应的编码深度值, 即迭代次数值,如果有任何一个对应的编码深度值不同,则说明两者指纹不匹配,结束比 对;如果相同,则认为两者指纹匹配。8. 根据权利要求6所述的基于比特空间的多路径深度编码的信息指纹提取方法,其特 征在于,把所生成所述信息的指纹的联合统一对比;所述联合统一对比的方法为:将权利要 求6中第一种排序方式构造的三元组按照权利要求7中的方法进行比对,如若相同,将权利 要求6中第二种排序方式构造的三元组按权利要求7中的方法进行比对,如若相同,将权利 要求6中第三种排序方式构造的三元组按权利要求7中的方法进行比对,如若相同,将权利 要求6中第四种排序方式构造的三元组按权利要求7中的方法进行比对,如若相同,将权利 要求6中第五种排序方式构造的三元组按权利要求7中的方法进行比对,如若相同,将权利 要求6中第六种排序方式构造的三元组按权利要求7中的方法进行比对;若按照相同排序模 式构造出的路径所形成的六个排序方式的三元组都一致,则指纹全部一致,则认为信息一 致,否则,认为信息不一致。9.根据权利要求2所述的基于比特空间的多路径深度编码的信息指纹提取方法,其特 征在于,所述m的取值为2的整数次幂。
【文档编号】G06K9/00GK105844214SQ201610119377
【公开日】2016年8月10日
【申请日】2016年3月2日
【发明人】杨灿, 任思璇, 韩国强
【申请人】华南理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1