改进的音频数据指纹搜索的制作方法

文档序号:6422356阅读:336来源:国知局
专利名称:改进的音频数据指纹搜索的制作方法
技术领域
本发明涉及适用于对指纹和数据库中所存储的指纹进行匹配的方法和设备。
背景技术
散列函数通常用于密码学的领域,其中它们一般用于汇总和验证大量数据。例如,由MIT(麻省理工学院)的RLRivest教授开发的MD5算法将一个任意长度的消息作为输入,并且产生该输入的128位的“指纹”、“签名”或“散列”作为输出。人们已经推测两条不同的消息具有相同的指纹在统计学上是很不可能的。因此,这种加密指纹算法对于验证数据完整性是一个有用的方式。
在很多的应用中,多媒体信号的识别是希望的,包括音频和/或视频内容。然而,经常以各种各样的文件格式传输多媒体信号。例如,适用于声音文件的格式就有若干种不同的文件格式,像WAV、MP3和Windowsmedia,以及各种压缩或质量级别。诸如MD5的加密散列是基于二进制数据格式的,因此它将为相同多媒体内容的不同文件格式提供不同的指纹值。这使得加密散列不适合于汇总多媒体数据,对此,要求相同内容的不同质量版本产生相同的散列,或至少相似的散列。多媒体内容的散列一直被称为健壮的散列(robust hashes)(例如在“Robust Audio Hashing for Content Indentification(内容识别的健壮性音频散列))”中,基于多媒体索引内容2001,Brescia,意大利,2001年9月,Jaap Haitsma、Ton Kalker和Job Oostveen),但是现在已经被统称为多媒体指纹。
相对于数据处理恒定的多媒体内容指纹(只要所述处理保持内容的得到认可的质量)称为健壮性汇总、健壮的签名、健壮的指纹、感知的(perceptual)或健壮的散列。健壮的指纹捕获视听内容的感知基本部分,与由人类听觉系统(HAS)和/或人类视觉系统(HVS)所感知到的一样。
多媒体指纹的一个定义是这样一个函数,它把多媒体内容的每一个基本的时间单元(time-uint)和半唯一的位序列(semi-uniquebit-sequence)相关联,所述位序列相对于由HAS/HVS所感知的内容相似性是连续的。换句话说,如果HAS/HVS认为两段音频、视频或图像非常相似,那么相关联的指纹也将是非常相似的。尤其是,原创内容和压缩内容的指纹应该是相似的。另一方面,如果两个信号确实表示不同的内容,则健壮的指纹将能区别开这两个信号(半唯一的)。因此,多媒体指纹能够实现内容识别,这是很多应用的基础。
例如,在一个应用程序中,大量多媒体对象的指纹以及每个对象相关的元数据被存储在一个数据库中。元数据通常是关于对象的信息,而不是关于该对象内容的信息,例如如果该对象是一首歌曲的一个音频剪辑,那么该元数据可以包括歌曲标题、艺术家、作曲家、唱片簿、剪辑的长度以及剪辑在该歌曲中的位置。
一般地,不为整个完整的多媒体信号计算单个指纹值或项。相反,为多媒体信号的多个分段中的每一个计算多个指纹(以下简称子指纹),例如为每一个图像帧(或一个图像帧的部分)、或音频轨道的一个时间片计算一个子指纹。因此,诸如歌曲之类的音频轨道的指纹只不过是一个子指纹列表。
一个指纹块是一个子指纹序列(一般地为256),其包括足够的信息以可靠地识别该信息源(例如歌曲)。原则上,一首歌曲的指纹块可以是该歌曲所有连续的子指纹块。一般地,为每一首歌曲建立多个指纹块,每一个块表示该歌曲的一个连续部分。
如果多媒体内容连续地被接收,而不带有任何元数据,那么多媒体内容的元数据可以通过计算该多媒体内容一或多个指纹块来确定,以及在该数据库中查找对应的指纹块。由于需要较少的存储器/大储存器,所以指纹块而不是多媒体内容本身的匹配是更加高效的,因为感知的不相干性一般不包括在该指纹内。
(从所接收的多媒体内容中)提取的指纹块和在数据库中存储的指纹块的匹配可以通过执行一种强力搜索来执行,以便将接收的信号的指纹块(或如果接收的信号的长度是足够长的话就是指纹块)和数据库中的每一指纹块进行匹配。
如下的这篇文章描述了一种合适的音频指纹搜索技术,所述论文为“Robust Audio Hashing for Content Indentification(内容识别的健壮性音频散列))”,基于多媒体索引内容2001,Brescia,意大利,2001年9月,Jaap Haitsma、TonKalker和Job Oostveen)。所描述的策略使用一个用于所有可能子指纹值的查找表。表中的条目指向所述歌曲以及各自子指纹值出现在的那首歌曲的位置。通过为每一个所述提取子指纹值检查查找表,产生一个候选者歌曲以及位置列表,以便高效地减少所要求的、指纹的匹配的范围。
本发明实施例的一个目的是提供一种能够实现高效搜索指纹数据库的方法以及设备。

发明内容
在一方面,本发明提供一种匹配一个输入指纹块组和数据库中存储的、识别各自信息信号的指纹的方法,每个指纹块表示信息信号的至少一部分,该方法包括如下步骤选择所述输入指纹块组的第一指纹块;在所述数据库中查找至少一个匹配所选指纹块的指纹块;从所述指纹块组中选择位于相对于所述第一选择指纹块的预定位置的另一个指纹块;在所述数据库中定位位于相对于所找到的指纹块的预定位置的至少一个对应的指纹块;并且确定所定位的指纹块是否匹配所述选择的另一个指纹块。
通过使用初始匹配来明显地缩小搜索范围,随后匹配对应位置的指纹块,因此,用这样的方式搜索可以有效地减小所述搜索的速度和/或增加健壮性。
另一个方面,本发明提供一种用于为一个信息信号产生日志报告的方法,包括如下步骤将该信息信号划分为相似的内容分段;为每一个分段产生一个输入指纹块;并且重复如上所述的方法步骤以便识别所述的每一个块。
本发明更进一步的一个方面提供一种计算机程序,用于执行如上所述的方法。
另一个方面,本发明提供一种记录载体,包括如上所述的计算机程序。
更进一步的方面,本发明提供一种可用来下载如上所述计算机程序的方法。
另一个方面,本发明提供一种用于匹配一个输入指纹块组和数据库中所存储的、识别各自信息信号的指纹的设备,每个输入块表示信息信号的至少一个部分,该设备包括处理单元,用于选择所述输入指纹块组的第一输入块;在所述数据库中查找至少一个匹配该选择指纹块的输入块;从所述指纹块组中选择位于相对于所述第一选择指纹块的预定位置的另一个指纹块;在所述数据库中定位位于相对于所找到的指纹块的预定位置的至少一个对应的指纹块;并且确定所述定位的输入块是否匹配所述选择的另一个指纹块。
本发明更进一步的特征定义在所述附加的权利要求中。


为了更好地理解本发明,并且说明如何执行相同的实施例以达到效果,现在通过实施例引用以下附图,其中附图1是本发明第一实施例方法步骤的流程图;附图2是示出根据本发明实施例对应于用于搜索选择音频信号分段的指纹块的示意图;附图3是第二实施例方法步骤的流程图;附图4是一种设备的示意图,根据本发明,所述设备用于根据输入信息流产生指纹块值,并且随后匹配更进一步的指纹块。
具体实施例方式
一般地,通过把指纹块和在数据库中所存储的指纹块进行匹配来识别指纹块,这要求我们所称为的一个完全搜索(例如使用在RobustAudio Hashing forContent Indentification(内容识别的健壮性音频散列))”中由Jaap Haitsma、Ton Kalker以及Job Oostveen描述的搜索技术,基于多媒体索引内容2001,Brescia,意大利,2001年9月)。
本发明利用了这样一个事实,即随后的(或先前的)指纹块产生于相同的信息分段(例如歌曲或录像剪辑段)的概率是高的。因此,一旦已经识别一个指纹块,试图通过仅仅把指纹块和数据库中对应的指纹块相匹配,就可以快速识别随后的指纹块。
附图1示出根据本发明第一实施例在执行这种搜索中所涉及到的步骤的流程图。
这种搜索假定存在一个数据库,所述数据库包括对应于一种信息信号不同部分的多个指纹。例如,这种数据库可以包括大量歌曲的指纹块,每个指纹块包括一个子指纹序列。一个子指纹对应于所述歌曲的短分段(例如长达11.8毫秒)。元数据和每首歌曲相关联,指示例如歌曲标题、歌曲长度、演出艺术家、作曲家、唱片公司等等。
接收一种信息信号(例如一首歌曲、或一首歌曲的部分)后,希望识别出这首歌曲和/或与这首歌曲相关联的元数据。这可以通过将这首歌曲的指纹块和数据库中对应的指纹块相匹配来实现。
如附图1所示,为在该信息信号中第一位置x计算第一指纹块X(步骤10)。例如,在一首歌曲中,这可能会涉及这首歌曲内3-5秒之间的时间片。
然后,执行该数据库的搜索,以识别该数据库中的任何指纹块是否匹配所述计算的指纹块X(步骤20)。
这种搜索(步骤20)可以是所述数据库的一种穷举搜索,将指纹块X和所述数据库内每个指纹块迭代地进行比较。可选择地,可以使用一个查找表来选择所述最可能的匹配,如上述由Jaap Haitsma、TonKalker以及Job Oostveen所述的论文“Robust Audio Hashing forContent Indentification(内容识别的健壮性音频散列))”中所描述,基于多媒体索引的内容2001,Brescia,意大利,2001年9月,。
由于在所述信号时间间隙的成帧过程中存在着变化,以及由于传输和/或压缩的信号衰减,因而导致指纹块X未必恰好匹配所述数据库存储中的任何单个指纹块。然而,如果所述指纹块X和所述数据库中所述指纹块的任何一个之间的相似性是足够高的,则被认为发生了一次匹配(步骤20)。
相同的,所述指纹块X和所述数据库中的指纹块间相异性是可以比较的。如果所述相异性(所述两个指纹块间相差的数目)低于一个预定的阀值T1,那么被认为发生了一次匹配。
如果确定没有匹配的指纹块存在于所述数据库(步骤40),那么为所述信号内一个新的开始位置计算指纹块,然后重新执行搜索(步骤20和40)。
如果发现一个或可能更多的(如果两首歌曲是非常相似的这种情况可能发生)指纹块是相似的,那么需要注意它们在所述数据库中的位置。如果所述匹配的可靠性是足够高的(步骤55)那么就能记录所述结果(步骤90),然后可以停止所述识别过程。在步骤60,如果所述匹配的可靠性不高,可以为所述信号中位置X的相邻位置确定指纹块Y(例如所述音频信号先前或随后的时间片)。
所述数据库中对应位置的指纹块然后和指纹块Y相比(步骤70)。例如,如果为紧跟在音频信号中位置X之后的时间间隙计算了指纹块Y,那么所述指纹块Y就会被和所述数据库中的指纹块相比较,所述指纹块预期可能会在紧跟着匹配了指纹块X的指纹块之后出现。
另外,指纹块的匹配可以使用一个预定门限值(T2)执行,所述预定门限值(T2)与所述指纹块间的相异性有关。阈值T2可以和T1相同,或者低于T1。然而,最好为T2是一个比T1稍高的阀值。两个相邻指纹块匹配所述数据库中两个相邻的指纹块是极其不太可能的,除非所述指纹块涉及相同的信息源。如果指纹块Y和所述数据库中对应的指纹块不相匹配(例如这种情况可能发生在一首新歌已开始播放之时),那么可以为指纹块Y执行一次完全搜索。
如果在数据库中没有任何匹配(步骤80),那么重新开始所述搜索过程,即为所述当前指纹块Y的匹配执行所述数据库的一个完全搜索(步骤20),然后视情况而定重复后面的步骤。
如果所述数据库中一个或多个对应的指纹块匹配(步骤80),那么确定所述任何匹配是否是可靠的(步骤85),例如任何匹配是否可靠得足以识别所述信息信号。如果一个匹配是可靠的,那么就记录所述结果(步骤90),然后停止所述识别处理。如果匹配不可靠,为所述信号中下一个相邻的时间间隙(即接近所述先前指纹块Y的位置)确定新的指纹块Y(步骤60)。
可以理解的是上述实施例仅仅是通过实施例来提供的。例如,已经结合接收的信息信号描述了所述实施例,按照所述搜索按照所述搜索还执行为所述信息信号内位置计算指纹块。同样地,所述搜索技术适用于接收的信息信号,以及适用于为所述信号中的一或多个位置(直至每个位置)(所述搜索开始之前)计算的指纹块,随后选择这些块以供所述搜索过程之用。可选择地,可以只接收对应于信息信号的至少一部分的两个或更多单个指纹块,并且执行搜索以便使用这些指纹块来识别所述原始信息信号。
所述匹配阈值可以依靠实施的搜索的不同而不同。例如如果预期所述信息信号很可能会失真,那么所述阀值T1可以设置为比正常的高,以便更健壮地防止失真并且减小假阴性率(false negative rate)(如果确定两个指纹块不匹配,那么就认为已产生了假阴性,即使它们涉及所述信息信号相同的部分)。减小假阴性率一般将导致一个高假阳性率(false positive rate)(其中匹配被认为发生在实际上涉及不同信息的两个指纹块间)。然而,通过考虑下一个(或前一个)指纹块是否与所述数据库中的对应的块相匹配,对于所述总体搜索,就可以减小假阳性率。
上述方法已经假定选择来匹配所述信息信号的每个随后的指纹块是邻近于前一个指纹块(按序在前或在后)的。然而,可以理解的是,如果所述指纹块对应的信息邻近于预先选择的指纹块的信息,那么也可以使用相同的方法。同样地,可以利用信息信号的指纹块间任何已知的关系,或所述指纹块涉及的信息的位置之间的任何已知关系,只要该关系是一个具有对应位置的指纹块可能位于所述数据库内即可。例如,在一个包括图像的信息信号中,可以沿着所述图像对角线依据对应于图像分段的指纹块执行搜索。
本发明的实施例还可以用来监控歌曲或其它音乐作品的无线或有线广播。例如,一个音频指纹系统可用于为存在于一个音频流中的所有时间块(一般地两级在3-5秒左右)产生一个日志报告,其可以包括多个歌曲。对于一个分段的日志信息通常包括歌曲、艺术家、唱片簿以及这首歌曲的位置。
该监控过程可以脱机完成,即音频流(例如广播电台的广播)的指纹块首先被记录到一个指纹文件,所述指纹文件例如包括一个小时的音频指纹块。对于这一个小时音频的日志,可以通过使用上述方法高效地产生。
附图2示出一个指纹文件90,包括三首歌曲(歌曲1、歌曲2、歌曲3)的指纹块,每首歌曲持续各自的一个时间(t1、t2、t3)。代替对所有指纹块执行一个完全搜索,仅仅对一个小的指纹块组(例如91,95以及98)执行一个完全搜索,最好相隔一个平均的歌曲间隔(大约3-4分钟)或一个极小歌曲间隔(例如2分钟的间隔,假定该极小歌曲间隔已知是等于或者或者大于2分钟)。一般地,一个子指纹将持续大约10毫秒,并且一个指纹块持续3-5秒。
一旦从该小的指纹块组中识别指纹块(91,95,98),通过仅仅匹配所述数据库中对应的指纹块并使用结合附图1所述的方法,就可以非常高效地识别相邻块(92,93,96,97…)。通过使用识别块的歌曲位置以及识别歌曲的歌曲间隔就可以识别对应的块。执行所述匹配之后,为一个完全搜索从一个未鉴别的块组中选择一个新的指纹块。该整个过程本身重复执行,直到所有的指纹块肯定已经由一个匹配识别,或者一个完全搜索已经把指纹块视为未知。
人们注意到本发明的实施例还可以用于实时监控。例如,一个实施例可用于在播放所述歌曲之时几乎瞬时地识别广播中的歌曲。在那种情况下仅仅在一个已经识别的指纹块之后的指纹块可以容易地用于与所述数据库中对应的块相配。然而,如果在接收当前块以及识别信息源之间允许一些延迟,那么多个在前的指纹块就可以用于识别过程。
附图3示出本发明实施例方法步骤的一个流程图,其适用于执行这种信息信号的实时监控。
在附图3中,为该方法步骤使用了对应于附图1相同方法步骤的附图标记。
首先,为信号中的位置x计算指纹块X(步骤10)。然后以第一阀值T1在所述数据库中执行一个搜索,以便匹配指纹块(步骤20),并且记录匹配的结果(步骤30)。
如果在数据库中没有找到任何匹配的块(步骤40),那么为所述信息信号的一个新的开始位置计算指纹块(步骤50),然后重新执行搜索(步骤20)。
如果在数据库中发现一或多个匹配的指纹块(步骤40),则为信息信号的相邻位置计算指纹块Y(步骤60)。例如,如果信息信号正在连续地接收,那么可以为该信号的下一个接收的时间片计算指纹块Y。
然后,以一秒的阈值T2把块Y和该数据库中对应的块进行比较(步骤70)。可选择地,仅仅把块Y和数据库中的如下的那些块相比较以匹配块X,所述那些块涉及在信息信号中的、与在步骤20中发现的块位置的邻近的位置。
如果发现块Y和该数据库中对应的任何块都不匹配,(步骤80),那么为指纹块Y执行数据库的一个完全搜索(步骤20)。
然而,如果发现块Y和该数据库中的一个或多个对应的块匹配(步骤80),那么记录该结果(步骤90),并且为一个相邻位置计算指纹块以及重复该过程。继续附图3描述的整个过程,直到所有的指纹块肯定已经被识别,或者已经被完全搜索确定为是未知的。
这个实施例可以更进一步的改进,即通过检验信息信号的、任何搜索的指纹块和数据库对应的块间的相似性以确定匹配是否是足够可靠的。换句话说,匹配块的历史是可以比较的。例如,在数据库中已经发现一个指纹块X的一个合理匹配,该合理匹配可以还没有可靠到足以识别该信息信号。在数据库中还可能已经发现了指纹块Y的一个合理匹配,该匹配本身可能被认为是还没有可靠到足以识别该信息信号。然而,如果X和Y的匹配都涉及相同的信息信号,那么这两种匹配偶然发生的可能性是相对低的,即匹配发生的组合概率可靠到足以识别传输的信息信号。
本发明适合于结合多种指纹技术使用。例如,Haitsma等的音频指纹技术计算对于音频信号的基本窗口设定的间隔的子指纹值,如存在于″(Robust Audio Hashing for Content Indentification(内容识别的健壮性音频散列))″、内容基于多媒体索引2001,Brescia,意大利,2001年9月。这种音频信号由此被分成帧,并且随后每个时间帧的频谱表示用傅里叶变换加以计算。这种技术提供一个模仿HAS行为的健壮的指纹函数,即它提供一种模仿了音频信号内容且与听众会感知到的一样的指纹。
在这种指纹技术中,如附图4所示,可以输入音频信号或包括音频信号的位流。
如果正在位流信号取出指纹,那么包括编码的音频信号的位流由位流解码器110接收。该位流解码器完全解码该位流,以便产生一个音频信号。这个音频信号然后传递到成帧单元120。
可替换地,一个音频信号可在直接音频输入100接收,并且传递到成帧单元120。
该成帧单元将音频信号划分为一系列基本窗口设定的(windowedtime)时间间隔。该时间间隔最好互相重叠,以使得来自随后的帧的子指纹值在很大程度上是相似的。
然后,每一窗口设定的时间间隔信号被传递到傅里叶变换单元130,该单元对于每一个时间窗口计算傅里叶变换。绝对值计算单元140用于计算该傅里叶变换的绝对值。执行这一计算,因为人类听觉系统(HAS)相对于相位不太灵敏,并且仅仅保持这种频谱的绝对值,因为该绝对值对应于人类耳朵常常会听到的音调。
为了能够为该频谱内预定的频带系列中的每一个计算单独的子指纹值,使用选择器151、152、…158、159来选择与所希望的频带相对应的傅里叶系数。适用于每个频带的傅里叶系数然后被传递到各自的能量计算级161、162、…168、169。每个能量计算级然后计算每一频带的能量,然后把所计算的能量传递给到微分电路,该微分电路计算子指纹位H(n,x)并且将其发送到输出180,其中x相当于各自的频带,而n相当于相关的时间帧间隔。在最简单的情况下,这些位可以是一个指示该能量是否大于一个预定门限值的符号。通过对比对应于单个时间帧的位,为每一个希望的时间帧计算一个子指纹。
然后,把每个帧的子指纹存储在一个缓冲器190中,以便形成指纹块。该缓冲器的内容随后由一个数据库搜索引擎195访问。该数据库搜索引擎然后执行搜索,以便使用上述方法匹配在匹配缓存器19O中存储的指纹块和在数据库中存储的对应的指纹块,以便有效地识别输入到了位流解码器110或直接音频输入100中的信息流(和/或与该信息流相关联的元数据)。
尽管已经结合了音频信息流描述本发明的上述实施例时,可以理解的是本发明可以适用于其它信息信号,尤其是多媒体信号,包括视频信号。
例如,这篇论文描述了一个用于提取来自一个运动图像序列实质的感性特征的合适的技术,所述论文是“J.C.Oostveen,A.A.C.Kalker,J.A.Haitsma,Visual Hashing of Digital VideoApplications and Techiques(数字视频的可视化散列)应用和技术”,SPIE,数字图像处理应用程序XXIV,2001年7月7月31-8月3,圣地亚哥,美国”。
由于该技术涉及可视化指纹,感知的特征涉及HVS查看的内容,即它辅助为同样由HVS考虑的内容产生相同(相似的)指纹信号。提出的算法注意考虑提取自通过像素块计算的亮度分量或者色度分量的特征。
技术人员可以理解的是未具体描述的各种实施例将可被理解为属于本发明的范围。例如,当仅仅描述了指纹块产生装置的功能度时,可以理解的是该装置可以由数字电路、模拟电路、计算机程序或其中的结合来实现。
同样地,当结合具体类型编码方案描述上述实施例时,可以理解的是本发明可以适用于其它类型编码方案,尤其是那些当传输多媒体信号时包括关于感知的重要信息系数的编码方案。
读者的注意放在论文和所有文件上,其是同时申请或连同这种应用程序之前的说明书,并且这种说明书对公众的监督是公开的,这里一并结合引用所有这种文件的内容。
本说明书公开的所有的特征(包括所有附加的权利要求、摘要以及附图),和/或因此公开的任何方法或处理的所有的步骤可以以任何结合方式进行结合,除非其中这种特征和/或步骤中至少一些是互斥的。
本说明书公开的每个特征(包括所有附加权利要求、摘要以及附图)可以由用于相同、相等或相似的目的的备选方案特征替代,除非另有明确说明。因此,除非另有明确说明,公开的每个特征仅仅是一般的一系列相等或相似特征的一个实例。
本发明并不局限于上述实施例的细节。本发明延伸本说明书(包括所有附加权利要求、摘要以及附图)公开特征的任何的新的特征或任何的新的组合,或因此公开的任何方法或处理的步骤的任何的新的步骤或任何的新的组合。
在本说明书内可以理解的是词“包括”不排除其它元件或步骤,“一个”或“以及”不排除大量,而单个处理器或其它装置可以完成本权利要求中叙述的若干装置的功能。
本发明可以概述如下。描述了一种匹配一个输入指纹块组和在数据库中存储的、识别各自信息信号的指纹的方法和装置,每个指纹块表示信息信号的至少一部分。本方法包括如下步骤选择所述输入指纹块组的第一指纹块,并且在所述数据库中查找至少一个匹配所选指纹块的指纹块。从所述指纹块组中选择位于相对于所述第一选择指纹块的预定位置的另一个指纹块。在所述数据库中定位位于相对于所找到的指纹块的预定位置的至少一个对应的指纹块,并且确定所定位的指纹块是否匹配所述选择的另一个指纹块。
权利要求
1.一种匹配一个输入指纹块组和在数据库中所存储的、识别各自信息信号的指纹的方法,每个指纹块表示信息信号的至少一部分,该方法包括如下步骤选择所述输入指纹块组的第一指纹块;在所述数据库中查找至少一个与所选指纹块相匹配的指纹决;从所述指纹块组中选择位于相对于所述第一选择指纹块的预定位置的另一个指纹块;在所述数据库中定位位于相对于所找到的指纹块的预定位置的至少一个对应的指纹块;并且确定所定位的指纹块是否匹配所选择的另一个指纹块。
2.如权利要求1的方法,该方法还包括迭代地重复执行的如下步骤选择另一个指纹块,在所述数据库中定位一个相应的指纹块,并且对于相对于第一选择指纹块的不同预定位置,确定所定位的指纹块是否与所选择的另一个指纹块相匹配。
3.如权利要求1的方法,其中所述预定位置是一个相邻位置。
4.如权利要求1的方法,其中如果指纹块间相差的数目低于第一阈值,则认为在所述查找步骤中已经发生了一次匹配,并且如果指纹块间相差的数目低于第二阈值,则认为在所述确定步骤中已经发生了一次匹配。
5.如权利要求4的方法,其中所述第二阈值不同于所述第一阈值。
6.如权利要求1的方法,还包括如下步骤接收一个信息信号;将该信息信号划分为几个部分;并且通过为每一个部分计算指纹块产生所述输入块。
7.一种用于为信息信号产生日志报告的方法,包括如下步骤将该信息信号划分为相似的内容分段;为每一个分段产生一个输入指纹块;并且重复如权利要求1所述的方法步骤,以便识别每一个块。
8.如权利要求7的方法,其中所述信息信号包括一个音频信号,并且其中每个分段相当于一首歌曲的至少一部分。
9.一种用于执行如权利要求1所述的方法的计算机程序。
10.一种包括如权利要求9所述的计算机程序的记录载体。
11.一种可用于下载如权利要求9所述的计算机程序的的方法。
12.一种用于匹配一个输入指纹块组和在数据库中存储的、识别各自信息信号的指纹的设备,每个输入块表示信息信号的至少一个部分,该设备包括处理单元,用于选择所述输入指纹块组的第一指纹块;在所述数据库中查找至少一个与所选指纹块相匹配的指纹块;从所述指纹块组中选择位于相对于所述第一选择指纹块的预定位置的另一个指纹块;在所述数据库中定位位于相对于所找到的指纹块的预定位置的至少一个对应的指纹块;并且确定所定位的指纹块是否匹配所选择的另一个指纹块。
13.如权利要求12的设备,还包括一个数据库,用于存储识别各自信息信号的指纹和与每个信号相关联的元数据。
14.如权利要求12的设备,还包括一个接收器,用于接收一个信息信号,以及一个指纹发生器,用于根据所述信息信号产生所述输入指纹块组。
全文摘要
描述了一种用于匹配一个输入指纹块组和在数据库中存储的、用于识别各自信息信号的指纹的方法和设备,每个指纹块表示信息信号的至少一部分。本方法包括选择该输入指纹块组的第一指纹块(10),并且在该数据库中查找至少一个与该选择的指纹块相匹配(20,40)的指纹块。然后,从该输入块组中选择位于距离第一选择指纹块(60)的一个预定位置处的另一个指纹块。然后,在该数据库中把另一个指纹块定位在一个相对于所找到的指纹块的相同的预定位置(70),并且确定该定位的指纹块是否匹配所选择的另一个指纹块(80)。
文档编号G06F17/30GK1708758SQ200380102514
公开日2005年12月14日 申请日期2003年10月7日 优先权日2002年11月1日
发明者J·A·海特斯马 申请人:皇家飞利浦电子股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1