“指纹”的提取的制作方法

文档序号:2821118阅读:1506来源:国知局
专利名称:“指纹”的提取的制作方法
技术领域
本发明涉及从媒体信号中提取“指纹”的方法和装置。
背景技术
“指纹”,一般也称作签名或者杂乱的信号,是从多媒体内容,比如歌曲,图象图片,一个视频片断等中提取的比特序列。多媒体“指纹”特别是在鉴别领域,在需要时可以用来识别所接收到的内容是否为原始内容,或者探测内容是否被篡改。“指纹”也常常被用来识别媒体内容。一个在不远的将来即将流行的服务就是音频识别。从一段未知的音乐中提取的“指纹”被发送到一个可以查阅音乐的名称,音乐家的名字和其他元数据的数据库,然后再返回的消费者。
一个已知的从媒体信号中提取指纹的方法在申请人的编号为WO02/065782国际专利申请中被披露。这一现有技术的方法显示在

图1中。这个媒体信号(这里的是一首歌)被分成叠加的帧(101)。每一帧的频谱表示通过一个快速傅里叶变换(102)而获得。子频带中对数间隔的音频信号的能量随后被计算出来(103)。在300-200赫兹范围内的频带是可感知的最相关范围。该33的能量级构成了一相应音频信号帧的可感知特性样本的一个序列。为了相对音频信号的绝对音量不变化和阻止一个主单音频为连续帧生成相同序列,一个简单的2维滤波器(104)被用于在获得32个差分特性样本前的频谱图上。该序列随后被一个适当的阈值操作(105)转换成一些比特串(105)。更具体的,一个特定帧的一个子频带,如果与相邻子频带的能量差不同大于与它相邻的前面一帧中子频带的能量差,则被分配比特“1”。否则,指纹比特是“0”。
该已知的方法为每一个音频帧生成一个32比特的字符串(约等于0.4秒)。这些帧最好重叠(例如系数31/32),因此比特串随着时间缓慢改变。这样指纹的提取不会随着时间偏移和帧边界定位的变化而变化。具有代表性的,256个重叠帧的块,即256×32=8192b比特(约等于3秒的音频)被用来识别一首歌。
现有技术的指纹提取方法相对于所有普遍使用的音频处理步骤已经非常稳固,如MP3编码,抽样率的变换,数字与模拟间的转换,均衡。但是,它相对速度变化却不稳固。广播电台加快几个百分点的播放速度是很普遍的。这样做应该有两个原因。第一,歌曲的播放时间会更短,因此可以让他们能播放更多的商业内容。第二,这些歌曲的节拍会快一些,而且听众看起来喜欢这样。这种速度的变化一般在0-4%之间。
发明目的和概述本发明的目的之一是提供一个改进的从媒体信号中提取指纹的方法和装置。
根据本发明,为了实现这个目的,提取方法包含从媒体信号获得信号的给定的可感知特性的样本序列;将特性样本施加一个自动相关函数,以获得一自动相关值序列;把这个自动相关值与各自的阈值比较;通过各自的指纹比特表现这个比较的结果。
本发明的提取方法与现有技术的指纹提取方法不同,本发明的指纹比特不是从信号的可感知特性上获得,而是从所述特性的自动相关获得的。本发明是根据一种认知,即音频信号的速度变化导致子频带中的能量级从一个子频带转移到另一个子频带,并且利用了自动相关函数偏移不变的特性。
该自动相关函数在一个持续的时间域内是众所周知的。但是,我们这里要解决的是有限的特性值序列(如能量水平)。因此,根据本发明的方法的一个实际应用的具体实施例,预期的自动相关是通过将一个特性样本子序列和特性样本的完整序列相关来近似的。
该自动相关函数最好是通过大量的大于预期指纹比特量的特性样本量被计算出的。被计算出的自动相关函数的下采样被用来获得预期的自动相关数值。
附图简述图1示意性地显示现有技术从音频信号提取指纹的方案。
图2示意性地现实根据本发明从音频信号中提取指纹的方案。
具体实施例一个音频信号的速度变化导致时间和频域的失调。关于时间的失调,一个音频摘录2%的速率改变导致这个摘录第250个指纹被从原摘录的第255个指纹处提取到。幸而,为了位移的不变,指纹是这样被构建的,它沿着时间轴具有相关性。因此,原始摘录和速度改变的相同摘录之间的BFR(比特错误率)不会由于时间的失调而大大增加。
因此速度大量改变所引起的的主要问题是频率失调。在图1所示的现有方案中,2%的提速将会导致由傅里叶变换获得一个频谱的频率轴缩放。例如,一个500赫兹的音调导致一个510赫兹的音调和一个1000赫兹的音调导致一个1020赫兹的音调。在计算频谱后,对数间隔频带里的能量被确定了。因为频带被对数地间隔,速度的变化导致的能量从一个频带改变到了下一个频带。从一个频带到下一个频带的能量偏移越大,提取指纹的比特错误的可能性越大。这是因为,该指纹的比特是被相邻频带的能量差异所决定的。
已经建议用强制的途径去识别显著速率变化的音频。强制途径包括在数据库中存储在多种速度下提取的指纹,或者在数据库中查寻在多种速度下提取的指纹。这种方法的缺点是,搜索的速度和/或储存的规格被提高系数N,N即在具体应用中所需的不同速率数。
图2显示的一个根据本发明从一个音频信号中提取指纹的装置。在该图中,相同的参数被用作在图1已经讨论过的同一的或相似的步骤。更具体的,该音频信号被分为重叠的帧(101)和每一帧的频谱被计算(102)。
一个自动相关的步骤(202)是取得更好的速度变化复原能力的基本步骤。一个速度变化导致被计算出的能量矢量的移位。自动相关有位移不变的特性。就像一般的所知,一个连续函数f(t)的自动相关p(x)是ρ(x)=∫-∞∞f(t)f(t+x)dt]]>但是,我们在这里并不涉及一个无限的连续函数f(t),而是一个有限的特性样本(能量)序列。为了从统计的大量的特性样本中计算出自动相关,512个子频带的能量被计算(201),而不是33个子频带。该频带仍然是对数的而且仍在300赫兹到2000赫兹的范围内。因而该频带有一个较小的带宽。该自动相关被通过将能量的一个子序列和完整的序列相关来近似。更具体的,如下从子频带能量样本E(j)计算出自动相关ρ[x]ρ[x]=Σj=1ME(K+j)E(x+j)forx=1,2,··,N-M]]>其中N表示整个能量矢量的长度(这里N=512),M表示子序列的长度和K表示子序列在该完整序列中开始的位置。M和K的典型设置分别是64和96。为了提高稳固性,该产生出的自动相关值被选择性地低通滤波(203)。该低通滤波的自动相关具有512-64=448个值,而在执行该阅值操作前,需要33个输入值,以用于2维滤波器(104)。因此,该448个自动相关值在一个下抽样器里被向下采样到33个值(204)。所产生出的指纹是一个每一帧的32比特字符串。
虽然已经参考音频指纹提取描述了本发明的方法和装置的实施例,但是本发明并不限于此。申请人已经提到的国际专利申请WO02/065782揭示了视频指纹的提取方法,其中指纹是从每个图像被划分成的图象块的平均亮度值获得的。根据本发明,每个图像被分成大量的图块,图块的一个子集(一个“超级图块”)对于所述超级块的一些位置被与该整个图像相关。该获得的自动相关值的序列不随视频图像的位移而变化。该序列被选择性地低通滤波,随后被向下取样。
本发明可以被总结如下。指纹是被从媒体信号(如一个音频或视频片断)中提取的比特字符串,用以识别所述媒体信号。典型的,他们被从信号的可感知特性获得,例如,一个音频片断的频谱能量分布或者一个视频图像的亮度分布。这里揭示的是一个相对于可感知的特性位移稳固的提取指纹的方法和装置。这种位移发生在指纹从一个音频信号的对数映射的频谱的能量分布获得时的,所述音频信号有速度的改变。根据本发明,该指纹不是被从可感知特性提取的,而是通过它的自动相关函数提取的。
权利要求
1.一种从媒体信号提取指纹的方法,包含从所述的媒体信号中提取信号的给定的可感知特性的样本序列,和从所述序列获得构成所述指纹的一个二进制序列的步骤,其中所述方法包含如下步骤给特性样本序列施加一个自动相关函数(202),以获得一个自动相关值的序列;比较(105)所述的自动相关值与各自的阈值;通过指纹的各个比特表示出所述比较的结果。
2.根据权利要求1所述的方法,其中给特性样本序列施加自动相关函数的所述步骤包括,将特性样本的一个子序列和特性样本的完整序列相关。
3.根据权利要求1所述的方法,其中给特性样本序列施加自动相关函数的所述步骤进一步包括,对自动相关值下采样(204),以获得所需个数的自动相关值。
4.根据权利要求1所述的方法,其中从所述媒体信号获取可感知特性值的序列的步骤包括,将一个音频信号划分成子频带并且计算所述音频子频带的能量。
5.根据权利要求1所述的方法,其中从所述媒体信号获取一个可感知特性序列的步骤包括,将图象划分成块并计算所述图象块的亮度。
6.一种用于从媒体信号提取指纹的设备,包括用于从所述媒体信号获取信号的给定可感知特性样本序列的装置,用于从所述序列获取构成所述指纹的二进制序列的装置,其特征在于,所述设备包括装置,用于给特性样本序列施加一个自动相关函数,以获得一个自动相关值序列;装置,用于比较所述自动相关值和相应的阈值;和用指纹的相应比特表示所述比较的结果。
7.一个计算机程序,包括使可编程设备执行以下步骤的指令从接收的媒体信号获取信号的给定可感知特性的样本序列;给特性样本施加一个自动相关函数,以获得一个自动相关值序列;比较所述自动相关值和相应的阈值;通过相应的指纹比特表示所述比较的结果。
全文摘要
“指纹”是指从媒体信号(例如一个音频或视频片断)中提取的位串,用以识别所述媒体信号。具体讲,他们是通过信号的可感知性被收集到的,例如,一个音频片断的频谱能量分配或者一个视频图像的亮度分布。这里揭示的是一种相对于可感知性的偏移稳固的提取“指纹”的方法和装置。尤其当“指纹”是源自一个音频信号的对数映射的频谱能量分配,并且该音频信号是处在速度变化之中时会发生这种偏移。根据本发明,指纹不是源自前面讲的媒体信号的可感知性,而是来自它的自动相关功能。
文档编号G10L19/018GK1685703SQ03823392
公开日2005年10月19日 申请日期2003年8月11日 优先权日2002年9月30日
发明者J·A·海特斯马 申请人:皇家飞利浦电子股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1