用于执行音频水印解码的方法、装置以及制造品的制作方法

文档序号:2825132阅读:198来源:国知局
专利名称:用于执行音频水印解码的方法、装置以及制造品的制作方法
技术领域
本公开总体上涉及媒体监测,并且更具体地说,涉及用于执行音频水印解码的方法、装置以及制造品。
背景技术
标识媒体内容(例如,电视(TV)节目、无线电节目、广告、评论、音频/视频内容、 电影、商业广告节目、广告等)有用于评价对这种内容的视听者接触率(exposure)。例如, 在视听者计量应用中,可以将代码或水印插入或嵌入媒体内容的音频或视频(例如,节目或广告)中,其中,随后在呈现(例如,在受监测家庭播放)该媒体内容时在一个或更多个监测点处检测代码/水印。嵌入到原始信号中的代码/水印的信息净荷可以包括独特节目标识、源标识、广播方信息,以及/或广播时间。监测点可以包括诸如家庭、商店、营业地点以及/或任何其它公共和/或私人机构的场所,其中,监测媒体内容接触率和/或媒体内容消费量。例如,在监测点,捕获来自音频和/或视频的代码/水印。可以将所收集的代码/ 水印发送给中心数据收集机构,以对诸如内容消费统计的计算进行分析。

发明内容
本发明提供一种用于执行音频水印解码的方法、装置以及制造品。本发明提供的方法包括以下步骤接收音频信号,该音频信号包括使用第一多个频率分量嵌入的听者测量代码;对所述音频信号进行采样;将所采样的音频信号变换成第一频域表示;确定是否能够在所述第一频域表示的所述第一多个频率分量中检测到所述代码;以及当在所述第一多个频率分量中未检测到所述代码时,检查第二频域表示的第二多个频率分量,以确定是否检测到所述代码,所述第二多个频率分量相对于所述第一多个频率分量偏移了第一偏移,所述第一偏移对应于采样频率失配。本发明提供的装置包括音频信号的音频输入接口,该音频信号包括使用第一多个频率分量嵌入的听者测量代码;采样器,该采样器用于对所述音频信号进行采样;时域频域转换器,该时域频域转换器用于将所采样的音频信号变换成第一频域表示;以及频域解码器,该频域解码器用于确定是否能够在所述第一频域表示的所述第一多个频率分量中检测到所述代码,并且当在所述第一多个频率分量中未检测到所述代码时,检查第二频域表示的第二多个频率分量,以确定是否检测到所述代码,所述第二多个频率分量相对于所述第一多个频率分量偏移了第一偏移,所述第一偏移对应于采样频率失配。本发明提供了一种存储机器可读指令的有形制造品,该机器可读指令在被执行时,使得机器接收音频信号,该音频信号包括使用第一多个频率分量嵌入的听者测量代码;对所述音频信号进行采样;将所采样的音频信号变换成第一频域表示;确定是否能够在所述第一频域表示的所述第一多个频率分量中检测到所述代码;以及当在所述第一多个频率分量中未检测到所述代码时,检查第二频域表示的第二多个频率分量,以确定是否检测到所述代码,所述第二多个频率分量相对于所述第一多个频率分量偏移了第一偏移,所述第一偏移对应于采样频率失配。


图1是采用嵌入到复合电视信号的音频部分中的识别码的示例性广播视听者测量系统的示意图。图2例示了实现图1的示例性编码器的示例性方式。图3例示了实现图1的示例性解码器的示例性方式。图4和5例示了可以例如通过处理器来执行的、用于实现图1和图3的示例性解码器的示例性处理。图6A和6B例示了可以通过图3的示例性解码器进行补偿的示例性频率偏移。图7是可以用于和/或编程为实现图4和图5的、用于实现对图1和图3的示例性解码器和/或示例性偏移补偿器的示例性处理的示例性处理器平台的示意图。
具体实施例方式公开了用于执行音频水印解码的示例性方法、装置以及制造品。所公开的示例性方法包括以下步骤接收音频信号,该音频信号包括使用第一多个频率分量嵌入其中的听者测量代码;对该音频信号进行采样;将所采样的音频信号变换成第一频域表示;确定是否能够在该第一频域表示的第一多个频率分量中检测到该代码;以及当在第一多个频率分量中未检测到该代码时,检查第二频域表示的第二多个频率分量,以确定是否检测到该代码,该第二多个频率分量相对于第一多个频率分量偏移了第一偏移,该第一偏移对应于采样频率失配。所公开的示例性装置包括对音频信号的音频输入接口,该音频信号包括使用第一多个频率分量嵌入其中的听者测量代码;采样器,该采样器用于对音频信号进行采样; 时域频域转换器,该时域频域转换器用于将所采样的音频信变换成第一频域表示;以及频域解码器。该频域解码器用于确定是否能够在该第一频域表示的第一多个频率分量中检测到该代码;并且当在第一多个频率分量中未检测到该代码时,检查第二频域表示的第二多个频率分量,以确定是否检测到该代码,该第二多个频率分量相对于第一多个频率分量偏移了第一偏移,该第一偏移对应于采样频率失配。下列描述分别提及音频编码和解码,该音频编码和解码还被称为音频水印印制和水印检测。应注意到,关于这点,音频是具有落入正常人类声频谱内的频率的任何类型的信号。例如,音频可以是语音、音乐、音频和/或视频节目(例如,电视(TV)节目、电影、因特网视频、无线电节目、插播商业广告等)的音频部分、噪音,或任何其它声音。一般来说,对音频进行编码指将一个或更多个代码插入该音频中。在一些示例中, 该代码被心理声学地掩盖,以使得该代码对于音频的人类听者来说是听不见的。然而,可能存在该代码对于某些人类收听者来说听得见的某些情况。这些代码还可以被称为水印。嵌入到音频中的这些代码可以具有任何适当的长度,并且可以利用用于将信息(例如,信道标识符、站标识符、广播方标识符、内容创建者标识符、内容拥有者标识符、节目标识符、时间戳、广播标识符等)映射至这些代码的任何适当的技术。而且,可以将这些代码转换成由嵌入到音频中的、具有选定频率的信号所表示的符号。任何适当的进行编码和/或纠错的
5技术都可以用于将代码转换成符号。这种听者测量代码的一些示例包括Nielsen公司(美国)、LLC、本专利的受让人所有的Nielsen码。Nielsen码是由Nielsen公司(美国)、LLC、 Melsen公司(美国)的任何分支机构或LLC的任何分支机构嵌入到任何媒体内容中的任何代码,和/或与Nielsen公司(美国)、LLC或与Nielsen公司(美国)的任何分支机构、 LLC的任何分支机构相关联地嵌入到任何媒体内容中的任何代码。在于此描述的示例中, 在发送和/或广播之前,和/或发送和/或广播期间,将媒体内容编码成包括一个或更多个这种代码。当在内容呈现设备上呈现(例如,通过TV、无线电、计算设备、蜂窝电话、手持设备,以及/或任何其它适当设备播放)媒体内容时,处于呈现区域中的人不仅接触该媒体内容,而且不为他们所知的是,还接触了嵌入到该媒体内容中的代码。虽然参照包括嵌入了和/或编码到其音频部分中的代码的广播音频/视频媒体内容(例如,TV节目、商业广告节目、电影等)对以下示例进行描述,但这种示例仅是例示性的。例如,代码可以附加地或另选地嵌入和/或编码到其它类型的媒体内容,诸如但不限于音频内容、视频内容、图形内容、图像、游戏、调查(survey),以及/或网页。而且,在此描述的方法和装置可以用于检测嵌入到任何数量和/或类型的附加地和/或另选的媒体内容 (例如,无线电广播、音频通知等)中的代码。而且,媒体内容不需要广播。例如,媒体内容可以经由任何数量和/或类型的有形介质(如包括嵌入代码的数字万用盘(DVD)和/或光盘(⑶))来散布。图1示出了示例性编码与解码系统100。图1的示例性系统100描绘了示例性电视观众测量系统,其将用作进一步描述在此公开的示例性解码处理的情境。图1的示例性系统100包括编码器102,该编码器102将代码103添加至音频信号104,来生成编码音频信号105。代码103可以表示任何期望的或选定的信息。例如,在媒体监测背景下,代码103 可以表示诸如电视广播、无线电广播等的广播媒体内容的标识。另外,代码103可以包括指示将该代码103插入到音频中的时间或媒体广播时间的定时信息。音频信号104可以是任何形式的音频,例如包括话音、音乐、噪音、商业广告音频、 与电视节目、现场演奏等相关联的音频。在图1的示例中,编码器102将编码音频信号105 传递至发送器106。该发送器106将编码音频信号105连同与该编码音频信号105相关联的任何视频信号108 —起发送。在一些情况下,虽然编码音频信号105可能具有关联的视频信号108,但编码音频信号105不需要具有任何关联的视频。尽管图1所示示例性系统100的发送侧示出了单个发送器106,但该发送侧可以更加复杂,并且可以包括在可以传递音频信号104的散布链中的多个级。例如,该音频信号 104可以在全国网络级生成并且向局部网络级传递以进行局部散布。因此,尽管在发送器 106之前的发送队列中示出了编码器102,但可以在音频信号104的整个散布链放置一个或更多个编码器。因此,音频信号104可以按多个级来编码并且可以包括与那些多个级相关联的多个嵌入代码。下面,结合图2,对实现示例性编码器102的示例性方式进行描述。图1的示例性发送器106可以包括可以通过自由空间传播(例如,经由陆地或卫星通信链路)散布编码音频信号的一个或更多个射频(RF)发送器,或者用于通过电缆、光纤等散布编码音频信号的发送器。在一些示例中,发送器106用于遍及广的地理区域广播编码音频信号105。在其它情况下,发送器106可以通过有限的地理区域散布编码音频信号 105。这种发送可以包括将编码音频信号105上变频至射频,以能够传播编码音频信号105。另选的是,该发送可以包括散布采用数字值或数字值包形式的编码音频信号105,该数字值或数字值包可以通过一个或更多个网络(如因特网、广域网、和/或局域网)进行发送。因而,编码音频信号105可以通过载波信号、通过信息包和/或通过任何适当的技术来传送, 以散布音频和/或视频信号。当通过接收器110(在媒体监测的情境下,该接收器110可位于统计上选定的计量点112处)接收示例性的编码音频信号105时,对该音频信号105进行处理以恢复代码 103,即使在通过接收器110的扬声器114呈现编码音频信号105时,收听者觉察不到(或大致觉察不到)代码103的存在。为此,解码器116直接连接至接收器110处可用的音频输出部118,或者连接至放置在再现音频105的扬声器114附近的麦克风120。所接收音频信号105可以是单声道格式或者立体声格式。下面,结合图3,对实现图1的示例性解码器 116的示例性方式进行描述。图2例示了实现图1的示例性编码器102的示例性方式。如上所述,图2的示例性编码器102将一个或更多个听不见(或大致听不见)的代码103插入到音频104中,以创建编码音频105。在图2所示的示例中,编码器102包括采样器201,该采样器201用于按采样频率202对音频104进行采样,以形成采样的音频信号203。将示例性采样器201耦接至掩蔽估算器(masking evaluator) 204,其估算音频104将代码103隐藏在其中的能力。 代码103被提供给代码频率选择器206,代码频率选择器206确定或选择将代码103插入或嵌入到采样的音频203中所使用的频率。代码频率选择器206可以利用任何适当的检测或校正编码将代码103转换成符号。将对指定或选定的代码频率(该代码频率用于呈现代码 103)的指示207传递至掩蔽估算器204,以使该掩蔽估算器204获知该频率,针对该频率应当确定通过音频104对代码103的掩蔽。另外,将对代码频率的指示207提供给代码合成器208,该代码合成器208生成具有代码频率选择器206所指定的频率的正弦波信号209。 组合器210接收来自代码合成器208的合成的代码频率209和向采样器提供的音频104,并将这两者进行组合以生成编码音频105。在以模拟形式将音频104提供给编码器102的一些示例中,示例性采样器201利用模拟数字转换器或任何其它适当的数字转换器来实现。采样器201可以以例如48000赫兹(Hz)或适于满足Nyquist标准的任何其它采样率对音频104进行采样。例如,如果将音频104频率上限制在15000Hz,则采样器201可以以30000Hz的采样频率202来操作。来自采样器201的各样本203可以通过数字比特串来表示,其中,比特数表示音频104被采样的精度。例如,采样器201可以生成8比特、16比特、24比特,或32比特值302。除了对音频104进行采样以外,图2的示例性采样器201将要一起处理的许多样本(即,音频块)进行累积。例如,示例性采样器201—次可以累积向掩蔽估算器204传递的512个样本音频块。另选的是,掩蔽估算器204可以包括累加器,在该累加器中,在音频块被处理之前将它们累积在缓冲区中。图2的示例性掩蔽估算器204接收或累积这些样本(即,512个样本),并确定所累积的样本的向人类听力大致隐藏代码频率的能力。即,掩蔽估算器204例如通过整体估算音频104的各临界频带以确定其能量,并确定各临界频带的类似噪声或类似音调的属性以及确定这些临界频带掩蔽代码频率的总体能力,来确定这些代码频率是否可以隐藏在由所累积的样本表示的音频104内。临界频带(其可以通过对人类听知觉执行的实验研究来确定)在宽度上可以从频谱低端处的窄频带至声频谱高端处更宽频带进行改变。如果掩蔽估算器204确定可以将代码频率隐藏在音频104中,则掩蔽估算器204指示可以将代码频率插入到音频104内的振幅等级,同时仍保持大致隐藏,并向代码合成器208提供振幅信息。在一些示例中,代码频率选择器206利用将输入代码103与状态相联系的查寻表来实现,在该查寻表中,各状态表示要在编码音频信号105中强调的许多代码频率。换句话说,可以根据代码频率映射表将输入代码103映射至代码频率。代码频率选择器206可以包括将符号或数据状态与冗余地表示数据状态的代码频率集相联系的信息。选定的供使用的状态的数目可以基于输入代码103的类型。例如,可以将包含两个比特的输入代码103 转换成表示四个符号或状态(例如,22)中的一个的代码频率。在其它示例中,包含四比特信息的输入代码103由16个符号或状态(例如,24)中的一个表示。在将代码103转换成一个或更多个符号或状态时,可以附加地或另选地使用一些其它编码来加入纠错。另外,在一些示例中,可以将一个以上代码103嵌入到音频104中。当经由采样块的傅里叶变换而在频域中表示音频信号104时,利用代码频率映射表选定的频率指数对应于要嵌入到音频信号104中的正弦波频率。参考频率指数而不是实际频率,这是因为这些指数所对应的频率基于编码器102内使用的采样率202和由解码器 116处理的采样数而变。与相邻指数对应的相邻频率之间的间隔与采样频率202和音频块尺寸的比率成比例。例如,以48000Hz的采样率和18432个样本的音频块尺寸,相邻指数之间的间距约为2. 6Hz。因而,频率指数360对应于936Hz (2. 6Hz X 360)。当然,可以选择其它采样率和块尺寸,由此可以选择其它频率间隔。而且,不是所有频率指数都需要用于例如避免与用于传送其它代码和/或水印的频率的干扰。而且,所选定和/或使用的频率范围不需要连续。在一些示例中,使用0. 8kHz至1. 03kHz与2. 9kHz至4. 6kHz范围内的频率。 在其它示例中,使用0. 75kHz至1. 03kHz与2. 9kHz至4. 4kHz范围内的频率。图2的示例性代码合成器208从代码频率选择器206接收对要包括频率指数的指示207,以创建包括对输入代码103的表示的编码音频信号105。响应于对频率指数的指示 207,代码合成器208生成具有所识别的频率的许多正弦波(或包括多个正弦波的一个复合信号)。这种合成可以导致正弦波信号或者导致表示正弦波信号的数字数据。在一些示例中,代码合成器208生成具有由掩蔽估算器204所指示的振幅的代码频率。在其它示例中, 代码合成器208生成具有固定振幅的代码频率,并且那些振幅可以通过在代码合成器208 内实现的或者设置在代码合成器208与组合器210之间的一个或更多个增益块(未示出) 来调节。虽然前面描述了生成正弦波或表示正弦波的数据的示例性代码合成器208,但代码合成器的其它示例性实现也是可以的。例如,另一示例性代码合成器208不是生成正弦波,而是可以输出频域系数,该频域系数用于调节提供给组合器210的特定音频频率的振幅。以这种方式,可以将音频104的频谱调节成包括必要的正弦波。图2的示例性组合器210接收代码合成器208的输出209和音频104两者,并将它们进行组合以形成编码音频105。组合器210可以以模拟或数字形式来组合代码合成器 208的输出209和音频104。如果组合器210执行数字组合,则代码合成器208的输出209 可以与采样器201的输出相组合,而不是与输入至采样器201的模拟音频104相组合。例如,数字形式的音频块可以与数字形式的正弦波相组合。另选的是,该组合可以在频域执行,其中,音频104的频率系数根据表示正弦波的频率系数来调节。作为另一另选例,可以以模拟形式组合正弦波和音频104。编码音频105可以以模拟或数字形式从组合器210输出。如果组合器210的输出105是数字的,则可以在将其耦接至发送器106之前随后将其转换成模拟形式。在2008年10月10日提交的美国专利申请No. 12/249619、2009年8月31日提交的美国专利申请No. 12/551220,以及2009年5月12日提交的美国专利申请No. 12/464811 中描述了可以用于选择代码频率、通过音频104分析对嵌入代码的掩蔽,以及/或实现代码频率映射表的示例性方法、装置以及制造品、示例性采样器201、示例性掩蔽估算器204、示例性代码频率选择器206、示例性代码合成器208、示例性组合器210和/或示例性编码器 102,通过引用将各专利申请的全部内容合并入于此。图3例示了实现图1的实例解码器116的示例性方式。图3的实例解码器116对插入到音频104中的代码103进行检测、解码以及/或提取,以在编码器102处形成编码音频105。如图1所示,编码音频105可以经由有线和/或无线连接提供至接收器110。而在下列描述中,为了容易理解而假定解码器116基本上处理由编码器102形成的同一编码音频105,一般来说,由解码器116处理的音频例如由于发送器106、接收器110以及/或任何介入的传输媒体所引入的失真、噪声等而不同。因此,实际上,这种影响通过执行任何数量和/或类型的适当的噪声缩减、失真减轻以及/或纠错技术来进行控制。图3的示例性解码器116包括采样器302,以模拟形式向该采样器302提供编码音频105,该采样器302可以利用模拟数字转换器或任何其它适当的技术来实现。图3的示例性采样器302例如以48000Hz的标称采样频率303对编码音频105进行采样。当然,可以有利地选择更低的采样频率,以便在解码时降低计算负荷。然而应当将采样频率303选择成满足Nyqusit标准。而且,如下所述,可以将采样频率303调节和/或选择成对采样频率202 (图2、、接收器110中采用的用于经由扬声器114输出编码音频105的采样频率、和 /或采样频率303中的任一个或全部之间的任何失配进行补偿。这种采样频率失配和/或差异可以导致嵌入的代码103在解码器116中以错误的代码频率出现,并由此可以削弱解码器116正确地解码、检测以及/或提取代码103的能力。采样频率失配可能例如因在接收器114和/或解码器116中使用低成本晶体和/或因导致谐振频率漂移的晶体老化而造成。低成本晶体通常在消费级装置(如个人计算机(PC))或机顶盒中发现,其中,从理想中心频率的轻微漂移对人耳不易察觉,但可能影响对嵌入的代码的检测、解码和/或提取。通常,编码器102利用准确的时基和/或晶体来实现。将来自示例性采样器302的样本提供给时域频域转换器304。图3的示例性时域频域转换器304利用离散的傅里叶变换(DFT)或用于将基于时间的信息转换成基于频率的信息305的任何其它适当的技术来实现。在一些示例中,该时域频域转换器304可以利用滑动DFT来实现,其中,每当将新样本提供给示例性时域频域转换器304并且丢弃旧样本时就计算频域表示或频谱305。在一些示例中,时域频域转换器304对接收的编码音频105的具有18432个样本的块,标称地计算频域表示305。时域频域转换器304生成的频域表示 305的分辨率随着为生成频域表示305而使用的样本数而增加。正常地选择采样频率303和由时域频域转换器304处理的样本数,以与编码器102 中为选择频率指数而使用的分辨率相匹配。然而,如下所述,由时域频域转换器304处理的、用于计算频域表述305的样本的数目可以被调节和/或选择成对采样频率202(图2)、 接收器110中采用的经由扬声器114输出编码音频105的采样频率、和/或采样频率303 中的任一个或全部之间的任何失配进行补偿。由时域频域解码器304生成的频域表示305传递至频域解码器306,该频域解码器 306监测与频率指数相对应的、可以潜在地传送由示例性编码器102插入的代码103的所有频率或谱线。示例性频域解码器306在接收到的音频105中寻找强调的代码频率的图案。 如下所述,可以另外或另选地监测不同频率集和/或偏移频率集,以对采样频率202 (图2)、 接收器110中采用的用于经由扬声器114输出编码音频105的采样频率、和/或采样频率 303中的任一个或全部之间的任何失配进行补偿。一旦频域解码器306已经确定强调了哪些代码频率,频域解码器306就基于所强调的代码频率来确定存在于编码音频105内的符号。频域解码器306可以记录这些符号,以及/或可以将那些符号解码成嵌入和/或插入到音频105中的代码103。将是否由频域解码器306检测、解码以及/或提取出有效代码 103的指示307提供给偏移补偿器308。在2008年10月10日提交的美国专利申请No. 12/249619、2009年8月31日提交的美国专利申请No. 12/551220,以及2009年5月12日提交的美国专利申请No. 12/464811 中描述了可以用于实现图3的示例性采样器302、示例性时域频域转换器304以及/或示例性频域解码器306的示例性方法、装置以及制造品。虽然这些示例可能未描述从示例性偏移补偿器308接收的可调和/或可选输入,但代替的是,这些示例可以根据预先选定和/或预先确定的参数来实现,本领域普通技术人员容易明白,怎样修改这些示例,以适应来自偏移补偿器308的可调和/或可选输入。为了补偿频率偏移,图3的示例性解码器116包括示例性偏移补偿器308。当图 3的示例性偏移补偿器308未接收到频域解码器306能够从编码音频105检测、解码以及 /或提取出代码的指示时,该示例性偏移补偿器308调节以下各项中的一个或更多个采样频率303、时域频域转换器304所使用的块尺寸以及/或由频域解码器306所考虑、检查以及/或分析的代码频率。在一些示例中,偏移补偿器308保持使得能够对代码103进行正确检测、解码以及 /或提取的先前频率偏移列表310。当偏移使能适当地解码代码103时,示例性偏移补偿器 308将该偏移存储在列表310中。列表310可以包括是否调节和/或选择了采样率303、块尺寸以及/或代码频率来实现该偏移。在这种示例中,偏移补偿器310在尝试其它偏移之前首先可以尝试先前成功的偏移310,以获得对代码103的适当解码。通过首先尝试先前成功的偏移310,可以减少开始解码代码103所需的时间。可以将列表310存储在非易失性存储器中,以使先前成功的偏移能够在断电之后和/或重新初始化解码器116之后能够被重新调用。在一些示例中,偏移补偿器308通过成功扰动一个或更多个参数(例如,采样率 303、块尺寸和/或代码频率)来尝试偏移,例如直到代码103被成功解码或达到预定限制为止。例如,采样率303可以按IHz或2Hz增量增加,直到代码103被成功解码或者达到为生成采样频率303而使用的时钟312的调谐范围限制为止。如果达到调谐范围限制,则采样率303可以重置成其标称值,并接着以IHz或2Hz的减量减小。在其它示例中,可以解码诸如Nielsen NAES II的另外容错码,以确定粗略频率偏移与用于使得能够对更复杂代码(诸如Nielsen NAES V和NAES VI代码)进行解码的随后的精细频率偏移调节。例如,NAES II和NAES V以及/或NAES VI代码可以同时存在。 首先可以解码NAES II代码以确定粗略偏移,随后检测NAES V和/或VI代码以进一步精炼频率偏移。在其它示例中,仅存在NAES II代码的训练相后面有NAES V和/或VI代码。 可以同样尝试对块尺寸和/或代码频率的调节和/或选择。图6A描绘了具有以多个频率嵌入到音频104中的代码的示例,该多个频率中的一个指定了标号605。在编码器102处,频率605对应于相应编码器频域箱(bins)和/或指数,频域箱(bins)和/或指数中的一个指定了标号610。采样频率202(图2)、接收器110中采用的用于经由扬声器114输出编码音频105 的采样频率、和/或采样频率303中的任一个或全部之间的失配可以造成编码器102嵌入代码103所在的频率与那些嵌入代码103出现在解码器116处所在的频率之间的不一致, 如图6B所示。例如,由于该失配,图6A中在编码器频率605嵌入的代码信息在解码器116 处出现在偏移频率615,如图6B所示。因而,该代码信息不是以频域箱和/或指数610出现,而是以频域箱和/或指数620出现。传送代码信息的其它频率同样偏移。这些代码频率偏移可以导致解码出错。在此描述用于补偿这种偏移的许多示例性方法。在一些示例中,调节和/或选择 (例如,从采样频率的标称值起增加或减小)采样频率303,直到以适当的保真度在标称频率箱中检测到代码103为止。在其它示例中,使用偏移频率箱集来检测和解码代码103。例如,如果期望代码在标称频率指数{12,20,56},则频域解码器306例如可以检查偏移频率指数{13,21,57}、{11,19,55}、{14,22,58}等,直到以适当的保真度检测到代码103为止。 在一些示例中,在校准期间可以使用已知代码,以易于确定代码检测保真度。在其它样本中,可将解码度量(如标准化能之和、解码有效性验证、解码评分(score)等)与已知和/ 或未知代码一起使用,以确定和/或估计解码保真度。另外或另选的是,可以调节和/或选择时域频域转换器304所使用的、用于计算频域表示305的块尺寸。例如,可以通过两倍系数来增加该块尺寸,来使得可能检测到代码信息的频率指数的数加倍。这样,如果频率偏移使代码信息移动至靠近两个频率指数之间的边界,则可以以增加保真度检测到该代码信息。当然,可以使用上述方法的任意组合。虽然在图3中例示了实现图1的示例性解码器116的示例性方式,但可以按任何其它方式组合、拆分、重新布置、省略、消除以及/或实现图3所示接口、数据结构、元件、处理以及/或设备中的一个或更多个。而且,示例性采样器302、示例性时域频域转换器304、 示例性频域解码器306、示例性偏移补偿器308以及/或更上位地示例性解码器116中的任一个都可以用一个或更多个电路、设备、可编程处理器、ASIC、PLD、FPLD、以及/或FPGA等来实现。当阅读本专利的并入了这些组成部分中的一个或更多个的任何装置权利要求以覆盖纯软件和/或固件实现时,示例性采样器302、示例性时域频域转换器304、示例性频域解码器306、示例性偏移补偿器308以及/或更上位地示例性解码器116中的至少一个由此被明确地限定成包括存储固件和/或软件的有形计算机可读介质。更进一步地,代替图3所示那些或除了图3所示那些之外,示例性解码器116可以包括接口、数据结构、元件、处理以及/或设备,以及/或可以包括任何或全部所示接口、数据结构、元件、处理以及/或设备中的一个以上。
图4和5例示了可以执行以实现图1和图3的示例性解码器116的示例性处理。 可以将处理器、控制器以及/或任何其它适当的处理设备用于和/或编程成执行图4和/ 或图5的示例性处理。例如,可以将图4和/或图5的处理体现在编码指令中,该编码指令存储在有形计算机可读介质(如闪速存储器、CD、DVD、软盘、只读存储器(ROM)、随机存取存储器(RAM)、闪速存储器、可编程ROM(PROM)、电可编程ROM(EPROM),以及/或电可擦除 PROM(EEPROM))、光学存储盘、光学存储设备、磁存储盘、磁存储装置,以及/或可以用于存储机器可读指令或数据结构形式的程序代码和/或指令的任何其它有形介质,并且该编码指令可以通过处理器、计算机以及/或具有处理器的其它机器(如下面结合图7讨论的示例性处理器平台P100)进行访问。另选的是,图4和/或图5的示例性处理中的一些或全部可以通过ASIC、PLD、FPLD, PFGA、离散逻辑、硬件、固件等的任意组合来实现。而且,图4 和/或图5的示例性处理中的一些或全部可以手动实现或者实现为任何前述技术的任意组合,例如,固件、软件、离散逻辑和/或硬件的任意组合。而且,可以采用实现图4和/或图 5的示例性处理的许多其它方法。例如,可以改变框的执行次序,和/或可以将描述的框中的一个或更多个进行改变、消除、再拆分,或组合。此外,图4和/或图5的示例性处理中的任何或全部例如可以顺序地执行和/或通过分隔处理线程、处理器、设备、离散逻辑、电路等并行地执行。图4的示例性处理从示例性采样器302对接收到的编码音频105进行采样开始 (框40幻。音频105可以经由音频传感器、硬布线连接,经由音频文件,或者通过任何其它适当的技术来获取。如上所描述的,可以在48000Hz,或者在任何其它适当的频率来执行采样。在获取各样本的同时,对包括许多旧样本和在框405获取的新添样本的样本集执行滑动时间频率变换(框410),在一些示例中,将滑动DFT用于对包括18431个旧样本和一个新添样本的流输入样本进行处理。在一些示例中,利用18432个样本的DFT导致具有 2. 6Hz的分辨率的频域表示305。在通过时间频率转换(框410)获取频域表示305之后,示例性频域解码器306监测针对嵌入的代码103的代码频率,并且对任何检测到的代码进行解码(框415)。如果由偏移补偿器308选定以及/或进行的频率调节使得当前频域表示305可以被重新处理(例如,用于检查不同的偏移频率集)(框425),则控制返回至框415,以执行附加频域解码,假定频域解码器306和/或偏移补偿器308能够在编码音频105的连续样本之间完成它们的操作一次以上。如果频率调节使得当前频域表示305不能被重新处理(例如,由于采样频率303 和/或块尺寸的改变)(框425),则控制返回至框405,以在需要时收集一个或更多个另外的音频样本。例如,如果改变采样频率303,则放弃整个缓冲区的音频样本,并在计算下一个频域表示305之前以新的采样频率303将缓冲区充满新的音频样本。例如,如果增加块尺寸,则在可以计算更大的频域表示305之前,可能需要收集一个或更多个另外的音频样本。 然而,如果采样器302和/或时域频域转换器304保持额外的音频样本(例如,具有足够大的缓冲区),则可以根据时域频域转换器304、频域解码器306以及/或偏移补偿器308的在编码音频105的连续样本之间完成它们的操作一次以上的处理能力,立即利用已经可用的音频样本来计算更大的频域表示305。
根据在框415是否检测到任何代码103,示例性偏移补偿器308例如通过执行图5 的示例性处理,来调节和/或选择频率偏移。接着,控制返回至框415,以处理下一个样本块。在示例性频域解码器306尝试对嵌入的代码103进行解码时,执行图5的示例性处理。如果频域解码器306不能够检测到并解码嵌入的代码103 (框50 ,则偏移补偿器 308确定是否已经尝试了在列表310中存储的所有先前成功的偏移(框510)。如果没有尝试完所有存储的偏移310 (框510),则偏移补偿器308选择下一个存储的偏移310 (框515), 对应地配置采样频率303、块尺寸以及/或代码频率(框520),并且设置标志,以指示已经将正在尝试的当前偏移存储在了列表310中。接着,控制从图5的示例性处理退出。返回至框510,如果已经尝试了所有存储的偏移310(框510),则偏移补偿器308 选择以及/或计算新的偏移以进行尝试(框530),并且清除标志,以指示正在尝试新的偏移 (框53 。例如,根据任何数量和/或类型的搜索标准、步骤尺寸以及/或图案,可以尝试标称频率指数的连续偏移,可以尝试采样频率303的连续改变,以及/或可以尝试块尺寸的连续改变。接着,控制从图5的示例性处理退出。返回至框505,如果代码被成功地解码(框505),并且未设置标志(框M0),则将当前偏移存储在列表310中(框讨幻,并且设置标志(框550)。接着,控制从图5的示例性处理退出。返回至框550,如果设置了标志(框550),则控制从图5的示例性处理退出, 而不需要将偏移存储在列表310中。图7是可以用于和/或编程成执行图4和图5的示例性处理并且/或用于实现图 1和图3的示例性解码器116的示例性处理器平台PlOO的示意图。可以使用一个或更多个通用处理器、处理器核、微控制器等来实现该处理器平台P100。图7的示例的处理器平台PlOO包括至少一个可编程处理器P105。该处理器P105 例如可以实现图3的偏移补偿器310。处理器P105执行处理器P105的主存储器中(例如, RAM P115和/或ROM P120内)存在的编码指令PllO和/或P112。处理器P105可以是任何类型的处理单元,如处理器核、处理器以及/或微控制器。除了其它方面,处理器P105可以执行图4和图5的示例性处理,以对本文所述的音频水印进行解码。因而,编码指令P102、 P112可以包括表示图4和图5的示例性处理的指令。处理器P105经由总线P125与主存储器(包括ROM P120和/或RAM P115)通信。 RAM Pl 15可以由动态随机存取存储器(DRAM)、同步动态随机存取存储器(SDRAM),以及/或任何其它类型的RAM设备来实现,而ROM可以由闪速存储器和/或任何其它所希望的类型的存储器设备来实现。对存储器P115和存储器P120的访问可以由存储器控制器来控制。 示例性存储器P115例如可以用于实现示例性偏移数据库310(图3)。处理器平台PlOO还包括接口电路P130。任何类型的接口标准(如外部存储器接口、串行端口、通用输入/输出等)可以实现接口电路P130。一个或更多个输入设备P135 和一个或更多个输出设备P140连接至接口电路P130。示例性输入设备P135例如可以用于实现示例性采样器302。尽管在此对具体示例性方法、装置以及制造品进行了描述,但本专利的覆盖范围并不限于此。与此相反,本专利在字面上或者在等同物原则下,覆盖清楚地落入本专利的权利要求书范围内的所有方法、装置以及制造品。
权利要求
1.一种方法,该方法包括以下步骤接收音频信号,该音频信号包括使用第一多个频率分量嵌入的听者测量代码;对所述音频信号进行采样;将所采样的音频信号变换成第一频域表示;确定是否能够在所述第一频域表示的所述第一多个频率分量中检测到所述代码;以及当在所述第一多个频率分量中未检测到所述代码时,检查第二频域表示的第二多个频率分量,以确定是否检测到所述代码,所述第二多个频率分量相对于所述第一多个频率分量偏移了第一偏移,所述第一偏移对应于采样频率失配。
2.根据权利要求1所述的方法,其中,所述第二频域表示包括所述第一频域表示。
3.根据权利要求1所述的方法,其中,所述方法还包括将所采样的音频信号变换成所述第二频域表示。
4.根据权利要求1所述的方法,所述方法还包括选择所述第二多个频率分量中的、要与所述第一多个频率分量中的对应频率分量相邻的各频率分量。
5.根据权利要求1所述的方法,所述方法还包括选择所述第二多个频率分量中的第一频率分量,以具有比所述第一多个频率分量中的第一频率分量更窄的带宽。
6.根据权利要求1所述的方法,所述方法还包括调节与所述音频信号的采样相关联的频率,以选择所述第二多个频率分量。
7.根据权利要求1所述的方法,所述方法还包括以下步骤当在所述第二多个频率分量中未检测到所述代码时,检查第三频域表示的第三多个频率分量,以确定是否检测到所述代码,所述第三多个频率分量相对于所述第一多个频率分量偏移了不同于所述第一偏移的第二偏移,所述第二偏移对应于第二采样频率失配。
8.根据权利要求1所述的方法,所述方法还包括基于所述第一偏移来选择将采样音频信号变换成所述第二频域表示所使用的参数。
9.根据权利要求1所述的方法,所述方法还包括从偏移列表中选择所述第一偏移。
10.根据权利要求1所述的方法,所述方法还包括当在所述第二多个频率分量中检测到所述代码时,将所述第一偏移添加至偏移列表。
11.一种装置,该装置包括音频信号的音频输入接口,该音频信号包括使用第一多个频率分量嵌入的听者测量代码;采样器,该采样器用于对所述音频信号进行采样;时域频域转换器,该时域频域转换器用于将所采样的音频信号变换成第一频域表示;以及频域解码器,该频域解码器用于确定是否能够在所述第一频域表示的所述第一多个频率分量中检测到所述代码,并且当在所述第一多个频率分量中未检测到所述代码时,检查第二频域表示的第二多个频率分量,以确定是否检测到所述代码,所述第二多个频率分量相对于所述第一多个频率分量偏移了第一偏移,所述第一偏移对应于采样频率失配。
12.根据权利要求11所述的装置,其中,当在所述第二多个频率分量中未检测到所述代码时,所述频域解码器检查第三频域表示的第三多个频率分量,以确定是否检测到所述代码,所述第三多个频率分量相对于所述第一多个频率分量偏移了不同于所述第一偏移的第二偏移,所述第二偏移对应于第二采样频率失配。
13.根据权利要求11所述的装置,所述装置还包括偏移补偿器,该偏移补偿器用于从偏移列表中选择所述第一偏移。
14.根据权利要求11所述的装置,所述装置还包括偏移补偿器,该偏移补偿器用于当在所述第二多个频率分量中检测到所述代码时,将所述第一偏移添加至偏移列表。
15.根据权利要求11所述的装置,所述装置还包括偏移补偿器,该偏移补偿器用于基于所述第一偏移来选择将采样音频信号变换成所述第二频率表示所使用的参数。
16.根据权利要求11所述的装置,所述装置还包括偏移补偿器,该偏移补偿器用于选择要与所述第一多个频率分量中的对应频率分量相邻的所述第二多个频率分量。
17.根据权利要求11所述的装置,所述装置还包括偏移补偿器,该偏移补偿器用于配置所述第二多个频率分量中的第一频率分量,以具有比所述第一多个频率分量中的第一频率分量更窄的带宽。
18.一种存储机器可读指令的有形制造品,该机器可读指令在被执行时,使得机器接收音频信号,该音频信号包括使用第一多个频率分量嵌入的听者测量代码;对所述音频信号进行采样;将所采样的音频信号变换成第一频域表示;确定是否能够在所述第一频域表示的所述第一多个频率分量中检测到所述代码;以及当在所述第一多个频率分量中未检测到所述代码时,检查第二频域表示的第二多个频率分量,以确定是否检测到所述代码,所述第二多个频率分量相对于所述第一多个频率分量偏移了第一偏移,所述第一偏移对应于采样频率失配。
19.根据权利要求18所述的有形制造品,其中,所述机器可读指令在被执行时,使所述机器将所采样的音频信号变换成所述第二偏移表示。
20.根据权利要求18所述的有形制造品,其中,所述机器可读指令在被执行时,使所述机器选择所述第二多个频率分量中的、要与所述第一多个频率分量中的对应频率分量相邻的各频率分量。
21.根据权利要求18所述的有形制造品,其中,所述机器可读指令在被执行时,使所述机器选择所述第二多个频率分量中的第一频率分量,以具有比所述第一多个频率分量中的第一频率分量更窄的带宽。
22.根据权利要求18所述的有形制造品,其中,所述机器可读指令在被执行时,使所述机器调节与所述音频信号的采样相关联的频率,以选择所述第二多个频率分量。
23.根据权利要求18所述的有形制造品,其中,所述机器可读指令在被执行时,使所述机器基于所述第一偏移来选择将采样音频信号变换成所述第二频域表示所使用的参数。
24.根据权利要求18所述的有形制造品,其中,所述机器可读指令在被执行时,使所述机器从偏移列表中选择所述第一偏移。
25.根据权利要求18所述的有形制造品,其中,所述机器可读指令在被执行时,使所述机器当在所述第二多个频率分量中检测到所述代码时将所述第一偏移添加至偏移列表。
全文摘要
本发明涉及用于执行音频水印解码的方法、装置以及制造品。公开了用于执行音频水印解码的示例性方法、装置以及制造品。一种公开的示例性方法包括以下步骤接收音频信号,该音频信号包括利用第一多个频率分量嵌入的听者测量代码;对所述音频信号进行采样;将所采样音频信号变换成第一频域表示;确定是否能够在所述第一频域表示的所述第一多个频率分量中检测到所述代码;以及当在所述第一多个频率分量中未检测到所述代码时,检查第二频域表示的第二多个频率分量,以确定是否检测到所述代码,所述第二多个频率分量相对于所述第一多个频率分量偏移了第一偏移,所述第一偏移对应于采样频率失配。
文档编号G10L19/00GK102237092SQ20111010525
公开日2011年11月9日 申请日期2011年4月26日 优先权日2010年4月26日
发明者D·J·尼森, 约翰·C·派弗, 韦努戈帕尔·斯里尼瓦桑 申请人:尼尔森(美国)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1