用于确定可包含回声、回响和/或噪声的接收到的音频信号中的水印符号的方法和设备的制造方法

文档序号:9383153阅读:719来源:国知局
用于确定可包含回声、回响和/或噪声的接收到的音频信号中的水印符号的方法和设备的制造方法
【技术领域】
[0001] 本发明涉及用于确定可包含回声、回响和/或噪声的接收到的音频信号中的水印 符号的方法和设备。
【背景技术】
[0002] 音频水印嵌入是以不可听的方式将附加信息嵌入音频信号的处理。通过改变音频 信号,例如通过添加伪随机噪声或回声,来执行嵌入。为了使嵌入不可听,通过对音频信号 进行心理声学分析来控制嵌入的强度。WO 2011/141292 Al描述了在音频信号(例如由麦 克风接收到的扬声器声音)中存在回声、回响和/或噪声的情况下的水印检测。这些回声 导致与水印符号(即,参考信号)的长度N的相关结果值序列中的多个峰值,并用于提高水 印检测的可靠性。这种统计检测器的基本步骤是:
[0003] -针对每个候选水印符号寻找相关结果序列中的峰值1^ 0??* ,其中, & 4..,并且np是被考虑的相关结果峰值的数目;
[0004] -递归地计算候选水印符号被嵌入的误检概率Ic=
[0005] -选择导致最低P00值的候选水印符号。
[0006] P00是错误地接受候选水印符号的概率。其描述了来自非水印嵌入的信号部分的 k个或更多个相关结果值大于或等于被考虑的实际k个峰值的概率。
[0007] 统计检测器解决了以下问题:
[0008] a)如何递归地评估概率P00,其中,可以逐渐增加被考虑的峰值的数目k。
[0009] b)如何通过重新使用已经执行的计算来最小化计算复杂度。
[0010] 该统计检测器使用若干相关结果峰值来提高检测性能。如果通过声学路径发送水 印嵌入的音轨(这由于回声而导致多径检测),则这种提高尤其有利。用于计算 峰值AS…,来自于长度N的整个相关结果值序列。

【发明内容】

[0011] 然而,这种类型的处理未以最佳方式反映物理真实性,这是因为相关结果值序列 中的附加峰值起源于回响并从而在主峰值附近群组化。即,它们将相对于扬声器和检测装 置的麦克风之间的直接路径但是仅在有限的时间段内被时间延迟。在水印检测装置通过与 源相距距离ds(以样本s为单位测量的)的声学路径接收声音的情况下,传播距离是Cl ni= dscT米,其中,cT是声音在一个采样间隔中传播的距离,T = Ι/f是采样率,并且c是声音 的速度。
[0012] 例如,如果针对直接路径并且针对间接路径遞? = 则在直接路径的主峰值和由于反射造成的相邻峰值之间的以样本为单位的距离是
!5:|$个样本,其中,C~343m/s且f ^ 48000样本/s。在典 型的设置中,相关长度是N= 16k个样本(其中Ik= 1024)。因此,将在主峰值或多个主峰 值附近的大小例如为L~Ik个样本(即,L <<N)的窗口中搜索峰值,并且将计算相应的 误检概率。由于主相关结果峰值位于N个相关结果值的当前集合中的某个位置,因此针对 大小N的缓存器中的大小L的窗口的所有可能的Ν-L+l个移位来计算误检概率。
[0013] 本发明将解决的问题在于比已知的统计水印检测器更好地考虑多路径接收的物 理特性,并从而提高误检概率计算和水印检测性能。该问题由权利要求1所述的方法解决。 使用该方法的设备如权利要求2中所公开的。
[0014] 如上所述,在通过引起回声、回响和/或噪声的声学路径发送了水印嵌入的音频 信号之后,水印检测相关结果峰值总体集中在有限时间范围(其最大大小被表示为L,比总 相关长度N小得多)内的主相关结果峰值附近。用于水印检测的相关任务可以由下面的公 式表示:
[0015] 假设针对未标记的音频信号内容的相关结果值的平均或预期概率分布中的np个 峰I
P ,如何计算概率PFP(np,L,V),即,在长度L的滑动窗口内,存在 大于或等于这些峰值V的来自当前长度N的相关结果值集合的np个或更多个峰值?
[0016] 测量已经示出针对未标记的内容的相关结果值的平均或预期的概率分布对应于 或类似于高斯分布。
[0017] 备注:当通过在当前输入音频信号部分上逐个样本地移位参考模式来执行相关 时,该相关的N值结果可具有正峰值和负峰值,它们被一起表示为"峰量值"。
[0018] 为了简化以下描述,介绍一些标记:
[0019]
!示在从N内的位置j开始的长度L的第j个滑 动窗口内的L个相关结果值。
[0020] -Cj> V指示在针对未标记的内容的相关结果值的平均或预期的概率分布中,在矢 量C]中存在大于或等于η p个峰值V的η p个或更多个当前相关结果值。
[0021] -巧m意味着在针对未标记的内容的相关结果值的平均或预期的概率分布 中,在矢量C]中存在大于或等于η p个峰值V的少于η p个当前相关结果值。
[0022] 备注:&衾的补集,即,其中,Pr表 示概率。
[0023] 设长度L的滑动窗口移位通过N个相关结果值。如上所述,要求的FP(误 检)概率是这样的概率:在针对非水印嵌入音频信号内容的相关结果值的平均或预 期概率分布中,滑动窗口 一次或多次包括大于或等于\个峰值的n 或更多个相关 结果量值。针对该FP概率的互补情况是:在针对非水印嵌入的音频信号内容的相 关结果值的平均或预期概率分布中,没有滑动窗口包括大于或等于np个峰值的η p个 或更多个相关结果量值,即,结果,Pr丨Q是针对误检概率 CN 105103223 A ^ Ti 贝
通过j对一个或多个窗口编索引)的互补概 率。
[0024] 最终的FP概率计算可以被表示为(见下文的详细描述):
[0025]
[0026] 针对L = N(在此情况下C1E c = (c p c2, . . .,Cn)),根据上文在f Cy Vi 定义中的备注,该一般公式简化为WO 2011/141292统计检测器中的递归计算的情况: I5 r i C, > P'· ?-Γ'·
[0027] 在WO 2011/141292中针对统计检测器描述了 i C:l态1?}的计算:基于针对当 前信号部分的相关结果值中的峰值,通过使用水印符号的类型的检测的误检概率的相关的 值来检测候选符号中的哪个候选符号存在于当前信号部分中,其中,以递归方式计算误检 概率,并且通过首先使用针对较少数目的相关结果峰值的误检概率,并通过根据要求的检 测可靠度逐渐增加考虑的相关结果峰值的数目,来评估给定数目的相关结果峰值的总误检 概率。
[0028] 因此,在以下描述中,将误检概率的计算映射为计算Pr _嘗1的问 题:对于给定数目(np个)的峰值,可以根据针对从峰值i = 1、2开始的np-l个峰值的概率 来递归地计算该概率(参考实施例部分的描述)。
[0029] 在本发明通过显著减少误检检测决定来提高了 WO 2011/141292统计水印检测处 理的检测性能的同时,本发明还保留了 WO 2011/141292水印检测的全部优点。
[0030] 有益地,本发明可用于用户观看TV并经由水印嵌入的TV声音得到水印信息的第 二屏幕场景,例如,用于使用水印信息来基本同步地下载和呈现与当前TV节目相关的附加 信息的平板计算机。
[0031] 原理上,本发明方法适合于确定可包括回声、回响和/或噪声的接收到的音频信 号中的水印符号,所述方法包括如下步骤:
[0032] -将接收到的音频信号的当前部分与关于相应的不同候选水印符号is的至少两 个不同候选参考模式信号进行相关,以在每个情况下产生针对每个候选水印符号is的N个 当前相关结果值c ls;
[0033] -针对每个候选水印符号is,确定所述相关结果值Cis内的M个峰值:
[0034]-针对所述接收到的音频信号的所述当前部分来确定根据针对每个候选水印符号 is的所述M个相关结果峰值得出的所述候选水印符号is中的水印符号,或者确定没有检测 到水印符号,其中,所述水印符号确定包括以下步骤:
[0035]-针对由所述M个峰值表示的全局峰值中的每一个以及针对每个候选水印符号 is,根据当前相关结果值Cls确定M个长度L的窗口中的每一个内的η p个峰值的相应矢量 !;&,其中,每个长度L的窗口包括所述M个全局峰值之一并且所有长度L的窗口的总和长 度小于N,其中,k = 1,...,M;
[0036] -针对所述M个长度L的窗口中的每一个,根据当前相关结果值Cls计算误检概率 PP (<),其中,误检概率FP 对应于这样的概率:在针对非水印嵌入的音频信号的 相关结果值的平均或预期概率分布中,这样的长度L的窗口 一次或多次包括大于或等于np 个峰值的np个或更多个相关结果值;
[0037] -针对所述接收到的音频信号的当前部分,选择候选水印符号is作为检测到的具 有最小误检概率彳
的水印符号。
[0038] 原理上,本发明设备适合于确定可包括回声、回
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1