音频信号中的信息的解码的制作方法

文档序号:7601482阅读:117来源:国知局
专利名称:音频信号中的信息的解码的制作方法
背景技术
本发明涉及从编码音频信号中抽取信息信号的方法和装置。
永久性地或不能消除地把信息信号结合到音频信号中,称为“加水印”,其动机多种多样。这种音频水印可以为如此加上标记的音频信号提供例如作者身份、内容、来源、版权存在性等的说明。另一方面,可在音频信号中结合或者涉及信号本身或者与其无关的其他信息。不论是否与音频信号本身有关,这些信息都可以为了各种目的、比如鉴定或者作为地址或命令而结合到信号中。
用信息对音频信号编码、从而生成具有与未编码的原始音频信号基本相同的可觉察特征的编码音频信号,这引起人们极大的关注。最近成功的技术利用了人类听觉系统的心理声学掩蔽效应,从而使某些声音在与其他声音一起被接收时是人无法觉察的。
美国专利No.5450490和No.5764763(Jensen等人)中描述了一种对心理声学掩蔽效应特别成功的应用,其中,由基于音频信号的掩蔽能力而给合到音频信号中的多频代码信号来表示信息。编码音频信号适用于广播传输和接收以及记录和再现。接收到音频信号后,接着处理音频信号以便检测多频代码信号的出现。有时,在接收的音频信号中仅检测到一部分多频代码信号,例如插入原始音频信号中的多个单频代码分量。如果能检测出足够数量的代码分量,就可以恢复信息信号本身。
一般来说,具有低幅度电平的声信号具有对信息信号即使有也很小的声掩蔽能力。例如,这样的低幅度电平可能发生在对话停顿期间、各段音乐之间的间歇期间、或者甚至在某种类型的音乐之中。在太长的低幅度电平过程中,可能难以将代码信号结合到音频信号中、而不引起编码音频信号与原始信号之间在听觉可觉察的方式上的不同。
另一个问题是在编码音频信号传输或再现期间突发错误的发生。突发错误可能以短暂的相邻信号段错误的形式出现。这种错误一般是无法预测的,并且严重影响编码音频信号的内容。突发错误通常是由严重的外部干扰导致的传输信道或再现设备的故障而引起的、比如来自不同传输信道的信号的重叠、系统电源尖峰信号的出现、正常操作的中断、噪声污染(有意或无意)的引入等。在传输系统中,这种环境可能导致一部分所传输的编码音频信号完全不可接收或者明显改变。若不重新发送编码音频信号,编码音频信号中受影响的那部分就可能完全不能恢复,而在另一些情况下,对编码的音频信号的改变可能导致无法检测嵌入的信息信号。在许多诸如无线电和电视广播这样的应用中,编码音频信号的实时再传输完全行不通。
在用于在听觉上再现媒体中记录的音频信号的系统中,各种因素都可能引起再现的声信号中的突发错误。通常,由损坏、阻塞或磨损引起的记录媒体的不规则会导致某部分记录的音频信号不可再现或者一旦再现就明显失真。而且,与记录媒体相关的记录或再现机构的失调或干扰都会在所记录的音频信号的声再现期间引起突发型的错误。另外,扬声器的声学局限以及收听环境的声学特性也可能导致声能分布的空间不规则性。这种不规则性可能引起所接收的声信号中出现突发错误、这干扰了代码的恢复。
发明的目的和概述因此,本发明的一个目的是为检测音频信号中的代码符号提供减轻由低信号电平时段和突发错误引起的问题的系统和方法。
本发明的另一个目的是提供在不利条件下能够可靠工作的这种系统和方法。
本发明还有一个目的是提供这种健壮的系统和方法。
根据本发明的一个方面,提供用于对音频信号中至少一个以多个代码符号表示的信息符号解码的系统和方法。所述系统和方法分别包括执行以下操作的装置和以下的步骤接收表示共同的信息符号的第一和第二代码符号,使音频信号中的第一和第二代码符号在时间上移位;累加表示第一代码符号的第一信号值和表示第二代码符号的第二信号值;以及检查累加的第一和第二信号值从而检测出共同的信息符号。
根据本发明的另一方面,提供用于对音频信号中至少一个以多个代码符号表示的信息符号解码的系统。所述系统包括用于接收表示共同的信息符号的第一和第二代码符号的输入装置,音频信号中的第一和第二代码符号被在时间上移位;以及与输入装置联系而从中接收表示第一和第二代码符号的数据的数字处理器,所述数字处理器被设计成累加表示第一代码符号的第一信号值和表示第二代码符号的第二信号值,所述数字处理器还被设计成检查累加的第一和第二信号值从而检测出共同的信息符号。
在某些实施例中,通过分别存储第一和第二信号值来将两者累加,并且通过检查两个分开存储的值来检测共同的信息符号。第一和第二信号值可以表示从多个其他信号值、如各个代码频率分量的值导出的信号值,或者单个信号值、如单个代码频率分量的大小的测量值。此外,获得的导出值可以是多个信号值的线性组合、如加权值或未加权值之和,或者多个信号值的非线性函数。
在另一些实施例中,通过生成从第一和第二信号值导出的第三信号值来累加第一和第二信号值。在某些实施例中,第三信号值是通过第一和第二信号值的线性组合、比如其加权和或未加权和、或者其非线性函数导出的。
通过结合附图来看下面对某些有利实施例的详细描述,根据本发明的其它目的、特征和优点会变得一清二楚,图中相同的部分用相同的参考标号来标识。


图1是编码装置的功能框图;图2是在说明对音频信号中信息编码的方法时要参考的表;图3A、图3B和图3C是说明音频信号编码方法的简单示意图;图4是另一个在说明音频信号中信息编码的方法时要参照的表;图5是说明多级音频信号编码系统的框图;图6是个人便携式仪表的功能框图;图7是说明解码装置的功能框图;图8是说明从编码音频信号中恢复信息代码的方法的流程图;图9是用于执行图8的方法的循环SNR(信噪比)缓冲器的原理图;图10是说明从编码音频信号中恢复信息代码的另一种方法的流程图;具体有利实施例的详细描述本发明涉及把信息转换为冗余代码符号序列的特别健壮的编码方法的使用。在某些实施例中,每个代码符号由一组不同的、预定的单频代码信号来表示;但是,在其他实施例中,不同的代码符号可选择性地共用某些单频代码信号,或者可通过不为给定符号分配预定的频率分量的方法来设置。冗余符号序列可结合到音频信号中,从而生成不引起收听者注意、然而可恢复的编码音频信号。
冗余代码符号序列特别适合于结合到具有低掩蔽能力的音频信号、如具有许多低振幅分量的音频信号等之中。另外,结合到音频信号中后,冗余代码符号序列会抵抗短暂影响相邻音频信号的突发错误所造成的恶化。如以上所描述的,这种错误可能是不良音频信号记录、再现、和/或存储处理、音频信号通过有损耗和/或有干扰的信道传输、声环境的不规则等造成的后果。
在某些有利的实施例中,为了恢复编码信息,检查编码音频信号以试图检测预定单频代码分量的出现。在编码过程中,由于在某些信号间隔中音频信号的掩蔽能力不足,所以一些单频代码分量可能在这些间隔中没有被给合到音频信号中。已经使编码音频信号的某些部分变坏的突发错误可能导致从编码音频信号中删去某些代码信号或者插入错误信号、比如把噪声插入编码音频信号中。因此,检查编码音频信号有可能揭示表示信息的单频代码信号组的原始序列的过分失真的变型。
处理恢复的单频代码分量以及被错误地检测为代码信号的错误附加信号,从而如果可能、分辨出代码符号的原始序列。代码信号检测和处理操作特别适合于利用编码方法的强度。结果,本发明的检测和处理方法提供了改善的容错能力。
图1是音频信号编码器10的功能框图。编码器10执行任选的符号生成功能12、符号序列生成功能14、符号编码功能16、声掩蔽效应评估/调整功能18以及音频信号嵌入功能20。编码器10最好包括软件控制的计算机系统。计算机可配备用于对要编码的模拟音频信号进行抽样的模拟处理器,或者可以直接以数字形式输入音频信号,再抽样或不再取样均可。或者,编码器10可以包括一个或多个离散信号处理元件。
若使用了符号生成功能12,则该功能可把信息信号转变为一组代码符号。此功能可利用存储装置来执行,比如预存了适用于对信息信号检索的代码符号表的计算机系统的半导体EPROM(可擦可编程只读存储器)。图2中示出用在某些应用场合中的、将信息信号转变为代码符号的表的实例。该表可以存储在计算机系统的硬盘驱动器或其他合适的存储器件中。符号生成功能也可以由一个或多个分立元件、如EPROM和相关的控制装置、由逻辑阵列、由专用集成电路、或者任何其他适合的装置或装置的组合来实现。符号生成功能也可以由还执行图1中所示的一个或多个其余功能的一个或多个装置来执行。
符号序列生成功能14把通过符号生成功能产生(或直接输入到编码器10)的符号格式化成冗余代码或信息符号序列。在某些实施例中,作为格式化处理的一部分,把标记和/或同步符号添加到代码符号的序列中。冗余代码符号序列被设计成特别能抗突发错误及音频信号编码处理。以下结合图3A、3B和3C的讨论来提供对根据某些实施例的代码符号冗余序列的进一步说明。生成功能14最好是在处理设备、如微处理器系统中实现,或者通过专用的格式化装置、如专用集成电路或逻辑阵列,通过多个部件或者前述的组合来实现。符号序列生成功能也可以由还执行图1中所示的一个或多个其余功能的一个或多个装置来执行。
如上文提到的,符号序列生成功能14是任选的。例如,可以这样执行编码处理,使得信息信号直接转换成预定的符号序列,而不用执行单独的符号生成和符号序列生成功能。
把由此产生的符号序列中的各个符号通过符号编码功能16转换为多个单频代码信号。在某些有利的实施例中,符号编码功能是借助计算机系统的存储器件、如预存了对应于各符号的单频代码信号组的半导体EPROM来执行的。图4中示出符号及对应的单频代码信号组的表的实例。
作为选择,代码信号组可存储在计算机系统的硬盘驱动器或者其他合适的存储器件中。编码功能也可以由一个或多个分立元件、如EPROM和相关控制装置、由逻辑阵列、由专用集成电路或者任何其他合适的装置或装置的组合来执行。编码功能还可以由还执行图1所示的一个或多个其余功能的一个或多个装置来执行。
另一方面,编码的序列可以直接从信息信号中生成,无需执行单独的功能12、14和16。
声掩蔽效应评估/调整功能18确定输入音频信号掩蔽由符号编码功能16产生的单频代码信号的能力。基于对音频信号的掩蔽能力的确定,功能18生成调整单频代码信号的相对幅度的调整参数,使得这种代码信号在结合到音频信号中时收听者听不见。若确定音频信号由于信号幅度小或其他信号特性而具有低掩蔽能力,则调整参数可以使某些代码信号的大小降低到极低的电平,或者整个取消这种信号。相反地,若确定音频信号具有较强的掩蔽能力,则可以通过产生增加特定代码信号幅度的调整参数来利用这种能力。幅度增加了的代码信号通常更有可能区别于噪声,因而可被解码装置检测出来。在授予Jensen等人的均题为“用于在音频信号中嵌入代码和解码的装置和方法”的美国专利No.5764763和No.5450490中给出这种评估/调整功能的某些有利实施例的更多详情,这里通过全部引用将其合并于此。
在某些实施例中,功能18将调整参数应用于单频代码信号而产生调整后的单频代码信号。调整后的代码信号通过功能20嵌入到音频信号中。或者,功能18提供调整参数连同单频代码信号,由功能20在音频信号中对其调整和嵌入。在另一些实施例中,功能18与功能12、14和16中的一个或多个组合起来,从而直接产生幅度调整后的单频代码信号。
在某些实施例中,声掩蔽效应评估/调整功能18是在处理设备、比如可能还执行图1所示的一个或多个附加功能的微处理器系统中中执行的。功能18也可以由专用装置、比如专用集成电路或逻辑阵列、或者由多个分立元件或者前述装置的组合来执行。
代码嵌入功能20将单频代码分量与音频信号组合,产生编码音频信号。在一个简单的实施方案中,功能20仅仅将单频代码信号直接加到音频信号上。但是,功能20可以将代码信号叠加在音频信号上。或者,调制器20可以根据来自声掩蔽效应评估功能18的输入而修改音频信号内各频率的振幅,产生包括调整后的代码信号的编码音频信号。而且,代码嵌入功能可以或者在时域或者在频域中执行。代码嵌入功能20可以借助加法电路、或者借助处理器来实现。此功能还可以由上述的还执行图1所示的其余的一个或多个功能的一个或多个装置来实现。
功能12到20中的一个或多个功能可以由单个装置来实现。在某些有利的实施例中,由单个处理器来实现功能12、14、16和18。在另一些实施例中,单个处理器执行图1所示的所有功能。而且,功能12、14、16和18之中的两个或两个以上功能可以借助保存在适当的存储器件中的单个表来实现。
图2说明用于将信息信号转换为代码符号的示例性的转换表。如图所示,信息信号可包括关于特定音频信号的内容、特征或其他与之相关的因素的信息。例如,期望可修改音频信号以便在音频节目中包含无法听到的要求版权的指示。对应地,可以用符号、比如S1来指明在特定作品中要求版权。类似地,作者可以用唯一符号S2来表示,而广播电台可以用唯一符号S3来表示。而且,具体日期可以由符号S4来表示。当然,许多其他类型的信息都可以包含在信息信号中并且转换成符号。例如,诸如地址、命令、加密密钥等信息都可以被编码成这类符号。或者,除单个符号之外或者代替单个符号,可用符号组或序列来表示特定类型的信息。作为另一个选择方案,可实施整个符号语言来表示任何类型的信息信号。同时,编码的信息不必与音频信号有关。
图3A是说明可由图1的符号生成功能12生成的符号流的简单示意图,而图3B和图3C是说明应图3A的符号流而可由图1的符号序列生成功能14生成的符号序列的简单示意图。在图3A到3C中,S1、S2、S3和S4是用作说明本发明特征的符号的实例,而不欲限制其适用性。例如,可以任意选择由符号S1、S2、S3或S4中任何一个或多个符号来表示的信息,而不论其他符号中任何一个或多个来表示的信息如何。
图3B说明冗余符号序列的核心单元的实例,该序列表示四个符号的输入组S1、S2、S3和S4。核心单元以具有顺序或标记符号SA的第一信息段开始,接下来是四个输入数据符号,再接下来是三个重复的信息段,每段包括顺序或标记符号SB和四个输入符号。对于许多应用场合,这个核心单元本身就具有足以提供所需残存程度的冗余度。换言之,这个核心单元本身可以重复以增加残存性。此外,这个核心单元具有的信息段可能多于四个或少于四个,并且各段具有的符号多于四个或少于四个或五个。
由此例推而广之,N个符号的输入组S1、S2、S3、……、SN-1、SN是由包括SA、S1、S2、S3、……、SN-1、SN、接着是(P-1)个包括SB、S1、S2、S3、……、SN-1、SN的重复段的冗余符号序列表示的。如实例中所示,这个核心单元本身可重复以增加残存性。此外,只要解码器配置成识别各个段中相应的符号,则信息段中各符号的顺序可以在各段之间互不相同。此外,可以采用不同顺序或标记符号及其组合,并且各标记相对于数据符号的位置可以安排得不同。例如,顺序可以采用S1、S2、……SA、……、SN这种形式,或者S1、S2、……、SN、SA这种形式。
图3C说明表示四个数据符号S1、S2、S3和S4的输入组的冗余符号序列的有利的核心单元的实例。核心单元以顺序符号或标记符号SA开始,接着是四个输入数据符号,再接着是顺序或标记符号SB,然后是S(1+δ)模M、S(2+δ)模M、S(3+δ)模M、S(4+δ)模M,其中M是现有符号组中不同符号的数目,而δ是取值在φ与M之间的偏移量。在有利的实施例中,选择偏移量δ作为CRC(循环冗余校验)校验和。在其他一些实施例中,偏移量δ的值随时间不同而不同,从而对信息中的附加信息编码。例如,如果偏移量可以从0到9变化,九种不同信息状态就可以用偏移量来编码。
由此例推而广之,N个符号的输入组S1、S2、S3、……、SN-1、SN用包括SA、S1、S2、S3、……、SN-1、SN、SB、S(1+δ)模M、S(2+δ)模M、S(3+δ)模M、……S(N-1+δ)模M、S(N+δ)模M的冗余符号序列表示。也就是说,在相同核心单元中用两个或两个以上不同符号表示相同的信息,并且根据它们在其中的次序来识别。此外,这些核心单元本身可重复以增加残存性。由于由多个不同符号表示相同信息,实质上使编码更加健壮。例如,音频信号的结构可能模拟数据符号SN之一的频率分量,但是音频信号还在其预定出现率下模拟其相应的偏移值S(N+δ)模M的可能性低得多。同时,由于在给定段内所有符号的偏移量是相同的,所以此信息提供了对该段内所检测的信号的合法性的进一步验证。因此,图3C的编码格式大大降低了由音频信号的结构而引起错误检测的可能性。
图3举例表示的冗余序列的特殊强度在于,它利用了原次序下的输入符号之后跟着(a)输入符号的不同排列,(b)包括代替输入符号中一个或多个的其他符号的符号排列,输入符号次序可能重新排列或保持原样,或者(c)不同于输入符号的符号的排列。排列(b)和(c)都特别健壮,因为在符号编码的基础上获得了单频代码信号的扩大的差异。假设输入符号的编码全都来自第一组代码信号,排列(b)和(c)中的符号用在某种程度上没有与第一组重叠的另一组代码信号来编码。代码信号的更大差异通常会增加一些代码信号在音频信号的掩蔽能力之内的可能性。
图4的表格说明将顺序或标记符号SA、顺序或标记符号SB以及N个数据符号S1、S2、S3、……、SN-1、SN转换成相应各组的M个单频代码信号f1x、f2x、f3x、……、f[M-1]x、fMx的实例,其中x指的是具体符号的标识下标。尽管单频代码信号可能出现在音频信号的整个频率范围上,并且在某种程度上超出这个频率范围,而本实施例的代码信号在500Hz到5500Hz的频率范围内,但是可选择不同的频率范围。在一个实施例中,M个单频代码信号组可共用某些单频代码信号;但是,在最佳实施例中,单频代码信号完全不重叠。而且,没有必要将所有符号都用相同数量的频率分量来表示。
图5说明多级音频信号编码系统50。该系统实现多个音频信号编码器、从而对沿着典型的音频信号分发网络移动的音频信号52连续编码。在分发的每一级,依次用与特定级相关的信息信号对音频信号编码。最好是,各个信息信号的依次编码不产生在频率上重叠的代码信号。然而,由于编码方法的健壮的固有性质,各编码信息信号的频率分量之间部分的重叠是可容许的。系统50包括记录装置54、广播设备66、中继站76、音频信号编码器58、70和80、音频信号记录器62、收听装置86以及音频信号解码器88。
记录装置54包括用来接收音频信号并对其编码、而且将编码音频信号记录到存储媒体上的装置。具体地说,记录装置54包括音频信号编码器58和音频信号记录器62。音频信号编码器58接收音频信号馈送52和记录信息信号56,并且用信息信号56对音频信号52进行编码、产生编码音频信号60。音频信号馈送52可以由任何常规音频信号源来产生,比如传声器、用于再现所记录的音频信号的装置等。记录信息信号56最好包括有关音频信号馈送52的信息,比如音频信号的作者、内容或来源、或者版权存在性等。作为选择,记录信息信号56可包括任何类型的数据。
记录器62是将编码音频信号60记录在适合于分发到一个或多个广播电台66的存储媒体上的常规装置。作为选择,音频信号记录器62可以完全省略。编码音频信号60可以通过记录后的存储媒体的分发或者经由通信链路64来分发。通信链路64延伸在记录装置54与广播设备66之间,而且可包括广播信道、微波链路、电缆或者光纤连接等。
广播设备66是接收编码音频信号60并进一步用广播设备信息信号68对该信号60进行编码、从而产生二次编码的音频信号72、并且沿着传输路径74播送二次编码的音频信号72的广播电台。广播设备66包括接收来自记录装置54的编码音频信号60和广播设备信息信号68的音频信号编码器70。广播设备信息信号68可包括有关广播设备66的信息、比如标识码,或者有关广播处理的信息,比如时间、日期或广播特性、广播信号的预期接收者等。编码器70用信息信号68对编码音频信号60进行编码,产生二次编码的音频信号72。传输路径74在广播设备66与中继站76之间延伸,可包括广播信道、微波链路、电缆或光纤连接等。
中继站76接收来自广播设备66的二次编码音频信号72,进一步用中继站信息信号78对该信号进行编码,并将三次编码的音频信号82经由传输路径84发送到收听装置86。中继站76包括接收来自广播设备66的二次编码的音频信号72和中继站信息信号78的音频信号编码器80。中继站信息信号78最好包括有关中继站76的信息、比如标识码,或者有关对广播信号的中继处理的信息、比如时间、日期或中继特性、中继信号的预期接收者等。编码器80用中继站信息信号78对二次编码的音频信号72进行编码,产生三次编码的音频信号82。传输路径84在中继站76与收听装置86之间延伸,可包括广播信道、微波链路、电缆或光纤连接等。作为选择,传输路径84可以是声传输路径。
收听装置86从中继站76接收三次编码的音频信号82。在听众评估应用中,收听装置86位于收听人可感觉到音频信号82的声学再现之处。如果音频信号82是以电磁信号的形式发送的,则收听装置86最好包括为收听者声学再现该信号的装置。但是,如果音频信号82存储在存储媒体中,则收听装置86最好包括用于从存储媒体再现信号82的装置。
在其他应用、比如音乐识别和商业监视中,采用监视装置代替收听装置86。在这种监视装置中,最好将音频信号82处理成接收编码信息而不用声学再现。
音频信号解码器88可接收以音频信号的形式、或者任选地以声信号的形式发来的三次编码的音频信号82。解码器88对音频信号82解码、从而恢复编码于其中的信息信号中的一个或多个。最好是,在收听装置86处理所恢复的信息信号,或者将其记录到存储媒体上以备后续处理。
作为选择,恢复的信息信号可转换成用来为收听者可视显示的图像。
在另一个实施例中,从系统50中省略记录装置54。代表例如现场音频表演的音频信号馈送52直接提供给广播设备66来编码和广播。因此,广播设备信息信号68还可包括有关音频信号馈送52的信息,比如其作者、内容或来源、或者版权存在性等。
在另一个备选实施例中,从系统50中省略中继站76。广播设备66通由传输路径74直接向收听者86提供二次编码的音频信号72,该传输路径是经修正而延伸于广播设备66与收听者之间的。作为另外一个备选方案,从系统50中可同时省略记录装置54和中继站76。
在另一个备选实施例中,从系统50中省略了广播设备66和中继站76。作为选择,修改通信链路64,使其在记录装置54和收听装置86之间延伸,并且在其间传送编码音频信号60。最好是,音频信号记录器62将编码音频信号60记录到存储媒体上,此后又将其传输给收听装置86。收听装置86上的任选再现装置从存储媒体再现编码音频信号,用来解码和/或声再现。
图6提供一个供听众评估应用使用的个人便携式仪表的实例。仪表90包括虚线中所示的外壳92,其尺寸和形状允许其被听众随身携带。例如,外壳的尺寸和形状如寻呼机那样。
传声器93位于外壳92内,起到声换能器的作用,它把接收到的声能、包括编码音频信号转换成模拟电信号。通过模数转换器把模拟信号转换为数字信号,然后把数字信号提供给数字信号处理器(DSP)95。DSP 95实现根据本发明的解码器,以便检测传声器93接收到的声能中预定代码的出现,后者指明携带个人便携式仪表90的人已经进入某个电台或信道的广播范围中。如果是这样,DSP 95将代表这种检测的信号以及相关的时间信号存储在其内存储器中。
仪表90还包括数据发射机/接收机,比如与DSP 95耦合的红外发射机/接收机97。发射机/接收机97使DSP 95能够将其数据提供给处理来自多个仪表90的这种数据的装置、从而产生听众评估,以及使DSP95能接收例如设置仪表90来执行新的听众调查的指令和数据。
图7的功能框图说明根据本发明的某些有利实施例的解码器。在输入端102接收可用多个代码符号按上述方式编码的音频信号。接收的音频信号可以是广播、互联网或其他传递的信号、或者再现信号。它可以是直接耦合的或声耦合的信号。从以下结合附图的描述中,应该理解,解码器100能够检测出除以上公开的格式中安排的代码以外的代码。
对于时域中接收的音频信号,解码器100利用功能106将这样的信号转换到频域。尽管转换中可使用直接余弦变换、线性调频变换或维诺格拉特(Winograd)变换算法(WFTA),但是功能106最好由实现快速傅里叶变换(FFT)的数字处理器来执行。代替这些,可使用任何其他保证必要分辨率的时域-频域变换功能。应该理解,在某些实施方案中,功能106还可以通过模拟或数字滤波器、或者专用集成电路、或者任何其他合适的装置或装置的组合来执行。功能106还可以由也执行图7中所示的一个或多个其余功能的一个或多个装置来实现。
在符号值导出功能110中处理变换到频域的音频信号,并且产生关于接收的音频信号中包括的各个代码符号的符号值流。产生的符号值可表示在绝对标度或相对标度下即时测量或在一段时间上测量的、例如信号能量、功率、声压电平、幅度等,并且可以表示成单值或多值。在把符号编码成单频分量组、每个分量具有预定频率的情况下,符号值最好表示或者单频分量值或者基于单频分量值的一个或多个值。
功能110可由数字处理器、如数字信号处理器(DSP)来执行,DSP有利地执行解码器100的其他功能中的一些或全部功能。但是,功能110也可以由专用集成电路、或者由其他任何合适的装置或装置的组合来执行,而且可以由除执行解码器100的其余功能的装置之外的装置来实现。
功能110生成的符号值流在逐个符号的基础上、在适当的存储装置中随时间累加,如功能116所示。具体地说,功能116有利地用于通过周期性累加各种可能符号的符号值、对周期性重复的编码符号进行解码。例如,如果预期某个给定符号每X秒重现一次,则功能116可用来以nX秒为周期(n>1)存储符号值流,并且加在已存储的一个或多个持续时间为nX秒的符号值流的各值上,使得符号值的峰值经过一段时间累加起来,提高了存储值的信噪比。
功能116可由数字处理器来执行,比如有利地执行解码器100的其他功能中的一些或全部功能的DSP。但是,功能110也可以利用与这种处理器分开的存储器件、或者通过专用集成电路、或者通过其他任何合适的装置或装置的组合来执行,也可以由除了执行解码器100的其余功能的装置之外的装置来实现。
接着由功能120检查功能116存储的累加符号值,以便检验编码信息的出现,并且在输出端126输出所检测的信息。功能120可以借助相关或另一种模式匹配技术、通过把存储的累加值或这种值处理后的变型与存储的模式相对比来执行。但是,功能120通过检查最大累加符号值及其相关定时、重建它们的编码信息来有利地执行。这个功能可以在功能116已存储了第一符号值流之后和/或在各个后继符号值流被加于其上之后执行,使得一旦所存储的累加符号值流的信噪比反映出有效信息模式,就检测出信息。
图8是利用DSP实现的根据本发明的一个有利实施例的解码器的流程图。步骤130是为那些以模拟形式接收编码音频信号的应用场合而提供的,例如,在信号由传声器(如图6的实施例)或射频接收器拾取的情况下。
图8的解码器尤其适合于检测均包括多个预定频率分量、如1000Hz到3000Hz的频率范围内的10个分量的代码符号。它专门为检测具有图3C所示序列的信息而设计,其中每个符号占用二分之一秒的间隔。在这个示例性的实施例中,假设符号组包括12个符号,每个符号有10个预定的频率分量,符号集中各符号之间没有共用任何频率。应该理解,图8中的解码器可容易地修改成检测不同数目的代码符号、不同数目的分量、不同符号序列和符号周期、以及安排在不同频段中的分量。
为了分离各种分量,DSP对在连续预定的间隔内的音频信号样值重复执行FFT。尽管不要求,但是这些间隔可以重叠。在一个示范实施例中,在解码器操作的每一秒中执行10个重叠的FFT。因此,各个符号周期的能量就落在五个FFT周期中。FFT可以开窗,但为了简化解码器也可省略。如步骤134和138所示,存储样值,当由此获得足够数目时,执行新的FFT。
在这个实施例中,在相对基础上产生频率分量值。也就是说,各分量值都表示成如下产生的信噪比(SNR)。任何符号的频率分量可能落入的FFT的各个频率仓(frequency bin)中的能量提供了各个相应SNR的分子。其分母是由相邻仓的值的平均值决定的。例如,可使用八个周围仓能量值中的七个值的平均值,忽略八个值中的最大值、以便避免例如可能由与代码频率分量邻近的音频信号分量产生的可能大的仓能量值的影响。同时,假定例如由于噪声或者音频信号分量、在代码分量仓中也可能出现大能量值,所以对SNR作适当的限制。在这个实施例中,如果SNR=>6.0,则把SNR限制为6.0,但是可以选择不同的最大值。
如步骤142指出的和图9中简单表示的,把各FFT的、对应可能出现的各个符号的十个SNR组合而形成符号SNR,将其存储在循环符号SNR缓冲器中。尽管可以采用其他方式组合SNR,但在某些实施例中,关于给定符号的10个SNR仅简单地相加。
如图9所示,关于12个符号A、B和0-9中每一个的符号SNR作为独立序列存储在符号SNR缓冲器中,每个FFT有一个符号SNR,一共有50个FFT。在50个FFT中生成的值都存储在符号SNR缓冲器中之后,新的符号SNR与之前存储的值组合,如下所述。
在步骤146中,检测符号SNR缓冲器是否已装满。在某些有利的实施例中,在步骤152中调整所存储的SNR以减少噪声的影响,但是在许多应用中这个步骤是任选的。在这个任选步骤中,每次缓冲器被填满时,关于缓冲器中各符号(行)的噪声值是通过取各行中所有存储的符号SNR的平均值得到的。接着,为补偿噪声的影响,从相应行中各个存储的符号SNR值中减去这个平均值或称“噪声”值。以这种方式,只是暂时出现、因而并非有效检测的“符号”是经过一段时间的平均而得出的。同时参考图3C,为了避免在解码器中夸大噪声值,最好能够约束编码方案,使得在前半个信息中(即在符号序列SA、S1、S2、S3、S4之内)相同符号不会出现两次。
在通过减去噪声电平已调整符号SNR之后,在步骤156中,解码器试着通过检查缓冲器中最大SNR值的模式来恢复信息。在某些实施例中,各符号的最大SNR值在连续组合五个相邻SNR的组的处理中被定位,该处理通过与序列加权值(6 10 10 10 6)成比例地对序列中的各值加权,然后把加权SNR相加而生成集中在序列的第三SNR的时间周期中的比较SNR。这种处理在各个符号的五十个FFT周期中逐渐执行。例如,FFT周期1到5中关于符号“A”的第一组的五个SNR被加权并相加而生成关于FFT周期3的比较SNR。接着利用FFT周期2-6得出的SNR生成另一个比较SNR,以此类推,直到获得集中在FFT周期3到48的比较值。但是,也可以采取其他方法来恢复信息。例如,可以组合多于或少于五个SNR,可以将它们组合而不进行加权,或者可以将它们以非线性方式组合。
得到比较SNR值之后,解码器检查比较SNR值以找到信息模式。首先,找到标记代码符号SA和SB。一旦获得这个信息,解码器就试着检测数据符号的峰值。利用第一段中的各个数据符号和第二段中相应数据符号之间预定的偏移量提供对所检测信息的有效性的校验。也就是说,如果检测到两个标记符号,并且在第一段中的各个数据符号与第二段中相应的数据符号之间观察到相同的偏移量,则很可能已接收到有效信息。
参考图3C和图9,假设缓冲器的开头对应于信息的开始(通常不是这种情况),关于符号“A”的比较SNR的峰值P如图所示应该出现在第三FFT周期中。那么解码器预期下一个峰值出现在第八FFT周期中对应于第一数据符号0-9的位置。在此实例中,假设第一个数据符号是“3”。如果最后一个数据符号是“4”,δ值为2,则如图9所示,解码器会在FFT周期48中发现符号“6”的峰值。如果这样检测出信息(即检测出标记,同时数据符号出现在期望的位置,并且偏移量始终相同),则如步骤162和166所示、信息被记录或者被输出,并且清除SNR缓冲器。
但是,如果这样找不到信息,则在音频信号随后的部分上执行另外五十个重叠FFT,并且把如此产生的符号SNR与已经在循环缓冲器中的那些值相加。执行噪声调整处理与前述相同,解码器再次试着检测信息模式。持续重复这种处理,直到检测出信息。在备选方案中,此处理可以执行有限的次数。
从前述中显而易见,只要不背离本发明的范围,对解码器操作的修改取决于信息结构、其定时、其信号通道、其检测的模式等等。例如,代替存储SNR,可以直接存储FFT的结果以用于检测信息。
图10是另一个同样借助DSP实现的根据另一个有利实施例的解码器的流程图。图10的解码器特别适合于检测五个代码符号的重复序列,它包括标记符号、后面跟着四个数据符号,其中各个代码符号包括多个预定频率分量,并且在信息序列中持续时间为半秒。假设各个符号由十个不同的频率分量表示,符号组包括12个不同符号A,B和0-9,如图3C的代码那样。但是,可容易地修改图9的实施例,以便检测任何数量的符号,每个符号由一个或多个频率分量来表示。
图10所示解码过程中采用的、对应于图8的步骤的步骤由相同的参考标号来表示,因此不再对这些步骤作进一步的描述。图10的实施例使用12个符号宽度乘以150个FFT周期长度的循环缓冲器。一旦缓冲器已填满,则用新的符号SNR各代替当时最旧的符号SNR值。实际上,缓冲器存储15秒窗口的符号SNR值。
如步骤174所示,一旦填满循环缓冲器,就在步骤178中检查它的内容,以便检测信息模式的出现。一旦填满,缓冲器持续保持满的状态,所以可以在每个FFT之后都执行步骤178的模式搜索。
由于每五个符号信息每2.5秒重复一次,各个符号以2.5秒的间隔或者每25个FFT重复一次。为了补偿突发错误等的影响,SNR的R1到R150通过将重复信息的对应值相加来组合,从而获得25个组合的SNR值,即SNRn,n=1、2……25,如下所示SNRn=Σi=05Rn+25i]]>因此,如果突发错误会导致信号间隔i的损失,六个信息间隔中只会损失一个,组合SNR值的基本特性有可能不受此事件的影响。
一旦确定了组合SNR值,解码器检测由组合SNR值指示的标记符号峰值的位置,并且根据标记位置和数据符号的峰值推导出数据符号序列。
一旦如步骤182和183所示那样形成信息,就会把信息记录下来。但是,与图8的实施例不同之处在于,没有清除缓冲器。而是,解码器在缓冲器中装入另外一组SNR并继续搜索信息。
如在图8的解码器中一样,从前述显而易见,只要不背离本发明的范围,可以针对不同的信息结构、信息定时、信号通道、检测模式等对图10的解码器进行修改。例如,图10的实施例的缓冲器可以由任何其他适合的存储器件来代替;可以改变缓冲器的大小;可以改变SNR值窗口的大小;和/或符号重复时间可变化。而且,在某些有利的实施例中,使用各个符号值相对于其它可能符号的测量值、例如各个可能符号大小的排序、代替计算和存储信号SNR来表示各个符号值。
在另一种对听众测量应用特别有用的变型中,分别存储相对较大数目的信息间隔,允许对其内容作回顾分析以检测信道变化。在另一个实施例中,采用了多个缓冲器,每个缓冲器对不同数量的间隔的数据进行累加,以供图8的解码方法使用。例如,一个缓冲器可存储单个信息间隔,另一个缓冲器存储两个累加的间隔,第三个缓冲器存储四个间隔,而第四个缓冲器存储八个间隔。然后利用基于各缓冲器内容的独立检测来检测信道变化。
尽管在这里对本发明的示例实施例及其修改作了详细描述,但是应该理解,本发明不限于这些具体的实施例和修改,只要不背离所附权利要求所定义的本发明的范围和精神,本领域的技术人员可以在其中实施其他修改和变化。
权利要求
1.一种用于对音频信号中至少一个由多个代码符号表示的信息符号解码的系统,它包括用于接收表示共同的信息符号的第一和第二代码符号的装置,在所述音频信号中所述第一和第二代码符号在时间上被移位;用于累加表示所述第一代码符号的第一信号值和表示所述第二代码符号的第二信号值的装置;以及用于检查所述累加的第一和第二信号值来检测所述共同的信息符号的装置。
2.如权利要求1所述的系统,其特征在于所述累加装置能够产生从所述第一和第二信号值导出的第三信号值,以及所述检查装置能够根据所述第三符号值检测所述共同的信息符号。
3.如权利要求2所述的系统,其特征在于所述累加装置能够通过线性组合所述第一和第二信号值而产生所述第三信号值。
4.如权利要求2所述的系统,其特征在于所述累加装置能够以所述第一和第二信号值的非线性函数的形式产生所述第三信号值。
5.如权利要求2所述的系统,其中所述第一和第二代码符号每个均包含预定数目的频率分量,其特征在于还包括用于产生第一和第二组分量值的装置,每一组分量值对应于所述第一和第二代码符号中相应的一个,并且每组的各个分量值表示所述对应符号的各个频率分量的特性;以及用于根据所述第一组分量值产生所述第一信号值和根据所述第二组分量值产生所述第二信号值的装置。
6.如权利要求2所述的系统,其特征在于所述接收装置能够接收多组的第一和第二代码信号,每一组表示多个信息符号中相应的一个,这些信息符号被安排成具有包括至少一个标记符号和至少一个数据符号的预定序列的信息,所述累加装置能够累加第一和第二信号值组,各个信号值组对应于所述第一和第二代码信号组中相应的一组,并且包括表示所述相应的代码信号组的所述第一代码信号的第一信号值和表示该组的所述第二代码信号的第二信号值,以及检查装置能够通过根据标记符号的信号值组检测标记符号的出现来检测该信息,并且根据所检测的标记符号的出现和所述至少一个数据符号的对应的信号值组来检测至少一个数据符号。
7.如权利要求1所述的系统,其特征在于所述累加装置能够存储所述第一和第二信号值,以及所述检查装置能够通过检测所述第一和第二信号值这两者来检测所述共同的信息符号。
8.如权利要求7所述的系统,其特征在于所述累加装置能够根据多个其他信号值产生所述第一和第二信号值。
9.如权利要求8所述的系统,其特征在于所述第一和第二信号值是由各组时间上移位的信号值产生的,所述时间上移位的信号值各表示所述第一和第二代码符号中相应的一个符号在其相应的时间周期中的值。
10.如权利要求8所述的系统,其中所述第一和第二代码符号均包括预定数目的频率分量,其特征在于还包括用于产生第一和第二组分量值的装置,每一组分量值对应于所述第一和第二代码符号中相应的一个符号,并且各组的各个分量值表示所述对应符号的各个频率分量的特性;以及用于根据所述第一组分量值产生所述第一信号值和根据所述第二组分量值产生所述第二信号值的装置。
11.如权利要求1所述的系统,其特征在于所述接收装置包括将听觉音频信号转换为电信号的声换能器,所述听觉音频信号具有表示多个包含所述听觉音频信号的源数据的信息符号的多个代码符号;以及还包括存储所检测的信息符号的指示的存储器。
12.如权利要求11所述的系统,其特征在于还包括所述系统用的适合于听众随身携带的外壳以及用于发送所述存储的数据、供产生听众评估使用的装置。
13.一种用于对音频信号中至少一个由多个代码符号表示的信息符号解码的方法,它包括接收表示共同的信息符号的第一和第二代码符号,在所述音频信号中所述第一和第二代码符号在时间上被移位;累加表示所述第一代码符号的第一信号值和表示所述第二代码符号的第二信号值;以及检查所述累加的第一和第二信号值来检测所述共同的信息符号。
14.如权利要求13所述的方法,其特征在于接收第一和第二代码符号的步骤包括将听觉音频信号转换为电信号,所述听觉音频信号具有包括所述听觉音频信号的源数据的多个信息符号;以及还包括存储表示所检测的信息符号的指示的数据。
15.如权利要求14所述的方法,其特征在于还包括发送所述存储的数据供产生听众评估使用。
16.一种用于对音频信号中由多个代码符号表示的至少一个信息符号解码的系统,它包括用于接收表示共同的信息符号的第一和第二代码符号的输入装置,在所述音频信号中所述第一和第二代码符号在时间上被移位;以及与所述输入装置相联系、从中接收表示所述第一和第二代码符号的数据的数字处理器,所述数字处理器被设计成把表示所述第一代码符号的第一信号值与表示所述第二代码符号的第二信号值累加,所述数字处理器还被设计成检查所述累加的第一和第二信号值、从而检测所述共同的信息符号。
17.如权利要求16所述的系统,其特征在于所述输入装置包括将听觉音频信号转换为电信号的声换能器,所述听觉音频信号具有表示多个包含所述听觉音频信号的源数据的信息符号的多个代码符号,以及所述数字处理器具有用于存储表示所检测的信息符号的指示的数据的存储器。
18.如权利要求17所述的系统,其特征在于还包括所述系统用的适合于听众随身携带的外壳以及用于发送所述存储的数据、供产生听众评估使用的装置。
全文摘要
提供用于对音频信号中的信息符号解码的系统和方法。此信息符号由在时间上移位的第一和第二代码符号来表示。累加表示代码信号的各个值(116)并且检查所累加的值、从而检测信息符号(120)。
文档编号H04H20/31GK1372682SQ00810732
公开日2002年10月2日 申请日期2000年5月22日 优先权日1999年5月25日
发明者A·R·纽豪泽, W·D·林奇, J·M·詹森 申请人:阿比特隆公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1