连续的备份音频的制作方法

文档序号:7604666阅读:208来源:国知局
专利名称:连续的备份音频的制作方法
技术领域
一般来说,本发明涉及数字音频系统。具体来说,本发明涉及在数字电视系统中使用的备份(即,另一个)数字音频系统,其中,音频系统在主音频和备份音频之间切换而不会产生时间不连续性或烦人的听得见的噪声。虽然是结合特定的数字电视标准来描述本发明的优选实施例的,但是,本发明也比较广泛地适用于使用主数字音频和备份数字音频的任何数字音频系统。本发明的各个方面包括数字音频编码方法、数字音频解码方法、数字音频编码器、数字音频解码器以及在其上具有编码的程序代码的机器可读取的介质,其中,当由机器执行程序代码时,机器实现数字音频解码方法。
背景技术
美国的当前的针对DTV(数字电视)的ATSC(高级电视系统委员会)标准使用Digital Audio Compression Standard(DolbyAC-3),(Document A/52,Advanced Television Systems Committee,Approved 10 November 1994)中描述的以下简称为“AC-3”知觉编码的音频编码系统。1995年4月12日添加了附件A(Rev 1)。1995年5月24日添加了勘误表(Rev 2)。1995年12月20日添加了附件B和C(Rev 3)。2001年8月20日对A/52A的修改删除了附件B,将附件C重编号为附件B,添加了新的附件C,并校正了许多勘误表。A/52A在World Wide Web上可以找到,网址是,http//www.atsc.org/Standards。请参见Steve Vernon所著的“Designand Implementation of AC-3 Coders”(IEEE Trans.ConsumerElectronics,Vol.41,No.3,August 1995)。“Dolby”是DolbyLaboratories Licensing Corporation的商标。
新的ATSC标准和对现有的标准的修改正在被视为为音频和/或视频提供可靠的备份或“健壮”传输系统。当在主音频或视频数据中发生了无法校正的错误或遗漏时,更加健壮音频和/或视频备份系统将为主系统提供备份。当携带音频/视频数据的RF信号的SNR(信噪比)不充分时,如在由于接收效果比较差、干预的短脉冲,或对于诸如移动接收器之类的困难的接收环境而使信号强度弱的情况下可能产生的情况,就可能会发生这种情况。
为了有用,甚至在存在损坏主音频数据的信号恶化(在主音频数据中产生不能从听觉上加以校正的误差或遗漏)的情况下,应该可靠地接收健壮传输系统。有许多已知的用于检测音频数据中的无法校正的错误和遗漏的技术。同样,有许多已知的用于使信号更健壮的方法,使用较低的数据速率调制方案来使位与噪音更加不同或使用更强大的错误校正。这样的技术降低了健壮备份系统的传输效率。因此,就每个位的带宽而言,在健壮备份系统中传输的数据通常比在主信道中传输的数据开销更大。
虽然备份传输系统音频和/或视频获得健壮性的方式不是本发明的一部分,本发明的一个方面是选择降低位成本的健壮数据的音频编码技术,特别是选择适当地与适用于主数据的音频编码技术相关的音频编码技术,以便两个音频编码技术可使主音频信号和健壮“同步”(如下文所说明的),以便可以以最少的干扰在主音频再现和健壮音频再现之间切换或渐高渐低,在再现的音频中没有时间间隙或重叠,理想情况下,可以共享设备和/或功能,或其某些部分,以便恢复主音频信号和健壮音频信号。
由于健壮系统传输的数据比新的或修改的ATSC标准中的主系统传输的数据要求更大的带宽,最小化备份音频系统所需的位数的需求是影响其特征和配置的因子。因为,与主传输系统相比,健壮备份传输系统要求更大的RF带宽来携带等量的数据,健壮备份系统的音频系统应该尽可能地有效,这说明了备份音频应该由比主音频的编码系统更有效的音频编码系统来携带,和/或应该比主音频具有较少的信道。另一个要求是,再现的音频应该能够在主音频和备份音频之间过渡,而不会产生时间不连续性(没有导致语音中的重复或遗漏音节的时间间隙)或烦人的听得见的噪声(例如,没有滴答声或劈劈拍拍声)。当主音频系统和备份不携带相同的方向信道时声场中的某些变化可能一定会产生。

发明内容
根据本发明的数字音频编码方法包括接收包括PCM音频数据采样的PCM编码的音频信息,用第一种数字音频编码类型对音频信息进行编码,编码的音频信息具有自含式数据单元,用第二种数字音频编码类型对同一音频信息进行编码,编码的音频信息具有自含式数据单元,其中,用第一种和第二种数字音频编码类型进行编码的对应的自含式数据单元对代表相同的PCM音频数据采样,以便第一和第二音频信息代表相同的基础音频信息。
根据本发明的数字音频解码方法包括接收用第一种数字音频编码类型编码的第一音频信息和用第二种数字音频编码类型编码的第二音频信息,其中,第一音频信息和第二音频信息两者都具有自含式数据单元,第一和第二音频信息中的对应的自含式数据单元对代表相同的基础音频信息,接收指出第一音频信息中的检测到错误和遗漏的错误信号,或检测接收到的数据中的错误或遗漏。该方法进一步包括提供PCM音频输出和/或符合第一种数字音频编码类型的编码的音频输出,其中PCM音频输出是当在第一音频信息中没有检测到错误或遗漏时通过对第一音频信息进行解码以及当在第一音频信息中检测到错误或遗漏时通过对第二音频信息进行解码而不是对第一音频信息进行解码而提供的,和/或符合第一种数字音频编码类型的编码的音频输出是当在第一音频信息中没有检测到错误或遗漏时由第一音频信息派生而来的,以及当在第一音频信息中检测到错误或遗漏时通过对第二音频信息进行代码转换派生而来的。
根据本发明的各个方面,主音频系统可以用具有大量的安装用户群的标准化编码系统(如AC-3知觉编码系统)进行编码,备份数字音频系统可以用标准化编码系统的修改的或相关的版本(如AC-3知觉编码系统的修改)进行编码。或者,主音频系统可以用另一个编码系统(例如,MPEG-2AAC或mp3(MPEG-Layer3)知觉编码系统)进行编码,备份音频系统可以用该另一个编码系统的修改方案(例如,具有光谱带复制(SBR)的AAC或mp3的相关的版本,如分别是aacPLUS或mp3PRO编码系统)来进行编码。例如,请参阅Kietz、Liljeryd、Kjorling和Kunz所著的“Spectral Band Replication,anovel approach in audio coding”(Audio Engineering SocietyConvention Paper 5553,AES 112th Convention,Munich,May 10-13,2002),GroscheL、Beer and Henn所著的“Enhancing audio codingefficiency of MPEG Layer-2 with Spectral Band Replication forDigital Radio(DAB)in a backwards compatible way”(AudioEngineering Society Convention Paper 5850,AES 114th Convention,Amsterdam,March 22-25,2003),Ehret、Dietz和Kjorling所著的“State-of-the-Art Audio Coding for Broadcasting and MobileApplications”(Audio Engineering Society Convention Paper 5834,AES 114th Convention,Amsterdam,March 22-25,2003),Ziegler、Ehret、Ekstrand和Lutzky所著的“Enhancing mp3 with SBRFeatures and Capabilities of the new mp3PRO Algorithm”(AudioEngineering Society Convention Paper 5560,AES 112 Convention,Munich,May 10-13,2002)。
备份编码系统应该是对主编码系统的修改,至少修改到这样的程度,以致主编码系统和备份编码系统中的每一个编码系统中的“对应的自含式数据单元对”分别能够代表相同的PCM音频数据采样集(即,它们代表相同的基础音频,而不一定具有相同的空间分辨率—它可以代表具有较少细节的基础音频的方向特征)。优选情况下,主编码系统和备份编码系统具有某些共同的特征,以便两者都不要求其自己的单独的解码器或解码功能以便解码器或解码功能的至少—部分可以在对主音频和备份音频进行解码时共享。
虽然编码的主音频和备份音频中的对应的自含式数据单元对应该代表相同的基础音频,但是,主音频信息中的自含式数据单元不必与备份或健壮音频信息中的对应的自含式数据单元具有相同的位数。通常,健壮音频信息中的数据单元可以比主音频信息中的其对应的数据单元具有较少的位,因为,它可以更加有效地代表基础音频和/或因为它可以代表具有较少细节(较少的信道)的基础音频的方向特征。
“自含式”的意思是,每一个数据单元都包含足够的信息,以便它可以被解码或转换,而无需另一个数据单元中的数据。原则上,每一个这样的数据单元都可以包含多个数据子单元,其中每一个子单元都是自含式。在本发明的实施例中,使用了最小的自合式数据单元。在AC-3编码的音频信息的情况下,最小的自含式数据单元是帧。
由主音频编码系统和健壮音频编码系统产生的“对应的”数据单元的数据单元对可以通过相对于彼此的位置或相对于一个或多个数据流(例如,主音频数据流和备份音频已经被多路复用的复合数据流可以交替主音频数据单元和健壮音频数据单元,以便对应的数据单元跟在彼此的后面,或者,音频数据单元可以以已知的方式与视频帧关联))内的其他数据(如视频数据)的位置来进行标识和/或通过将标识符附加到每一个自含式音频数据单元来进行标识。例如,可以将时间戳附加到每一个主自含式音频数据单元,以便可以识别其对应的备份音频数据单元。
基于标识,可以使主音频信息和备份音频信息中的对应的自含式数据单元对在解码设备或进程中“同步”。这样的“同步”要求对应的主音频和健壮音频数据单元在解码器或解码进程中同时可用,以便允许两者之间的切换或渐高渐低,而不会在再现的音频中产生时间不连续性或烦人的听得见的噪声。
同时可用性可以通过在数据存储中具有适当数量的对应的数据单元来获得,以便可以在适当的时间读出每一个对对应的数据单元中的每一个数据单元。这通常在使用了缓冲的现代的基于数据包的数据系统中发生。
主音频和健壮音频的对应的数据单元,不必被解码器或解码功能同步传递,也不必被它们同步接收(通常,在稍微不同的时间接收对应的数据单元,并存储在存储器中),只要对应的自含式数据单元对解码器或解码进程可用,是可识别的,并可以在解码器或解码进程在主音频和健壮音频之间来回切换时概念上的切换点使其“同步”。当然,当主音频的对应的数据单元损坏或遗漏时,只有健壮音频数据单元可以在概念上的切换点存在。
当对PCM样本进行编码以便可以将对应的数据单元传递到解码器或解码功能(在实际传输过程中最有可能不同步)时,识别(显式或隐式)代表相同的PCM样本集(基础音频)的对应的数据单元对。在这样的传递的过程中,对应的数据单元可以存储在一个或多个存储器中,其中,同步没有任何意义。在诸如下面将描述的数字电视环境之类的近乎实时的系统中,对应的和健壮的数据单元不应该带来带来任何显著的额外延迟。
备份ATSC音频系统的另一个所希望的能力是能够向诸如家庭A/V(音频/视频)接收器之类的外部解码器提供编码的AC-3音频位流。家庭A/V接收器常常是在5.1信道中再现主音频系统以产生环绕声的位置。备份音频系统与主音频系统越不同,要维持到外部解码器的连续的AC-3位流就越复杂,越昂贵。这样做将需要复杂而昂贵的AC-3编码器。
在主音频用AC-3编码类型进行编码的情况下,优选情况下,备份音频用AC-3编码类型的修改方案进行编码。修改方案可以包括,但不仅限于,用于再生或复制频谱的某些部分的各种技术,已知的有“高频再生”(HFR)和“光谱带复制”(SBR)。这样的技术可以显著降低数据速率,只对AC-3系统作细小的修改,额外的复杂性就会很小。
在Makhoul和Berouti所著的″High-Frequency Regenerationin Speech Coding Systems″(Proc.of the Intl.Conf.on Acoust,Speech and Signal Proc,April 1979)中可以找到HFR的已知方法的描述。在2002年3月28日提出的标题为“Broadband FrequencyTranslation for High Frequency Regeneration”的美国专利申请S.N.10/113,858,2002年6月17日提出的标题为“Audio Coding SystemUsing Spectral Hole Filling”的S.N.10/174,493,2002年9月6日提出的“Audio Coding System Using Characteristics of a DecodedSignal to Adapt Synthesized Spectral Components”的S.N.10/238,047,2003年5月8日提出的标题为“Improved AudioCoding Systems and Methods Using Spectral Component Couplingand Spectral Component Regeneration”的S.N.10/434,449中描述了用于对高质量音乐进行编码的改进的频谱再生技术,这里所引用的每一个参考都对其全部内容进行了引用。
在上文所引用的Audio Engineering Society Convention Papers中的某一篇论文中可以找到对SBR的各个方面的描述。
还可以使用另外几种技术来降低数据速率,不过复杂性有某些增大,如向由修改的AC-3编码生产的一些位流信息应用熵编码(例如,算术或霍夫曼编码)(有时被称为“无损失的”编码)。例如,可以将简单的霍夫曼编码方案应用于修改的AC-3位流指数,以将它们的传输成本。
用于备份音频的AC-3主音频系统的经过修改的形式还可以包括其位流中的某些其他信息,该信息可以由低复杂性代码转换器使用,如下面所描述的。
使用AC-3音频系统的修改的更加有效的版本来创建健壮备份音频位流的优点是,它可以最小化解码器复杂性的增大程度。例如,如下文所说明的,可以使用AC-3音频解码器的修改版本来对主音频和健壮音频位流两者进行解码,从而不必为主音频和健壮音频提供单独的解码器。
当使用常规代码转换技术来转换由知觉编码系统进行编码的信号时,这些常规代码转换技术具有一些缺点。一个缺点是,常规代码转换设备相对比较昂贵,因为它必须实现完全的解码和编码进程。第二个缺点是,在解码之后的转换的信号的感觉质量通常相对于在解码之后输入编码的信号的感觉质量而降低。
虽然可以使用解码和重新编码的那种类型的常规现有技术代码转换器,以便降低复杂性和成本,优选情况下,也可以使用具有低复杂性部分的代码转换器,以将健壮备份音频位流转换为AC-3兼容的位流,供外部AC-3解码器使用。这里“AC-3兼容的数据流或位流”的意思是,“兼容的”位流可以由标准的AC-3解码器进行解码(虽然这样的“兼容的”位流可能需要格式化,以便满足S/PDIF、Toslink或其他连接接口的要求)。2003年6月9日提出的标题为“Conversion of Synthesized Spectral Components for Encoding andLow-Complexity Transcoding”的美国专利申请S.N.10/458,798中描述了具有低复杂性部分的代码转换器,该申请在这里全部加以引用。根据该申请的方法和设备,以相对低复杂性的操作以及最小的代码转换质量损耗来执行转换。
所述S.N.10/458,79申请中描述的代码转换器从代码转换进程中消除了某些功能,如在常规编码器和解码器中要求的分析与综合过滤。以其简单的形式,根据该申请的代码转换执行部分解码进程,只执行到去量子化光谱信息所需要的程度,它执行部分编码进程,只执行到重新量子化被去量子化的光谱信息所需要的程度。代码转换进程通过从编码的信号中获取控制去量子化和重新量子化所需要的控制参数来被进一步简化。
低复杂性代码转换器的其他形式可以在本发明的各种实施例中使用。这样的低复杂性编码器可以包括N.D.Wells和N.H.C.Gilchrist所著的“ATLANTICPreserving video and audio quality inan MPEG-coded environment”(ATLANTIC Technical Papers1197-1998)以及在2000年9月22-25在109thConvention of theAudio Engineering Society中三篇论文,Natalie Peckham和FrankKurth所著的“Transport of Context-Based Information in DigitalAudio Data”(Preprint No.5250),Jurgen Herre和Michael Schug所著的“Analysis of Decompressed Audio-The Inverse Decoder”(Preprint No.5256)和Frank Kurth和Viktor Hassenrik所著的“A Dynamic Embedding Codec for Multiple GenerationsCompression”(Preprint No.5257)中所描述的那些编码器。
通过参考下面的讨论和附图,对本发明以及其优选实施例的各种特点可以更好地理解,在附图中,相同的参考符号表示多个图中的相似的元素。下面的讨论和图形的内容只是作为示例来阐述的,不应该被理解为代表对本发明的范围的限制。


图1是编码器或编码进程的功能和简要方框图,其中用第一种数字音频编码类型对包括PCM音频数据采样的线性PCM编码的音频信息进行编码,编码的第一音频信息具有自含式数据单元,以及用第二种数字音频编码类型进行编码,编码的第二音频信息也具有自含式数据单元。用第一种和第二种数字音频编码类型进行编码的对应的自含式数据单元对代表相同的PCM音频数据采样,以便第一和第二音频信息代表相同的基础音频信息。
图2到4显示了解码器或解码进程配置的功能和简要方框图,该配置用于响应分别用第一种和第二种数字音频编码类型进行编码的第一和第二音频信息,并响应第一音频信息中的检查错误和遗漏,提供PCM音频输出和/或符合第一种数字音频编码类型的编码的音频输出。
图2是解码器或解码进程的功能和简要方框图,显示了响应携带多路复用的AC-3(主信道)和修改的AC-3(健壮信道)位流,提供PCM输出和/或AC-3兼容的位流输出。
图3是解码器或解码进程的功能和简要方框图,显示了响应携带多路复用的AC-3(主信道)和修改的AC-3(健壮信道)位流,提供PCM输出和/或AC-3兼容的位流输出的另一个配置。图3的配置没有图2的配置那么复杂-它避免了串行代码转换器/解码器配置可能会导致的衰减,它还消除了某些重复的解码器功能。
图4是解码器或解码进程的功能和简要方框图,显示了响应携带多路复用的AC-3(主信道)和修改的AC-4(健壮信道)位流(其中,某些功能或设备也是可以进一步共享的,以便节约硬件和/或处理能力。),提供PCM输出和/或AC-3兼容的位流输出的另一个配置。
具体实施例方式
图1显示了在其中接收包括PCM音频数据采样的线性PCM编码的音频信息的编码器或编码进程的功能和简要方框图。用第一种数字音频编码类型对该音频信息进行编码,编码的第一音频信息具有自含式数据单元,并用第二种数字音频编码类型对该音频信息进行编码,编码的第二音频信息也具有自含式数据单元。用第一种和第二种数字音频编码类型进行编码的对应的自含式数据单元对代表相同的PCM音频数据采样,以便第一和第二音频信息代表相同的基础音频信息。
具体来说,图1显示了ATSC电视环境中的配置的功能和简要方框图,该配置用于产生携带主音频、视频、数据和同步信息的主传输数据流(“主TS”),以及携带健壮音频、视频、数据和同步信息的健壮传输数据流(“健壮TS”)。当在主音频或视频数据中发生了无法校正的错误或遗漏时,适当的健壮音频和/或视频备份系统可以为主系统提供备份。视频和数据信息生成的细节超出了本发明的范围,因此,没有显示。
通常代表音频的5.1信道(左、中心、右、左环绕、右环绕和低频效果信道)的线性PCM(脉码调制),应用于音频编码器或编码功能(“AC-3和修改的AC-3编码器”)2。编码器提供两个编码的音频输出,这些输出可以以数据流的形式-主AC-3兼容的数据流和健壮修改的(“扩展”)AC-3数据流。每一个数据流都被分为帧,这些帧构成了自含式数据单元,如上所述。两个数据流中的对应的帧对代表相同的PCM样本。
AC-3兼容的和修改的AC-3兼容的位流中的每一个都可以代表一个或多个音频信道。通常,主流代表音频的5.1信道。健壮流可以代表单(“单音”或“单)音频信道,矩阵编码的音频的两个信道,或音频的5.1信道,如在主流中那样。编码的主AC-3音频数据可以在主节目多路复用器或多路复用功能(“主节目MUX”)4中与视频及其他数据进行多路复用,以便提供主传输数据流(TS)。类似地,编码的健壮音频数据可以在健壮节目多路复用器或多路复用功能(“健壮节目MUX”)6中与视频及其他数据进行多路复用,以提供健壮传输数据流。主传输数据流和健壮传输数据流随后在传输数据流多路复用器或多路复用功能(“传输数据流MUX”)8中被多路复用在一起,以形成ATSC DTV传输数据流。
图2到4显示了解码器或解码进程配置的功能和简要方框图,该配置用于响应分别用第一种和第二种数字音频编码类型进行编码的第一和第二音频信息,并响应第一音频信息中的检查错误和遗漏,提供PCM音频输出和/或符合第一种数字音频编码类型的编码的音频输出。虽然这里描述了其中第一和第二音频信息是AC-3和修改的AC-3编码的ATSC电视的环境中的配置,但是,可以理解,本发明的原理如这里所指出的应用范围相当广泛。
在图2到4中,显示了响应携带多路复用的AC-3(主信道)和修改的AC-3(健壮信道)位流,提供解码的(PCM)输出和/或AC-3兼容的位流输出的配置。运输系统和/或音频系统可以判断主节目信道数据流是否具有无法校正的错误或遗漏。遗漏可以包括,主音频数据流中的数据的完全丢失。用于检测编码的音频数据流中的无法校正的错误或遗漏的各个技术在当前技术中已为大家所熟知,使用哪一个特定技术对于本发明不是关键。如果主数据流具有无法校正的错误或遗漏,则控制器可以对健壮节目信道进行解码。否则,控制器可以对主节目信道进行解码。解码器或解码进程的输出可以是PCM音频位流或AC-3兼容的位流或两者。AC-3兼容的位流可能需要格式化,以便满足S/PDIF、Toslink或其他连接接口的要求。
图2的配置说明了根据本发明的各个方面的解码器或解码配置的基本原理。在图3和4的替代实施例中显示了不是太复杂、不是太重复的配置。
具体参看图2的细节,“ATSC传输DEMUX”(多路分解器或多路分解器功能)10接收ATSC传输数据流,除了视频和数据输出外(视频和数据输出超出了本发明的范围),还提供主(AC-3)和健壮(修改的AC-3)数字音频数据流输出。主(AC-3)数据流应用于可选数据速率变化设备或功能(“变化数据速率”)12,用于更改(通常是提高)主AC-3数据速率。ATSC系统中的主AC-3数据速率(384或444kb/s)小于最大AC-3数据速率(640kb/s)。为了匹配代码转换器输出数据速率,如下面所描述的,应该将主AC-3提高到640kb/s。众所周知,这可以通过以这样的方式来对数据进行填充,以便不降低音频质量(例如,通过将现有的量子化系数重新包装为具有更高位速率的位流)。
健壮(修改的AC-3)数据流应用于代码转换器或代码转换功能(“代码转换器”)14,该代码转换器将修改的AC-3健壮音频转换为AC-3兼容的位流。优选情况下,代码转换器14将修改的AC-3数据速率(可以是96kb/s)转换为最大标准AC-3位速率(640kb/s)。使用最大标准AC-3位速率,以便最小化代码转换衰减。
控制器或控制器功能(“主/健壮控制器”)16可以从ATSC传输DEMUX 10接收显式的错误信息,当主音频损坏时通知控制器(具有无法校正的错误或遗漏),并应该选择健壮音频而不是主音频。或者,当数据不是由传输信号分离器提供时(预期这样时),可以在另一个进程或处理器(未显示)中检测遗漏。实现数据错误或遗漏检测器或检测进程的各种方式在当前技术中已为大家所熟知。例如,如果主音频是AC-3编码的音频,可以使用嵌入在每一个AC-3帧中的一个或两个CRC字来检查数据完整性。如果任何一个CRC字检查,则可以认为位流在某种合理的确定性程度上可使用。如果需要更高程度的确定性,则检测器可以要求在每一个帧中有两个CRC字进行检查和/或多个帧中的CRC字进行检查。
控制器16控制开关或开关功能(“开关”)18,以使开关根据主音频是损坏还是不可用来选择从代码转换器14转换为AC-3音频的健壮音频或主AC-3音频(其数据速率可能改变)。图2到4的各种实施例中的开关18,以及所有开关和开关功能可以以各种已知的方式来实现。一个可能的“开关”实现方式是以软件方式来实现。开关18输出,AC-3兼容的位流,可以应用于标准AC-3解码器或解码功能(“标准AC-3解码器”)20,(而该解码器或解码功能提供线性PCM音频输出),和/或应用于可选格式器或格式化功能(“格式器”)22,(该格式器或格式化功能格式化AC-3兼容的位流),以满足S/PDIF、Toslink或其他连接接口的要求,以便应用于外部解码器。例如,电视机可以不具有这样的AC-3兼容的位流输出,而“机顶盒”(通常是接收有线和/或卫星输入的转换器设备)可能具有。如果只需要这样的AC-3兼容的位流,则不需要解码器20。如果只需要线性PCM输出,则不需要可选的格式器22。
如上所述,AC-3兼容的位流的数据速率最好是相同的,无论开关18选择主音频还是选择转换的健壮音频。到标准AC-3解码器20的恒定输入数据速率确保了解码器很少会在其解码的PCM输出中发生破裂。还确保了接收可选地格式化的AC-3兼容的位流的外部AC-3解码器发生故障的可能性不大。
为了节约处理能力,当选择了主音频和健壮音频中的某一个时,可以使图2到4的配置中的某些设备或功能处于非活动状态。例如,在图2的配置中,当开关18选择主音频时,代码转换器14可以处于非活动状态。同样,当开关18选择健壮音频时,可选的变化数据速率12可以处于非活动状态。这样的活动和不活动可以通过诸如控制器16之类的控制器来进行控制。
再次请参看图2,虽然可以使用解码和重新编码的那种类型的现有技术代码转换器以提供代码转换器14的基本功能,以便降低复杂性和成本,可以使用如所述美国专利申请S.N.10/458,798中所描述的具有低复杂性部分的代码转换器,以将健壮备份音频位流转换为AC-3兼容的位流,供AC-3解码器使用。
除了提供代码转换功能外,代码转换器14在必要时还可以提供某些程度的信道格式化,以便使健壮音频与5.1信道AC-3主音频更加兼容。例如,如果健壮音频只是音频的一个信道(即,它是单音或“单”),则代码转换器还可以将该单音信道应用到左、中心和右AC-3,以便当被解码时,再现的声音压缩为单信道。或者,如果健壮音频是代表四个信道(左、中心、右和环绕)的矩阵编码的音频的两个信道,两个矩阵编码的信道可以被作为双信道的位流来转换,或作为多信道位流来矩阵解码和插入(以及可选的低音提高)。健壮音频可以是5.1信道,如在主AC-3信道中那样,在这样的情况下,不需要进行格式转换。
图3显示了响应携带多路复用的AC-3(主信道)和修改的AC-3(健壮信道)位流,提供解码的(PCM)输出和/或AC-3兼容的位流输出的第二种配置。图3的配置没有图2的配置那么复杂-它避免了串行代码转换器/解码器配置可能会导致的衰减,它还消除了某些重复的解码功能。
在图3和4的配置中,如在图2中那样,可以使用ATSC传输多路分解器10,但为简单起见,没有显示。如在图2中那样,如果多路分解器10没有提供错误信息,则可以使用另一个数据错误或遗漏检测器或检测进程。请参看图3,解码器或解码功能(“AC-3和修改的AC-3解码器”)32解码以线性PCM AC-3编码的主音频流或修改的AC-3编码的健壮音频流。解码器32可以被配置为包括部分AC-3解码器或解码功能(“AC-3部分解码器”)36、部分修改的AC-3解码器或解码功能(“修改AC-3部分解码器”)38、连接到部分解码器36和38的完整解码功能或设备(“完整解码”)40,以及将主音频连接到AC-3部分解码器36或将健壮音频连接到修改的AC-3部分解码器38的开关或开关功能(“开关”)34。部分解码36可以通过反向量子化的性能来执行AC-3解码,直到解码进程中的特定点。部分解码38通过反向量子化的性能来执行到相同点的修改的AC-3位流的解码。不论是哪一种情况,完整的解码40提供了部分解码36和38没有提供的其余的解码功能。例如,如果部分解码36和38两者都通过方向量子化的性能来进行解码,完整的解码40执行反向转换,后面跟在AC-3解码器中通常执行的某些其他功能,如动态范围控制、向下混合等等,以便提供解码的PCM输出。根据需要,完整的解码40还可以执行如上文所讨论的某些程度的信道格式化。注意,在诸如部分解码36或38之类的部分解码和完整的解码40之间传递的信息可以不是串行位流一例如,它可以是量子化系数。
如图2中的控制器16,从ATSC传输DEMUX 10接收错误信息,当主音频损坏时通知它,应该选择健壮音频。在这种情况下,控制器16控制开关或开关功能(“开关”)30以使解码器32作为其输入接收健壮音频,它控制开关34以使修改的AC-3部分解码器38接收健壮音频输入。当主音频没有损坏时,控制器16使开关30和34将主音频应用到AC-3部分解码器36。健壮音频还适用于代码转换器14,如在图2中那样,该代码转换器将健壮音频转换为AC-3兼容的位流。控制器16还控制开关或开关功能(“开关”)42以使如图2所示的可选格式器22以在主音频损坏时选择代码转换器14或在主音频没有损坏时选择主音频(可能具有变化的数据速率),以便应用到外部解码器。如果只需要这样的AC-3兼容的位流,既不需要解码器32,也不需要开关30。如果只需要线性PCM输出,则变化数据速率12、代码转换器14、开关42或可选格式器22中任何一个都不需要。
如上文结合图2的配置所讨论的,代码转换器14可以具有如美国专利申请S.N.10/458,798所描述的低复杂性部分。此外,如上文结合图2的配置所讨论的,代码转换器18还可以提供某些程度的信道格式化,以便使健壮音频与5.1信道AC-3主音频更加兼容。
图3的配置显示了解码功能(完整的解码40)的某些共享。某些功能或设备的进一步的共享也是可能的,以便节约硬件和/或处理能力。图4在概念上显示了一个这样的进一步的共享配置。
主音频位流应用于AC-3部分解码36,如在图3中那样,健壮音频位流应用于修改的AC-3部分解码38,如在图3中那样。响应错误信息,主/健壮控制器16,如在图3中那样,使开关或开关功能(“开关”)44,以当主音频损坏时从部分解码器38选择信息,当它没有损坏时,从部分解码器36中选择部分地解码的主AC-3信息。不论是哪一种情况,开关44将部分解码信息连接到完整的解码40,如在图3中那样,完整的解码提供了部分解码36或38没有提供的其余的解码功能,以便提供PCM输出。
来自修改的AC-3部分解码器38连接到完整的代码转换功能或设备(“完整代码转换”)46,该功能或设备与部分解码38结合,构成或作为诸如图2和3的代码转换器之类的代码转换器。如图3中的代码转换器14那样,完整的代码转换46还可以执行某些程度的信道格式化,以便使健壮音频与5.1信道AC-3主音频更加兼容,如上所述。
健壮数据流可以具有不同于最高的常规AC-3数据速率的数据速率。例如,它可以具有诸如96kb/s之类的较低的数据速率。当数据速率不同时,完整的代码转换46的功能是将健壮流的数据速率转换为最高的AC-3数据速率,640kb/s。健壮音频和AC-3音频之间的其他区别可以由部分解码38来进行处理。如果部分解码38和完整的代码转换46的组合构成了诸如上文讨论的低复杂性代码转换器,使用音频编码器2(图1)提供的信息,完整的代码转换46可以执行位分配,将数据量子化并将数据包装为AC-3兼容的位流。
控制器16还控制开关或开关功能(“开关”)48以使可选S/PDIF、Toslink或其他数字输出格式器功能或设备22在主音频损坏时选择完整的代码转换46输出(否则,它通过可选变化数据速率12选择主数据流,如在图2和3中那样)。
注意,在诸如部分解码36或38之类的部分解码和完整的解码40或完整的代码转换46之间传递的信息可以不是串行位流-例如,它可以是量子化系数。
如果只需要AC-3兼容的输出,则既不需要AC-3部分解码36,完整的解码40,也不需要开关44。如果只需要PCM输出,则变化数据速率12、完整的代码转换46、开关48或格式器22中的任何一个都不需要。
那些精通相关技术的普通人员将知道,在不改变操作原理的情况下,所说明的实施例的某些细节可以变化。例如,可以使用另外的开关或开关功能以将当选择主输入和健壮输入中的某一个时处于空闲状态的设备或功能,和/或可以省略开关或开关功能,以便通过关掉非选择的设备或功能来获得相同的结果。此外,功能也可以在指定的设备或功能之间以与所描述的方式的不同方式来进行共享。例如,当选择健壮输入时,格式器22可以从代码转换器14或完整的代码转换器46接收数据,从该数据生成AC-3位流,而不是接收AC-3位流。作为另一个示例,格式器22可以执行变化数据速率12的功能。那些精通本技术的普通人员将认识到,其他变体也是可以的。
本发明可以以各式各样的方式来实现。可以根据需要使用模拟和数字技术。各个方面可以通过单独的电组件、集成电路、可编程逻辑阵列、ASIC及其他类型的电子元件,以及通过执行指令程序的设备来实现。指令程序可以通过基本上诸如磁性和光存储介质、只读存储器和可编程序存储器之类的任何设备可读的介质来传递。
本发明的软件实现方式可以通过诸如包括从超声波到紫外线频率的频谱中的基带或调制的通信路径之类的各种机器可读的介质,或基本上使用包括磁带、卡或光盘、光卡或光盘,诸如纸之类的介质中的可检测的标记的任何记录技术传递信息的存储介质来传递。
权利要求
1.一种数字音频编码方法,包括接收包括PCM音频数据采样的PCM编码的音频信息,用第一种数字音频编码类型对所述音频信息进行编码,编码的音频信息具有自含式数据单元,以及用第二种数字音频编码类型对所述音频信息进行编码,编码的音频信息具有自含式数据单元,其中,用第一种和第二种数字音频编码类型进行编码的对应的自含式数据单元对代表相同的PCM音频数据采样,以便第一和第二音频信息代表相同的基础音频信息。
2.根据权利要求1所述的数字音频编码方法,其中,所述第一列举的编码方式将用第一种数字音频编码类型编码的音频信息编码为第一数字音频流,所述第二列举的编码方式将用第二种数字音频编码类型编码的音频信息编码为第二数字音频流,以便所述流被分成所述自含式数据单元。
3.根据权利要求2所述的数字音频编码方法,进一步包括将至少所述第一和第二数字音频流多路复用为复合数据流。
4.根据权利要求1所述的数字音频编码方法,进一步包括将至少用第一种数字音频编码类型编码的音频信息和用第二种数字音频编码类型编码的所述音频信息多路复用为复合数据流。
5.根据权利要求1所述的数字音频编码方法,其中,每一个所述自含式数据单元都包括一个或多个帧。
6.根据权利要求1所述的数字音频编码方法,其中,第二列举的编码的音频信息表示具有比第一列举的编码的音频信息较少的细节的基础音频中的方向信息。
7.一种数字音频解码方法,包括接收用第一种数字音频编码类型编码的第一音频信息和用第二种数字音频编码类型编码的第二音频信息,其中,第一音频信息和第二音频信息两者都具有自含式数据单元,并且第一和第二音频信息中的对应的自含式数据单元对代表相同的基础音频信息,接收指出第一音频信息中的错误和遗漏的错误信号或检测第一音频信息中的错误和遗漏,以及提供PCM音频输出和/或符合所述第一种数字音频编码类型的编码的音频输出,其中PCM音频输出是当在第一音频信息中没有检测到错误或遗漏时通过对第一音频信息进行解码而提供的,以及当在第一音频信息中检测到错误或遗漏时对第二音频信息进行解码而不是对第一音频信息进行解码而提供的,和/或符合所述第一种数字音频编码类型的编码的音频输出是当在第一音频信息中没有检测到错误或遗漏时由第一音频信息派生而来的,以及当在第一音频信息中检测到错误或遗漏时通过对第二音频信息进行代码转换派生而来的。
8.根据权利要求7所述的数字音频解码方法,其中,相同的基础音频信息代表相同的PCM音频数据采样。
9.根据权利要求7所述的数字音频解码方法,其中,所述代码转换是将第二音频信息转换为第一音频信息的数字音频编码类型。
10.根据权利要求9所述的数字音频解码方法,其中,所述代码转换还修改第二音频信息的信道格式。
11.根据权利要求7所述的数字音频解码方法,进一步包括当提供符合所述第一种数字音频编码类型的编码的音频输出时,格式化符合所述第一种数字音频编码类型的编码的音频输出的联结接口。
12.根据权利要求7所述的数字音频解码方法,其中,提供PCM音频输出和/或符合所述第一种数字音频编码类型的编码的音频输出包括根据所述错误信号从第一音频信息和第二音频信息选择对应的自含式数据单元对中的一个。
13.根据权利要求7所述的数字音频解码方法,其中,所述提供步骤将以编码的位流的形式提供符合所述第一种数字音频编码类型的编码的音频输出。
14.根据权利要求7所述的数字音频解码方法,其中,所述第一音频信息和第二音频信息两者都是作为编码的位流来接收的。
15.根据权利要求14所述的数字音频解码方法,其中,所述提供步骤将以编码的位流的形式提供符合所述第一种数字音频编码类型的编码的音频输出,编码的音频输出位流具有不同于第一音频信息编码的位流的数据速率的数据速率。
16.根据权利要求7所述的数字音频解码方法,其中,当所述提供步骤提供PCM音频输出时,对第一音频信息进行解码和对第二音频信息进行解码的步骤包括共同的解码或共同的解码部分。
17.根据权利要求7所述的数字音频解码方法,其中,第一种数字音频编码类型是AC-3编码,第二种数字音频编码类型是修改的AC-3编码。
18.根据权利要求2所述的数字音频解码方法,其中,修改的AC-3编码使用高频再生。
19.根据权利要求17所述的数字音频解码方法,其中,所述第二音频信息包括对在对第二音频信息进行代码转换时可使用的信息进行代码转换,当所述提供步骤提供符合所述第一种数字音频编码类型的编码的音频输出时,所述代码转换使用所述代码转换信息。
20.根据权利要求7所述的数字音频解码方法,其中,当所述提供步骤提供PCM音频输出时,对第一音频信息进行解码是由包括用于所述第一种数字音频编码类型的解码器的设备执行的,其中,对第二音频信息进行解码是由包括将第二种数字音频编码类型转换为第一种数字音频编码类型的代码转换器的设备以及由用于所述第一种数字音频编码类型的所述解码器执行的,其中,共同的解码器用于第一和第二音频信息。
21.根据权利要求7所述的数字音频解码方法,其中,当所述提供步骤提供PCM音频输出时,对第一和第二音频信息进行解码是由包括解码器[32]的设备执行的,解码器[32]包括用于第一和所述第二种数字音频编码类型的共同的解码部分。
22.根据权利要求7所述的数字音频解码方法,其中,当所述提供步骤提供PCM音频输出时[36]对第一音频信息进行解码以提供PCM音频输出的步骤包括部分地对第一音频信息进行解码以提供部分地解码的第一音频信息,[38]对第二音频信息进行解码以提供PCM音频输出的步骤包括部分地对第二音频信息进行解码以提供部分地解码的第二音频信息,其中,所述对第一音频信息进行解码和对第二音频信息进行解码的步骤进一步包括对部分地解码的第一和第二音频信息进行共同的完整的解码[40]以提供PCM音频输出。
23.根据权利要求22所述的数字音频解码方法,其中,当所述提供步骤还提供符合所述第一种数字音频编码类型的编码的音频输出时,对第二音频信息进行代码转换的步骤包括完成从第二音频信息派生出来的部分地解码的数字音频信号的代码转换[34]。
24.根据权利要求7所述的数字音频解码方法,其中,当所述提供步骤提供PCM音频输出时,对第一音频信息进行解码和对第二音频信息进行解码的步骤包括对第一和第二音频信息的部分解码或完整的解码,
25.根据权利要求24所述的数字音频解码方法,其中,当所述提供步骤还提供符合所述第一种数字音频编码类型的编码的音频输出时,对第二音频信息进行代码转换的步骤包括所述部分解码并进一步包括完成部分地解码的第二音频信号的代码转换,以便对第二音频信息的部分解码对于对第二音频信息的解码是共同的,以提供PCM音频输出,并且对于对第二音频信息的代码转换是共同的,以提供符合第一种数字音频编码类型的编码的输出。
26.一种用于对数字音频进行编码的设备,包括被配置为执行下列操作的音频编码器接收包括PCM音频数据采样的PCM编码的音频信息,用第一种数字音频编码类型对所述音频信息进行编码,编码的音频信息具有自含式数据单元,以及用第二种数字音频编码类型对所述音频信息进行编码,编码的音频信息具有自含式数据单元,其中,用第一种和第二种数字音频编码类型进行编码的对应的自含式数据单元对代表相同的PCM音频数据采样,以便第一和第二音频信息代表相同的基础音频信息。
27.一种用于对数字音频进行解码的设备,包括被配置为执行下列操作的音频解码器接收用第一种数字音频编码类型编码的第一音频信息和用第二种数字音频编码类型编码的第二音频信息,其中,第一音频信息和第二音频信息两者都具有自含式数据单元,并且第一和第二音频信息中的对应的自含式数据单元对代表相同的基础音频信息,接收指出第一音频信息中的错误和遗漏的错误信号或检测第一音频信息中的错误和遗漏,以及提供PCM音频输出和/或符合所述第一种数字音频编码类型的编码的音频输出,其中PCM音频输出是当在第一音频信息中没有检测到错误或遗漏时通过对第一音频信息进行解码而提供的,以及当在第一音频信息中检测到错误或遗漏时对第二音频信息进行解码而不是对第一音频信息进行解码而提供的,和/或符合所述第一种数字音频编码类型的编码的音频输出是当在第一音频信息中没有检测到错误或遗漏时由第一音频信息派生而来的,以及当在第一音频信息中检测到错误或遗漏时通过对第二音频信息进行代码转换派生而来的。
28.一种数字音频编码器,包括用于接收包括PCM音频数据采样的PCM编码的音频信息的装置,用于用第一种数字音频编码类型对所述音频信息进行编码的装置,编码的音频信息具有自含式数据单元,以及用于用第二种数字音频编码类型对所述音频信息进行编码的装置,编码的音频信息具有自含式数据单元,其中,用第一种和第二种数字音频编码类型进行编码的对应的自含式数据单元对代表相同的PCM音频数据采样,以便第一和第二音频信息代表相同的基础音频信息。
29.一种数字音频解码器,包括用于接收用第一种数字音频编码类型编码的第一音频信息和用第二种数字音频编码类型编码的第二音频信息的装置,其中,第一音频信息和第二音频信息两者都具有自含式数据单元,并且第一和第二音频信息中的对应的自含式数据单元对代表相同的基础音频信息,用于接收指出第一音频信息中的错误和遗漏的错误信号或检测第一音频信息中的错误和遗漏的装置,以及用于提供PCM音频输出的装置和/或符合所述第一种数字音频编码类型的编码的音频输出的装置,其中PCM音频输出是当在第一音频信息中没有检测到错误或遗漏时通过对第一音频信息进行解码而提供的,以及当在第一音频信息中检测到错误或遗漏时对第二音频信息进行解码而不是对第一音频信息进行解码而提供的,和/或符合所述第一种数字音频编码类型的编码的音频输出是当在第一音频信息中没有检测到错误或遗漏时由第一音频信息派生而来的,以及当在第一音频信息中检测到错误或遗漏时通过对第二音频信息进行代码转换派生而来的。
30.在其上具有编码的程序代码的机器可读取的介质,其中,当程序代码是由机器执行的,机器实现数字音频解码方法,包括接收用第一种数字音频编码类型编码的第一音频信息和用第二种数字音频编码类型编码的第二音频信息,其中,第一音频信息和第二音频信息两者都具有自含式数据单元,并且第一和第二音频信息中的对应的自含式数据单元对代表相同的基础音频信息,接收指出第一音频信息中的错误和遗漏的错误信号或检测第一音频信息中的错误和遗漏,以及提供PCM音频输出和/或符合所述第一种数字音频编码类型的编码的音频输出,其中PCM音频输出是当在第一音频信息中没有检测到错误或遗漏时通过对第一音频信息进行解码而提供的,以及当在第一音频信息中检测到错误或遗漏时对第二音频信息进行解码而不是对第一音频信息进行解码而提供的,和/或符合所述第一种数字音频编码类型的编码的音频输出是当在第一音频信息中没有检测到错误或遗漏时由第一音频信息派生而来的,以及当在第一音频信息中检测到错误或遗漏时通过对第二音频信息进行代码转换派生而来的。
31.一种数字音频编码和解码方法,包括接收包括PCM音频数据采样的PCM编码的音频信息,用第一种数字音频编码类型对所述音频信息进行编码,编码的音频信息具有自含式数据单元,用第二种数字音频编码类型对所述音频信息进行编码,编码的音频信息具有自含式数据单元,其中,用第一种和第二种数字音频编码类型进行编码的对应的自含式数据单元对代表相同的PCM音频数据采样,以便第一和第二音频信息代表相同的基础音频信息,接收用所述第一种数字音频编码类型编码的音频信息和用第二种数字音频编码类型编码的音频信息,接收指出第一音频信息中的错误和遗漏的错误信号或检测第一音频信息中的错误和遗漏,以及提供PCM音频输出和/或符合所述第一种数字音频编码类型的编码的音频输出,其中PCM音频输出是当在第一音频信息中没有检测到错误或遗漏时通过对第一音频信息进行解码而提供的,以及当在第一音频信息中检测到错误或遗漏时对第二音频信息进行解码而不是对第一音频信息进行解码而提供的,和/或符合所述第一种数字音频编码类型的编码的音频输出是当在第一音频信息中没有检测到错误或遗漏时由第一音频信息派生而来的,以及当在第一音频信息中检测到错误或遗漏时通过对第二音频信息进行代码转换派生而来的。
全文摘要
数字音频编码器接收PCM编码的音频信息,并用第一种和第二种数字音频编码类型对其进行编码,编码的音频信息具有自含式数据单元,其中,用第一种和第二种数字音频编码类型进行编码的对应的自含式数据单元对代表相同的基础音频信息。解码器接收第一和第二音频信息和指出第一音频信息中的检测到错误和遗漏的错误信号。根据在第一音频信息中是否有错误或遗漏的情况,基于第一或第二音频信息,解码器提供PCM音频输出和/或符合所述第一种数字音频编码类型的编码的音频输出。
文档编号H04L1/22GK1739141SQ200480002420
公开日2006年2月22日 申请日期2004年1月29日 优先权日2003年2月6日
发明者格雷格·坎贝尔·托德, 迈克尔·米德·杜鲁门, 朱莉娅·鲁思·库特勒 申请人:杜比实验室特许公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1