数字音频信息在其存储媒介上的多路调制编码方法与装置的制作方法

文档序号:6744526阅读:255来源:国知局
专利名称:数字音频信息在其存储媒介上的多路调制编码方法与装置的制作方法
技术领域
本发明涉及能显著扩展激光盘、袖珍盘、数字音频磁带及其它常规数字录音媒介有效容量的方法与装置,更具体而言涉及将多数字声信号多路调制到数字通道上的方法及其相关装置,其中该通道正为这些记录媒介上的脉冲编码调制(PCM)数字音频通道所占用。
目前市场上标准的数字音频格式为双通道立体声16位线性PCM系统。这种编码形式用于袖珍盘(CDs)、激光盘和数字音频磁带(DAT),以及专业数字磁带录音机。它在略高于90dB的动态范围内提供双声道,且对于常规的CD,它提供大约一小时的录音时间。一种误差修正技术系统被用来检测并修正位误差,从而导致了能给出可靠的高质量立体声录音的系统。
尽管16位线性数字音频可提供良好的录音质量,但它还不能达到非常高的质量标准以满足录音爱好者的要求。目前已经出现了新的20位模-数编码器和数-模解码器,但这些器件不能与用于现有CD和激光盘的16位线性PCM技术相兼容;从而该新型编码器和解码器对质量的改善不能在现行的数字音频标准中实现。
常规数字录音媒介对双通道立体声的限制以及大约一小时的录音时间也是不合要求的。例如,六声道装置将具有产生类似于十足装备的六轨剧场环境收听效果的潜力。另外,可在单个盘上进行远超过一小时的录音,这在许多情况下将是有利的,同时其非常迅速的盘存取能力仍将允许录音的任何部分被快速和方便地存取。
本发明的目的在于提供一种方法和装置,其用于将更高质量的多通道数字音频存储于常规录音媒介(如CD、激光盘和DAT)的立体声通道和/或进行比该媒介通常所能实现的录音时间更长的录音。该系统有足够的适应性,能处理许多不同种类的音频输入,且不需要特别的新成分。
该目的通过压缩多轨输入数字音频信号的数据比特率以使其压缩后组合数据比特率不超过该音频存储媒介的最大数据比特率而实现。接着,该压缩信号相互进行多路调制以产生一多路调制信号,该信号具有不超过该存储媒介最大容量的数据比特率。在编码成该存储媒介所使用的格式之后(例如常规的AES/EBU),该多路调制信号被记录在该存储媒介之上。实现重放的过程是,从存储媒介上读取所录信号,对该读取信号以与编码方式互补的方式进行解码,对该解码信号以与多路调制方式互补的方式进行信号分离,再对该分离信号以与压缩方式互补的方式进行解压缩。然后该解压缩信号可通过数-模变换器(DAC)进行处理并提供给扬声器。
压缩因子的选择与输入信号通道的数据比特率、录音媒介的数据比特率容量以及输入通道数相关,以便使压缩后输入信号的组合数据比特率不超过该录音媒介的容量。用于存储音频采样的录音媒介具有对每个采样预定的位数,从而压缩输入信号被多路调制成具有相同位数的数据组。尽管这样会导致某些输入采样被分离在不同的数据组之中,但互补的解码处理可恢复原始采样的完整性。
不同输入格式要求不同类型的多路调制,为适应这一点,可将识别标志码与该输入信号一起录入以保证信号分离以互补的方式进行。这一点的实现,可指定32位AES/EBU子系统中的一位作为识别标志,也可提供一个独立的模式识别输入。当大量输入轨道存在时,如当具有扩展长度的较低质量输入轨道被分解为用以顺序编码的大量子通道时,可利用中等存储媒介编辑各个输入通道组以进行多路调制。
附图简要说明

图1为将多数字音频输入在数字存储媒介上进行编码的系统框图,该数字存储媒介的容量小于输入信号组合的容量;图2为解码系统的框图,该系统用于从该存储媒介上重现该数字音频信号;图3描述了较高比特级音频输入信号至记录于数字音频存储媒介的较低比特级数据流的压缩与多路调制;图4为另一种用于大量输入数据通道的多路调制方案的框图;图5的数据图描述了用于本发明优选方案的常规AES/EBU接口标准;图6A1~图6A7以及图6B1~图6B7共同组成了用于本发明优选方案的AES/EBU编制器的原理图;图7A1~图7A7、图7B1和图7B2以及图7C1~图7C7共同组成了用于本发明优选方案的解码器的原理图。
本发明给出了将六个或甚至更高质量(即20位)的数字音频通道可兼容地编码于常规立体声PCM数据比特流上的方法,因而极大地扩展了数字音频存储媒介(如CD、激光盘和DAT)的有效数据存储容量。例如,在通常只能存储大约一小时立体声(双通道)16位音频的CD上,这种方法可记录一小时六轨超高保真20位音频,或记录四小时16位立体声数字音频,或记录四十小时调幅射频质量的音频。
编码系统的框图在图1中给出。多轨数字音频输入信号CH1、CH2…CHn以线性数字音频格式而给出,其典型格式为对每个采样16、18或20位。如果本发明用于记录超高质20-20KHz带宽的数字音频信号,则输入数据的形式为具有每秒24,100采样率的20位线性PCM信号,该采样率与常规立体声16位线性编码音频相同。对于扩展时间调幅质量的音频编码,可将四十通道20-4KHz 16位线性PCM信号(其采样率为每秒8,820)输入该系统。
将n个输入通道各自分别施加于数据压缩器C1、C2…Cn,该压缩器将输入数据音频压缩成较低的数据比特率。这种数据比特率压缩器以前已用于实时无线电及电视广播,而同样的压缩器也可用于此项新应用。适合的数据压缩器包括音频处理技术公司的APTX100(其将数据比特率缩减四倍),DolbyRAC-3、SonyRATRAC以及European Musician压缩规则系统。
数据压缩算法的选择应使得来自所有压缩器输出端的数据比特率的总和不超过常规双通道16位线性PCM音频的数据比特率。例如,如果有20位数据的六个输入通道,则4∶1的压缩率将实现足够的压缩。这六个20位输入通道中每一个具有1.25倍于16位立体声通道的数据比特率,而输入通道的数量为立体声通道的三倍。因而,压缩前的组合输入信号数据率为该16位数据比特率的3.75倍。从而将该输入信号的数据比特率压缩四倍便满足了组合压缩输入数据比特率不超过16位立体声数据比特率的要求。
压缩音频信号由多路调制器2相互进行多路调制。该多路调制可以用若干方式实现。最简单的方法是以反复的方式循环该压缩输入,而在每个周期顺序从各个压缩输入中提取一位或一组位。在优选方案中(这将在下面进行详细说明),依次从每个压缩器提取16位数据单元以产生在数据比特率上等价于16位双通道立体声信号的多路调制输出。
在该多路调制的过程中,要求该调制数据在优选AES/EBU格式的数据单元中是位置稳定的,以便使来自基本CD或其它数字存储媒介误差修正装置的插值与代换在最终多路调制信号重现时产生最小的音频误差。正象在上述六通道20位输入音频信号的场合,如果来自压缩器的组合数据率小于16位线性PCM立体声数据率,则附加的位误差修正可利用常规的误差修正芯片装置(如Reed Solomon误差修正规范)而引入该数字多路调制器。
多路调制器2的输出可选择存入数据文件4(如计算机硬盘),在那里可进行编辑函数或添加同步信号之类的附加处理。然后,该多路调制信号被送入常规编制器6,该编制器将该信号编制成用于记录在数字音频存储媒介上的适当格式;本应用中的常规格式为AES/EBU。该多路调制信号在数据率上等效于双通道16位线性PCM,从而对于AES/EBU编制器6而言它等效于常规的立体声信号。适合的编制器由若干公司生产,例如由晶体半导体公司生产的CS8401、CS8402数字音频接口传送器。
为最大程度地增加处理不同类型输入音频信号的灵活性,该多路调制器2应当可调以接受不同数目的输入通道,并允许选择在多路调制周期内从各个通道所提取的数据位数。常规AES/EBU编制器(又称为接口传送器)包括用户位输入端8,该端口允许多路调制模式被记录在AES/EBU比特流之内。当该比特流在重放过程中从数字录音媒介上被解时,该多路调制模式信息被利用来控制信号分离。另一方面,可加入移位寄存器以将压缩用户信息直接置于具有AES/EBU格式的20位音频数据部分之中,这将在下面加以介绍。该格式化数字音频数据通过常规数字录音机10被记录在CD、激光盘、DAT或其它类型设计的数字录音媒介12上。
将该录制数字音频数据转换成驱动扬声器的模拟声音信号的解码系统如图2所示。它包括常规数字重放装置14,用以读出记录在存储媒介上的音频数据,并将该数据以标准AES/EBU系列比特流的形式输出。AES/EBU接口接收机(如晶体半导体公司的CS8411或CS8412)以与图1中AES/EBU编制器6相互补的方式进行工作以产生等价于双通道16位线性PCM的输出。AES/EBU接口接收机16的输出由信号分离器18进行信号分离,该信号分离器以互补于图1多路调制器2的方式进行工作。利用将适当的控制信号沿输出线22送至信号分离器18,AES/EBU用户位可通过附加微处理器控制器20读出并被用来选择编码过程中任何不同形式的多路调制方案。信号分离模式也可以人为选定,可直接或通过该控制器的用户输入端24进行选择。该控制器的另一个输出26设定系统时钟28的采样时钟率。例如,在不同于高保真录音的扩展调幅质量录音的情况下,采样率从每秒44,100减至每秒8,820;而该时钟率必须与用于录音过程的采样率相匹配。
来自信号分离器18的比特流输出被馈至数字音频解压器D1、D2…Dn,其方式与由图1中多路调制器2从压缩器C1、C2…Cn接收压缩音频输入信号的方式相互补。最后,来自信号分离器D1、D2…Dn的输出被分别送到数-模变换器DAC1、DAC2…DACn。在此,它们被转变成模拟信号,通过输出线01、02…0n进行传送以驱动扬声器。在目前最高数字音频质量的情况下,由这些DAC而来的输出可达到22或甚至24位线性PCM编码。
图3描述了由图1所示系统将载有高质量音频信号(如20位)的多音频输入通道加工成模拟用于AES/EBU编制器6的常规16位立体声输入的方式。输入通道CH1、CH2…CHn被描述为包含20位采样S1、S2、S3、S4等的各个系列比特流。这些输入信号被压缩器C1、C2…Cn压缩成5位压缩采样信号CS1、CS2、CS3、CS4等。多路调制器2对压缩通道进行循环,在每个周期内对每个通道提取16位。这代表了来自三个完整采样的位,再加上来自第四采样的附加位。在图3中,来自CH1的字30包含通道1数据比特流中三个5位采样再加上来自第四采样的第一位,该字被该多路调制器所获取并将其放入输出多路调制数据比特流32。随后再从CH2获取包含三个5位采样加上来自第四采样一个附加位的字34,该字在多路调制输出中紧随字30之后。该多路调制以这种方式继续进行直到第n通道中的字36,该字仍包含三个5位采样加上来自第四采样的一个附加位。在从最后一个通道取得一个字后,另一个循环周期开始,从第一通道取得一个新的16位字,其首位为压缩采样信号CS4的第二位。
表面上,这种多路调制过程不保证每个通道压缩采样的完整性,从而可能含预期在重放时导致输入音频信号的损失。然而,由于重放过程中信号分离的互补特性,该输入采样的完整性可在解压缩之前得到恢复。
用于被压缩输入数字音频信号的压缩因子应足够大以允许该信号以这种方式进行多路调制。首先,对具有比数字音频存储媒介所载正常位密度大的每采样位数(如20位比16位),该压缩因子应至少同输入信号每采样位数与通常存储于存储媒介上每采样位数的比率相等。第二,当所提供的输入通道数多于存储媒介正常所存储的通道数时(如6通道对双通道立体声),该压缩因子应当至少同输入信号通道数与存储媒介正常所录通道数的比率相等。当输入信号比正常所录既有较大每采样位数又有较大通道数时,该压缩因子应至少等于上述两个比率的乘积。
图4的框图描述了长时间录制相对较低质量音频数据(如40小时单轨调幅无线电音频)的方式。该四十小时被分成连续的部分,比如分成四十个一时部分,而每一个部分按一个独立的通道来处理。这些不同的″通道″被组合成便于处理的组,比如组成五组,每组八个通道;这种情况在图4中被推广到一般情形,即每组可包含n个通道。标号数字1-1表示第一组的第一通道,1-2表示第一组的第二通道,2-1表示第二组的第一通道,余此类推。总分组数用m表示。
通道CH1-1至CHm-n中的每一个分别用于压缩器C1-1至Cm-n。每组压缩器的输出又分别施加于数据文件DF1,DF2,…DFm。各组压缩音频输入由其各自数据文件进行合并与编辑,而该数据文件的输出由多路调制器2进行多路调制。该输入音频信号的进一步处理过程如图1所示。
例如,如果四十小时调幅质量的音频要记录在通常具有一小时双通道立体声的CD上,可将该四十小时分成各含八个通道的五组,而把这四十个小时在这些通道之间依次分配。各组的八个压缩通道由各自的数据文件进行合并,这五个数据文件的输出被多路调制成AES/EBU编制器的输入,该输入模拟正常的16位立体声信号。在解码器部分,提供了互补数据文件设计以存储解码通道1-2至m-n,同时通道1-1被转换成模拟格式并由扬声器重放。在播放通道1-1的所需时间内,所有其余通道可聚集在其各自的数据文件中。顺序跟随其后的各个通道接着被重放,直到整个四十小时播放的完成。这个重放过程可以在任何需要的时间被中断。
利用中间硬盘数据文件提供了极大的灵活性,因为同时输入所有通道是不必要的。例如,该系统还可用于借助将四小时双通道输入音频信息通过数据压缩器录在硬盘中间数据文件上而录制超过四小时的立体声数字音频,然后将该信号编辑成八通道格式并将其以平行于AES/EBU的格式输出这里所使用的AES/EBU格式如图5所示,其进一步的详细介绍请参见有关资料,如晶体半导体公司的数字音频产品数据手册,1994年1月,第6-35至6-68页。该AES/EBU数据被组织成数据块40,其中每个数据块包含二十四个通道状态字节42。每个字节包括八个结构44,而每个结构含有一对子结构46,其中每个子结构包含三十二位。因此数据块40包含384个32位子结构46。在每个子结构中,前四位0-3保留作为前置位,4-7位作为辅助数据位,8-27位作为音频数据位,28位作为有效标志位,29位作为用户数据位,30位作为通道状态数据位,而31位作为奇偶校验位。29位可用于编码当前多路调制模式;因为每个数据块可提供总数据为384个这样的用户位,所以实际上可定义任意数量的多路调制模式。
图6A1至6A7以及图6B1至6B3共同构成了图1所示AES/EBU编制器(发送器)6特定方案的原理图。以下所提到的与图6电路有关的部分数字均为工业标准术语,除了晶体半导体公司的CS8401 AES/EBU发送器U2和用于接收AES/EBU信号而为该发送器生成时钟的晶体半导体公司的CS8412AES/EBU接收机U3之外。该电路包括75C01发送缓冲器FIFO U4,可编程逻辑PALCE22V10并一串变换器U6,用于发送DMA计时的PALCE16V8 U8,用于AES/EBU收/发计时的一对PALCE16V8 U10和U12,地址解码器PALCE22V10U14,用于发送DMA符号交换的双74HCT74 U16,一对74HCT374控制寄存器U18和U20,一对74HCT244状态寄存器U22和U23以及至IBM计算机的边缘接口48。
IBM数据文件4由DMA转移到发送缓冲器FIFO U4。该数据读出由信号/OUTHF所控制,其中该信号为FIFO半完全标志。IBM计算机总线信号/IOW、TC、IRQ12及DREQ0排定DMA次序。DMA由控制信号/ENDMA0起动。信号SCK为串行移位时钟,而FSYNC为结构的同步信号;标定的FSYNC速率为44.1kHz。FSYNC的每周期四个字节被从发送缓冲器FIFO U4的输出转移到并一串变换器U6。U6的串行输出SDATAO被移入AES/EBU发送器U2。U2的端口11为用户位输入端(图1中数字8),它由FSYNC计时。U2的端口20为AES/EBU发送输出端。数字录音机(图1中数字10)为任何可接受AES/EBU格式数据的录音机,例如D3格式的录像机。
特定解码方案的原理图由图7A1至7A7、7B1、7B2以及7C1至7C3共同给出。该解码器包括晶体半导体公司的CS8412 AES/EBU接收机U30;四个PALCE16V8 U32、U34、U36和U38,分别用于SYNC检测、同步间隔检测、在同步信号下降上自由换向以及无同步信号三毫秒之后静默;六个音频处理技术公司的APTX100 4∶1音频解压器U40、U42、U44、U48、U50和U52;三个晶体半导体公司的CS4328数一模变换器U56、U58和U60;用于解压器的PALCE16V8中断计时器U62;74HC14通电复位装置U64;PALCE22V10 APT中断发生器U66;PALCE16V8 APT输出延迟装置U68;MTO-TI-60MHz APT DSP时钟42;以及三个TL072双输出放大器A2、A4和A6。寻址表50被提供给解压器U40、U42、U44、U48、U50和U52。
AES/EBU接收机U30对来自数字记录媒介的AES/EBU数据进行解码;它执行图2AES/EBU接收机16的功能。FSYNC输出是结构同步信号,具有每个采样一次的频率,标称值为44.1kHz。SCK输出为位时钟,它是解码器的移位时钟。SDATA输出为串行数据,它传至同步检测电路和音频解压器。11MHz输出为U30锁相环的输出,它用于对U56-U60 DAC中的数字滤波进行计时。U30-14为用户位输出,它由FSYNC进行计时。U32检测串行数据中的同步模式;在本方案中,同步标志为多路调制时隙中的十六进制数$55AA。U32-18为同步检测信号。U32的/SCK输出对U68进行计时,它加入1/2位的延迟以产生输出信号APTDO0DEL、APTDO1DEL及APTDO2DEL,它是DAC U56-U60的数据。
端口U34-18表明最后三个同步标志处在适当位置,而/FSYNC输出用于区分多路调制数据的奇偶时隙。端口U36-17(即SYNC)识别用于APT音频解压器的时隙。它由U34-18信号进行同步。U36-18表示SYCH和U34-18是一致的;该信息用于复位计数器38,它在未收到同步信号三毫秒之后使解码器静默。APTDI(即解码器串行输入数据)在静默情况下被置零。/MUTE信号在静默时将U68输出置零。
来自音频解压器U40、U42、U44、U48、U50和U52的解压输出被标记为APTDO0至APTDO2,且成对进行多路调制。音频解压器DAC U56、U58和U60为数一模变换器,其对应于图2中元件DAC1、DAC2、…DACn。每个双放大器A2、A4和A6包括两个放大器,用以提供六通道输出容量。
尽管所给出并介绍的是本发明的特定方案,但熟悉此项技术的人将会推演出许多变形和替代方案。因此,应当指出,本发明只受后附权利要求的局限。
权利要求
1.将具有预定数据比特率的多通道数字音频信息记录于永久数字存储媒介的方法,它包括提供可存储数字音频信号的永久性数字存储媒介(12),其中数字音频信号由该存储媒介以预定格式并以不超过预定最大数据比特率的速率所接收;提供多通道输入数字音频信号(CH1、CH2、…CHn),其组合数据比特率超过该最大数据比特率;压缩(C1、C2、…Cn)该多通道输入数字音频信号的数据比特率以使其压缩后的组合数据比特率不超过存储媒介的最大数据比特率;多路调制(2)该压缩数字音频信号使之成为具有不超过存储媒介最大数据比特率之比特率的多路调制信号(32);编码(6)该多路调制信号使之具有该预定格式;将该编码信号记录(10)于该数字存储媒介上。
2.根据权利要求1的方法,其中该数字存储媒介用于存储具有预定每采样位数的音频采样信号(CS1、CS2、…),该输入数字音频信号被提供为具有大于预定数目每采样位数的音频采样(S1、S2、…),该输入数字音频信号的数据比特率以该数据比特率压缩步骤进行压缩,其压缩因子至少等于该输入数字音频信号每采样位数与该预定每采样位数的比率。
3.根据权利要求2的方法,其中该数字存储媒介用于存储预定数目的音频通道,且该输入数字音频信号的数据比特率压缩因子至少等于该每采样位比率与输入信号通道数同该预定音频通道数比率的乘积。
4.根据权利要求3的方法,其中该压缩数字音频信号被多路调制成具有该预定位数数据组的多路调制信号。
5.根据权利要求1的方法,其中还包括在该压缩步骤之后对该各组中间数字存储媒介(DF1、DF2、…DFn)中的数字音频信号进行编辑的步骤,并将该多路调制步骤施加于该编辑信号组。
6.用于将具有预定数据比特率的多通道数字音频信号记录于可存储数字音频信号的永久性数字存储媒介(12)上的系统,其中数字音频信号由该数字存储媒介以预定格式并以不超过预定最大数据比特率的速率所接收,该输入数字音频信号具有大于该最大数据比特率的组合数据比特率;该系统包括一组用于压缩各输入数字音频信号通道(CH1、CH2、…CHn)数据比特率的压缩器(C1、C2、…Cn),以便使压缩后的组合数据比特率不超过该存储媒介的最大数据比特率;多路调制器(2),用于将来自该数据比特率压缩器的输出多路调制成具有不超过存储媒介最大数据比特率的多路调制信号;编码器(6),用于将来自该多路调制器的输出编码成该预定格式;录音机(10),用于将来自该编码器的输出录制在该数字存储媒介上。
7.根据权利要求6的录音系统,用于设计成存储双通道立体声录音的数字存储媒介,其中该多路调制器生成在数据比特率方面等效于适合记录在该数字存储媒介上的双通道立体声信号的输出。
8.根据权利要求6的录音系统,其中该数字存储媒介设计用于存储具有预定每采样位数的音频采样信号(CS1、CS2、…),而该压缩器压缩该输入数字音频信号的数据比特率,其压缩因子至少等于该输入数字音频信号每采样位数与该预定每采样位数的比率。
9.根据权利要求8的录音系统,其中该数字存储媒介设计用于存储预定数目的音频通道,而该压缩器压缩该输入数字音频信号的数据比特率,其压缩因子至少等于该每采样位数比率与输入信号通道数同该预定音频通道数比率的乘积。
10.根据权利要求6的录音系统,其中还包括中间数字存储媒介(DF1、DF2、…DFm),用于编辑由该数据比特率压缩器压缩之后的各组数字音频信号,并将该编辑信号组提供给该多路调制器。
全文摘要
具有大于数字存储媒介(CD、激光盘或数字录音带)最大数据比特率之组合数据比特率的超高质或超长数字音频通道被记录于音频媒介上。录制的实现过程是,压缩多通道输入信号数据比特率使之压缩后组合数据比特率不超过存储媒介的最大值,多路调制该压缩音频信号,编码该调制信号成为预定格式,最后在存储媒介上录制该编码信号。重放的实现是以与录制过程互补的方式对来自存储媒介的信号进行解码、信号分离及解压缩。
文档编号G11B20/12GK1140513SQ95191502
公开日1997年1月15日 申请日期1995年1月23日 优先权日1994年2月4日
发明者特里·D·比尔德, 詹姆斯·S·凯查姆 申请人:Dts工业技术股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1