数字音频记录媒体及其重放装置的制作方法

文档序号:6748601阅读:278来源:国知局
专利名称:数字音频记录媒体及其重放装置的制作方法
技术领域
本发明涉及数字音频记录媒体及其重放装置。特别是,涉及在光盘等高密度记录媒体上的数字音频信号的记录格式和适用于重放该高密度记录媒体的重放装置。
如公知的那样,近年来,开发出了能够记录主图象信号、该主图象信号中所附带的多种副图象信号和多信道的音频信号的高密度记录光盘。该高密度记录光盘被称为DVD。以后把该技术称为DVD视频。
应用该DVD视频技术,还开发出了DVD音频技术。该DVD音频作为音频专用技术被开发,以高音质作为目标。
在DVD音频的开发中,作为其标准,希望以尽可能类似于DVD视频中的音频数据构造的标准的形式来实现。作为关于DVD音频的先行技术例子,例如有日本专利申请公开公报特开平9-312066号中所揭示的。
考虑到上述情况,本发明的目的是提供一种数字音频记录媒体及其重放装置,能够尽可能利用DVD视频中的音频数据构造的标准,来实现采用高音质规格的DVD音频的标准。
为了实现上述目的,本发明的记录媒体,能够把以预定取样频率和量化位数所数字化的音频信号记录到记录面上的预定区域中,其特征在于,记录了第一取样数据串,用第一取样频率和第一量化位数把多个信道的音频信号中的第一信道的音频信号进行数字化而形成;第二取样数据串,用第二取样频率和第二量化位数把多个信道的音频信号中的第二信道的音频信号进行数字化而形成;包含用于使该第一取样数据串和第二取样数据串同步的定时数据的首部数据。
本发明包括把从上述记录媒体所读取的数据解码为多信道的音频信号的装置。而且,本发明包括传送上述数据构造并记录在记录媒体上的装置。本发明包括传送上述数据构造的信号的装置。
根据上述装置,由于使多信道中第一信道和第二信道的音频信号中的取样频率或者量化位数成为不同的值,能够把整体的数据传输率容纳在预定的数据传输率以内,能够在所希望的标准的数据传输率内得到高品位的音质。并且能够记录这样的数据。
本发明的这些和其他的目的、优点及特征将通过结合附图对本发明的实施例的描述而得到进一步说明。在这些附图中

图1A~图1D分别是用于说明本发明所涉及的DVD视频(video)的数据取样构成和取样的配置的图;图2是用于说明DVD视频所涉及的包的排列例子和该排列中的音频包的构成的图;图3A和图3B分别是详细说明DVD视频所涉及的音频包的构成的图;图4A和图4B分别是用于说明线性PCM数据的包元内的数据尺寸的例子的一览的图;图5是用于说明DVD视频所涉及的音频包的生成例子的图;图6是用于说明DVD视频所涉及的线性PCM数据的尺寸的一览表的图;图7是用于说明音频包的包首部的图;图8是用于说明音频包的包元首部的图;图9A和图9B分别是用于说明采用缩放的盘记录装置和重放装置的基本构成的方框图;图10是使用取样例子来说明本发明所使用的缩放原理的图;图11是使用另一个取样例子来说明本发明所使用的缩放原理的图;图12是使用另一个取样例子来说明本发明所使用的缩放原理的图;图13是使用另一个取样例子来说明本发明所使用的缩放原理的图;图14是用于说明本发明所涉及的数据取样构造的一个例子的图;图15是用于说明本发明所涉及的数据取样构造的另一个例子的图;图16是用于说明本发明所涉及的数据取样构造的另一个例子的图;图17是用于说明本发明所涉及的数据取样构造的另一个例子的图;图18是用于说明本发明所涉及的数据取样构造的另一个例子的图;图19是用于说明本发明所涉及的数据取样构造的另一个例子的图;图20是用于简要说明本发明所涉及的音频包的内部构造的图;图21是用于分层地说明本发明所涉及的音频对象组和音频包的关系的图;图22是用于说明本发明所涉及的音频对象组的单元与节目链信息的关联的图;图23是用于说明记录有本发明所涉及的DVD音频的盘的逻辑数据的配置的图;图24是用于说明本发明所涉及的音频对象组信息管理表的内容的图;图25是用于说明构成图23所示的音频标题组节目链信息检索指针的信息的图;图26是用于说明本发明所涉及的信道分配表的图;图27是用于说明本发明所涉及的音频包的内部构造的图;图28A和图28B分别是用于说明图27所示的音频包具有的包元首部的内容的图;图29是用于说明具有图27所示的音频包的专用包元首部的内容的图;图30是用于说明本发明所涉及的盘重放装置的构成的方框图;图31是用于说明图30所示的盘重放装置的解码器的内部构成例子的方框图32A~图32D分别是用于说明盘、凹坑串、扇区串以及物理扇区的图;图33A和图33B分别是用于说明物理扇区的内容的图;图34A和图34B分别是用于说明记录扇区的构成的图;以及图35A和图35B分别是用于说明纠错码块的构成的图。
下面参照附图来对本发明的一个实施例进行详细说明。首先,对在DVD视频的标准中所定义的音频信号的记录格式进行说明。
其中,以线性PCM(Pulse Code Modulation)方式所产生的数据的排列为例进行说明。在这里说明的线性PCM方式中,假定任意采用例如16位、20位以及24位等来作为量化位数。
作为音频的方式,准备了单声道(1声道)、双声道(2声道)、3声道、4声道、5声道、6声道、7声道和8声道的8种。
这样具有8个声道A~H的音频信号,这些音频信号分别以48kHz或者96kHz的取样频率进行取样之后,被量化。在此情况下,量化位数以20位为例来进行说明。
图1A表示8个声道A~H的音频信号分别被取样的情况。各个取样数据被分为主要字和附加字。
各声道A~H的主要字用字母的大写An~Hn表示,附加字用小写an~hn表示。在此情况下,角标n(n=0,1,2,3,…)表示取样顺序。其中,主要字为16位,附加字为4为。因此,这样制作各取样数据声道A的音频信号为A0 a0、A1 a1、A2 a2、A3 a3、A4a4、……,声道B的音频信号为B0 b0、B1 b1、B2 b2、B3 b3、B4b4、……,声道C的音频信号为C0 c0、C1 c1、C2 c2、C3 c3、C4c4、……,以下同样,声道H的音频信号为H0 h0、H1 h1、H2 h2、H3 h3、H4h4、……。
下面,图1B用取样串来表示把上述主要字和附加字记录到记录媒体中时的各字的排列格式。
即,分别由20(=M)位组成的各取样数据被分为其MSB(MostSignificant Bit)侧的16(=m1)位的主要字和LSB(Least SignificantBit)侧的4(=m2)位的附加字。
最初,各声道A~H的第0(=2n)个主要字A0~H0被集中配置。接着,各声道A~H的第1(=2n+1)个主要字A1~H1被集中配置。
然后,各声道A~H的第0(=2n)个附加字a0~b0被集中配置。接着,各声道A~H的第1(=2n+1)个附加字a1~h1被集中配置。其中,n=0,1,2,……。
在此,把各声道A~H的相同编号的主要字A0~H0,A1~H1,A2~H2,……集中的群称为一个主取样S0,S1,S2,……。
而且,把各声道A~H的相同编号的附加字a0~h0,a1~h1,a2~h2,……集中的群称为一个附加取样e0,e1,e2,……。
图1B表示各取样数据以主要字A0~H0的主取样S0、主要字A1~H1的主取样S1、附加字a0~h0的附加取样e0、附加字a1~h1的附加取样e1、……的顺序所排列的情况。
这样,把由两个主取样和两个附加取样组成的一个组称为4取样或者两对取样。
在成为这样的格式的情况下,当用简易机型(例如以16位方式工作的机种)进行数据重放处理时,可以仅处理任意声道的主要字,或者,如果是双声道可以仅处理两个声道的各主要字来进行重放处理。
而且,当用高档机型(例如以20位方式工作的机种)进行数据重放处理时,可以处理主要字和与其相对应的附加字来进行重放处理。
图1C使用构成主取样的8个主要字的具体位数(16)和构成附加字的8个附加字的具体位数(4)来表示主取样和附加取样的排列状态。
这样,通过在被量化的线性PCM码的状态下把作为20位的取样数据分成16位的主要字和4位的附加字,而能够成为以下这样即,在16位方式工作的简易机型中,当处理取样排列时,在附加取样的区域中,以8位单位进行数据处理,由此,能够容易地丢弃不需要的部分。
这是因为构成2对取样的2个附加取样的数据量为4位×8信道+4位×8信道。这样,该数据量能够以8位单位连续8次进行处理(丢弃)。
这样的取样排列的特征并不仅限于上述实施例。例如,在信道数为奇数的情况下和附加字为8位的情况下,连续的2个附加取样的合计位数为8位的整数倍。
因此,在仅重放主要字的简易机型中,根据方式来执行8位的n次连续丢弃处理,由此,能够容易地跳读附加字。
在上述图1B所示的取样排列的状态下,可以原封不动地进行调制处理并记录到记录媒体(光盘的信息道上),而在与其他的控制信息和视频信息一起进行记录时,为了容易实现数据的处理和同步,最好以时间管理容易的形态来进行记录。因此,而进行以下这样的帧化、帧的分组化、包元(packet)化。
图1D表示了音频帧串。即,首先,把具有一定的重放时间(1/600秒)的数据的单位做成1帧。在1帧中分配80或者160取样。
当对音频信号进行取样的取样频率为48kHz时,1取样为1/48000秒,1帧的时间相当于(1/48000秒)×80取样=1/600秒。
当取样频率为96kHz时,1取样为1/96000秒,1帧的时间为(1/96000秒)×160取样=1/600秒。这样,1帧为80取样或者160取样。
图2表示上述1帧和1GOF(Group of Frame)的关系。1帧为80取样或者160取样,是1/600秒的数据,1GOF为20帧。这样该1GOF相当于(1/600秒)×20=1/30秒的期间。
即,这是电视的帧频。这样的GOF的连续是音频流。这样,通过决定1GOF的单位,在取得音频流和电视信号的同步时是有效的。
上述帧在与其他控制信号和电视信号一起记录在记录媒体上的情况下被分配给包元。下面说明该包元和帧的关系。
图3A表示上述包元和帧的关系。NV是导航包。在该导航包NV中,记述了包首部、包元首部、PCI_PKT(展示控制包元)和DSI_PKT(数据检索信息包元)。
DSI_PKT的数据是数据检索信息,V是视频对象包,A是音频对象包,S是子图象对象包。
1包被规定为2048字节。而且,1包包含1包元,由包首部、包元首部和包元组成。在该DSI_PKT的数据中,记述了各包的开始地址和结束地址等在重放时用于控制各数据的信息。
图3B仅取出音频包来进行表示。实际上,如图3A所示的那样,DSI_PKT、视频包V、音频包A混合配置,而在图3B中,为了容易看出帧与包的关系,而仅取出音频包A来表示。
在该系统的标准中,规定为配置DSI_PKT与下一个DSI_PKT之间的重放时间仅为约0.5秒的信息。由此,1帧按上述那样为1/600秒,因此,在DSI_PKT与下一个DSI_PKT之间所存在的音频帧的数量为30帧。
1帧的数据量D随取样频率fs、信道数N和量化位数Qb而不同。即当fs=48kHz时,D=80×N×Qb当fs=96kHz时,D=160×N×Qb因此,1帧并不仅限于对应于1包,具有使1包对应于多帧,或者对应于1帧以下的情况。因此,如图3B所示的那样,帧的开头位于1包的中间。
帧开头的位置信息被记述在包首部中,作为来自包首部或者DSI_PKT的数据计数数(定时)。因此,在重放装置中,当重放上述记录媒体时,取出音频包元的帧,并且,抽出将重放的信道的数据,取入到音频解码器中,进行解码处理。
图4A一般地表示量化位数为20位时的主要字(16位)和附加字(4位)的数据排列关系。图4B一般地表示量化位数为24位时的主要字(16位)和附加字(8位)的数据排列关系。
如图4A和图4B所示的那样,取样数据把使主取样和附加取样作为一对的两对取样作为一个单位,用其整数倍实现上述帧构成和包构成。
如上述那样,能够得到可以用简易机型和高档机型进行重放处理的用于多声道对应的线性PCM方式的数据的记录或者传输的数据配置方法以及用该方法进行数据记录的记录媒体及其重放处理装置。
在该系统的标准中,如上述那样,规定为配置DSI_PKT与下一个DSI_PKT之间的重放时间仅为约0.5秒的信息。
1包由包首部、包元首部和包元数据部构成。而且,在包首部和包元首部中记载音频包的尺寸、用于取得与视频的重放输出定时的展示时间印记PTS、声道(流)的识别码、量化位数、取样频率、数据的开始地址、结束地址等的用于重放音频信号所需要的信息。
在包元中所插入的音频信号以图1A~图1C所示的2个主取样和2个附加取样组成的两对取样为单位而被插入。
图5放大表示音频包。在该音频包的数据部中,在该数据区域的开头,配置两对取样的主取样S0,S1(主要字A0~H0,A1~H1),以后以两对取样单位进行排列。
其中,1包的字节数固定为2048字节。另一方面,取样数据为可变长度数据,因此,并不仅限于2048,可以是两对取样的整数倍的字节长。
因此,产生1包的最大字节长与(两对取样×整数倍)的字节长不同的情况。在此情况下,包的字节长≥(两对取样×整数倍)的字节长,在包的一部分剩余的情况下,实施以下对策。
即,当包的剩余的部分为7字节以下时,在包首部内插入填充字节,当包的剩余的部分超过7字节即8字节以上时,如图5中用斜线表示的那样,在包尾部插入垫整包元。
在这样的包形式的音频信息的情况下,在重放时容易进行处理。即,各包的开头的音频数据必须为两对取样的开头即主取样S0,S1,因此,当取定时来进行重放时,其处理是容易的。
这是因为重放装置通过用包单位取入数据来进行数据处理。假如音频数据的取样跨过两个包之间来配置,通过取入两个包,使该音频数据成为一体化来进行解码,则处理变复杂。
因此,如该方式那样,各包的开头的音频数据必须为两对取样的开头,当音频数据以包单位被集中时,取定时可以仅对一个包进行,处理变得容易。
由于是用包元单位划分的数据处理,故能够简化创作系统(支援系统),能够简化用于数据处理的软件。
特别是,在特殊重放时,断续地抽取视频数据来进行处理或者进行插补来进行处理,而在这样的情况下,由于用包元单位来处理音频数据,故重放定时的控制变得比较容易。不会使解码器的软件复杂化。
在上述系统中,以把20位的取样数据分成前16位和后4位的形式来制成取样,但是,并不仅限于这样形式的数据。只要是把线性PCM音频数据进行取样化即可。
例如,当考虑使附加取样的数据长为0时,数据串为主取样的连续,为一般的数据形式。在此情况下,由于没有附加取样,不需要以2对取样为单位,可以以主取样单位来进行分组。
图6表示按上述那样以2对取样单位把线性PCM数据配置在包元内时的线性PCM数据的尺寸。即,把音频流方式区分为单声道(1声道)、立体声(2声道)以及3~8的多声道,进一步按每个量化位数区别各区分,表示容纳在1个包元内的最大取样数。
由于是2对取样单位,故1个包元内的取样数全部是偶数取样。当声道数变多时,字节数相应增加,因此,1个包元内的取样数变少。
在量化位数是16位的单声道的情况下,1个包元内的取样数是1004个,字节数是2008,填充字节是5字节,没有垫整字节。但是,最初的包元的填充字节为2字节。这是因为在该首部中附加了3字节的属性信息。
当查看量化位数为24位的双声道方式时,开头的包元施加了6字节的填充字节,以后的包元施加了9字节的垫整。
图7简要地表示音频包的包首部。首先,存在包开始码(4字节),在其后,记述了系统时间基准参考值SCR。系统时间基准参考值SCR表示该包的取入时间。当SCR的值小于重放装置内部的基准时间的值时,附加了该SCR的包取入到音频缓冲器中。
在包首部中,用3字节记述了节目复用率,用1字节记述了填充长度。该填充长度被控制电路所参照,由此,控制电路能够决定控制信息的读取地址。
图8表示音频包元的包元首部的内容。在该包元首部中,首先包含了用于通知包元的开始的包元开始码前缀、表示包元具有那种数据的流ID、表示包元基本流PES的长度的数据。
在包元基本流PES中记述了各种信息,例如,表示复制的禁止和许可的标志、表示原始信息或者复制信息的标志、包元首部的长度等信息。
在包元首部中,记述了用于取得该包元与其他的视频和副图象的时间的输出同步的展示时间印记PTS。而且,在个视频对象中,在最初字段的最初包元中,记述了表示是否对缓冲器记述的标志和缓冲器的尺寸等信息。而且,具有0~7字节的填充字节。
具有用于表示是音频流、是线性PCM还是其他压缩方式、音频流的编号等的子流ID。而且,在该包元内记述了配置开头的字节数据的音频帧数。而且,记述了将在由上述PTS所指示的时刻所重放的包元内的最初的音频流,即,指示最初进行存取的单元的开头字节的指针。
该指针用来自该信息的最后字节的字节编号来记述,表示该音频流的最初的字节地址。而且,记述了表示是否进行了高频强调的音频强调标志、用于在音频帧数据全是0时得到静音的静音标志、音频帧组(GOF)中的最初进行存取的帧编号。
而且,记述了量化字的长度,即,量化位数、取样频率、声道数、动态范围的控制信息。
上述首部信息在音频解码器内的解码器控制部(未图示)中被解析。解码器控制部把解码器的信号处理电路切换为与现在取入中的音频数据相对应的信号处理形式。
与上述首部信息相同的信息被记述在视频管理器中,因此,在重放动作的初期读取这样的信息,以后如果是相同的子流的重放,就不需要进行读取。
但是,如上述那样,为了重放音频而在各包元的首部中记述必要方式的信息,这是因为在例如包元串以通信系列进行传输时,无论在何时开始接收,都使接收终端能够识别音频的缘故。而且,是为了在音频解码器仅取入包时,能够重放音频信息的缘故。
在上述DVD视频标准中的声音数据规格中,音频数据的最大传输率为6.144Mbps,全部音频数据流的合计的最大传输率为9.8Mbps。这样,一个流中的各声道的属性(取样频率fs、量化位数Qb、信道数N等)是相同的。该限制规定在DVD视频标准中。
由于存在这样的限制,在环绕声这样的多声道音频(例如,在一个流中存在R,L,C,SR,SL,SW六个声道)中,不能实现高音质规格。
即,在上述限制条件下,由于全部声道的取样频率fs和量化位数Qb必须是相同的,当要实现高音质(例如fs=96kHz)时,由于必须在全部声道中同样地进行对应,因此,传输率的值变大,而超过规定值。
例如,取样频率fs、量化位数Qb中的每1声道ch的传输率,纯粹仅音频数据部分,当是96kHz,24位时,为2.304Mbps/ch当是96kHz,20位时,为1.92Mbps/ch当是96kHz,16位时,为1.536Mbps/ch当是48kHz,24位时,为1.152Mbps/ch当是48kHz,20位时,为0.96Mbps/ch
当是48kHz,16位时,为0.76Mbps/ch。
因此,能够在上述DVD视频标准的限制条件下实现的高音质规格为到48kHz,20位下6声道(与此时的音频相关的传输率为0.96×6=5.76Mbps<6.144Mbps)为止的,其以上的规格不可能对应。
因此,在本发明中,尽可能原样留下DVD视频标准中的音频数据构造的类型,来形成具有高音质的声音信号规格的DVD音频标准的数据构造。
下面把DVD视频标准与DVD音频标准进行比较来说明本发明的基本概念。即,DVD音频中的音频包的大小与DVD视频相同为2048字节。而且,量化位数Qb与DVD视频中的音频规格相同,为Qb=16位或者20位或者24位。
其中,在DVD音频中,把同时传输的线性PCM音频流限定为1条。即,在DVD视频中,当作为视频对象而收录电影的内容时,把各种语言分配给音频流的各声道,而能够进行音频流的切换选择。
但是,在DVD音频中,由于基本上把音乐的内容作为对象,并不一定进行按各流的切换选择,因此,能够同时重放输出全部声道,即,能够成为1条。在本发明的系统中,这样同时传输的线性PCM音频流成为1条。
接着,使DVD音频中的最大传输率从6.144Mbps增加到9.6Mbps。如上述那样,当查看DVD视频的全体数据流时,视频数据、副图象数据、音频数据、导航数据等各包被进行时分复用来进行传输。
包含这样的传输数据全体,最大传输率被限制为9.6Mbps。因此,关于音频数据,难于提高到6.144Mbps以上的传输率。
然而,与DVD视频相比较,由于DVD音频除若干控制数据之外都是音频数据,故音频数据的量能够增多,能够增大传输率。
如上述那样,由于增大了DVD音频中的最大传输率,故能够使图2中说明的1音频流中的取样数成为DVD视频时的二分之一。这样,相对于取样频率fs,使取样数为在fs=48kHz或者44.1kHz时,为40个/帧在fs=96kHz或者88.2kHz时,为80个/帧在fs=192kHz或者176.4kHz时,为160个/帧在DVD视频中,不支持44.1kHz、88.2kHz、176.4kHz和192kHz。这是因为构成为在1音频流中最低包括1个音频包,音频帧必须具有展示时间印记PTS的数据(用于与重放时的系统时间印记同步的数据)的缘故。
这里,在DVD音频中,为了超过DVD视频而实现高音质声音规格,而采用缩放方式。即,迄今为止,1流内的全部声道对于取样频率fs和量化位数Qb为相同属性,与此相对,本发明认可在1流中具有不同属性的声道。
这是基于这样的事实例如,在环绕声的R(右声道),L(左声道),C(中央声道),SR(后方右声道),SL(后方左声道),SW(低频声道)的六个声道中,没有必要使全部声道都为高音质(高的取样频率fs),把成为主要的声道(例如R,L)作成高音质(例如,fs=96kHz),成为其他部分的声道(C,SR,SL,SW)作成现状的音质(fs=48kHz),作为全体能够得到足够的高音质。
在此,简单地说明使用缩放方式的音频系统。关于音频,一个声道群的信号的最大传输率为6.144Mbps以下,作为1流的信号的传输率合计的最大传输率的目标是成为9.8Mbps以下。
所谓声道群是指例如包含双声道的R,L声道(主要的2个声道)的数字信号。而且,C,SR,SL,SW集中起来的流为一个声道群。
下面,作为在记录媒体上记录的的信号,对记录例如6声道的音频信号的情况进行说明。其中所谓的6声道是例如上述环绕声中的R,L,C,SR,SL,SW,制作有与各声道相对应的信号。
可以区分为使R,L作为主声道,其他作为副声道。而且,能够通过重放各声道的信号并分别提供给扬声器,能够得到立体声的音响效果。
这里,在本发明的方式中,将上述6声道作为第一声道群和第二声道群来生成。在此情况下,选择重要度较高的R,L来作为构成第一声道群的声道,选择C,SR,SL,SW来作为构成第二声道群的声道。
在此情况下,第一声道群的音频信号以较高的取样频率fs进行取样,第二声道群的音频信号以fs/2的取样频率(整数)进行取样。
图9A具体地表示第一声道群的音频信号的记录处理系统和第二声道群的音频信号的记录处理系统。即,在模拟信号源10中,准备在环绕声方式中使用的R,L,C,SR,SL,SW声道的各个信号,而提供给取样部11。
取样部11分别以取样频率fs=96kHz来对所输入的各声道的信号进行取样。在取样部11中被取样的各个信号被输入量化部12,而量化为24位的取样数据,被变换为PCM信号。
接着,C,SR,SL,SW声道的各信号被输入变频部13,使取样频率fs从96kHz变频为其的1/2的48kHz。
另一方面,以96kHz被取样的R,L声道的各信号被输入相位匹配部14,进行相位匹配以取得取样之间的相位的对应。实际上,与变频部13的延迟量相同的延迟量被设定在相位匹配部14中。接着,被延迟的96kHz的R,L声道的信号被输入成帧部15,使每预定的取样数成帧。
被变频了的48kHz的C,SR,SL,SW声道的各个信号被输入成帧部16,使每预定的取样数成帧。
在成帧部15,16中成帧的各信号被输入分组部17,而变换为预定格式的包元。这样,来得到96kHz系统的流(第一属性Atr1的流)和48kHz系统的流(第二属性Atr2的流)。
该两个流通过在包元首部所附加的识别符(ID)来进行识别。该两个声道群的包元进一步打包并复用,然后,通过记录处理部(未图示)记录在盘18上。
当重放在上述盘18上所记录的信号时,进行下面这样的处理。即,图9B具体地表示第一声道群的音频信号的重放处理系统和第二声道群的音频信号的重放处理系统。
首先,从盘18光学地读出的信号通过进行纠错和解调处理等的解调部(未图示)被输入包元处理部21。该包元处理部21参照包元首部的识别符来识别声道群。可以通过该识别来识别第一声道群的包元和第二声道群的包元,来进行各声道群的信号的分离,即所谓多路解编。
第一声道群的信号被输入帧处理部22,来进行帧的解除,而作为R,L声道的各信号被输出。而且,第二声道群的信号被输入帧处理部23,来进行帧的解除,而作为C,SR,SL,SW声道的各信号被输出。
在此,R,L声道的各信号被输入相位匹配部24。C,SR,SL,SW声道的各信号被输入用于把取样频率fs从48kHz变换(升频变换)为96kHz的变频部25。
这样,被相位匹配并且取样频率fs成为相同的R,L声道的各信号和C,SR,SL,SW声道的各信号被输入96kHz的D/A(数字/模拟)变换部26,来进行PCM解码,然后,变换为模拟信号并输出。
通过以上处理,能够重放高品位的R,L声道的各信号和通常的C,SR,SL,SW声道的各信号。
在本发明中,如上述那样,在1帧内存在的取样数据的数量被设定为在重放时成为1/600秒的数量。由此,在96kHz系统的流(第一声道群)和48kHz系统的流(第二声道群)中,在1帧内存在的取样数据的数量是不同的。
图10通过第一声道群和第二声道群进行比较来表示在1帧内存在的取样数据的数量。在上述相位匹配部14中,制成进行第一声道群和第二声道群的相位匹配的帧。
在成帧部15,16中,在第一和第二声道群的对应的帧(时间上在同一时刻所重放的帧)的开头附加相同的展示时间印记PTS。其结果,在重放时,在帧处理部22,23中进行帧解除,而提供给D/A变换部26,在此情况下,各帧的解除定时只要同时解除具有相同的展示时间印记PTS的帧即可。
如上述那样,在DVD音频中,可以把本来构成为1音频流的声道群分为两个属性组Atr1,Atr2。其中,作为属性,具有取样频率fs,量化位数Qb和信道数N等。当然,在1流中的全部声道的属性相同的情况下,可以不分成为两个属性组。
如上述例子那样,当整理环绕声的6声道的情况时,为以下这样。即存在这样的两种作为成为R,L的第一声道群的属性(Atr1),取样频率fs为96kHz,量化位数Qb为24位;作为成为C,SR,SL,SW的第二声道群的属性(Atr2),取样频率fs为48kHz,量化位数Qb为24位。
这样,在此情况下的传输率为2.304×2+1.1152×4=9.216Mbps,而满足上述最大传输率9.8Mbps。由此,通过导入缩放方式,能够得到具有高音质的声音信号规格的音频数据构造。
在上述的说明中,作为第一声道群和第二声道群中的属性,包含取样频率fs和量化位数Qb来考虑。
在本发明的方式中,作为各声道群的属性,可以考虑取样频率fs不同而量化位数Qb相同的情况,取样频率fs相同而量化位数Qb不同的情况,取样频率fs相同并且量化位数Qb相同的情况,取样频率fs不同并且量化位数Qb不同的情况等,各种组合(情况),但是,重要的是只要构成满足上述最大传输率9.8Mbps的流即可。
图11表示例1的情况。在该例1中,表示了作为第一声道群中的属性Atr1,取样频率fs为96kHz的情况;作为第二声道群中的属性Atr2,取样频率fs为48kHz的情况。
图12表示例2的情况。在该例2中,表示了作为第一声道群中的属性Atr1和第二声道群中的属性Atr2,取样频率fs都是96kHz的情况。
图13表示例3的情况。在该例3中,表示了作为第一声道群中的属性Atr1和第二声道群中的属性Atr2,取样频率fs都是48kHz的情况。
如上述那样,当在1流中存在具有不同属性的多个声道群时,在本发明的方式中,作为数据构造做成下列这样的数据构造。
图14所示的数据构造与图11所示的例1相对应,为这样的例子作为第一声道群中的属性Atr1,取样频率fs为96kHz,量化位数Qb采用16位;作为第二声道群中的属性Atr2,取样频率fs为48kHz,量化位数Qb采用16位。该数据构造除了上述缩放方式外,还构筑为类似于DVD视频的取样排列构造的数据构造。
即,4个取样S4n,S4n+1,S4n+2,S4n+3为第一属性的主取样,而且,2个取样S2n,S2n+1为第二属性的主取样。在此情况下,由于量化位数Qb都是16位,不存在附加取样。
在该例中,由于取样频率fs的关系,第二声道群的2个取样与第一声道群的4个取样相对应。关于成为主要的第一声道群,4个取样为基本的,当加上第二声道群时,作为全体6个取样为基本的。
即,图14所示的数据构造对多个声道中的至少2个声道的第一声道群的信号以第一频率进行取样,对作为其他声道的第二声道群的信号以第二频率进行取样。
首先,依次排列构成以第一频率所取样的第一声道群的各声道的主取样的第S4n,第S4n+1,第S4n+2,第S4n+3,接着,依次排列构成以第二频率所取样的第二声道群的各声道的主取样的第S2n,第S2n+1。其中,n=0,1,2,…。
图15所示的数据构造与图12所示的例2相对应,为这样的例子作为第一声道群中的属性Atr1,取样频率fs为96kHz,量化位数Qb采用24位;作为第二声道群中的属性Atr2,取样频率fs为96kHz,量化位数Qb采用20位。
在此情况下,两对取样S2n,S2n+1,e2n,e2n+1包含第一属性的主取样和附加取样,另两对取样S2n,S2n+1,e2n,e2n+1是第二属性的主取样,作为全体,4对取样为基本的。第一属性的附加取样e2n,e2n+1为第二属性的附加取样。
即,图15所示的数据构造对多个声道中的至少2个声道的第一声道群的信号以第一频率进行取样,对作为其他声道的第二声道群的信号以第二频率进行取样,而且,把取样数据分成为MSB侧的m1位的主要字和LSB侧的m2位的附加字。
集中第一声道群的各声道的第2n的取样数据的主要字而作为主取样S2n进行配置,在其后,集中第一声道群的各声道的第2n+1的取样数据的主要字而作为主取样S2n+1进行配置,在其后,集中第一声道群的各声道的第2n的取样数据的附加字而作为附加取样e2n进行配置,在其后,集中第一声道群的各声道的第2n+1的取样数据的附加字而作为附加取样e2n+1进行配置。
在其后,集中第二声道群的各声道的第2n的取样数据的主要字而作为主取样S2n进行配置,在其后,集中第二声道群的各声道的第2n+1的取样数据的主要字而作为主取样S2n+1进行配置,在其后,集中第二声道群的各声道的第2n的取样数据的附加字而作为附加取样e2n进行配置,在其后,集中第二声道群的各声道的第2n+1的取样数据的附加字而作为附加取样e2n+1进行配置。其中,n=0,1,2,…。
图16所示的数据构造与图13所示的例3相对应,为这样的例子作为第一声道群中的属性Atr1,取样频率fs为48kHz,量化位数Qb采用16位;作为第二声道群中的属性Atr2,取样频率fs为48kHz,量化位数Qb采用16位。
在此情况下,S4n,S4n+2是第一属性的主取样,e4n,e4n+2是第一属性的附加取样,S4n,S4n+2是第二属性的主取样,e4n,e4n+2是第二属性的附加取样。第一和第二声道群,两对取样为基本的,作为全体4对取样为基本的。
即,图16所示的数据构造对多个声道中的至少2个声道的第一声道群的信号以第一频率进行取样,对作为其他声道的第二声道群的信号以第二频率进行取样,而且,把取样数据分成为MSB侧的m1位的主要字和LSB侧的m2位的附加字。
集中第一声道群的各声道的第4n的取样数据的主要字而作为主取样S4n进行配置,在其后,集中第一声道群的各声道的第4n+2的取样数据的主要字而作为主取样S4n+2进行配置,在其后,集中第一声道群的各声道的第4n的取样数据的附加字而作为附加取样e4n进行配置,在其后,集中第一声道群的各声道的第4n+2的取样数据的附加字而作为附加取样e4n+2进行配置。
在其后,集中第二声道群的各声道的第4n的取样数据的主要字而作为主取样S4n进行配置,在其后,集中第二声道群的各声道的第4n+2的取样数据的主要字而作为主取样S4n+2进行配置,在其后,集中第二声道群的各声道的第4n的取样数据的附加字而作为附加取样e4n进行配置,在其后,集中第二声道群的各声道的第4n+2的取样数据的附加字而作为附加取样e4n+2进行配置。其中,n=0,1,2,…。
图17所示的数据构造与图11所示的例1相对应,但在此情况下,量化位数Qb在第一和第二声道群中不同。即,为这样的例子作为第一声道群中的属性Atr1,取样频率fs为96kHz,量化位数Qb采用20位;作为第二声道群中的属性Atr2,取样频率fs为48kHz,量化位数Qb采用24位。该数据构造除了上述缩放方式外,还构筑了与DVD视频的取样排列构造类似的数据构造。
即,S4n,S4n+1,S4n+2,S4n+3是第一属性的主取样,S2n,S2n+1是第二属性的主取样。在此情况下,在第一声道群中存在附加取样e4n,e4n+1,e4n+2,e4n+3,在第二声道群中存在e2n,e2n+1。在此情况下也是,第一声道群中4对取样为基本的,与其相对应的第二声道群,2对取样为基本的,作为全体6对取样为基本的。
通过成为上述这样的数据构造,能够得到尽可能原样保留DVD视频的音频数据构造的类型的,满足预定的传输率的,具有高音质的声音信号规格的DVD音频的数据构造。
本发明提供了具有特征的数据构造,但是,其中的特征部分是两个属性中的一方的取样频率fs为另一方的取样频率fs的倍数。如果两个属性的组仅声道数N或者量化位数Qb不同,可以应用DVD视频的标准的考虑方法,来与声道数N或者量化位数Qb的不同的数据构造相对应。
例如,在图4A和图4B所示的数据构造中,接着主取样部和附加取样部,只要变更(切换)并记录后续的数据的属性信息中的声道数N或者量化位数Qb即可。
本发明在上述数据构造中包含下列思想。即,图11表示第一属性Atr1的第一声道群的各取样与第二属性Atr2的第二声道群的各取样的应同步的时刻的对应,附加了4n,4n+1,4n+2,4n+3和2n,2n+1这样的符号。
如从该图所看的那样,4个取样为1个集合。由此,把4个取样作为1个集合来进行处理,如图18所示的那样,第一属性Atr1的2个取样S4n,S4n+1和第二属性Atr2的2个取样S2n,S2n+1连续配置,接着,可以配置第一属性Atr1的2个取样S4n+2,S4n+3。该数据构造相当于图14所示的数据构造的变形。
图19表示另一个数据构造的例子。该数据构造相当于图16所示的数据构造的变形。即,4个取样S4n,S4n+1,S4n+2,S4n+3是第一属性的主取样,2个取样S2n,S2n+1是第二属性的主取样。
在此情况下,在第一声道群中存在附加取样e4n,e4n+1,e4n+2,e4n+3,在第二声道群中存在e2n,e2n+1。在此情况下,第一声道群中4对取样为基本的,与其相对应的第二声道群,2对取样为基本的,作为全体,6对取样为基本的。
这里,该数据构造是,作为4对取样,集中第一声道群的S4n,S4n+1,e4n,e4n+1和第二声道群的S2n,S2n+1,e2n,e2n+1。而且,在其后,排列第一声道群的2对取样S4n+2,S4n+3,e4n+2,e4n+3。
当考虑上述取样的单位时,可以按以下这样进行理解。即,在第一属性Atr1和第二属性Atr2中的取样频率fs相同的情况下(例如,图12和图13,图15和图16所示的例子)经过相同时间后的取样的数量,第一属性Atr1侧的声道群和第二属性Atr2的声道群中成为相同。在此情况下,与按照DVD视频标准进行处理的情况相同,以2个取样1单位方式来捕获数据。
而且,本发明的数据构造可以按以下这样进行理解。即,构成一个集合即1单位的取样数,2,4,6为基本的。因此,为了使其具有通用性,也可以把作为2,4,6的最小公倍数的12个取样或者12对取样作为1单位,来处理数据。
如上述那样,1单位的取样数可以有各种例子,但在任一种例子中,对于音频包的数据区域,可以按每个单位进行填充,在音频包的其余部分不足1单位的情况下,与视频标准相同,填充填充字节或者垫整包元。
图20表示由于产生了未充满1单位的区域(阴影部)而插入垫整包元的例子。所谓未充满1单位的区域是指预定取样数以下或者预定对取样数以下的数据量的区域。所谓预定取样数或者预定对取样数是2,4,6,12等。该音频包是2048字节,构成为必须具有展示时间印记PTS。
而且,上述各图中的第一属性Atr1和第二属性Atr2的数据排列并不仅限于该排列,例如,当然可以是相反的排列。该排列根据约定可以进行各种变更。
而且,在上述说明中,作为取样频率fs表示了96kHz和48kHz,但是,并不仅限于此,也可以是88.2kHz和44.1kHz,两个取样频率fs的关系只要为一方是另一方的2倍的关系,就总可以适用本发明。而且,如果使其具有通用性而使两个取样频率fs的关系为一方是另一方的整数倍的关系,就能够容易地应用本发明。
在上述说明中,使1流内的声道属性为2种,但3种以上也是本发明的适用范围。
虽然上述说明对数据构造进行了说明,但是,本发明可以进一步适用于具有上述数据构造的记录媒体、与该记录媒体相对应的记录方法和记录装置,并且进一步适用于来自记录媒体的数据重放方法和重放装置、数据的传输方式。
下面对DVD音频信息所记录的光盘的全体数据构造与上述音频包的关系进行简单的说明。
图21表示DVD音频区的记录内容(音频专用标题用音频对象组AOTT_AOBS)的数据构造的一例。
AOTT_AOBS定义了一个以上音频对象AOTT_AOB#n的集合。各AOTT_AOB定义了一个以上的音频单元ATS_C#n的集合。而且,由一个以上的单元ATS_C#n的集合来构成节目,由一个以上的节目的集合来构成节目链PGC。该PGC构成用于指示音频标题的全体或者一部分的逻辑单元。
在该例中,各音频单元ATS_C#由2048字节大小的音频包A_PCK的集合所构成。这些包为进行数据传输处理时的最小单位。而且,进行逻辑上的处理的最小单位是单元,逻辑上的处理以该单元单位进行。
图22是说明通过DVD音频区的节目链信息ATS_PGCI来对单元进行存取的情况的图。即,通过关于ATS_PGCI内的节目#1的单元重放信息来重放AOB的单元ATS_C#1,ATS_C#2。
如果把一个PGC作为一部歌剧,可以解释为构成该PGC的多个单元与该歌剧中的各种场景的音乐或者歌唱部分相对应。该PGC的内容(或者单元的内容)由制作在盘上所记录的内容的软件提供者所决定。即,提供者使用在ATS内的节目链信息ATS_PGCI中所写入的单元重放信息ATS_C_PBI,而能够按照意图来重放构成AOTT_AOBS的单元。
下面说明上述第一声道群和第二声道群的各种约定在管理数据上具体怎样进行。
图23是说明DVD音频区内的音频标题组ATS的记录内容的图。音频标题组ATS由音频标题组信息ATSI、音频专用标题用音频对象组AOTT_AOBS、音频标题组信息的备份ATSI_BUP所构成。
音频标题组信息ATSI包含音频标题组信息管理表ATSI_MAT、音频标题组节目链信息表ATS_PGCIT。
音频标题组节目链信息表ATS_PGCIT包含音频标题组节目链信息表信息ATS_PGCITI、音频标题组节目链信息检索指针ATS_PGCI_SRP、一个以上的音频标题组节目链信息ATS_PGCI。
图24表示图23的音频标题组信息管理表ATSI_MAT的记录内容。即,在音频标题组信息管理表ATSI_MAT中设有音频标题组识别符ATS_ID;音频标题组的结束地址ATS_EA;音频标题组信息的结束地址ATSI_EA;所采用的音频标准的版本编号VERN;音频标题组信息管理表的结束地址ATSI_MAT_EA;音频专用标题AOTT用视频标题组VTS的开始地址VTS_SA;音频专用标题用音频对象组的开始地址AOTT_AOBS_SA或者音频专用标题用视频对象组的开始地址AOTT_VOBS_SA;音频标题组用节目链信息表的开始地址ATS_PGCIT_SA;音频专用标题用音频对象组的属性AOTT_AOBS_ATR或者音频专用标题用视频对象组的属性AOTT_VOBS_ATR#0~#7;音频标题组数据混合系数ATS_DM_COEFT#0~#15;其他的预约区域。
当ATS没有AOTT_AOBS时,在上述AOTT用VTS的开始地址VTS_SA中,写入包含用于AOTT的VTSTT_VOBS的视频标题组VTS的开始地址。当ATS具有AOTT_AOBS时,“00000000h”被写入VTS_SA中。这是因为有时也记录有视频信息。
当ATS具有AOTT_AOBS时,在上述AOTT_AOBS_SA中,以来自ATS的最初逻辑块的相对逻辑块数写入AOTT_AOBS的开始地址。另一方面,当ATS没有AOTT_AOBS时,在上述AOTT_AOBS_SA中,以包含用于ATS的VTSTT_VOBS的VTS的VTS的最初逻辑块的相对逻辑块数写入用于视频标题组的视频对象组VTSTT_VOBS的开始地址。
在上述ATS_PGCIT_SA中以来自ATSI的最初逻辑块的相对逻辑块数写入ATS_PGCIT的开始地址。
作为用于上述视频标题组的属性信息的AOTT_AOBS_ATR或者作为视频标题组的属性信息的AOTT_VOBS_ATR准备了从#0到#7的八个。当ATS具有AOTT_AOBS时,在ATS中所记录的AOTT_AOB的属性被写入AOTT_AOBS_ATR。
另一方面,当ATS没有AOTT_AOBS时,在AOTT_AOBS_ATR写入用于ATS内的AOTT_AOB的VOB内的音频流的属性。在该AOTT_AOBS_ATR或者AOTT_VOBS_ATR中写入所采用的取样频率fs(44~192kHz)和量化位数Qb(16~24位)。
而且,在该部分中记述了声道分配。在声道分配中记述了在由其属性所指定的视频对象中包含的音频流的各个声道的分配信息。该分配信息的内容对应于多声道的构成。下面将对该声道分配信息进行描述。该分配信息被记述在下述的音频包元首部中。
上述ATS_DM_COEFT表示把具有DTS(Decoding Time Stamp)和AC-3等多声道输出的音频数据降频混频为2声道时的系数,仅在记录在ATS内的一个以上的AOTT_AOB中所使用。
当ATS没有AOTT_AOBS时,在16个(#0~#15)ATS_DM_COEFT的所有位中都写入“0h”。用于该16个(#0~#15)ATS_DM_COEFT的区域被固定地设置。
图25是说明在音频标题组信息ATSI中包含的音频标题组节目链信息表ATS_PGCIT的内容的图。该ATS_PGCIT的记录位置被写入ATSI_MAT的ATS_PGCIT_SA中。
该ATS_PGCIT如上述那样包含音频标题组节目链信息表信息ATS_PGCITI、音频标题组节目链信息检索指针ATS_PGCI_SRP和音频标题组节目链信息ATS_PGCI。
上述ATS_PGCI_SRP包含一个以上的音频标题组节目链信息检索指针ATS_PGCI_SRP#1~ATS_PGCI_SRP#j,上述ATS_PGCI包含与ATS_PGCI_SRP相同数量的音频标题组用节目链信息ATS_PGCI#1~ATS_PGCI#j。
各ATS_PGCI具有作为控制音频标题组用节目链ATS_PGC的重放的导航数据的功能。
其中,ATS_PGC是定义音频专用标题AOTT的单位,由ATS_PGCI和一个以上的单元(AOTT_AOBS内的单元或者作为AOTT的对象所使用的AOTT_VOBS内的单元)所构成。
各ATS_PGCI包含音频标题组用节目链的一般信息ATS_PGC_GI、音频标题组用节目信息表ATS_PGIT、音频标题组用单元重放信息表ATS_C_PBIT、音频标题组用音频静止视频重放信息表ATS_ASV_PBIT。
上述ATS_PGIT包含一个以上的音频标题组用节目信息ATS_PGI#1~ATS_PGI#k,上述ATS_C_PBIT包含与ATS_PGI相同数量的音频标题组用单元重放信息ATS_C_PBI#1~ATS_C_PBI#k。
图26表示上述声道分配信息以及由该信息所分类的第一声道群和第二声道群的分类。首先,在图24所示的ATSI_MAT中记述音频对象的属性信息,当其中存在声道分配时进行了说明,而该声道分配是图26所示的数据。
声道分配信息在00000b的情况下代表单声道,在00001b的情况下代表在第一声道群中存在L,R(双声道)声道,在00010b的情况下代表在第一声道群中存在Lf,Rf(左前,右前)声道,在第二声道群中存在S(环绕声)。
在00011b的情况下,代表在第一声道群中存在Lf,Rf,在第二声道群中存在Ls,Rs(左环绕声,右环绕声)。在00100b的情况下,代表在第一声道群中存在Lf,Rf,在第二声道群中存在LFE(低频效果)。
在00101b的情况下,代表在第一声道群中存在Lf,Rf,在第二声道群中存在LFE,S。在00110b的情况下,代表在第一声道群中存在Lf,Rf,在第二声道群中存在LFE,Ls,Rs。
在00111b的情况下,代表在第一声道群中存在Lf,Rf,在第二声道群中存在C(中央)。在01000b的情况下,代表在第一声道群中存在Lf,Rf,在第二声道群中存在C,S。
在01001b的情况下,代表在第一声道群中存在Lf,Rf,在第二声道群中存在C,Ls,Rs。在01010b的情况下,代表在第一声道群中存在Lf,Rf,在第二声道群中存在C,LFE。
在01011b的情况下,代表在第一声道群中存在Lf,Rf,在第二声道群中存在C,LFE,S。在01100b的情况下,代表在第一声道群中存在Lf,Rf,在第二声道群中存在C,LFE,Ls,Rs。
在01101b的情况下,代表在第一声道群中存在Lf,Rf,C,在第二声道群中存在S。在01110b的情况下,代表在第一声道群中存在Lf,Rf,C,在第二声道群中存在Ls,Rs。
在01111b的情况下,代表在第一声道群中存在Lf,Rf,C,在第二声道群中存在LFE。在10000b的情况下,代表在第一声道群中存在Lf,Rf,C,在第二声道群中存在LFE,S。
在10001b的情况下,代表在第一声道群中存在Lf,Rf,C,在第二声道群中存在LFE,Ls,Rs。在10010b的情况下,代表在第一声道群中存在Lf,Rf,Ls,Rs,在第二声道群中存在LFE。
在10011b的情况下,代表在第一声道群中存在Lf,Rf,Ls,Rs,在第二声道群中存在C。在10100b的情况下,代表在第一声道群中存在Lf,Rf,Ls,Rs,在第二声道群中存在C,LFE。
在图24所示的属性信息中,即,在AOTT_AOBS_ATR或者AOTT_VOBS_ATR中,写入有所采用的取样频率fs(44~192kHz)和量化位数Qb(16~24位)。
下面对音频包进行更详细的说明。图27表示音频包A_PKT的基本构成。即,在A_PKT中设定包首部、包元首部、子流ID、ISRC(International Standard Recording Code)、专用首部长度、第一存取单元指针、音频数据信息、0~7字节的填充字节、线性PCM音频数据的区域。
作为包元首部的尺寸,使用下列规则。即,如果A_PKT是音频对象内的最初包元,其尺寸为17字节,在不包含音频帧的最初数据的情况下,为9字节,否则为14字节。
线性PCM的音频包元由包元首部、专用首部、音频数据所构成。包元首部和专用首部的内容为图28A、图28B和图29所示的构成。
图28A和图28B表示包元首部。即,当以记述顺序来描述各数据时,具有包元开始码、流id、PES包元长度、“10”、PES扰频控制信息、PES优先度、数据整列指示器、版权、原作或者复制品,PTS_DTS标志、ESCR标志、ES速率标志、DSM特技方式标志、附加性复制标志、PES_CRC标志、PES扩展标志、PES首部长度。
其次,表示该包元的重放时刻的展示时间印记PTS的记述区域确保5字节。其次,记述了PES专用数据标志、包首部字段标志、节目包元顺序计数器标志、P_STD缓冲器标志、第二PES扩展标志、“01”、P_STD缓冲器标度、P_STD缓冲器尺寸信息。
图29表示专用包元。若按记述顺序来描述各数据,为子流id、预约、ISRC编号、ISRC数据、专用首部长度、开头的存取单元指针、音频强调标志、预约、预约、降频混频码、第一量化位数、第二量化位数、第一音频取样频率、第二音频取样频率、预约、多声道类型、预约、声道分配、动态范围控制信息、填充字节。
当说明各个字段项目时,为以下这样在子流id中,记述了表示是线性PCM音频数据的数据10100000b。在用于静止画面控制的ISRC编号中,记述了表示所记录的ISRC数据的范围的编号1至12。ISRC数据记述了由ISRC编号所指定的数据。
作为专用首部长度,以来自该字段的最后字节的逻辑块数来表示长度。在开头的存取单元指针中,以来自该字段的最后字节的逻辑块数来表示最初存取的单元的开头字节的地址。
音频强调标志,当第一取样频率fs为96kHz或者88.2kHz时,记述强调off,并且当第二取样频率fs为96kHz或者88.2kHz时,也记述强调off。强调off被记述为0,强调on被记述为1。在降频混频码中,指示了用于音频取样的降频混频的系数表。表编号以0000b至1111b来表示。
在第一量化位数Qb中,记述了第一声道群的被量化的音频取样的位数,0000b时代表16位,0001b时代表20位,0010b时代表24位。
在第二量化位数Qb中,记述了第二声道群的被量化的音频取样的位数,0000b时代表16位,0001b时代表20位,0010b时代表24位。1111b时代表位数未被指定。例如,为不存在第二声道群时。
在第一音频取样频率中,记述了第一声道群的音频信号的取样频率fs。0000b代表48kHz,0001b代表96kHz,1000b代表44.1kHz,1001b代表88.2kHz。
在第二音频取样频率中,记述了第二声道群的音频信号的取样频率fs。0000b代表48kHz,0001b代表96kHz,1000b代表44.1kHz,1001b代表88.2kHz。当1111b时,代表取样频率fs未被指定。例如,为不存在第二声道群时。
在多声道类型中,记述了音频取样的多声道构造的类型。0000b是类型1,其他是预约的。声道分配记述了声道分配的情况,为前面图26所述的那样。
动态范围控制信息是压抑动态范围的控制信息,8位字的前三位表示整数X,后五位表示整数Y。
线性增益为G=24-[(X+Y)/30](0≤X≤7,0≤Y≤29),以dB表示为G=24.082-6.0206X-0.2007Y(0≤X≤7,0≤Y≤29)。
在盘重放时,通过系统控制部把握表示上述声道组等的分配的属性信息、音频数据的第一和第二量化位数、第一和第二音频取样频率,而能够进行第一声道群和第二声道群的数据的分离,并且,能够得到重放定时的同步。即,这些首部信息能够作为同步信息来使用。
下面对按上述那样所记录的DVD唱盘的重放系统进行详细说明。图30表示关于音频流的重放装置的信号系列。在光盘500中所记录的数据由光头部533所读取,作为高频信号而输出。
被输入系统处理部504的高频信号(读取信号)被输入同步检测器601。在同步检测器601中,检测出在记录数据上所附加的同步信号,而生成定时信号。在同步检测器601中被除去同步信号的读取信号被输入到把16位解调为8位的8-16解调器602中,而解调为8位的数据串。
该解调数据被输入纠错电路603,进行纠错处理。进行了纠错处理的数据通过信息道缓冲器604被输入信号分离器605。在该信号分离器605中,根据流ID来进行音频包、实时数据等的识别,向对应的解码器输出各包。
音频包被取入音频缓冲器611中。音频包的包首部和包元首部被读取到控制电路612中。控制电路612识别音频包的内容。即,识别音频包的开始码、填充长度、包元开始码、流ID等。而且,进行包元的长度、子流ID的识别、最初的存取指针的识别、音频的量化位数的识别、取样频率的识别、从声道分配来进行声道群的识别等。
当这些信息被识别时,控制电路612识别线性PCM数据的包元内容,而能够决定解码方式。而且,控制电路612能够把握在音频缓冲器611中所存储的包元内的重放用音频数据的分离地址。
为此,音频缓冲器611由控制电路612进行控制,把上面说明的取样例如S0,S1,e0,e1,S2,S3,…输出给解码器613。控制电路612至少识别量化位数、取样频率、声道分配。这样,根据该识别信息能够对数据的分离以及解码器613执行解码方式的设定。该取样被提供给进行声道处理并解码的解码器613。
图31表示解码器613的具体构成例子。提供给输入端子710的取样通过开关712根据控制电路612的控制而分配给每个声道。即,在来了L或者Lf信号(包含附加字)时,被分配给缓冲存储器713;在来了R或者Rf信号(包含附加字)时,被分配给缓冲存储器714;在来了C信号(在来了附加字时包含其)时,被分配给缓冲存储器715;在来了Ls信号(在来了附加字时包含其)时,被分配给缓冲存储器716;在来了Rs信号(在来了附加字时包含其)时,被分配给缓冲存储器717。而且,在来了S信号时,被分配给缓冲存储器718;在来了LEF信号时,被分配给缓冲存储器719。
各个缓冲存储器713~719的输出分别被输入帧处理部813~819中,而成为帧单位。帧处理部813、814、814、816、817的输出分别被提供给相位匹配部723、724、725、726、727。
帧处理部815、816、817的输出通过开关820分别提供给变频器821、822、823。帧处理部818、819的输出分别提供给变频器824、825。
相位匹配部723~727用于在第二声道群受到变频时把第一声道群的信号与第二声道群的信号的最终相位进行匹配。相位匹配部723~727的输出和变频器821~825的输出分别提供给选择器730。
选择器730,如图26所示的那样,根据声道分配的信息,选择对应的声道的信号,分别提供给对应的数字模拟变换器731、732、733、734、735、736。
在上述实施例中,是把第二声道群的取样进行变频而输出,但是,也可以不进行变频,而进行模拟变换。在此情况下,可以删除第一声道群侧的相位匹配部。
下面简单说明上述音频信息以哪种形态记录到光盘上。如图32A~图32D所示的那样,当放大光盘100的一部分的记录面时,形成有凹坑串。该凹坑的集合构成扇区。由此,在光盘100的信息道上形成扇区列。该扇区由光头连续读取。而且,音频包被实时重放。
下面说明一个扇区例如记述有音频信息的扇区。如图33A和图33B所示的那样,一个扇区由13×2帧所构成。而且,在各帧中附加有同步码。在图中,二维地表示帧的排列,在信息道上从开头的帧来依次进行记录。若以图示的同步码的顺序进行描述,为SY0、SY5、SY1、SY5、SY2、SY5、…。
图示的1帧中的同步码和数据的位数为32位和1456位。32位=16位×2,1456位=16位×91。该代数式表示记录有16位的调制码的情况。当进行与光盘相对应的记录时,8位的数据被调制为16位来进行记录。此外,该扇区信息还包含被调制的纠错码。
图34A表示把上述物理扇区的16位数据解码为8位后的一个记录扇区。该记录扇区的数据量为(172+10)字节×(12+1)行。在各行中附加了10字节的纠错码。而且,虽然存在1行的纠错码,但该纠错码,如后述那样,当集中12行时,作为列方向的纠错码而起作用。
当从上述1记录扇区的数据中除去纠错码时,为图34B所示的那样的数据块。即,使2048字节的主要数据为这样的数据块在数据开头附加4字节的扇区ID、2字节的ID检错码IED、6字节的著作权管理信息CPR MAI,而且,在数据的末尾附加4字节的检错码EDC。
上述2048字节的数据为上述的1包。从该1包的开头记述包首部、包元首部、音频数据。而且,在包首部和包元首部中记述用于处理音频数据的各种向导信息。
如上述那样,对于盘的一个扇区,分配记录了排列有音频取样的一个包元。而且,即使是一个扇区的信息,音频解码器也能良好地重放线性PCM数据。这是因为1包内的音频数据的开头必定进行了数据分配以便于从主取样的开头开始。而且,因为在包首部和包元首部中记述有音频解码器处理音频数据所需的足够控制信息。
下面对纠错码块(ECC块)进行说明。如图35A和图35B所示的那样,ECC块通过集合16个上述1记录扇区而构成。图35A表示集合16个12行×127字节的数据扇区(图34A)的状态。
在各列中分别附加有16字节的外码校验位(PO)。在各行中分别附加有10字节的内码校验位(PI)。而且,在记录之前,如图35B所示的那样,16字节的外码校验位(PO)在各行分散1比特。其结果,1记录扇区构成为13(=12+1)行的数据。
在图35A中,B0,0、B,1、……表示字节单位的地址。在图35B中,附在各块中的0~15分别是1记录扇区。在上述盘的记录信息道中,排列着音频包、管理信息、其他的任意地排列着静止图象的信息、实时信息。
本发明说明了记录到盘中或者从盘重放的数据构造,而在使用通信系统的数据传输时,使用上述数据构造是容易的,本发明当然包含数据构造本身、以及传输这样的数据构造的装置、转送装置、接收装置。
在上述说明中,说明了对音频信号进行取样并进行处理的方法和装置,但是,不言而喻,如果是必须同时进行重放输出并且在相同的转送系统和传输系统中使用的数据,即使对于音频信号以外的信号,也能适用。
权利要求
1.一种记录媒体,能够把以预定取样频率和量化位数所数字化的音频信号记录到记录面上的预定区域中,其特征在于,记录了第一取样数据串,用第一取样频率和第一量化位数把多个信道的音频信号中的第一信道的音频信号进行数字化而形成;第二取样数据串,用第二取样频率和第二量化位数把多个信道的音频信号中的第二信道的音频信号进行数字化而形成;包含用于使该第一取样数据串和第二取样数据串同步的定时数据的首部数据。
2.根据权利要求1所述的记录媒体,其特征在于,使上述第一取样频率和第二取样频率成为相互不同的频率。
3.根据权利要求1所述的记录媒体,其特征在于,使上述第一量化位数和上述第二量化位数为相互不同的位数。
4.根据权利要求1,2或3所述的记录媒体,其特征在于,以上述第一取样频率和上述第一量化位数所数字化的第一取样数据串是作为双声道的左右声道的声音而重放的音频信号的数据串;以上述第二取样频率和上述第二量化位数所数字化的第二取样数据串是与上述双声道的左右声道的声音同步重放并用于产生环绕声的音频信号的数据串。
5.根据权利要求1所述的记录媒体,其特征在于,上述第一取样数据串所需要的数据量多于上述第二取样数据串所需要的数据量,分别根据数据量而占有记录区域中预定大小的记录区域。
6.根据权利要求1所述的记录媒体,其特征在于,上述第一取样频率和上述第二取样频率被设定为整数倍的关系。
7.根据权利要求1所述的记录媒体,其特征在于,上述第一取样数据串和上述第二取样数据串被配置并记录得能够与上述首部数据相组合来进行传输。
8.根据权利要求1所述的记录媒体,其特征在于,上述第一取样数据串和上述第二取样数据串分别由主取样数据串和附加取样数据串所构成,通过把它们进行组合,来构成声道数、取样频率或者量化位数不同的数据串。
9.一种重放装置,重放记录媒体(500),该记录媒体(500)记录了第一取样数据串,用第一取样频率和第一量化位数把多个信道的音频信号中的第一信道的音频信号进行数字化而形成;第二取样数据串,用第二取样频率和第二量化位数把多个信道的音频信号中的第二信道的音频信号进行数字化而形成;包含用于使该第一取样数据串和第二取样数据串同步的定时数据的首部数据,其特征在于,包括根据对上述首部数据进行解码处理而得到的上述定时数据或者根据该定时数据而生成的同步用数据,来重放上述第一声道的音频信号或者第二声道的音频信号,并从声音输出端子有选择地输出的装置(612,613)。
10.一种重放装置,从记录媒体(500)读取第一取样数据串、第二取样数据串和首部数据来进行解调,该记录媒体(500)记录了第一取样数据串,用第一取样频率和第一量化位数把多个信道的音频信号中的第一信道的音频信号进行数字化而形成;第二取样数据串,用第二取样频率和第二量化位数把多个信道的音频信号中的第二信道的音频信号进行数字化而形成;包含用于使该第一取样数据串和第二取样数据串同步的定时数据的首部数据,其特征在于,包括传输装置(611,612),传输在上述首部数据中所包含的定时数据或者根据该定时数据而生成的同步用数据、上述第一取样数据串、以及上述第二取样数据串。
全文摘要
本发明能够尽量利用DVD视频中的音频数据构造的标准,来实现具有高音质规格的DVD音频的数据构造。在记录媒体上记录了以第一取样频率和第一量化位数把第一声道的音频信号数字化的第一取样数据串、以第二取样频率和第二量化位数把第二声道的音频信号数字化的第二取样数据串、以及包含用于使第一和第二取样数据串同步的定时数据的首部数据。
文档编号G11B5/09GK1240987SQ99108599
公开日2000年1月12日 申请日期1999年6月25日 优先权日1998年6月26日
发明者大友仁, 三村英纪, 鱼田润一 申请人:株式会社东芝
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1