数据记录/再现方法和装置及数据编辑方法和装置的制作方法

文档序号:6749700阅读:202来源:国知局
专利名称:数据记录/再现方法和装置及数据编辑方法和装置的制作方法
技术领域
本发明涉及数据记录方法和装置和数据再现方法和装置,用于向记录介质记录/从记录介质再现内容数据,所述记录介质被划分成预定长度的多个扇区并且可以以扇区为单位被访问,例如就象CD2光盘一样。本发明也涉及数据记录方法和装置,用于向这样的记录介质记录内容数据,还涉及数据编辑方法和装置以及数据记录介质。
背景技术
近些年来,作为大容量介质的光盘已经得到发展。例如,其上记录了音乐信息的CD(致密盘)、其上记录了计算机数据的CD-ROM、处理视频信息的DVD(数字多用途盘或数字视盘)等是公知的。
在此所述的光盘是只读盘。在近些年来,其上可以被另外写入一次数据或可以重写数据的光盘,如CD-R(可以记录)盘、CD-RW(可重写CD)盘等,已经被用在实际中。而且,诸如在保持CD的形状的同时提高了记录容量的双密度CD、其中可以增进普通CD播放机和个人计算机的相似性的CD2等得到发展。
CD2光盘具有一个在内边缘的区域和在外边缘的区域。例如在内边缘的区域,音频数据已经被以与普通CD-DA(CD数字音频)类似的格式被记录,以便它也可以被普通CD播放机再现。在外边缘的区域,为了实现与个人计算机的相似性,内容数据被按照CD-ROM的规格归档和记录。
按照MPEG2-PS的规格向这样的CD2光盘记录包括音频数据和图像数据的多媒体的内容数据的一种方法被考虑。例如,作为音频数据的压缩系统,ATRAC3、MP3或AAC的使用也被考虑。
作为一个音频数据的压缩系统,公知的有一种子带系统,其中在时基方向上被输入的音频数据被频带划分滤波器划分成多个频带并被压缩编码;一种变换编码系统,其中以在时基方向上被输入的音频数据被诸如DCT等的正交函数转换成在频基方向上的数据并被压缩编码;一个混合系统,其中组合了这两种系统。ATRAC3、MP3或AAC是音频压缩系统,它属于混合系统。由预定的时间窗切出的音频数据被划分频带和MDCT变换,以便执行压缩编码。
例如,在ATRAC3中,其采样频率等于例如44.1kHz的音频数据被例如11.6毫秒的时间窗切出并被混合系统编码。在11.6毫秒的时间窗中,512个样值的音频数据被切出。假定一个样值包括16个比特,则每2048字节执行编码。在ATRAC3中,由于执行自适应比特分配,因此有可能任意处理比特率。当传输比特率等于66kbps的时候,一个编码单元被压缩成192个字节。当传输比特率等于105kbps的时候,一个编码单元被压缩成304个字节。当传输比特率等于132kbps的时候,一个编码单元被压缩成384个字节。
在CD-ROM模式1中,包括98个帧的一个字码块被设置为一个扇区,并且数据以扇区为单位被记录。一个扇区的大小等于2352字节,并且在它们中的数据记录容量等于2048字节。在通过MPEG2-PS记录内容数据的情况下,一个数据分组被记录在一个扇区中。例如,假定14字节的一个分组首标被加入,则可以记录到一个扇区中的内容的数据容量等于2020字节。
如上所述,在CD-ROM模式1的规格中,一个扇区的数据容量等于2048字节。当记录MPEG2-PS的时候,假定14字节的分组首标被加入,可以记录到一个扇区中的内容的数据容量等于2020字节。
另一方面,例如,在由105kbps的比特率的ATRAC3压缩的音频数据中,一个编码单元的大小是304字节。
如上所述,可以记录到一个扇区中的内容的数据容量和一个编码单元的大小被独立地预定。本发明不限于ATRAC3的情况,而且在MP3或AAC中,可以记录到一个扇区中的内容的数据容量和一个编码单元的大小是独立的。因此,如果编码单元是连续被记录的,则产生了超过两个扇区的数据记录的编码单元。
例如,如果其中编码单元的大小等于304字节(105kbps的比特率的ATRAC3)的音频数据被记录到2020字节的一个扇区的容量之中,则在一个扇区中安排的编码单元的数量等于2020/304=6.64
虽然在一个扇区中可以完全安排6个编码单元,第7个编码单元被记录到下一个扇区的一部分。
如果在扇区上记录的编码单元如上所述,则编码单元的首部在访问的时候变得不清楚,并且出现在快进模式、快退模式或搜索模式下难于访问所期望的扇区和编码数据的问题。
即,在按照CD-ROM模式1的规格记录数据的情况下,以扇区为单位来执行访问。即使编码单元已经被记录到扇区上,只要执行连续的再现,则这样的编码单元的数据被连续从两个相邻的扇区再现,因此没有问题。
但是,当用户打算访问所期望的扇区和开始在快进模式、快退模式或搜索模式等下的再现的时候,如果编码单元已经被记录到扇区中,则不能在扇区的首部部分获得完整的编码单元并且这样的编码单元不能被解码。因此在这样的情况下,有必要跳跃到下一个完整编码单元和从可以再现完整编码单元的位置开始解码。
但是,特别是在ATRAC3中,不象MP3或AAC一样,由于示出编码单元的首部的首标不存在,因此难于找到下一个完整的编码单元。
因此考虑其中扇区的首部总是与编码单元的首部重合的一种方法。例如,如上所述,在记录音频数据——其中编码单元的大小是304字节并且它已经被通过105kbps的比特率压缩——的情况下,考虑其中每个扇区的6个编码单元被从扇区的首部记录并且剩余的扇区被填充的一种方法。如上所述,如果扇区的首部与编码单元的首部重合,则所期望的扇区被访问,并且当扇区首部被访问的时候从这样的扇区的数据的首部执行解码。以便可以再现数据。但是,在这种情况下,每个扇区发生2020-304×6=196字节的数据容量的浪费。

发明内容
因此,本发明的一个目的是提供数据记录方法和装置、数据再现方法和装置以及数据记录介质,其中即使当以扇区为单位访问的时候,数据也可以从编码单元的首部再现,数据容量不被浪费。
本发明的另一个目的是提供数据编辑方法和装置,其中即使数据被编辑,数据也可以在一个编辑点从编码单元的首部再现,数据容量不被浪费。
按照本发明,提供了一种数据记录方法,用于向一个记录介质记录内容数据,所述记录介质被划分成预定长度的扇区并可以以扇区为单位来被访问,包括步骤以每个预定的长度划分编码的内容数据,增加一个首标和分组化;进一步增加一个首标给分组以便形成分组数据;将已经被分组化并进一步形成分组数据的数据记录到对应于扇区的记录介质上的每个扇区中;当编码内容数据被以每个预定长度划分并被分组化的时候,向分组的首标记录指示在多个编码单元中一个所期望的编码单元的首部位置的信息,所述多个编码单元被安排在每个分组中。
按照本发明,提供了一种数据记录装置,用于向一个记录介质记录内容数据,所述记录介质被划分成预定长度的扇区并可以以扇区为单位来被访问,包括用于以每个预定的长度划分编码的内容数据,增加一个首标和分组化的装置;用于进一步增加一个首标给分组以便形成分组数据的装置;用于将已经被分组化并进一步形成分组数据的数据记录到对应于扇区的记录介质上的每个扇区中的装置;用于当编码内容数据被以每个预定长度划分并被分组化的时候,向分组的首标记录指示在多个编码单元中一个所期望的编码单元的首部位置的信息的装置,所述多个编码单元被安排在每个分组中。
按照本发明,提供了一种数据再现方法,用于从一个数据记录介质再现内容数据,所述数据记录介质被划分成预定长度的多个扇区并可以以扇区为单位被访问,并且其上记录了所述内容数据,其中在所述数据记录介质上,以每个预定的长度划分编码的内容数据,增加一个首标和将数据分组;进一步增加一个首标给分组以便形成分组数据;将已经被分组化并进一步形成分组数据的数据记录到对应于扇区的所述记录介质上的每个扇区中;当编码内容数据被以每个预定长度分组的时候,向分组的首标记录指示在多个编码单元中一个所期望的编码单元的首部位置的信息,所述多个编码单元被安排在每个分组中;所述数据再现方法包括步骤访问和再现所述数据记录介质的每个扇区;当访问在所述记录介质上的一个所期望的扇区的时候,根据从分组首标的信息获得的并示出所期望的编码单元的首部位置的信息设置用于在所述扇区中开始再现的一个位置。
按照本发明,提供了一种数据再现装置,用于从一个数据记录介质再现内容数据,所述数据记录介质被划分成预定长度的多个扇区并可以以扇区为单位被访问,并且其上记录了所述内容数据,其中在所述数据记录介质上,以每个预定的长度划分编码的内容数据,增加一个首标和将数据分组;进一步增加一个首标给分组以便形成分组数据;将已经被分组化并进一步形成分组数据的数据记录到对应于扇区的所述记录介质上的每个扇区中;当编码内容数据被以每个预定长度分组的时候,向分组的首标记录指示在多个编码单元中一个所期望的编码单元的首部位置的信息,所述多个编码单元被安排在每个分组中;所述数据再现装置包括用于访问和再现所述数据记录介质的每个扇区的装置;用于当访问在所述记录介质上的一个所期望的扇区的时候、根据从分组首标的信息获得的并示出所期望的编码单元的首部位置的信息设置用于在所述扇区中开始再现的一个位置的装置。
按照本发明,提供了一种数据编辑方法,用于编辑记录在一个记录介质上的内容数据,所述数据记录介质被划分成预定长度的多个扇区并可以以扇区为单位被访问,其中在所述数据记录介质上,每个预定的长度划分编码的内容数据,增加一个首标和将数据分组;进一步增加一个首标给分组以便形成分组数据;将已经被分组化并进一步形成分组数据的数据记录到对应于扇区的所述记录介质上的每个扇区中;当编码内容数据被以每个预定长度分组的时候,向分组的首标记录指示在多个编码单元中一个所期望的编码单元的首部位置的信息,所述多个编码单元被安排在每个分组中;所述数据编辑方法包括步骤当一系列内容数据被编辑的时候,向扇区的首标记录指示编辑点的信息;当从首标检测到指示编辑点的信息的时候,根据从分组首标的信息获得的并示出所期望的编码单元的首部位置的信息设置用于在所述扇区中开始再现的一个位置。
按照本发明,提供了一种数据编辑装置,用于编辑记录在一个记录介质上的内容数据,所述数据记录介质被划分成预定长度的多个扇区并可以以扇区为单位被访问,其中在所述数据记录介质上,以每个预定的长度划分编码的内容数据,增加一个首标和将数据分组;进一步增加一个首标给分组以便形成分组数据;将已经被分组化并进一步形成分组数据的数据记录到对应于扇区的所述记录介质上的每个扇区中;当编码内容数据被以每个预定长度分组的时候,向分组的首标记录指示在多个编码单元中一个所期望的编码单元的首部位置的信息,所述多个编码单元被安排在每个分组中;所述数据编辑装置包括用于当一系列内容数据被编辑的时候、向扇区的首标记录指示编辑点的信息的装置;用于当从首标检测到指示编辑点的信息的时候、根据从分组首标的信息获得的并示出所期望的编码单元的首部位置的信息设置用于在所述扇区中开始再现的一个位置的装置。
按照本发明,提供了一种数据记录介质,所述数据记录介质被划分成预定长度的多个扇区并可以以扇区为单位被访问,并且其上记录了所述内容数据,其中以每个预定的长度划分编码的内容数据,增加一个首标和将数据分组;进一步增加一个首标给分组以便形成分组数据;将已经被分组化并进一步形成分组数据的数据记录到对应于扇区的所述记录介质上的每个扇区中;当编码内容数据被以每个预定长度分组的时候,向分组的首标记录指示在多个编码单元中一个所期望的编码单元的首部位置的信息,所述多个编码单元被安排在每个分组中。
按照本发明,提供了一种数据记录介质,所述数据记录介质被划分成预定长度的多个扇区并可以以扇区为单位被访问,并且其上记录了所述内容数据,其中以每个预定的长度划分编码的内容数据,增加一个首标和将数据分组;进一步增加一个首标给分组以便形成分组数据;将已经被分组化并进一步形成分组数据的数据记录到对应于扇区的所述记录介质上的每个扇区中;当编码内容数据被以每个预定长度分组的时候,向分组的首标记录指示在多个编码单元中一个所期望的编码单元的首部位置的信息,所述多个编码单元被安排在每个分组中,当编辑一系列内容数据的时候,记录指示编辑点的信息。
在被划分成预定长度的扇区并可以以扇区为单位被访问的记录介质上,当以每个预定长度划分编码内容数据的时候,增加首标和将数据分组;进一步增加一个首标以便形成分组数据,将数据记录;编码单元被连续记录到每个分组中,并由指针示出在扇区的首部存在的完整编码单元的位置。通过在从扇区的分组数据的首部到作为由如上所述编码单元指针示出的完整编码单元的编码单元的首部的范围中记录长度,当访问扇区的时候,作为完整编码单元的编码单元的位置可以从扇区首部从编码单元指针的值获知。因此可以即刻从编码单元的首部开始解码。如果编码单元已经通过固定的长度被预定,则可以由扇区编号来指定到完整编码单元的首部的长度。因此,即使当在搜索模式中从内容的中间再现或编辑数据,可以不丢失编码单元的首部而执行解码处理。


图1是示出CD2光盘的结构的原理图。
图2A和2B是示出被应用了本发明的光盘记录和再现装置的一个记录系统的结构的方框图。
图3A和3B是示出被应用了本发明的光盘记录和再现装置的一个再现系统的结构的方框图。
图4是用于说明CD-ROM的数据结构的原理图。
图5用于说明通过MPEG2-PS记录数据的原理图。
图6A和6B是用于说明填充的原理图。
图7是用于说明分组首标的原理图。
图8是用于说明分组首标的原理图。
图9是用于说明CD2流首标的原理图。
图10是示出ATRAC编码器的结构的方框图。
图11A和11B是说明ATRAC编码器的原理图。
图12是示出ATRAC解码器的结构的方框图。
图13A和13B是用于说明ATRAC解码器的原理图。
图14是示出ATRAC3编码器的结构的方框图。
图15是示出ATRAC3解码器的结构的方框图。
图16A到16C是用于说明ATRAC3的编码单元的原理图。
图17是示出在编码单元和扇区之间的关系的原理图。
图18是示出在编码单元和扇区之间的关系的原理图。
图19是示出在编码单元和扇区编号之间的关系的原理图。
图20是示出在编码单元和扇区之间的关系的原理图。
图21是示出在编码单元和扇区编号之间的关系的原理图。
图22是示出在编码单元和扇区之间的关系的原理图。
图23是示出在编码单元和扇区编号之间的关系的原理图。
图24是示出MP3编码器的结构的方框图。
图25是用于说明MP3的帧首标的原理图。
图26是示出MP3解码器的结构的方框图。
图27是示出AAC编码器的结构的方框图。
图28是示出AAC解码器的结构的方框图。
图29A和29B是用于说明AAC帧首标的原理图。
图30是用于说明数据访问的流程图。
图31是用于说明在编辑模式中编码帧的处理的原理图。
图32是说明在编辑模式中的处理的流程图。
图33是用于说明在编辑模式中的处理的流程图。
具体实施例方式
以下,参照附图来说明本发明的一个实施例。本发明适合用于向光盘记录内容数据和从光盘再现数据的情况,其中所述光盘如CD(致密盘)2。
图1示出应用本发明的CD2光盘1的外观结构。CD2是类似于普通CD一样具有例如120毫米直径的光盘。也可能使用象被称为单CD的其直径等于8毫米的光盘。
CD2考虑到与现有的CD播放机和个人计算机的相似性而被发展。按照如上所述的CD2光盘1,如图1所示,在中心形成一个中心孔,在内边形成一个区域AR1,在外边形成一个区域AR2。在内边的区域AR1和外边的区域AR2之间形成一个镜象部分M1。内边的区域AR1和外边的区域AR2被镜象部分M1分离。在内边的区域AR1的最里边形成一个引入区域LIN1,在内边的区域AR1的最外边形成一个引出区域LOUT1。在外边的区域AR2的最里边形成一个引入区域LIN2,在外边的区域AR2的最外边形成一个引出区域LOUT2。
内边的区域AR1是与现有CD播放机具有相似性的区域。在这个区域AR1中,例如,音频数据已经被以与普通CD-DA(CD数字音频)类似的格式被记录,以便即使普通CD播放机也可以再现数据。通常,在内边的区域AR1,不执行内容数据的加密以便可以以与普通CD-DA类似的方式来处理数据。当然,为了保护版权,也考虑对记录到内边的区域AR1的数据的加密的情况。除了音频数据之外的诸如视频数据、计算机程序数据等的数据也可以被记录到内边的区域AR1。也有可能将内容的数据压缩和记录到内边的区域AR1。
另一方面,外边的区域AR2是与个人计算机具有相似性的区域。在这个区域AR2中,可以以双密度来记录数据。例如,根据MPEG(活动图像编码专家组)2-PS(程序流)的规格来在区域AR2中记录诸如音频数据或图像数据的多媒体的内容数据。作为音频数据的压缩系统,使用了ATRAC(自适应变换声音编码)3系统、MP3(MPEG1音频层-3)系统或AAC(MPEG2高级声音编码)系统。作为图像数据的压缩系统,使用了JPEG(联合图像专家组)系统(静止图像)或MPEG2系统(活动图像)。为了保护版权,所期望的是,加密和向外边区域记录内容数据。
如上所述,CD2光盘1可以以类似于普通CD的方式利用内边的区域AR1被CD播放机再现,并且可以利用外边的区域AR2来处理数据并同时与个人计算机或便携播放机互锁。
本发明适合于向这样的CD2光盘1——具体上是外边的区域AR2——记录内容数据和从这样的CD2光盘1再现内容数据。
图2示出被应用了本发明的光盘记录和再现装置的一个记录系统的结构。在所述记录系统中,包括活动图像、静止图像和音频数据的多媒体的内容数据被按照MPEG2-PS的规格记录到CD2光盘1。
在图2中,图像数据流被提供到输入端11,音频数据流被提供到输入端21。来自输入端11的图像数据流被提供到一个图像编码器12。来自输入端21的音频数据流被提供到音频编码器22。
图像数据被图像编码器12压缩编码。在输入图像数据是静止图像的情况下,例如JPEG系统被用作图像数据的压缩系统,在活动图像的情况下,使用MPEG2系统作为图像数据的压缩系统。
按照JPEG系统,通过DCT(离散余弦变换)变换压缩编码静止图像数据。按照MPEG2系统,通过活动补偿预测编码和DCT变换来压缩编码活动图像数据。
当图像数据被压缩编码时候的时间信息被提供到PTS(表示时间标记)形成电路13。作为系统的参考的时间信息被从STC(系统时钟)形成电路10发送到PTS构成电路13。作为图像数据再现的基准时间的PTS根据来自STC形成电路10的系统基准时间信息由PTS形成电路13形成。
图像编码器12的输出被提供到加密电路14。在诸如图像数据或音频数据的内容数据的情况下,存在有必要加密来保护版权的情况。从图像编码器12输出的图像数据在必要的时候由加密电路14加密。加密电路14的输出被提供到分组化电路15。
在加密电路14中,例如。诸如DES(数据加密标准)或三重DES的块加密的系统被用作加密系统。按照块加密,例如,以8字节为单位进行加密。DES是一个典型的公共密钥加密,64比特(8字节)的数据进行初始的转置(扰码),每个包括32比特的数据被依序由从一个56比特的加密密钥形成的16个密钥非线性处理,然后再次进行转置,因此将数据加密。当然,加密系统不限于这样的块加密。
此时,在必要的时候通过从填充产生电路16填充数据来执行填充。被填充的部分被填上了全“1”或全“0”的数据。当被填充的部分被加密的时候,填充数据变成象随机数字的数据。填充不限于固定值,而是可以在考虑到安全性的情况下通过随机数字执行。以下将说明填充。
分组化电路15将图像数据划分成预定数量的数据,以便它可以被存储在MPEG2-PS的分组中。即,如下所述,在MPEG2-PS中,一个分组的数据被安排到一个CD-ROM标准的扇区中。在这个示例中,一个分组的数据被设置为2016个字节。因此,图像数据被分组化电路15以每2016个字节划分。
分组化电路15的输出被提供到PES首标增加电路17。PES首标被从PES首标形成电路18提供到PES首标增加电路17。例如,14字节的PES首标被PES首标增加电路17加到2016字节的一个分组的数据。
如下所述,在PES首标中包括一个流ID、一个扰码控制标志、一个PTS等。在内容被加密的情况下,扰码信息被从加密电路14发送到PES首标形成电路18。在此基础上,扰码控制标志被加到PES首标上。PTS被PES形成电路13形成。在此基础上,PTS信息被加到PES首标。PES首标增加电路17的输出被提供到复用器19。
而且,在本发明的实施例中,例如,4字节的CD2流首标被PES首标增加电路17加到14字节的PES首标之后。在CD2流首标中记录了编码单元指针、填充ID、编辑ID等。下面将详细说明CD2内容首标。
音频数据被音频编码器22压缩编码。ATRAC3、MP3、AAC等被用作音频数据的压缩系统。自然地,也可以使用ATRAC、ATRAC2、MPEG1音频(MPEG1音频层-1、MPEG1音频层2)等。也已经开发了诸如TwinVQ、RealAudio、WMA等的各种压缩系统,也可以类似地使用它们。
作为一个音频数据的压缩系统,公知的有一种子带系统,其中在时基方向上被输入的音频数据被频带划分滤波器划分成多个频带并被压缩编码;一种变换编码系统,其中以在时基方向上被输入的音频数据被诸如DCT等的正交函数转换成在频基方向上的频谱数据并被压缩编码;一种混合系统,其中组合了这两种系统。MPEG1音频(MPEG1音频层-1、MPEG1音频层2)属于子带编码系统。ATRAC、ATRAC2、ATRAC3、MP3和AAC属于混合系统。
当音频数据被压缩编码时候的时间信息被从音频编码器22提供到PTS形成电路23。作为系统的参考的时间信息被从STC形成电路10发送到PTS构成电路23。作为音频数据再现的基准时间的PTS根据来自STC形成电路10的系统基准时间信息由PTS形成电路23形成。
音频编码器22的输出被提供到加密电路24。从音频编码器22输出的音频数据在必要的时候被加密电路24加密。加密电路24的输出被提供到分组化电路25。
在加密电路24中,例如,一个诸如DES或三重DES的块加密的系统被用作加密系统。所述加密系统不限于这样的块加密。
此时,在必要的时候通过来自填充产生电路16的填充数据来执行填充。被填充的部分被填充数据全“1”或全“0”。当加密填充的部分的时候,填充的数据变成象随机数的数据。自然地,填充不限于固定的数据,而是在考虑到安全性的情况下也通过随机数来执行。以下将说明填充。
分组化电路25将图像数据划分成预定数量的数据,以便它可以被存储在MPEG2-PS的分组中。在这个示例中,由分组化电路25将音频数据以每2016个字节划分。
分组化电路25的输出被提供到PES首标增加电路27。PES首标被从PES首标形成电路28提供到PES首标增加电路27。例如,14字节的PES首标被PES首标增加电路27加到2016字节的一个分组的数据。
在PES首标中包括一个流ID、一个扰码控制标志、一个PTS等。在内容被加密的情况下,扰码信息被从加密电路24发送到PES首标形成电路28。在此基础上,扰码控制标志被加到PES首标上。PTS被PES形成电路23形成。在此基础上,PTS信息被加到PES首标。
而且,在本发明的实施例中,此时,例如,CD2流首标被PES首标增加电路27增加。在CD2流首标中记录了编码单元指针、填充ID、编辑ID等。PES首标增加电路27的输出被提供到复用器19。
图像数据和音频数据被提供到复用器19,其中图像数据已经别图像编码器12编码、被加密电路14加密、被分组化电路15和PES首标增加电路17分组,音频数据已经被音频编码器22压缩编码、被加密电路24加密和被分组化电路25和PES首标增加电路27分组。包括其他附加信息的程序分组也被提供。那些图像分组、音频分组和程序分组被复用器19复用。
复用器19的输出被提供到分组首标增加电路31。分组首标信息被从分组首标形成电路32提供到分组首标增加电路31。分组首标被分组首标增加电路31加到每个分组上。
如下所述,用于校准系统的时间的SCR(系统时钟参考)、复用率等被插入分组首标。SCR是由SCR形成电路33在STC形成电路10的输出的基础上形成的。这个SCR被提供到分组首标形成电路32。
分组首标增加电路31的输出被提供到纠错编码电路34。纠错编码电路34按照CD-ROM模式1用CIRC(交叉交织里德-索罗蒙编码)对记录数据执行纠错编码处理。
在CD-ROM中,包括98个帧的子码块被作为一个扇区。
即,信道P-W的子码已经被插入CD。通过将98个帧设置到一个块中,子码被编码。子码的信息被用在访问的时候。因此,包括98个帧的子码块被设置到一个访问单元。
在CD-ROM中,包括98个帧的子码块被作为一个扇区。一个扇区的物理容量等于2352字节。在CD-ROM模式1的情况下,288字节的辅助数据被增加和记录,用于检测和纠正差错。12字节的同步数据和4字节的首标被提供到每个扇区的首部。因此,按照CD-ROM模式1的规格,一个扇区的数据记录容量等于2352-288-12-4=2048字节如下所述,从分组首标增加电路31输出的分组的大小包括14字节的分组首标、14字节的PES首标、4字节的CD2流首标和2016字节的数据(有效负荷),等于14+14+4+2016=2048字节这个值与在CD-ROM模式1中的一个扇区的数据容量(2048字节)重合。
纠错编码电路34的输出被提供到调制电路35。记录数据被调制电路35用预定的调制系统调制。调制电路35的输出被经由记录电路36提供到光头37。
光盘1是如上所述的CD2光盘。光盘1被主轴电动机42旋转。用于控制光盘1的旋转的主轴伺服电路、用于控制在光盘1的径向上的光头37的跟踪伺服电路和用于控制在光轴方向中的来自光头37的光束的聚焦伺服电路被提供。这些电路被访问控制电路43控制。
在记录数据的情况下,访问控制电路43使得光头37访问在光盘1上所期望的记录位置的扇区。在来自记录电路36的记录数据的基础上调制的激光光束被从光头37输出到光盘1。因此,数据被记录到光盘1上。
图3示出了可以应用本发明的光盘记录/再现装置的再现系统的结构。在图3中,在再现的时候,访问控制电路43使得光头37访问在光盘1上所期望的再现位置的扇区。一个分组的数据已经被记录到在光盘1上的一个扇区,可以以扇区为单位访问光盘。
在光盘1上的记录数据被光头37读取。来自光头37的再现数据被经由再现电路51提供到解调电路52。解调电路52执行对应于图2的调制电路35的调制系统的解调处理。解调电路52的输出被提供到纠错电路53。在纠错电路53中,执行按照CIRC的纠错处理和解码每个扇区的数据。
如上所述,一个分组的数据已经被记录到一个扇区中。14字节的分组首标和14字节的PES首标被加到一个扇区的数据的首部。而且,CD2流首标被增加。
一个扇区的再现数据被提供到分组首标提取电路54。分组首标提取电路54提取对应与一个扇区的2016字节的数据的首部的分组首标。被提取的分组首标被提供到分组首标分析电路55。
SCR和复用率已经被插入分组首标。分组首标的SCR被SCR提取电路56提取并被提供到STC形成电路57。由系统时钟计数的一个计数器的值被与来自STC形成电路57的STC的值比较。在比较输出的基础上,校准系统的基准时间。
分组首标提取电路54的输出被提供到去复用器58。去复用器58将图像数据分组、音频数据分组和程序分组分离。通过检测PES首标的流ID来执行分组的分离。
由去复用器58分离的图像数据分组被提供到EPS首标提取电路61。
PES首标提取电路61提取插入到分组首标的下一个14字节中的PES首标。这个PES首标被提供到PES首标分析电路62。
在PES首标中包括一个流ID、一个扰码控制标志、一个PTS等。可以从PES首标的扰码控制标志识别是否内容已经被加密。如果数据被加密并且当允许对加密解密的时候,对于加密的解密密钥被设置到加密解密电路64中。
在PES首标中包括的PTS被PTS提取电路65提取。PTS示出了再现时间。被提取的PTS被提供到一个再现定时设置电路66。
而且,在这个示例中,PES首标分析电路62分析CD2流首标。在CD2流首标中已经记录了编码指针、填充ID、编辑ID等。
PES首标提取电路61的输出被提供到分组分解电路63。一个分组的2016字节的数据被分组分解电路63分解。
分组分解电路63的输出被提供到加密解密电路64。如果允许内容数据的解密,则由加密解密电路64执行加密的解密。加密解密电路64的输出被提供到图像解码器67。
图像解码器67根据在记录时候的图像的压缩编码系统执行图像数据的解压处理。即,如果被再现的图像数据涉及JPEG系统的图像,则图像解码器67执行JPEG的解码处理。如果是MPEG2的活动图像数据,则图像解码器67执行MPEG2的解码处理。
由PTS提取电路65提取的PTS的值被提供到再现定时设置电路66,并且系统的基准时间也被从STC形成电路57提供到那里。再现定时设置电路66将由按照PTS所示的时间信息与系统的基准时间相比较。当按照PTS所示的时间信息和系统的基准时间重合的时候图像解码器67解码图像数据。解码的图像数据从输出端68输出。
由去复用器58分离的音频数据分组被提供到PES首标提取电路71。
插入到分组首标的下一个14字节中的PES首标被PES首标提取电路71提取。这个PES首标被提供到PES首标分析电路72。
在PES首标中包括流ID、扰码控制标志、PTS等。从PES首标可以识别是否内容已经被加密。如果数据已经被加密或如果允许加密的解密,则加密的解密密钥被设置到加密解密电路74。
PTS提取电路75提取在PES首标中的PTS。PTS示出了再现时间。被提取的PTS被提供到再现定时设置电路76。
而且,CD2流首标被PES首标分析电路72分析。在CD2流首标中已经记录了编码单元指针、填充ID、编辑ID等。
PES首标提取电路71的输出被提供到分组分解电路73。分组分解电路73分解一个分组的2016字节的数据。
分组分解电路73的输出被提供到加密解密电路74。如果允许内容数据的解密,则由加密解密电路74执行加密的解密。加密解密电路74的输出被提供到音频解码器77。
音频解码器77在记录的时候根据音频的压缩编码系统执行音频数据的解压处理。即,如果被再现的音频数据涉及ATRAC3,音频解码器77执行ATRAC3的解码处理。如果它涉及MP3或AAC,则音频解码器77执行MP3或AAC的解码处理。
由PTS提取电路75提取的PTS的值被提供到再现定时设置电路76并且系统的基准时钟也被从STC形成电路57提供到那里。再现定时设置电路76将由按照PTS所示的时间信息与系统的基准时间相比较。当按照PTS所示的时间信息和系统的基准时间重合的时候图像解码器77解码音频数据。解码的音频数据从输出端78输出。
在上述的示例中,在记录系统中,包括图像数据和音频数据的多媒体数据被按照MPEG2-PS的规格记录到光盘1,在再现系统中,多媒体数据被再现。但是,仅仅音频数据也可以被按照MPEG2-PS的规格记录/再现。自然地,仅仅图像数据也可以被记录/再现。
如果仅仅音频数据被记录/再现,系统可以被用作音频记录/再现装置,用于记录/再现ATRAC3或MP3的音频数据。
也有可能以下面的方式构造记录静止图像数据和音频数据,记录描述它们的再现顺序的脚本,并由用户按照脚本指定的顺序再现静止图像数据和音频数据。
如上所述,按照本发明的实施例,诸如图像数据和音频数据的复用器媒体的内容数据按照MPEG2-PS被作为一个分组压缩和记录到CD2光盘1上的一个扇区中。
即,图4示出了记录在一个扇区中的数据的结构。如上所述,一个扇区对应于CD的包括98个帧的一个子码块。如图4所示,一个扇区的物理容量等于2352字节。在CD-ROM模式1的情况下,288字节的辅助数据被增加以检测和纠正差错。12字节的一个同步数据和4字节的一个首标被提供在每个扇区的首部。因此,在CD-ROM模式1中的规格中,一个扇区的数据记录容量等于2048字节。
图5示出了MPEG2-PS的一个分组的结构。如图5所示,14字节的一个分组首标被提供在一个分组的首部。随后,提供一个14字节的PES首标。而且,在本发明的实施例中,提供了4字节的CD2流首标。诸如音频数据、图像数据等的数据(有效负荷)被安排到后续的2016个字节。一个分组的数据量等于2048字节并与图4所示的一个扇区的数据记录容量重合。
在MPEG2-PS的规格中,填充字节可以被插入到分组首标中。但是,在本发明的实施例中在分组首标中未插入填充字节。取而代之,如下所述,通过使用数区域来执行填充。
这是因为分组首标的长度是固定的,因此使得分组数据的开始位置能够容易地被检测并使得能够容易地提取扰码控制标志。
即,如果填充字节被插入分组首标,则分组首标的长度变得不稳定,以便一个分组的数据的开始位置变得不稳定。
相反,如果确定在分组首标中未插入填充字节,则分别地,分组首标被固定为14字节,PES首标被固定为14字节,CD2流首标被固定为4字节。一个分组的数据从分组的首部(或一个扇区的首部)从(14+14+4=32)的位置开始。
如下所述,扰码控制标志(参见图8)已经被插入PES首标中。在于再现时控制扰码的情况下,首先有必要提取扰码控制标志。
如果确定在分组首标中没有插入填充字节,则分组首标的长度被固定为14字节。如果分组首标的长度固定,通过简单地从一个分组的首部(或一个扇区的首部)提取预定位置的部分,可以提取在PES首标中的扰码控制标志。
按照MPEG2-PS可以提供一个填充分组。但是,在本发明的实施例中,不使用填充分组。
为什么不使用填充分组的原因是因为按照填充分组,难于执行小数量的字节或比特的填充,并且如果使用了填充分组,则填充分组的PES首标被加密或在加密时出现问题。
即,PES分组被加到填充分组,并且在PES分组中说明32比特的分组开始代码和16比特的分组长度。因此,为了插入填充分组,有必要提供至少包括32比特的分组开始代码和16比特的分组长度的PES首标。不能插入少于对应于PES首标的6字节的数据。
包括扰码控制标志的各种信息已经被存储在普通分组的PES首标中。但是,填充分组的PES首标包括32比特的分组开始代码和16比特的分组长度,不能存储各种信息不能被存储。因此,扰码控制标志不能被插入到填充分组的PES首标中。因此,扰码的控制依赖于在前的PES分组。如果在前的PES分组已经被加密,则可以发生加密下一个包括PES首标的填充分组的情况。如果加密PES首标,则填充分组的开始位置和长度不清楚,有可能不能执行正确的解码。
因此,在本发明的实施例中,如图6所示,在一个分组的数据区域插入填充数据。填充数据通常被设置为全“1”或全“0”。因为在数据区域中存在填充数据,如果加密填充数据,则它变成象随机数的数据。填充不限于固定值,但是考虑到安全性也可以通过随机数来执行。示出是否填充数据已经被插入的信息被描述为在CD2流首标中的填充ID,并且在那里描述了填充长度。
作为插入填充数据的方法,存在一种向在图6A所示的数据区域之后的位置插入填充数据的方法,一种向在图6B所示的数据区域之前的位置插入填充数据的方法。如果填充数据被插入到在图6A所示的数据区域之后的位置,则例如在数据的最后11个比特描述填充长度。如果填充数据被插入到在图6B所示的数据区域之前的位置,则例如在数据的最先11个比特描述填充长度。在执行前向填充和反向填充的情况下,通过填充ID来区别是否填充是前向填充或反向填充。
图7示出了在一个分组首部提供的分组首标的结构。如图7所示,分组首标包括14个字节,并且一个32比特的分组开始码(pack_start_code)被提供在分组首标的首部。
其后,2比特的“01”被提供,它们是在MPEG1和MPEG2之间的识别代码。
其后,用于校准作为系统的基准的STC的SCR(42+4比特)和复用率(program_mux_rate)(22+2比特)被提供。复用率被以50字节/秒为单位测量。
而且,提供了填充长度(pack_stuffing_length)(3+5比特)。在MPEG2-PS中。由这个填充长度所示的填充字节(stuffin_bytes)可以随后被提供到填充长度。但是,在本发明的实施例中,确定因为上述的原因没有填充数据被插入。即,填充长度被设置为“0”。
图8示出了PES首标的结构。PES首标包括14字节,并且一个24比特的分组开始码(pack_start_code)被提供在PES首标的首部。
其后,提供了8比特的一个流ID(stream_id)。按照流ID,一种数据即是否数据是活动图像数据或音频数据等可以被识别。
其后,提供了16比特的一个PES分组长度(PES_packet_length)。PES分组长度示出了在这个字段之后的分组的数据长度。
其后,跟随14比特的各种标志和控制数据。作为各种标志和控制数据,存在PES扰码控制数据(PES_scrambling_control),用于控制数据的扰码;PES优先级数据(PES_piority),用于区别重要分组和其他分组;数据排列指示符(data_alignment_indicator);版权数据(copyright),指示内容数据的版权;原始/复制数据(original或copy),示出了是否内容数据是原数据或复制数据。PTS和DTS标志(PTS_DTS_flag);ESCR标志(ESCR_flag);ES率标志(ES_rate_flag);DSM特技模式(trick mode)标志(DSM_trick_mode_flag);附加复制信息标志(additional_copy_info_flag);PES_CRC标志(PES_CRC_flag);PES扩展标志(PES_extension_flag)。
其后,提供一个8比特的PES首标长度(PES_eader_data_length),用于指示PES首标的长度。
下面40个比特是条件编码。在PTS在此被记录的情况下,记录(3+7)比特的PTS。
在MPEG2-PS流已经被记录到CD2的情况下,4字节的CD2流首标被随后提供到14字节的PES首标。
图9示出了CD2流首标的结构。在CD2流首标中提供了流ID、编码单元指针、填充ID和编辑ID。
编码单元指针示出了在扇区中的第一个完整编码单元的开始位置。
即,例如,当编码音频数据时候的单元的大小和一个分组的大小被独立预定。因此,如果压缩的音频数据被填充到每个分组中,则发生分组的数据的首部与编码单元的首部不一致。因此,如果用户打算访问一个任意扇区并开始以快进模式、快退模式或搜索模式再现,他丢失编码单元的首部,难于再现数据。
因此,在扇区中达到第一个完整编码单元的开始位置的数据被描述为在CD2流首标中的编码单元指针。通过使用这样的编码单元指针,有可能访问任意一个扇区和容易地从在这个扇区中存在的编码单元的首部再现数据。
填充ID被提供用于识别是否在分组的数据中存在填充数据。作为填充数据,存在图6A所示的反向填充数据和图6B所示的前向填充数据。填充ID识别填充数据的存在与否。如果已经进行了填充,则填充ID识别是否填充是前向填充或反向填充。
编辑ID指示编辑点的存在与否。如果编辑点存在,则编辑ID识别是否它是一个尾部点或开始点。
在如上所述的本发明的实施例中,诸如图像数据或音频数据的内容数据被按照MPEG2-PS压缩和记录到象CD2的光盘1。作为在记录音频数据情况下的压缩系统,考虑使用ATRRAC3、MP3或AAC。
如上所述,在ATRAC3、MP3或AAC中,以预定的单元为单位来执行编码,编码单元的大小和一个分组的大小被独立预定。因此,如果被压缩的音频数据被填充到每个分组,则发生分组数据的首部和编码单元的首部不重合的情况。因此,例如,如果用户打算访问一个任意扇区并开始以快进模式、快退模式或搜索模式再现,他丢失编码单元的首部,难于平滑地再现数据。
因此,按照本发明的实施例,扇区的完整编码单元的位置被如上所述的编码单元指针指示。
如图9所示,编码单元指针在CD2流首标中被说明。通过使用这样的编码单元指针,当访问一个任意扇区和开始数据的再现的时候,编码单元的首部和数据可以被平滑地再现,下面将详细说明。
现在假设音频数据被ATRAC3压缩和记录。在ATRAC3、MP3或AAC中,在时间窗中的音频数据被获取,音频数据被频带划分,在时间区域中的数据被转换为在频率区域的数据,并且音频数据被压缩。
首先,为了阐明编码单元的概念,在说明ATRAC3之前将说明基本的ATRAC。
图10示出了ATRAC编码器的一个示例。在图10中,音频数据被最大11.6毫秒的时间窗以例如44.1kHz的切出而采样,并被提供到输入端101。这个音频数据被提供到频带划分滤波器102。在频带划分滤波器102,输入的音频数据被分离成高频带分量和频率低于高频带的分量。由频带划分滤波器102分离的高频带分量被提供到MDCT(改进的DCT)变换电路104,频率低于高频带的分量被提供到频带分离滤波器103。在频带分离滤波器103中,输入的音频数据被划分为低频带分量和中频带分量。被分离的中频带分量被提供到MDCT电路105,低频带分量被提供到MDCT电路106。
如上所述,来自输入端101的音频数据被两级的频带划分滤波器102和103划分成3个频带,即高频带、中频带和低频带。QMF(正交镜象滤波器)被用作频带划分滤波器101和102。高频带分量的数据被提供到MDCT变换电路104。中频带分量的数据被提供到MDCT变换电路105。低频带分量的数据被提供到MDCT电路106。在MDCT变换电路104、105和106中,高频带分量的数据、中频带分量的数据和低频带分量的数据被分别从时基区域的数据转换成频率区域中的频谱数据。
MDCT变换电路104、105和106的输出被分别提供到规格化和量化电路107。在规格化和量化电路107中,MDCT变换电路104、105和106的输出被分别量化。规格化和量化电路107的输出从输出端109输出。MDCT变换电路104、105和106的输出被提供到比特分配电路108。规格化和量化电路107的比特分配被比特分配电路108按照代码的数量确定。这个比特分配信息从输出端110输出。
图11是用于说明在ATRAC编码器中的压缩处理的图。如图11A所示,输入的音频数据被最大11.6毫秒的时间窗切出。实际上,时间窗以短模式和长模式被分别打开。在时间窗中包括重叠。
由于音频数据的采样频率等于44.1kHz,因此11.6毫秒的时间窗对应于512个样值。因为一个样值包括16个比特,因此在左右两个信道中的512个样值的数据对应于512×2×16/8=2048字节这个数据被如上所述分离成高频带、中频带和低频带三个频带,被MDCT变换变换成在频率区域中的频谱数据,并被规格化和量化。因此,如图11B所示,2049字节的数据被压缩成大约1/5,变成424字节。当压缩音频数据的时候,424字节的数据被设置到一个编码单元。在ATRAC中,这样的一个编码单元被称为声音组。在这个示例中,包括作为编码单元的424字节的声音组被设置到编码单元。
图12示出了ATRAC解码器的结构。在图12中,由ATRAC压缩的数据被提供到输入端111。比特分配信息被从输入端12提供。
在频谱重建电路113中,根据比特分配信息来执行反向量化,并且重建频谱数据。高频带分量的频谱数据、中频带的频谱数据和低频带的频谱数据被从频谱重建电路113输出。高频带分量的频谱数据被提供到IMDCT变换电路114。中频带分量的频谱数据被提供到IMDCT变换电路115。低频带分量的频谱数据被提供到IMDCT变换电路116。在IMDCT变换电路114、115和116中,在频率区域中的频谱数据被变换为时间区域中的数据。
IMDCT变换电路114的输出被提供到频带合成滤波器117。IMDCT变换电路115和116的输出被提供到频带合成滤波器118。在频带合成滤波器118中,中频带的数据和低频带的数据被合成。在频带合成滤波器117中,高频带分量的数据被进一步合成到由频带合成滤波器118合成的中频带的数据和低频带的数据。频带合成滤波器117的输出从输出端119输出。
图13是用于说明ATRAC解码器的解压处理的图。如图13A所示,424字节的编码单元的频谱数据被IMDCT变换变换为时间区域中的数据、被频带合成和还原为原始音频数据。因此,424字节的一个编码单元的数据变成2048字节的数据。如图13B所示,2048字节的数据对应于1.6毫秒的左右信道的512个样值的数据。如上所述,在ATRAC中,在对应于11.6秒的左右信道中的2048字节的数据被每424字节的编码单元编码。
ATRAC2使得ATRAC能够进一步处理低比特率,一个声音分量被分离和编码。在ATRAC3中,进一步执行小的改变。
图14示出了ATRAC3编码器的一个示例。在图14中,例如,由例如最大11.6毫秒的时间窗切出的音频数据被从输入端121提供到频带划分滤波器122。音频数据被频带划分滤波器122划分成四个频带的分量。每个频带的数据被进一步子采样为1/4的比率,并被分别提供到增益控制电路123、124、125和126。通过增益控制电路123、124、125和126,以已经自适应地被预定的一个函数来对每个频带的数据进行增益控制。
增益控制电路123、124、125和126的输出被分别提供到MDCT变换电路127、128、129和130。在时间区域中的数据被MDCT变换电路127、128、129和130变换成频率区域中的频谱数据。从MDCT变换电路127、128、129和130获得256个系数数据。以便作为四个频带的总和获得1024个系数数据。MDCT变换电路127、128、129和130的输出被提供到频谱数据分离电路131。
这些输出被频谱数据分离电路131分离成一个声音分量和一个非声音分量。声音分量被提供到声音分量编码器132。非声音分量被提供到非声音分量编码器133。通过声音分量编码器132和非声音分量编码器133,分别对于声音分量和非声音分量执行规格化和量化。声音分量编码器132的输出和非声音分量编码器133的输出被提供到编码链形成电路134。编码链形成电路134形成一个编码链。熵编码也被用于产生编码链。编码链形成电路134的输出从输出端135输出。
图15示出了ATRAC3解码器的示例。在图15中,由ATRAC3压缩的数据被从输入端141提供到编码链分解电路142。在频率区域中的频谱数据被编码链分解电路142分别针对声音分量和非声音分量分解。声音分量被提供到声音分量解码器143。非声音分量数据被提供到非声音分量解码器144。在声音分量解码器143中执行声音分量的系数数据的反向量化。在非声音分量解码器144中执行非声音分量的系数数据的反向量化。
声音分量解码器143的输出和非声音分量解码器144的输出被提供到频谱数据合成电路145。由频谱数据合成电路145合成声音分量的频谱数据和非声音分量的频谱数据。
频谱数据合成电路145的输出被提供到IMDCT电路146、147、148和149。频谱数据被IMDCT电路146、147、148和149分别还原为在时间区域中的数据。
IMDCT电路146、147、148和149被分别提供到增益补偿电路150、151、152和153。增益补偿电路150、151、152和153对应于在编码器方的增益控制电路123、124、125和126而被提供。增益补偿电路150、151、152和153的输出被提供到频带合成滤波器154。每个频带的数据被频带合成滤波器154合成。从输出端155得到频带合成滤波器154的输出。从输出端155获得解压的原始音频数据。
在ATRAC3中,执行自适应比特分配,因为在编码链中包括比特分配信息,因此有可能任意处理比特率。作为传输比特率,使用66kbps、105kbps、132kbps等。
假定ATRAC3被用做如上所述的音频数据的压缩系统,如图16所示,当传输率等于66kbps的时候,编码单元的大小等于192字节(图16A)。当传输率等于105kbps的时候,编码单元的大小等于304字节(图16B)。当传输率等于132kbps的时候,编码单元的大小等于384字节(图16C)。
如上所述,如果用户打算按照CR-ROM模式1来记录,如图4所示,则以扇区为单位来执行记录。一个扇区的大小等于2352字节。在CD-ROM模式1的情况下,一个扇区的数据记录容量等于2048字节。
如图5所示,在按照MPEG2-PS记录数据的情况下,由于14字节的分组首标和14字节的PES首标被增加并且进一步增加了4个字节的CD2流首标,则一个扇区的分组数据的数据量等于2016字节。
另一方面,如16所示,假定ATRAC3被用作音频数据的压缩系统,当传输率是66kbps的时候,编码单元的大小是192字节。当传输率是105kbps的时候,编码单元的大小等于304字节。当传输率等于132kbps的的时候,编码单元的大小是384字节。因为一个扇区的分组数据的大小和编码单元的大小已经被独立地预定,如果多个编码单元被存储在一个分组中,则发生剩余量。
即,如图17所示,当传输率等于66kbps的时候,每个包括192字节的10个编码单元被针对一个扇区的分组的数据量存储,并且剩余96字节。当传输率等于105kbps的时候,每个包括304字节的6个编码单元被针对一个扇区的分组的数据量存储,并且剩余132字节。当传输率等于132kbps的时候,每个包括384字节的5个编码单元被针对一个扇区的分组的数据量存储,并且剩余96字节。
在CD中,以扇区为单位访问数据。因此,如果一个扇区的分组数据的首部和编码单元的首部不重合,当以扇区为单位访问数据的时候,不能从编码单元的首部进行解码,并且不能获得平滑的解码。
如果用户打算总是允许一个扇区的首部和编码单元的首部重合,则在数据记录容量中出现浪费。即,例如,当传输率等于66kbps的时候,每个扇区浪费96字节。
因此,在本发明的实施例中,编码单元被填充和记录,并且用指针示出在扇区首部存在的完整编码单元的位置。
例如,当传输率等于66kbps的时候,如图17所示,10个编码单元SU(1)到SU(10)被存储在扇区(1)中,一个编码单元SU(11)被记录在扇区(1)和扇区(2)上。编码单元SU(11)被从扇区(2)的中间记录在它中。在这种情况下,在扇区(2)中,在从扇区的分组数据的首部到作为一个完整编码单元的编码单元(12)的首部的范围的长度2113-2017=96字节被记录作为编码单元指针。
当传输率等于105kbps的时候,如图17所示,6个编码单元SU(1)到SU(6)被存储在扇区(1)中,编码单元SU(7)被记录在扇区(1)和扇区(2)上。编码单元SU(7)被从扇区(2)的中间记录在它中。在这种情况下,在扇区(2)中,在从扇区的分组数据的首部到作为一个完整编码单元的编码单元(8)的首部的范围的长度2129-2017=112字节被记录作为编码单元指针。
当传输率等于132kbps的时候,如图17所示,5个编码单元SU(1)到SU(5)被存储在扇区(1)中,编码单元SU(6)被记录在扇区(1)和扇区(2)上。编码单元SU(7)被从扇区(2)的中间记录在它中。在这种情况下,在扇区(2)中,在从扇区的分组数据的首部到作为一个完整编码单元的编码单元(7)的首部的范围的长度2305-2017=288字节被记录作为编码单元指针。
如上所述,如果在从扇区的分组数据的首部到作为一个完整编码单元的编码单元的首部的范围的长度被记录作为一个编码单元指针,当访问扇区的时候,可以从编码单元指针的值知道从扇区头部起的作为一个完整编码单元的编码单元的位置,以便可以立即从编码单元的首部开始解码。
如果编码单元被预定为固定的长度,则可以通过扇区编号指定到完整编码单元的首部的长度。
此时,例如,在ATRAC3的情况下,如果通过象一组管理单元设置8个扇区(16k字节)来分配扇区编号,则可以容易地管理编码单元指针。
即,在ATRAC3中的编码单元被重第一扇区填充,并且扇区编号被依序分配到扇区(1)到(8)。在分配编号之后,分配位置返回扇区(1),并且扇区编号被分配。
通过使用上述方法,如果比特率等于66kbps,如图18所示,则编码单元(1)、(2)、……被安排到扇区(1)、(2)、……,并且扇区(1)、(2)、……的编码单元指针如图19所示。
即,如图19所示,如果比特率等于66kbps,当扇区编号等于“1”的时候,编码单元指针等于“0”;当扇区编号等于“2”的时候,编码单元指针等于“96”;当扇区编号等于“3”的时候,编码单元指针等于“0”;当扇区编号等于“4”的时候,编码单元指针等于“96”;当扇区编号等于“5”的时候,编码单元指针等于“0”;当扇区编号等于“6”的时候,编码单元指针等于“96”;当扇区编号等于“7”的时候,编码单元指针等于“0”;当扇区编号等于“8”的时候,编码单元指针等于“96”。
如果比特率等于105kbps的时候,如图20所示,编码单元(1)、(2)、……被安排到扇区(1)、(2)、……,并且扇区(1)、(2)、……的编码单元指针如图21所示。
即,如图21所示,如果比特率等于105kbps,当扇区编号等于“1”的时候,编码单元指针等于“0”;当扇区编号等于“2”的时候,编码单元指针等于“112”;当扇区编号等于“3”的时候,编码单元指针等于“224”;当扇区编号等于“4”的时候,编码单元指针等于“32”;当扇区编号等于“5”的时候,编码单元指针等于“144”;当扇区编号等于“6”的时候,编码单元指针等于“256”; 当扇区编号等于“7”的时候,编码单元指针等于“64”;当扇区编号等于“8”的时候,编码单元指针等于“176”。
对应于8个扇区的数据容量等于2016×8=16128字节假定在此在8个扇区中记录了53个编码单元,数据容量等于304×53=16112字节因此,通过执行16128-16112=16比特的填充,在下一个扇区中的编码单元的首部于扇区的分组数据的首部重合。
如果比特率等于132kbps,如图22所示,则编码单元(1)、(2)、……被安排到扇区(1)、(2)、……,并且扇区(1)、(2)、……的编码单元指针如图23所示。
即,如图23所示,如果比特率等于105kbps,当扇区编号等于“1”的时候,编码单元指针等于“0”;当扇区编号等于“2”的时候,编码单元指针等于“288”;当扇区编号等于“3”的时候,编码单元指针等于“192”;当扇区编号等于“4”的时候,编码单元指针等于“96”;当扇区编号等于“5”的时候,编码单元指针等于“0”;当扇区编号等于“6”的时候,编码单元指针等于“288”;当扇区编号等于“7”的时候,编码单元指针等于“192”;当扇区编号等于“8”的时候,编码单元指针等于“96”。
如上所述,例如,在ATRAC3的情况下,当通过向一个管理单元设置8个扇区的组而分配扇区编号的时候,如果已经预定了比特率,则编码单元指针可以通过8个扇区编号(1)到(8)来管理编码单元指针。
因此,例如,在ATRAC3的情况下,也可以在CD2流首标的编码单元指针的位置说明在8个扇区的组的管理单元中的扇区编号。也可以说明编码系统、比特率等。
作为其中可以从扇区编号指定编码单元指针的CD2流首标,已经检查了下列指令。CD2流首标包括4个字节(32比特)。如下所示,4个字节的CD2流首标被构造为包括流ID;填充ID;采样频率;信道结构;固定长度/可变长度编码;信道间编码;比特率;扇区编号;保留区域。这些分量元素示出了下列内容(1)流ID(6比特)示出了诸如AAC、MP3、ATRAC3等的流种类。
(2)填充ID(2比特)示出了无填充、1字节的填充或2个或更多字节的填充。
(3)采样频率(5比特)示出了采样频率,如22.05kHz、44.1kHz、88.2kHz、176.4kHz、16kHz、32kHz、48kHz、96kHz、192kHz等。
(4)信道结构(3比特)示出了信道结构,如单声道、2信道立体声、4信道立体声、5.1信道立体声、6信道立体声、7.1信道立体声等。
(5)固定长度/可变长度编码(1比特)示出了是否数据已经按照固定长度或可变长度编码。
(6)信道间编码(1比特)示出了LR独立编码或联合编码。
(7)比特率(3比特)示出了是否比特率等于6kbps、105kbps或132kbps。
(8)扇区编号(3比特)示出了在组中的扇区编号1-8。
(9)保留区域(8比特)保留用于将来的扩展。
如上所述,通过比特率和流ID来指定编码单元指针。
虽然已经参照通过ATRAC3压缩和记录音频数据的情况说明了上述示例,在通过MP3或AAC记录的情况下也执行类似的处理。在MP3或AAC的情况下,由于在作为编码单元的数据的首部提供了首标,因此从扇区的首部到所述首标的距离被设置为编码单元指针。
图24示出了MP3编码器的结构。在图24中,音频数据的流被提供到输入端301。这个音频流被提供到子带分析滤波器组302。子带分析滤波器组302包括一个多相滤波器,将音频信号划分为相等宽度频率的32个子带。
输入的音频数据流被提供到FFT 303A和303B。FFT 303A和303B的输出被发送到非预测性测量单元304。非预测性测量单元304的输出被提供到一个信号掩蔽比计算单元305。信号掩蔽比计算单元305的输出被提供到心理听觉熵估测(psychological auditory entropy evaluating)单元306。
FFT 303A和303B、非预测性测量单元304、信号掩蔽比计算单元305和心理听觉熵估测单元306形成一个心理听觉模型,用于确定每个频带的信号能量与掩蔽阈值的比。心理听觉模型分析音频信号和计算可以用作频率的函数的噪音的掩蔽量。在这种情况下,同时,MDCT的块长度被利用可预测性在心理听觉熵的基础上确定。
子带分析滤波器组302的输出被提供到自适应块长度MDCT算术运算单元307。自适应块长度MDCT算术运算单元307对每个子带的音频数据执行MDCT算术运算。在自适应块长度MDCT算术运算单元307中,使用18样值的长块和6样值的短块这两种MDCT块长度。通过长块来改进具有固定的特性的音频信号的频率分辨率。通过短块来改进暂时的信号的频率分辨率。在短块模式中,一个长块被替换为三个短块。
自适应块长度MDCT算术运算单元307的输出被提供到一个混叠畸变降低蝶形单元308。在混叠畸变降低蝶形单元308中,为滤波器组的32个频带输入靠近频带边界的8个样值,并在一个蝶形区域对通过MDCT算术运算获得的数据执行混叠畸变消除处理。即,对邻近的多相滤波器组的频带执行蝶形算术运算。混叠畸变降低蝶形单元308的输出被提供到非线性量化单元309。
标度因数计算单元310的输出被提供到非线性量化单元309。在来自心理听觉模型的信息的技术上,标度因数计算单元310确定被分配到子带的编码比特的数量。标度因数计算单元310的输出被提供到缓冲器控制单元311。
由非线性量化单元309量化的数据被发送到霍夫曼编码单元312。在霍夫曼编码单元312中,通过霍夫曼代码执行可变长度编码。如上所述被编码的数据被与诸如来自辅助信息编码单元313的比特分配信息的辅助信息一起发送到比特流形成单元314。在比特流形成单元314中,在霍夫曼编码的数据加上帧首标,所述辅助信息和这个数据被组合到帧中。
如图25所示,在首标之后,编码的音频数据和CRC被加到MP3的数据。
图25示出了在MP3情况下的一个帧首标。如图25所示,12比特的预定格式的同步字被提供在首部。
其后,提供了一个ID。如果ID字等于“1”,它指示MPEG1。
在ID之后,提供了2比特的层。在这个层中,“00”表示层-1,“11”表示层-2,“10”表示层-3。
其后,提供1比特的保护比特。保护比特示出是否已经加上了差错检测纠正信息。当它等于“0”的时候,已经加上了差错检测纠正信息。当它等于“1”的时候,未加上差错检测纠正信息。
其后,提供了4比特的比特率索引。比特率索引定义一个比特率。
其后,提供了一个采样频率。当采样频率信息等于“00”的时候,采样频率等于44.1kHz。当它等于“01”的时候,采样频率等于48kHz。当它等于“10”的时候,采样频率等于32kHz。
其后,提供了一个填充比特。如果已经嵌入了填充比特,则填充比特被设置为“1”。如果未嵌入填充比特,则填充比特被设置为“0”。
其后,提供了2比特的一个模式。这个模式定义一个音频信道。“00”表示立体声,“01”表示联合立体声,“10”表示双信道,“11”表示单声道。
其后,提供了2比特的模式扩展。在层-1或层-2中,在联合立体声编码的时候,为频带设置它。层-3指示被使用的强度立体声和MS立体声的组合。
其后,提供了1比特的版权。它指示是否数据是版权内容。在版权内容的情况下,这个个比特被设置为“1”。如果它不是版权内容,则这个比特被设置为“0”。
其后,提供了1个比特的原始/复制。在原始的情况下,它被设置为“1”。在复制的情况下,它被设置为“0”。
其后,提供了2比特的重点。它指示重点的存在与否。如果使用重点,则示出一种重点。
图26示出了MP3解码器的结构。在图26中,按照MP3压缩的音频数据流被提供到输入端350。这个MP3流被发送到比特流分解单元351。在比特流分解单元中,经常预定格式的首标,并分解帧。
已经被霍夫曼编码和发送的音频数据与辅助信息从比特流分解单元351被输出。霍夫曼编码的音频数据被发送到霍夫曼解码单元353。在霍夫曼解码单元353中,参照霍夫曼表354来执行霍夫曼码的解码。霍夫曼解码单元353的输出被发送到反量化单元355。
在标度因数解码单元352中,从来自比特流分解单元351的辅助信息解码反量化的标度。在反量化单元355中,通过按照短块或长块的情况使用反量化标度来执行反量化。
反量化单元355的输出被提供到混叠畸变降低蝶形单元356。在混叠畸变降低蝶形单元356中,执行蝶形算术运算来降低混叠畸变。
混叠畸变降低蝶形单元356的输出被提供到IMDCT算术运算单元357。通过IMDCT算术运算单元357来执行IMDCT算术运算。IMDCT算术运算的数量在短块的情况下等于12、在长块的情况下等于36。
IMDCT算术运算单元357的输出被提供到子带合成滤波器组358。在子带合成滤波器组358中,合成32子带的解码数据。
在MP3的情况下,在帧的首部提供了如图25所示的首标。因此,在按照CD-ROM的规格通过MPEG2-PS记录MP3数据的情况下,从扇区的首部道帧首标的范围的长度被记录为一个编码单元指针。通过使用指示从扇区的首部道帧首标的范围的长度的编码单元指针可以迅速地访问MP3数据。
现在说明AAC的情况。图27示出了AAC的编码数据。AAC编码器具有增益控制单元402、滤波器组403、TNS 404、强度/耦合单元405、预测器406、M/S单元407、标度因数计算单元408、量化单元409、无噪音编码单元410、听觉模型单元411和比特流单元412。
AAC对应于在从8到96kHz中的12种采样频率,标准信道结构对应于从单声道到信道7的范围中的信道。可以指定在复用器信道中的扬声器的位置和数量,即,可以指定前信道的数量和后信道的数量,因此使得有可能处理更灵活的多信道结构。
按照AAC,三个简况(profile),即主简况、LC简况和SSR简况被根据一个应用要求的要求条件来准备。
主简况被提供用于最高的声音质量,预测器被用于向声音质量提供最高的优先级。
按照LC简况,为了获得在声音质量和成本之间的平衡,预测器被从主简况去除,并限制TNS的带宽和等级。
按照SSR简况,通过将4个分开的频带滤波器布置到MDCT的前面位置,通过选择一个再现带宽而降低了和最小化了用于不必要频带的MDCT的RAM的大小,并降低了解码标度。
增益控制单元402被仅仅用于SSR简况。输入的时间区域的信号被PQF频带滤波器划分成4个信号。除了最低频带的信号以外的信号被增益控制,因此抑制了前回波。
滤波器组403通过MDCT电路将输入的时间区域信号转换为频率区域的频谱数据。在将算术运算块长度每50%重叠的同时执行变换。例如,2048个样值被转换为1024个MDCT系数。为了抑制前述的前回波,使用了一种被称为块转换的机构,用于转换MDCT的算术运算块长度。每个帧的块长度被转换为长、开始、短和停止之一。
在主简况和LC简况中,在稳定信号的情况下,MDCT的算术运算长度被设置为2048样值的长、开始或停止,并被转换为1024个MDCT系数。另一方面,在瞬态信号的情况下,它被转换为128个MDCT系数作为256个样值的短块。在短块中,通过使用8个连续短转换长度而变换样值,输出的MDCT系数的数量被设置为1024以便与其他块的重合。
在SSR简况的情况下,由于通过PQF被划分为4个信号的信号被每个带宽变换,因此MDCT算术运算长度等于前述的值的1/4。但是,由于四个频带的MDCT系数的总数等于1024,因此它等于其他简况的。
TNS单元404将MDCT系数看作时间系列的信号,并允许它们通过LPC滤波器,因此将噪音集中到在时基上的大幅度的位置,并改进了低音调频率的信号的声音质量。
预测器406仅仅用于主简况中。编码器每个达到16kHz的MDCT系数具有预测器,并且编码预测的误差,因此改进了稳定信号的声音质量。
作为立体声编码,存在MS立体声、强度立体声和耦合。MS立体声是选择编码左右信道的模式或每个标度因数编码和(L+R)信号和差(L-R)信号的模式并编码它们的方法。可以改进位于左右信道的中心的信号的编码效率。强度立体声是通过使用特性编码左右信号的和信号和左右信道的功率比的方法,以便用户通过在高频的左右信号的功率的差来感觉到声源的位置。耦合可以实现称为画外音的方法,以便背景声音被编码为传统的多信道信号,并且背景声音被编码为耦合信号。强度/耦合单元405设置强度立体声和耦合。M/S单元407设置MS立体声。
图28示出了AAC的解码器。AAC解码器(图27)具有与在编码器中的增益控制单元402、滤波器组403、TNS 404、强度/耦合单元405、预测器406、M/S单元407、标度因数计算单元408、量化单元409、无噪音编码单元410、听觉模型单元411和比特流单元412对应的增益控制单元502、滤波器组503、TNS 404、强度/耦合单元505、预测器506、M/S单元507、标度因数计算单元508、反量化单元509、无噪音解码单元510和比特流分解单元512。
在AAC的情况下,在帧的首部提供了如图29所示的帧首标。作为帧首标有固定首标和可变首标。如图29A所示,固定首标包括12比特的同步字;1比特的ID;2比特的层;1比特的保护缺少;2比特的简况;4比特的采样频率指数;1比特的专用比特;3比特的信道配置;1比特的原始/复制和1比特的原点。
如图29B所示,可变首标包括1比特的版权标识比特;1比特的版权标识开始;13比特的帧长度、11比特的缓冲器充满度和2比特的早帧中的低数据的块数量。
在根据CD-ROM的规格按照MPEG2-PS记录AAC的数据的情况下,从扇区的首部到帧首标的范围的长度被设置为编码单元指针。可以通过使用示出从扇区的首部到帧首标的范围的长度的编码单元指针来迅速访问AAC的数据。
虽然在没有为ATRAC3的流提供首标的假设下说明了上述示例,但是对于ATRAC3的流也可以提供首标。在这种情况下,使用类似于另一种对于首标的编码方法的方式,从扇区的首部到帧首标的范围的长度将被记录为编码单元指针。
如上所述,按照本发明的实施例,通过使用在CD2流首标中说明的编码单元指针来访问任意一个扇区,并且可以从在扇区中存在的编码单元的首部容易地执行再现。
图30是示出在通过指定在快进模式、快退模式或搜索模式中的一个扇区而开始再现时候的访问控制的流程图。
在图30中,当指定扇区和开始再现的时候(步骤S1),光头37访问在光盘1上的指定扇区(步骤S2)。
是否已经完成对指定扇区的访问被识别(步骤S3)。如果确定已经完成了访问,则从这个扇区的首部读出数据,并读出CD2流首标的编码单元指针的信息(步骤S4)。
当读出编码单元指针的信息的时候,从由编码单元指针所示的位置上的编码单元的数据开始解码,并再现数据(步骤S5)。
当持续执行再现的时候(步骤S6),是否再现被完成被识别(步骤S7)。如果还没有完成再现,则再现被继续执行。如果完成再现,则在此结束再现。
在本发明的实施例中,编辑ID被插入CD2流中。在编辑的时候,可以利用编辑ID来执行有效的编辑。
例如,如图31所示,执行编码以便断开扇区(2)和(3)的连接、以便断开扇区(7)和(8)的连接、并连接扇区(2)和(8)。
编辑被以电子方式执行。作为一种编辑方法,存在在光盘1上完全重写数据的方法和控制再现顺序而不在光盘1上重写数据的方法。
在图31的情况下,由于记录在扇区(2)中的最后一个编码单元(14)已经被记录到扇区(2)和(3),如果断开扇区(2)和(3)的连接,则数据变得不完整。在这个情况下,在CD2流首标中的编辑ID中说明指示终点的编辑ID。此时,也可以在编码单元(14)的部分装入填充。
因为已经在扇区(7)和(8)上记录了在扇区(8)中记录的第一编码单元(47),如果断开扇区(7)和(8)的连接,则数据变得不完整。在这个情况下,在CD2流首标中的编辑ID中说明指示起点的编辑ID。在数据区域的开始描述填充长度。
如果连接了扇区(2)和(8),当解码扇区(2)的时候,作为一个完整编码单元的直到编码单元(13)的数据被再现,并且编码单元(14)的部分被越过。在扇区(8)的开始存在的不完整编码单元(47)被越过,并且从作为完整编码单元的编码单元(48)开始再现。
图32是示出在编辑时的处理的流程图。在图32中,如果以扇区为单位指定一个终点(步骤S11),则识别是否编辑点是终点或起点(步骤S12)。
如果确定编辑点是终点,则向在扇区中的最后一个不完整编码单元插入填充(步骤S13)。在CD2流首标的填充ID中说明在反向位置存在的填充,并且在数据的最后说明填充长度(步骤S14)。同时,在比较ID中说明示出终点的信息(步骤S15)。是否已经完成了比较被识别(步骤S16)。
如果在步骤S12确定编辑点是起点,则在扇区中的第一个不完整编码单元插入填充(步骤S17)。在CD2流首标的填充ID中说明示出填充存在于前向位置的信息,并且在数据的开始说明填充长度(步骤S18)。同时,在编辑ID中说明示出起点的信息(步骤S19)。是否已经完成了编辑被识别(步骤S16)。
在步骤S16,识别是否已经完成了编辑处理。类似的处理被重复直到结束编辑处理。
在这个示例中,虽然填充数据已经被插入到不完整编码单元中,但是也可能使得不执行填充。
图33示出了如上所述在再现编辑点时的处理。在图33中,读取CD2流首标的编辑ID(步骤S21)。是否是编辑点被识别(步骤S22)。如果是编辑点,则识别是否是终点或起点(步骤S23)。
如果在步骤S23确定编辑点是终点,则执行再现直到完整编码单元,最后的不完整编码单元被越过(步骤S24),连续再现被执行(步骤S25)。
如果在步骤S23确定编辑点是起点,则读出编码单元指针(步骤S26)。从由编码单元指针指定的编码单元开始再现(步骤S27),并且执行连续再现(步骤S25)。
是否再现已经完成被识别(步骤S28)。处理继续直到完成再现。
虽然在前述的示例中已经填充了不完整编码单元,但是有可能在编辑的时候在每个扇区中执行直到编码单元的边界的填充。即,编辑点被设置到编码单元的边界。因为CD2流首标知道第一完整编码单元的位置,因此在每个扇区中的编码单元的边界是已知的。如果编辑点被假设为编码单元的饿边界,当连接编辑点的时候,它们在编码单元的边界被连接。在编辑后,可以执行连续的再现。
在上述示例中,扇区的完整编码单元的首部的位置已经被设置到编码单元指针。但是,如果它被设置到在扇区中存在的所期望的一个完整编码单元的位置而不是扇区的所述完整编码单元的位置,则有可能以编码单元为单位指定再现位置或编辑。
即,按照CD-ROM模式1的规格,访问单元是扇区,并且通常不可能在扇区中指定编码单元和再现。但是,如果在扇区中存在的所期望的一个完整编码单元的位置是由编码单元指针预先说明的,则有可能指定和访问在扇区中的所期望的编码单元。这个方法在执行严格的编辑的时候尤其有效。
在前述的示例中,分组首标被设置为14字节的固定值,PES首标被设置为14字节的固定值,CD2流首标被设置为4字节的固定值,一个分组的数据被设置为2016字节。因此,在PES首标中的PES分组长度(PES_packet_length)等于2028字节。由此,也可能在PES分组中检测PES分组长度、识别是否它的值等于2028字节,并使用识别是否光盘是CD2光盘的识别结果。
虽然在上述示例中CD2流首标已经被设置为4字节,但是不限于首标的这个长度。但是,如果CD2流首标被设置为4字节,则一个分组的数据长度等于2016字节,这个值是8的倍数。例如,在诸如DES或三重DES的块加密中,以8字节为单位执行加密。假定一个分组的数据长度是2016字节,一个分组的数据是8字节的倍数,并且它在加密中更可取。
在上述示例中,当执行填充的时候,执行前向填充和反向填充。但是,也可以仅仅执行前向填充或反向填充。
在上述示例中,已经提供了示出是否已经对CD2流首标执行填充的填充ID,并且已经在数据的反向11比特中说明填充长度(在反向填充的情况下)。但是,如果填充长度等于“0”,则可有能限定填充不执行。因此,有可能形成一种模式,使得不提供CD2流首标的填充ID而仅仅描述填充长度。
而且,也有可能执行三种填充,包括前向填充、反向填充和前向反向双向填充。
虽然在前面的说明中解释了编码音频数据的情况,本发明在编码图像的时候也有效。在MPEG2的图像中,虽然它包括例如序列层、GOP层、画面层、限幅层(slice layer)、宏块层和块层,但是作为可变编码的单位的限幅层或画面层可以被作为一个编码单元。
虽然在上面的说明中按照CD-ROM如上所述已经被分组化和形成为分组数据的数据被记录到CD2的光盘上,本发明在发送数据的情况下也有效。例如,如果使得如上所述已经被分组化和形成为分组数据的数据可以通过网络被分布,则当数据被下载和记录到光盘上用于按照CD-ROM记录的时候它是适合的。
按照本发明,当编码的内容数据被每预定长度划分、首标被加上、数据被分组化、首标被进一步加上因此形成分组数据、并且数据被记录到记录介质上——所述记录介质被划分成预定长度的扇区并且可以以扇区为单位被访问——的时候,编码单元被填充和记录到每个分组,并且由指针示出在扇区的首部存在的完整编码单元的位置。如上所述,如果在从扇区的分组数据的首部到作为完整编码单元的编码单元的首部的范围的长度被记录为一个编码单元指针,当访问扇区的时候,可以从编码单元指针的值知道从扇区的首部起的作为完整编码单元的编码单元的位置,以便可以从编码单元的首部立即开始解码。如果按照固定的长度确定编码单元,则可以通过扇区编号指定到完整编码单元的首部的长度。因此,即使通过搜索从内容的中间再现或编辑数据,也不丢失编码单元的首部,并且可以执行解码处理。
产业上的应用如上所述,本发明当被用作数据记录方法和装置和数据再现方法和装置的时候是适用的,所述数据记录方法和装置和数据再现方法和装置用于向记录介质记录/从记录介质再现内容的数据,所述记录介质诸如被划分为预定长度的扇区和可以以扇区为单位被访问的CD2光盘,本发明当被用作在上述的记录介质中记录内容数据的数据记录方法和装置、数据编辑方法和装置、数据记录介质的时候也是适用的。
权利要求
1.一种数据记录方法,用于向一个记录介质记录内容数据,所述记录介质被划分成预定长度的扇区并可以以扇区为单位来被访问,所述方法包括步骤以每个预定的长度划分编码的内容数据,增加一个首标和分组化;进一步增加一个首标给分组以便形成分组数据;将已经被分组化并进一步形成分组数据的数据记录到对应于扇区的记录介质上的每个扇区中;并且当编码内容数据被以每个预定长度划分并被分组化的时候,向所述分组的首标记录指示在多个编码单元中一个所期望的编码单元的首部位置的信息,所述多个编码单元被安排在每个分组中。
2.按照权利要求1的数据记录方法,其中所述所期望的编码单元的首部位置是在所述多个编码单元中的一个任意完整编码单元的首部位置,所述多个编码单元被安排所述分组的每个中。
3.按照权利要求1的数据记录方法,其中所述所期望的编码单元的首部位置是在所述多个编码单元中的第一个完整编码单元的首部位置,所述多个编码单元被安排在所述分组的每个中。
4.按照权利要求1的数据记录方法,其中指示所述所期望的编码单元的首部位置的信息是在从扇区或分组的首部到所述所期望的编码单元的首部位置的范围中的长度。
5.按照权利要求1的数据记录方法,其中指示所述所期望的编码单元的首部位置的信息是在从扇区或分组的首部到一个所期望的帧的帧首标的范围中的长度。
6.按照权利要求1的数据记录方法,其中当通过向一个组设置预定数量的扇区而增加扇区编号的时候,指示所述所期望的编码单元的首部位置的信息是在所述组中的扇区编号。
7.按照权利要求1的数据记录方法,其中向所述扇区记录已经按照CD-ROM分组和形成为分组数据的数据。
8.按照权利要求1的数据记录方法,其中所述分组化和所述分组数据建立符合MPEG(活动图像专家组)-PS(程序流)。
9.按照权利要求1的数据记录方法,其中所述内容数据被按照ATRAC(自适应变换声音编码)、ATRAC2或ATRAC3编码。
10.按照权利要求1的数据记录方法,其中所述内容数据被按照MP3(MPEG1音频层-3)编码。
11.按照权利要求1的数据记录方法,其中所述内容数据被按照AAC(MPEG2高级音频编码)编码。
12.一种数据记录装置,用于向一个记录介质记录内容数据,所述记录介质被划分成预定长度的扇区并可以以扇区为单位来被访问,所述数据记录装置包括用于以每个预定的长度划分编码的内容数据、增加一个首标和分组化的装置;用于进一步增加一个首标给分组以便形成分组数据的装置;用于将已经被分组化并进一步形成分组数据的数据记录到对应于扇区的记录介质上的每个扇区中的装置;以及用于当编码内容数据被以每个预定长度划分并被分组化的时候,向分组的首标记录指示在多个编码单元中一个所期望的编码单元的首部位置的信息的装置,所述多个编码单元被安排在每个分组中。
13.按照权利要求12的数据记录装置,其中所述所期望的编码单元的首部位置是在所述多个编码单元中的一个任意完整编码单元的首部位置,所述多个编码单元被安排所述分组的每个中。
14.按照权利要求12的数据记录装置,其中所述所期望的编码单元的首部位置是在所述多个编码单元中的第一个完整编码单元的首部位置,所述多个编码单元被安排所述分组的每个中。
15.按照权利要求12的数据记录装置,其中指示所述所期望的编码单元的首部位置的信息是在从扇区或分组的首部到所述所期望的编码单元的首部位置的范围中的长度。
16.按照权利要求12的数据记录装置,其中指示所述所期望的编码单元的首部位置的信息是在从扇区或分组的首部到一个所期望的帧的帧首标的范围中的长度。
17.按照权利要求12的数据记录装置,其中当通过向一个组设置预定数量的扇区而增加扇区编号的时候,指示所述所期望的编码单元的首部位置的信息上在所述组中的扇区编号。
18.按照权利要求12的数据记录装置,其中向所述扇区记录已经按照CD-ROM分组和形成为分组数据的数据。
19.按照权利要求12的数据记录装置,其中所述分组化和所述分组数据建立符合MPEG(活动图像专家组)-PS(程序流)。
20.按照权利要求12的数据记录装置,其中所述内容数据被按照ATRAC(自适应变换声音编码)、ATRAC2或ATRAC3编码。
21.按照权利要求12的数据记录装置,其中所述内容数据被按照MP3(MPEG1音频层-3)编码。
22.按照权利要求12的数据记录装置,其中所述内容数据被按照AAC(MPEG2高级音频编码)编码。
23.一种数据再现方法,用于从一个数据记录介质再现内容数据,所述数据记录介质被划分成预定长度的多个扇区并可以以该扇区为单位被访问,并且其上记录了所述内容数据,其中在所述数据记录介质上,以每个预定的长度划分编码的内容数据,增加一个首标和将数据分组;进一步增加一个首标给分组以便形成分组数据;将已经被分组化并进一步形成分组数据的数据记录到对应于扇区的所述记录介质上的每个扇区中;当编码内容数据被以每个预定长度分组的时候,向分组的首标记录指示在多个编码单元中一个所期望的编码单元的首部位置的信息,所述多个编码单元被安排在每个分组中;所述数据再现方法包括步骤访问和再现所述数据记录介质的每个扇区;当访问在所述记录介质上的一个所期望的扇区的时候,根据从分组首标的信息获得的并示出所期望的编码单元的首部位置的信息,设置用于在所述扇区中开始再现的一个位置。
24.按照权利要求23的数据再现方法,其中所述所期望的编码单元的首部位置是在所述多个编码单元中的一个任意完整编码单元的首部位置,所述多个编码单元被安排所述分组的每个中。
25.按照权利要求23的数据再现方法,其中所述所期望的编码单元的首部位置是在所述多个编码单元中的第一个完整编码单元的首部位置,所述多个编码单元被安排所述分组的每个中。
26.按照权利要求23的数据再现方法,其中指示所述所期望的编码单元的首部位置的信息是在从扇区或分组的首部到所述所期望的编码单元的首部位置的范围中的长度。
27.按照权利要求23的数据再现方法,其中指示所述所期望的编码单元的首部位置的信息是在从扇区或分组的首部到一个所期望的帧的帧首标的范围中的长度。
28.按照权利要求23的数据再现方法,其中当通过向一个组设置预定数量的扇区而增加扇区编号的时候,指示所述所期望的编码单元的首部位置的信息上在所述组中的扇区编号。
29.按照权利要求23的数据再现方法,其中向所述扇区记录已经按照CD-ROM分组和形成为分组数据的数据。
30.按照权利要求23的数据再现方法,其中所述分组化和所述分组数据建立符合MPEG(活动图像专家组)-PS(程序流)。
31.按照权利要求23的数据再现方法,其中所述内容数据被按照ATRAC(自适应变换声音编码)、ATRAC2或ATRAC3编码。
32.按照权利要求23的数据再现方法,其中所述内容数据被按照MP3(MPEG1音频层-3)编码。
33.按照权利要求23的数据再现方法,其中所述内容数据被按照AAC(MPEG2高级音频编码)编码。
34.一种数据再现装置,用于从一个数据记录介质再现内容数据,所述数据记录介质被划分成预定长度的多个扇区并可以以该扇区为单位被访问,并且其上记录了所述内容数据,其中在所述数据记录介质上,以每个预定的长度划分编码的内容数据,增加一个首标和将数据分组;进一步增加一个首标给分组以便形成分组数据;将已经被分组化并进一步形成分组数据的数据记录到对应于扇区的所述记录介质上的每个扇区中;当编码内容数据被以每个预定长度分组的时候,向分组的首标记录指示在多个编码单元中一个所期望的编码单元的首部位置的信息,所述多个编码单元被安排在每个分组中;所述数据再现装置包括用于访问和再现所述数据记录介质的每个扇区的装置;用于当访问在所述记录介质上的一个所期望的扇区的时候、根据从分组首标的信息获得的并示出所期望的编码单元的首部位置的信息,设置用于在所述扇区中开始再现的一个位置的装置。
35.按照权利要求34的数据再现装置,其中所述所期望的编码单元的首部位置是在所述多个编码单元中的一个任意完整编码单元的首部位置,所述多个编码单元被安排在所述分组的每个中。
36.按照权利要求34的数据再现装置,其中所述所期望的编码单元的首部位置是在所述多个编码单元中的第一个完整编码单元的首部位置,所述多个编码单元被安排在所述分组的每个中。
37.按照权利要求34的数据再现装置,其中指示所述所期望的编码单元的首部位置的信息是在从扇区或分组的首部到所述所期望的编码单元的首部位置的范围中的长度。
38.按照权利要求34的数据再现装置,其中指示所述所期望的编码单元的首部位置的信息是在从扇区或分组的首部到一个所期望的帧的帧首标的范围中的长度。
39.按照权利要求34的数据再现装置,其中当通过向一个组设置预定数量的扇区而增加扇区编号的时候,指示所述所期望的编码单元的首部位置的信息是在所述组中的扇区编号。
40.按照权利要求34的数据再现装置,其中向所述扇区记录已经按照CD-ROM分组和形成为分组数据的数据。
41.按照权利要求34的数据再现装置,其中所述分组化和所述分组数据建立符合MPEG2-PS。
42.按照权利要求34的数据再现装置,其中所述内容数据被按照ATRAC(自适应变换声音编码)、ATRAC2或ATRAC3编码。
43.按照权利要求34的数据再现装置,其中所述内容数据被按照MP3(MPEG1音频层-3)编码。
44.按照权利要求34的数据再现装置,其中所述内容数据被按照AAC(MPEG2高级音频编码)编码。
45.一种数据编辑方法,用于编辑记录在一个记录介质上的内容数据,所述数据记录介质被划分成预定长度的多个扇区并可以以该扇区为单位被访问,其中在所述数据记录介质上,以每个预定的长度划分编码的内容数据,增加一个首标和将数据分组;进一步增加一个首标给分组以便形成分组数据;将已经被分组化并进一步形成分组数据的数据记录到对应于扇区的所述记录介质上的每个扇区中;当编码内容数据被以每个预定长度分组的时候,向分组的首标记录指示在多个编码单元中一个所期望的编码单元的首部位置的信息,所述多个编码单元被安排在每个分组中;所述数据编辑方法包括步骤当一系列所述内容数据被编辑的时候,向扇区的首标记录指示编辑点的信息;当从首标检测到指示编辑点的信息的时候,根据从分组首标的信息获得的并示出所期望的编码单元的首部位置的信息,设置用于在所述扇区中开始再现的一个位置。
46.按照权利要求45的数据编辑方法,其中指示所述编辑点的信息包括示出是否所述编辑点是当编辑内容数据的时候的起点或终点的信息,当所述编辑点是所述终点的时候,在所述分组的所述多个编码单元中的一个不完整的编码单元的数据被越过,当所述编辑点是所述起点的时候,从基于下述信息的位置开始再现,所述信息是从所述分组的首标的信息获得的并示出了所期望的编码单元的首部位置。
47.一种数据编辑装置,用于编辑记录在一个记录介质上的内容数据,所述数据记录介质被划分成预定长度的多个扇区并可以以扇区为单位被访问,其中在所述数据记录介质上,以每个预定的长度划分编码的内容数据,增加一个首标和将数据分组;进一步增加一个首标给分组以便形成分组数据;将已经被分组化并进一步形成分组数据的数据记录到对应于扇区的所述记录介质上的每个扇区中;当编码内容数据被以每个预定长度分组的时候,向分组的首标记录指示在多个编码单元中一个所期望的编码单元的首部位置的信息,所述多个编码单元被安排在每个分组中;所述数据编辑装置包括用于当一系列内容数据被编辑的时候、向扇区的首标记录指示编辑点的信息的装置;用于当从首标检测到指示编辑点的信息的时候、根据从分组首标的信息获得的并示出所期望的编码单元的首部位置的信息,设置用于在所述扇区中开始再现的一个位置的装置。
48.按照权利要求47的数据编辑装置,其中指示所述编辑点的信息包括示出是否所述编辑点是当编辑内容数据的时候的起点或终点的信息,当所述编辑点是所述终点的时候,在所述分组的所述多个编码单元中的一个不完整的编码单元的数据被越过,当所述编辑点是所述起点的时候,从基于下述信息的位置开始再现,所述信息是从所述分组的首标的信息获得的并示出了所期望的编码单元的首部位置。
49.一种数据记录介质,所述数据记录介质被划分成预定长度的多个扇区并可以以该扇区为单位被访问,并且其上记录了所述内容数据,其中以每个预定的长度划分编码的内容数据,增加一个首标和将数据分组;进一步增加一个首标给分组以便形成分组数据;将已经被分组化并进一步形成分组数据的数据记录到对应于扇区的所述记录介质上的每个扇区中;当编码内容数据被以每个预定长度分组的时候,向分组的首标记录指示在多个编码单元中一个所期望的编码单元的首部位置的信息,所述多个编码单元被安排在每个分组中。
50.按照权利要求49的数据记录介质,其中所述所期望的编码单元的首部位置是在所述多个编码单元中的一个任意完整编码单元的首部位置,所述多个编码单元被安排在所述分组的每个中。
51.按照权利要求49的数据记录介质,其中所述所期望的编码单元的首部位置是在所述多个编码单元中的第一个完整编码单元的首部位置,所述多个编码单元被安排在所述分组的每个中。
52.按照权利要求49的数据记录介质,其中指示所述所期望的编码单元的首部位置的信息是在从扇区或分组的首部到所述所期望的编码单元的首部位置的范围中的长度。
53.按照权利要求49的数据记录介质,其中指示所述所期望的编码单元的首部位置的信息是在从扇区或分组的首部到一个所期望的帧的帧首标的范围中的长度。
54.按照权利要求49的数据记录介质,其中当通过向一个组设置预定数量的扇区而增加扇区编号的时候,指示所述所期望的编码单元的首部位置的信息是在所述组中的扇区编号。
55.按照权利要求49的数据记录介质,其中向所述扇区记录已经按照CD-ROM分组和形成为分组数据的数据。
56.按照权利要求49的数据记录介质,其中所述分组化和所述分组数据建立符合MPEG(活动图像专家组)-PS(程序流)。
57.按照权利要求49的数据记录介质,其中所述内容数据被按照ATRAC(自适应变换声音编码)、ATRAC2或ATRAC3编码。
58.按照权利要求49的数据记录介质,其中所述内容数据被按照MP3(MPEG1音频层-3)编码。
59.按照权利要求49的数据记录介质,其中所述内容数据被按照AAC(MPEG2高级音频编码)编码。
60.一种数据记录介质,所述数据记录介质被划分成预定长度的多个扇区并可以以该扇区为单位被访问,并且其上记录了所述内容数据,其中以每个预定的长度划分编码的内容数据,增加一个首标和将数据分组;进一步增加一个首标给分组以便形成分组数据;将已经被分组化并进一步形成分组数据的数据记录到对应于扇区的所述记录介质上的每个扇区中;当编码内容数据被以每个预定长度分组的时候,向分组的首标记录指示在多个编码单元中一个所期望的编码单元的首部位置的信息,所述多个编码单元被安排在每个分组中,当编辑一系列内容数据的时候,记录指示编辑点的信息。
61.按照权利要求60的数据记录介质,其中指示所述编辑点的信息包括示出是否所述编辑点是当编辑所述内容数据的时候的起点或终点的信息。
全文摘要
当编码的内容数据被每预定长度划分、首标被加上、数据被分组化、首标被进一步加上因此形成分组数据、并且数据被记录到记录介质上,该记录介质被划分成多个扇区并且可以以扇区为单位被访问,编码单元被填充和记录到每个分组,并且由指针示出在扇区的首部存在的完整编码单元的位置。如果使用指针,则会知道作为完整编码单元的编码单元的位置,以便可以立即从编码单元的首部开始解码。如果按照固定的长度来确定编码单元,则可以由扇区编号指定直到完整编码单元的首部的长度。
文档编号G11B27/30GK1463434SQ02801930
公开日2003年12月24日 申请日期2002年4月15日 优先权日2001年4月19日
发明者佐古曜一郎, 风见进一, 猪口达也 申请人:索尼公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1