记录设备、记录方法和记录介质的制作方法

文档序号：6749716阅读：168来源：国知局

专利名称：记录设备、记录方法和记录介质的制作方法
技术领域：
本发明涉及使得将会改善可访问性和编辑效率的一种记录设备、一种记录方法和一种记录介质。
近年来，随着多媒体系统的软件程序的发展，“快时”(QuickTime)软件已为人所知。“快时”是一种允许处理随时间变化数据(这种数据被称为电影数据)的软件程序。电影含有运动图像、声音和文本。当前，“快时”文件格式可用于苹果(Apple)公司的Macintosh平台。“快时”文件格式是MPEG-1(运动图像专家组阶段1)程序流文件存储格式，该格式是视频基本流和音频基本流按时间进行复用的。在这种存储格式中，整个MPEG-1文件(即，一个整个封闭的场景)被处理为一个“快时”文件格式的样品，而不考虑其持续期的长短。这样，一个大的样品被处理为一个大的程序块(chunk)。
此外，音频数据和视频数据按“快时”文件格式一起被存储在一个轨道(或一个介质)上。作为代表含在大样品或大程序块中的这种数据部分的一种新的介质类型已经被定义为MPEG介质(MPEG Media)。
但是，含在大样品中的特定类型数据的可访问性与编辑效率变坏了。为了使计算机再现和编辑“快时”电影文件，记录在具有内置摄像机(camera)的便携记录和再现设备的记录介质(例如，光盘)上的视频数据和音频数据可以被变换为“快时”文件格式。在这种情况下，特定类型数据的可访问性和编辑效率将被进一步改善。这个问题适用于记录和再现设备的音频数据，以及记录和再现设备的视频数据。
因此，本发明的目的是提供一种记录设备、一种记录方法和一种记录介质，允许在具有对应诸如“快时”之类的多媒体数据文件格式的数据记录到记录介质上的情况下改善可访问性和编辑效率。
本发明的第一个方面是一种用于将视频数据记录到记录介质上的记录设备，该设备包括编码装置，用于对应于作为帧间预测编码处理与运动补偿处理的组合的压缩编码处理而按多帧群结构编码视频数据；变换装置，用于变换从编码装置输出的编码视频数据的数据结构为不用专门的硬件部分就可以由计算机软件程序处理的文件结构，使得运动图像等被同步地再现；和记录装置，用于记录具有所述文件结构的数据到记录介质上，其中所述文件结构具有第一数据单元和第二数据单元，该第二数据单元是一组第一数据单元，并且，其中至少一种数据结构是与第一数据单元匹配的。
本发明的第二方面是一种用于将视频数据记录到可重写光盘上的记录设备，该设备包括编码装置，用于对应于一种压缩编码处理而编码视频数据；变换装置，用于变换从编码装置输出的编码视频数据的数据结构为不用专门的硬件部分就可以由计算机软件程序处理的文件结构，以使运动图像等可以被同步地再现；记录装置，用于记录具有所述文件结构的数据到光盘上，其中所述文件结构具有第一数据单元和第二数据单元，该第二数据单元是一组第一单元，并且，其中所述第二数据单元是与写入光盘的数据的连续记录长度相匹配的。
本发明的第三个方面是一种用于将音频数据记录到可重写光盘上的记录设备，该设备包括变换装置，用于变换音频数据或编码的音频数据的数据结构为不用专门硬件部分就可以由计算机软件程序处理的文件结构，使得运动图像等被同步地再现；和记录装置，用于记录具有所述文件结构的数据到光盘上，其中所述文件结构具有第一数据单元和第二数据单元，该第二数据单元是是一组第一数据单元，并且，其中所述第二数据单元是与写入到光盘上的数据的连续记录长度相匹配的。
本发明的第四个方面是一种用于将视频数据和音频数据记录到记录介质上的记录设备，该设备包括编码装置，用于对应于作为帧间预测编码处理与运动补偿处理的组合的压缩编码处理而按多帧群结构编码视频数据；音频输出装置，用于输出经压缩编码或非压缩的音频数据；用于变换从视频编码装置输出的编码的视频数据和从音频输出装置输出的音频数据的数据结构为不用专门的硬件部分就可以由计算机软件程序处理的文件结构的装置，使得运动图像等被同步地再现，并且复用具有该文件结构的编码的视频数据和音频数据；和记录装置，用于记录被复用的具有所述文件结构的数据到记录介质上，其中所述文件结构具有第一数据单元和第二数据单元，并且，其中编码视频数据的至少一种数据结构是与第一数据单元相匹配的。
本发明的第五个方面是一种用于将视频数据和音频数据记录到可重写光盘上的记录设备，该设备包括编码装置，用于对应于作为帧间预测编码处理与运动补偿处理的组合的压缩编码处理而按多帧群结构编码视频数据；音频输出装置，用于输出经压缩编码或非压缩的音频数据；用于变换从视频编码装置输出的编码的视频数据和从音频输出装置输出的音频数据的数据结构为可以不用专门的硬件部分就可以由计算机软件程序处理的文件结构的装置，使得运动图像等被同步地再现，并且复用具有该文件结构的编码的视频数据和音频数据；和记录装置，用于记录被复用的具有所述文件结构的数据到光盘上，其中所述文件结构具有第一数据单元和第二数据单元，该第二数据单元是一组第一数据单元，并且，其中所述第二数据单元是与连续写入光盘的数据的连续记录长度相匹配。
本发明的第六个方面是一种用于将视频数据记录到记录介质上的记录方法，该方法包括以下步骤对应于作为帧间预测编码处理与运动补偿处理的组合的压缩编码处理而按多帧群结构编码视频数据；变换编码的视频数据的数据结构为不用专门的硬件部分就可以由计算机软件程序处理的文件结构，使得运动图像等被同步地再现；并且记录具有所述文件结构的数据到记录介质上，其中所述文件结构具有第一数据单元和第二数据单元，该第二数据单元是一组第一数据单元，并且，其中至少一种数据结构是与第一数据单元相匹配的。
本发明的第七个方面是一种用于将视频数据记录到可重写光盘上的记录方法，该方法包括以下步骤对应于一种压缩编码处理而编码视频数据；变换该编码的视频数据为不用专门的硬件部分就可以由计算机软件程序处理的文件结构，使得运动图像等被同步地再现；并且记录具有所述文件结构的数据到光盘上，其中所述文件结构具有第一数据单元和第二数据单元，该第二数据单元是一组第一数据单元，并且，其中所述第二数据单元是与写入光盘的数据的连续记录长度相匹配的。
本发明的第八个方面是一种用于将音频数据记录到可重写光盘上的记录方法，该方法包括以下步骤变换音频数据或编码的音频数据的数据结构为不用专门的硬件部分就可以由计算机软件程序处理的文件结构，使得运动图像等被同步地再现；并且记录具有所述文件结构的数据到光盘上，其中所述文件结构具有第一数据单元和第二数据单元，该第二数据单元是一组第一数据单元，并且，其中所述第二数据单元是与被连续地写入光盘的数据记录长度相匹配的。
本发明的第九个方面是一种用于将视频数据和音频数据记录到记录介质上的记录方法，该方法包括以下步骤用于对应于作为帧间预测编码处理与运动补偿处理的组合的压缩编码处理而按多帧群结构编码视频数据；输出经压缩编码或非经压缩编码的音频数据；变换编码的视频数据和音频数据的数据结构为不用专门的硬件部分就可以由计算机软件程序处理的文件结构，使得运动图像等被同步地再现，并且复用具有该文件结构的编码的视频数据和音频数据；和记录复用的具有所述文件结构的数据到记录介质上，其中所述文件结构具有第一数据单元和第二数据单元，该第二数据单元是一组第一数据单元，并且，其中编码视频数据的至少一种数据结构是与第一数据单元相匹配的。
本发明的第十个方面是一种用于将视频数据和音频数据记录到可重写光盘上的记录方法，该方法包括以下步骤对应于作为帧间预测编码处理与运动补偿处理的组合的压缩编码处理而按多帧群结构编码视频数据；输出经压缩编码的或者经非压缩编码的音频数据；变换编码的视频数据和音频数据的数据结构为不用专门的硬件部分就可以由计算机软件程序处理的文件结构，使得运动图像等被同步地再现，并复用具有该文件结构的编码视频数据和音频数据；并且记录经复用的具有所述文件结构的数据到光盘上，其中所述文件结构具有第一数据单元和第二数据单元，该第二数据单元是一组第一数据单元，并且，其中所述第二数据单元是与连续写入光盘的数据的连续记录长度相匹配的。
本发明的第十一个方面是一种在其上记录了程序的记录介质，该程序用于将视频数据记录到记录介质上，该程序使得计算机执行以下各个步骤对应于作为帧间预测编码处理与运动补偿处理的组合的压缩编码处理而以多帧群结构编码视频数据；变换编码的视频数据的数据结构为不用专门的硬件部分就可以由计算机软件程序处理的文件结构，使得运动图像等被同步地再现；并且记录具有所述文件结构的记录数据到记录介质上，其中所述文件结构具有第一数据单元和第二数据单元，该第二数据单元是一组第一数据单元，并且，至少一种数据结构是与第一数据单元相匹配的。
本发明的第十二个方面是一种在其上记录了程序的记录介质，该程序用于将视频数据记录到可重写光盘上，该程序使得计算机执行以下各个步骤对应于一种压缩编码处理而编码视频数据；变换编码的视频数据的数据结构为不用专门的硬件部分就可以由计算机软件程序处理的文件结构，使得运动图像等被同步地再现；并且记录具有所述文件结构的数据到光盘上，其中所述文件结构具有第一数据单元和第二数据单元，该第二数据单元是一组第一数据单元，并且，其中所述第二数据单元是与写入光盘的数据的连续记录长度相匹配的。
本发明的第十三个方面是一种在其上记录了程序的记录介质，该程序用于将音频数据记录到可重写光盘上，该程序使得计算机执行以下各个步骤变换音频数据或编码的音频数据的数据结构为不用专门的硬件部分就可以由计算机软件程序处理的文件结构，使得运动图像等被同步地再现；并且记录具有所述文件结构的记录数据到光盘上，其中所述文件结构具有第一数据单元和第二数据单元，该第二数据单元是一组第一数据单元，并且，其中所述第二数据单元是与写入光盘的数据的连续记录长度相匹配的。
本发明的第十四个方面是一种在其上记录了程序的记录介质，该程序用于将视频数据和音频数据到可重写光盘上，该程序使得计算机执行以下各个步骤对应于作为帧间预测编码处理与运动补偿处理的组合的压缩编码处理而按多帧群结构编码视频数据；输出经压缩编码的或非压缩的音频数据；变换编码的视频数据和音频数据的数据结构为不用专门的硬件部分就可以由计算机软件程序处理的文件结构，使得运动图像等被同步地再现，并且复用编码的具有所述文件结构的视频数据和音频数据；和记录经复用的具有所述文件结构的数据到记录介质上，其中所述文件结构具有第一数据单元和第二数据单元，该第二数据单元是一组第一数据单元，并且，其中编码视频数据的至少一种数据结构是与第一数据单元相匹配的。
本发明的第十五个方面是一种在其上记录了程序的记录介质，该程序用于将视频数据和音频数据记录到可重写光盘上，该程序使得计算机执行以下步骤对应于作为帧间预测编码处理与运动补偿处理的组合的压缩编码处理而按多帧群结构编码视频数据；输出经压缩编码的或经非压缩编码的音频数据；变换编码的视频数据和音频数据的数据结构为不用专门的硬件部分就可以由计算机软件程序处理的文件结构，使得运动图像等被同步地再现并复用编码的具有该文件结构的视频数据和音频数据；并且记录经复用的具有所述文件结构的数据到光盘上，其中所述文件结构具有第一数据单元和第二数据单元，该第二数据单元是一组第一数据单元，并且，其中所述第二数据单元是与被连续写入光盘的数据的连续记录长度相匹配的。
按照本发明，因为在MPEG压缩视频信号中至少一个GOP对应于诸如“快时”文件的一个数据单元，多种数据类型的每种都可以进行访问和编辑。当具有一种文件结构的数据被记录到光盘上时，因为连续记录长度对应于第二数据单元(例如，“快时”的一个程序块)，因而可以改善可访问性和编辑效率。
本发明的专利申请具有以下美国专利作为其现有专利技术。
(1)美国专利 No.4,945,475(2)美国专利 No.5,253,053(3)美国专利 No.5,652,879通过下面对于如附图所示的本发明的最佳实施例的详细描述，本发明的这些目的、特点和优点就变得更加清楚。

图1是表示本发明的一个实施例的结构方框图；图2是表示按照本发明的“快时”文件格式的例子示意图。
图3A和3B是用于解释按照本发明的实施例的GOP与“快时”文件格式之间关系的示意图；图4A和4B是用于解释按照本发明的实施例的经压缩编码的音频与“快时”文件格式之间关系的示意图；图5A和5B是用于解释按照本发明的实施例的另一个例子的经压缩编码的音频与“快时”文件格式之间关系的示意图；图6A、6B、6C和6D是用于解释按照本发明的实施例的MPEG视频的GOP与“快时”文件格式之间关系的示意图；图7A、7B、7C和7D是用于解释按照本发明的实施例的经压缩编码的音频与“快时”文件格式之间关系的示意图；图8是用于解释按照本发明的实施例的光盘记录方法的例子的示意图；图9是用于解释按照本发明的实施例的另一个光盘记录方法例子的示意图。
接下来，将参照各个附图描述本发明的一个实施例。图1表示按照本发明的数字记录和再现设备的结构。如图1所示，输入视频信号被馈送到视频编码器1。视频编码器1压缩编码该视频信号。此外，输入音频信号被馈送到音频编码器2。音频编码器2压缩编码该音频信号。用于视频信号和音频信号的压缩编码方法例如是MPEG。视频编码器1和音频编码器2的输出信号被称为基本流。
当使用MPEG时，视频编码器1包括运动预测部分、图像序列重排部分、减法部分、DCT部分、量化部分、可变长度码编码部分和缓冲存储器。运动预测部分检测一个运动矢量。减法部分形成一个输入图像信号与本地解码的图像信号之间的预测误差。DCT部分对应于DCT方法变换减法部分的输出信号。量化部分量化DCT部分的输出信号。可变长度编码部分编码量化部分的输出信号为具有可变长度的信号。缓冲存储器按恒定的数据速率输出编码的数据。图像序列重排部分对应于编码处理重排各个图像的序列。换言之，图像序列重排部分重排各个图像的序列，使得在I和P图像被编码以后，B图像被编码。本地解码部分包括逆量化部分、逆DCT部分、加法部分、帧存储器和运动补偿部分。运动补偿部分执行所有的前向预测操作、反向预测操作和双向预测操作。当执行内编码处理时，减法部分直接处理数据，而不执行减法操作。音频编码器2包括子频带编码部分和自适应量化比特分配部分。
作为一个例子，在具有内置摄像机的便携式光盘记录和再现设备中，由摄像机拍摄的图像作为视频数据输入。此外，由麦克风拾取的声音作为音频数据输入。视频编码器1和音频编码器2变换模拟信号为数字信号。按照本发明的实施例，可重写光盘变用作记录介质。这样的光盘的例子是磁光盘和相变型光盘。按照本发明的实施例，使用具有相对小的直径的磁光盘。
视频编码器1和音频编码器2的输出被馈送到文件发生器5。文件发生器5变换视频编码器1和音频编码器2的输出信号为视频基本流和音频基本流，使得它们可以被按照一种计算机软件程序进行处理，因而不用专门硬件部分就能同步都再现运动图像和声音。按照本发明的实施例，例如，将“快时”用作这样一种软件程序。随时间改变和由“快时”处理的数据序列(视频数据、音频数据和文本数据)被称为“快时”电影。文件发生器5复用编码的视频数据和音频数据。为了产生“快时”电影文本，一种系统控制微计算机9控制文件发生器5。
由文件发生器5产生的“快时”电影文本通过存储器控制器8被连续地写入存储器7。当系统控制微计算机9为光盘发出数据写请求给存储器控制器8时，存储器控制器8从存储器7读“快时”电影文件。在这个例子中，对于“快时”电影文件的编码处理转移速率低于对于数据写入到盘中的速率。例如，前者是后者的一半。因此，虽然“快时”电影文件被连续地写入存储器7，但它们立即在系统控制微计算机9按照防止存储器7上溢和下溢的方式的控制下被从存储器7中读出。
通过存储器控制器8从存储器7读出的“快时”电影文件被馈送到纠错编码器/解码器11。纠错编码器/解码器11u将“快时”电影文件临时写入存储器10。纠错编码器/解码器11执行一种交错器处理和一种纠错码编码处理，以便产生冗余数据。纠错编码器/解码器11从存储器10读带有冗余数据的“快时”电影文件。
纠错编码器/解码器11的输出数据被馈送到数据调制/解调器13。当数字数据被记录到光盘上时，数据调制/解调器13以时钟信号容易被提取的方式调制该数据，以使该数据可以被记录在光盘上，并且没有诸如内码干扰之类的问题。例如，可以使用RLL(1、7)。
数据调制/解调器13的输出被馈送到磁场调制驱动器14。此外，用于驱动光拾取头23的信号被输出到磁场调制驱动器14。磁场调制驱动器14对应于输入信号而驱动磁场头22，以便施加磁场给光盘20。光拾取头23照射一个记录激光束到光盘20。以这样的方式，数据被记录到光盘20上。光盘20按CLV(Constant Linear Velocity，恒定线速度)、CAV(Constant AngularVelocity，恒定角速度)、或者ZCAV(区域(Zone)CLV，其中光盘20表面被分为例如三个区域，每个区域中光盘以这样的方式按CAV旋转，即最里边的区域的速度是最高的而最外边的速度是最低的)旋转，使得它们的线速度接近相同。
因为从存储器控制器8立即读出的数据被记录到光盘20上，所以数据不是连续记录的。换言之，在预定量的数据被记录以后，记录操作被暂停，直至下一个记录请求被接收到。
当系统控制微计算机9发出一个驱动请求给驱动控制微计算机12时，该微计算机发一个请求给伺服电路15，以便控制整个盘的驱动。因此，盘驱动执行记录操作。伺服电路15对光拾取头23执行盘的径向移动伺服操作、跟踪伺服操作和聚焦伺服操作。此外，伺服电路15对马达21执行心轴(spindle)伺服操作。与系统控制微计算机9相联系，设置了用户操作输入部分(未示出)。
接下来，将描述再现部分的结构和操作。当数据被再现时，再现激光束被辐射到光盘20上。光拾取头23的检测器变换光盘20的反射的光为再现信号。从光拾取头23的检测器的输出信号中检测跟踪误差和聚焦误差。伺服电路15控制光拾取头23，使得光拾取头23对准并聚焦在期望的轨迹上。此外，伺服电路15控制光拾取头23的径向移动，使得它再现光盘20上期望的轨迹上的数据。
与记录操作一样，当数据被再现时，从光盘20上再现的数据转移速率高于“快时”电影文件的速率。例如，从光盘20上再现数据的转移速率是“快时”电影文件的转移速率的两倍那么大。同样，数据不是连续地从光盘20上再现的。换言之，在预定量的数据被再现以后，停止再现操作，直至接收到下一个再现请求，以这样一种方式，执行一种间歇的再现操作。与记录操作一样，在再现操作中，当系统控制微计算机9发出一个请求给驱动控制微计算机12时，它发出一个请求给伺服电路15，以便控制整个盘的驱动。
从光拾取头23输出的再现信号被输入到数据调制器/解调器13。数据调制器/解调器13解调该再现的信号。经解调的数据被馈送给纠错编码器/解码器11。纠错编码器/解码器11暂时写该再现的数据到存储器10。纠错编码器/解码器11对再现数据执行去交错处理和纠错处理。经纠错的“快时”电影文件通过存储器控制器8被写入存储器7。
写入到存储器7的“快时”电影文件与对应于由系统控制微计算机9发出的请求的多路分解定时同步地输出到文件解码器6。系统控制微计算机9监视从光盘20再现的和写入到存储器7中的数据量，和从存储器7读出的和输出到文件解码器6的数据量，以便连续地再现视频信号和音频信号。此外，系统控制微计算机9控制存储器控制器8和驱动控制微计算机12，以便按存储器7不上溢或下溢的方式从光盘20中读出数据。
在系统控制微计算机9的控制下，文件解码器6解码“快时”电影文件为视频基本流和音频基本流。视频基本流被馈送给视频解码器3。音频基本流被馈送到音频解码器4。视频基本流和音频基本流是从文件解码器6同步地输出的。
视频解码器3和音频解码器4压缩解码视频基本流和音频基本流，并分别产生视频输出信号和音频输出信号。在这个例子中，视频信号和音频信号已经被对应于MPEG编码。视频输出信号通过显示驱动器被输出到一个显示器(液晶显示器或类似的显示器)并显示为图像。同样，音频输出信号被输出到音频放大器并被再现为声音(图中没有示出这些结构部件)。
视频解码器3包括缓冲存储器、可变长度码解码部分、逆DCT部分、逆量化部分、加法部分和本地解码部分。加法部分将逆量化部分的输出信号与本地解码输出信号相加。本地解码部分包括图像序列重排部分、帧存储器和运动补偿部分。当执行内编码处理时，加法部分直接通过数据，不执行相加处理。解码的数据被从加法部分输出到图像序列重排部分。图像序列重排部分按原来的次序重排解码的各个图像。
如上所述，由于上面记录数据的光盘是可装上和可拆下的，记录在光盘20上的数据可以由另外的设备进行再现。例如，利用“快时”应用软件操作的个人计算机可以读出记录在光盘20上的数据，并且从光盘上重放再现视频数据和音频数据。应当注意到，本发明还可以应用到仅处理视频数据或仅处理音频数据的设备上。
接下来，将更详细地描述本发明的实施例。首先参照图2，将简单描述“快时”。“快时”是一种不需要使用专门的硬件而再现运动图像的OS扩充功能。存在着用于“快时”的各种数据格式。换言之，可以同步地输出音频数据、视频数据、MDI等多达32个轨迹。
“快时”电影文件被粗略地分为两个主要部分，即电影素材部分和电影数据部分。电影素材部分含有需要再现“快时”电影文件的时间数据和涉及实时数据需要的信息。电影数据部分含有视频数据的实时数据和音频数据的实时数据。
一个“快时”电影文件可以含有相应于各独立轨迹的不同类型的媒体数据，诸如音频、视频和文本，这些轨迹分别是音频轨迹、视频轨迹和文本轨迹。这些独立的轨迹按时间基准被严格地控制。每个轨迹具有涉及实时数据压缩方法及其显示时间周期的一种媒体。该媒体含有电影数据部分中实时数据的最小样品的尺寸、作为多个样品的一个块的程序块部分和每个样品的显示持续期。
图2表示处理音频数据和视频数据的“快时”文件的一个例子。“快时”文件的最大结构部分是电影素材部分和电影数据部分。电影素材部分含有对于再现该文件所需要的持续期和涉及实时数据所需要的数据。电影数据部分还有视频数据、音频数据等的实时数据。
接下来，将详细地描述电影素材部分。电影素材部分含有电影标题41和各个轨迹。电影标题41含有总的文件信息。存在着对应于多种类型数据的多个轨迹。图2详细表示视频轨迹50的内部结构。视频轨迹50含有轨迹标题42和媒体部分。轨迹标题42含有总的轨迹信息。媒体部分含有媒体标题43、媒体处理器44和媒体信息部分。媒体标题43含有总的媒体信息。媒体处理器44含有处理信息的媒体数据。
媒体信息部分含有媒体处理器45、数据处理器46、数据信息47和样品表。媒体处理器45含有图像媒体信息。数据处理器46含有图像数据处理信息、数据信息47含有数据信息。样品表含有样品描述、时间-样品(time-sample)、样品尺寸48、样品-程序块(sample-chunk)、程序块的偏移量49、同步样品等等。样品描述含有每个样品。时间-样品代表一个样品与时基之间的关系。样品尺寸48代表该样品的大小。样品-程序块代表样品与程序块之间的关系。程序块的偏移量49代表该程序块在电影文件中的开始字节位置。同步样品含有同步信息。同样，音频轨迹51具有一种类似于视频轨迹的结构(未示出)。
另一方面，电影数据部分含有对应于例如MPEG音频层2编码的音频数据和按对应于例如MPEG(运动图像专家组)方法的压缩编码方法编码的图像数据，该编码的数据是按多个程序块的单元进行编码的，每个程序块包含预定数量的样品。但是，应当注意，本发明并不仅限于这样的编码方法。此外，电影数据部分可以含有没有被压缩编码的线性数据。
电影素材部分的每个轨迹都与含在电影数据部分中的数据相关。换言之，在如图3所示的例子中，因为音频数据和视频数据都被处理，所以电影素材部分含有视频轨迹和音频轨迹。电影数据部分含有音频数据的实时数据和视频数据的实时数据。当处理其它类型的数据时，电影素材部分含有它们的轨迹和电影数据部分含有其实时数据。例如，当处理文本与MIDI时，电影素材部分含有文本与MIDI的轨迹，而电影数据部分含有其实时数据。
接下来，将描述在MPEG2被用作对于已经被压缩编码的数据的解码方法的情况下，用于将压缩的视频数据(视频基本流)和压缩的音频数据(视频基本流)转换为“快时”文件格式的方法。首先将描述MPEG。MPEG具有一种6层的分层结构，这些结构按最高层级数是序列层、GOP层、图像层、片段(slice)层、宏块层和块层。标题位于这6层的每层的开始。例如，序列标题是位于序列层的开始。该序列标题含有一个序列开始码、一个水平屏幕尺寸、一个垂直屏幕尺寸、一个长宽(aspect)比、一个图像速率、一个比特速率、一个VBV缓冲器大小、一个限制参数比特、一个对于两个量化矩阵的加载标志和一个内容(content)。
按照MPEG，存在着三种图像类型I、P和B。在I图像(内编码图像)中，当一个图像信号被编码时，仅利用一个图像的信息。因此，当对编码图像信号进行解码时，仅利用I图像的信息。在P图像(预测编码图像)中，作为预测编码图像(用于获得与当前P图像的差的参考图像)，已经被解码的一个I图像或另一个P图像暂时由该当前P图像跟随。对于每个宏块，当前P图像与运动补偿的预测图像之间的差被编码。可替代地，对于每个宏块，当前P图像被编码，并且不用获得这样一些图像的差。无论选择这些方法之一的哪个，最后都获得较高的效率。在B图像(双向预测编码的图像)中，作为一种预测图像(用于获得与当前B图像的差的参考图像)，利用三种类型的参考图像。第一种类型的参考图像是已经被解码并暂时由当前B图像跟随的一个I图像或一个P图像。第二种类型的参考图像是已经被解码并暂时由当前B图像置于其前面的一个I图像或一个P图像。第三种类型的参考图像是第一类型参考图像与第二类型参考图像的一个内插图像。对于每个宏块，当前的B图像与已经被运动补偿的三种类型的参考图像的每一种之间的差被编码。可替代地，对于每个宏块，当前B图像被编码，而不用获得这样一种差。这些方法的每一种无论选择哪一种，都能获得较高的效率。
因此，存在着帧内编码宏块、正向帧间预测宏块帧(未来的宏块是利用过去的宏块进行预测的)、反向帧间预测宏块帧(过去的宏块是利用未来的宏块进行预测的)、和双向宏块(当前宏块是利用未来宏块与过去宏块两者进行预测的)。在I图像中的所有宏块都是帧内编码的宏块。P图像含有帧内编码的宏块和正向帧间预测宏块。B图像含有上述四种类型的宏块。
在MPEG中，为一群图像定义了一种GOP(Group of Picture，图像群)结构，以便数据可以被随机访问。在MPEG中，对GOP进行以下定义。GOP的第一个图像是I图像。GOP的最后一个图像是I图像或P图像。被在先GOP的最后的I或P图像预测的GOP是允许的。可以被解码但没有在先GOP的图像的GOP被称为闭合的GOP。按照该实施例，作为一种闭合GOP的结构，每个GOP都可以进行编辑。
在MPEG音频(压缩方法)中，已经定义了层1、层2和层3三种模式。在层1中，例如，执行32个子频带编码操作和自适应比特分配操作。一个音频解码单元包含384个样品。一个音频解码单元是一个音频比特流的一个音频帧。音频解码单元是编码的数据被解码为音频数据的最小单元。同样，已经定义了对应于一个视频帧的视频解码单元。在NTSC制式中，一个视频帧等于1/30秒。通常，在层1中的立体声音频的比特速率是256kbps。在层2中，执行32个子频带编码操作和自适应比特分配操作。一个音频解码单元包含1152个样品。通常，在层2中立体声音频的比特速率是192kbps。
文件发生器5变换已经被对应MPEG压缩的视频数据和音频数据为对应于上述“快时”文件格式的一种文件结构。图3A和3B表示各视频帧、各GOP和“快时”文件格式的各样品单元与程序块中的相对关系。如上所述，一个样品是电影数据的最小单元。一个程序块是多个样品被集合为一个块的单元。
如图3A所示，例如原始视频信号的15个视频帧被对应于MPEG2被压缩编码并且产生一个GOP。15个视频帧等于0.5秒。每个GOP最好被构成为一个闭合GOP。序列标题被放置在每个GOP的开头。序列标题和一个GOP构成一个视频解码单元。因为序列标题被放在每个GOP，每个样品可被直接编辑并利用“快时”进行解码。如图1所示的视频编码器1输出如图3A所示的MPEG视频基本流。
如图3B所示，一个视频解码单元被处理为“快时”文件格式的一个样品。6个按时间顺序排列的连续样品(例如，样品#1到样品#5)被处理为一个视频程序块(例如，程序块#1)。一个程序块的持续期为3秒。可替代地，6个GOP可以被处理为一个视频程序块，使得一个程序块对应于一个样品。在这个例子中，一个程序块的持续期为3秒。
图4A和4B表示对应于MPEG音频层2而编码的各音频帧、各GOP和“快时”文件格式的各样品单元和程序块的相互关系。在层2中，1152个音频样品/信道被作为一个音频帧处理。如图4A所示，在立体声中，1152个音频样品x2声道在层2中被编码并处理为一个音频解码单元。一个音频解码单元含有已经被压缩编码的384个字节x2声道的数据。音频解码单元含有一个标题和解码该编码数据需要的信息(分配、标度因子等)。
如图4B所示，一个音频解码单元被处理为“快时”文件格式的一个样品。因此，每个音频样品可以利用“快时”进行解码。125个按时间顺序的连续样品(例如，样品#0到样品#124)被按一个音频程序块进行处理(例如，程序块#0)。在音频取样频率为48KHz情况下，一个程序块的持续期为3秒。
在图3A、3B、4A和4B中，分别表示出视频数据文件和音频数据文件。文件发生器5作为一个数据流复用视频数据文件和音频数据文件并且因此产生一个“快时”电影文件。在“快时”电影文件中，视频程序块和音频程序块被按时基交替地放置。在这种情况下，视频程序块和音频程序块被按视频程序块相邻于与之对应的音频程序块这样一种方式进行放置。如上所述，一个视频程序块的视频数据的持续期等于一个音频程序块的音频数据的持续期(例如，3秒)。
作为音频压缩方法的另一个例子，可以利用用于微型盘(Mini Disk)中的ATRAC(Adaptive Transform Acoustic Coding，自适应变换声音编码)。在ATRAC中，处理按44.1KHz取样的16比特音频数据。在ATRAC中处理的最小数据单元是一个声音单元。在立体声中，一个声音数单元包含512样品x16比特x2声道。
当ATRAC被用作音频压缩编码方法时，如图5A所示，一个声音单元被压缩为212字节x2声道的一个音频解码单元。如图5B所示，一个音频解码单元被处理为按“快时”文件格式的一个样品。64个样品被处理为按“快时”文件格式的一个程序块。
按照本发明，音频数据可以被按照非压缩基础进行记录。该非压缩方法被称为线性PCM。同样，在线性PCM中，512个音频样品被处理为一个音频解码单元。一个音频解码单元被处理为按“快时”文件格式的一个样品。
图6A、6B、6C和6D表示在视频数据和音频数据被复用的情况下用于视频数据的“快时”文件格式。如图6A所示，视频帧的周期是t0秒和一个GOP的帧数是f0。当原始视频数据被对应于MPEG2进行编码时，形成如图6B所示的MPEG视频基本流。如上所述，序列标题被放置在每个GOP上。
如图6C所示，一个具有序列标题的GOP被处理为按“快时”文件格式的一个样品。一个样品的长度被称为样品尺寸。利用多个样品(例如，6个样品)，按“快时”文件格式构成一个程序块。如图6D所示，视频程序块和音频程序块按时基被交替地放置并因此被复用。结果，形成“快时”的电影文件。“快时”电影文件的每个视频程序块的开始被称为视频程序块的偏移量。该视频程序块的偏移量是由从该文件的开始到该视频程序块的开始的字节数表示的。
图7A、7B、7C和7D表示在视频数据和音频数据被复用的情况下音频数据的“快时”文件格式。如图7A所示，一个原始的音频信号被数字化。一个音频帧含有f0个音频样品xn个信道。当该原始音频数据被对应于MPEG音频进行压缩编码时，形成如图7B所示的MPEG音频基本流。
如图7C所示，例如，一个音频解码单元被处理为“快时”文件格式的一个样品。该一个样品的大小被称为样品尺寸。多个样品(例如，125个样品)组成“快时”文件格式的一个程序块。如图7D所示，视频程序块和音频程序块被交替地放置并因此被复用。结果，形成一个“快时”电影文件。“快时”电影文件的每个音频程序块的开始被称为音频程序块偏移量。音频程序块偏移量是由从该文件的开始到该音频程序块的开始的字节数表示的。每个视频程序块的持续期是与每个音频程序块的持续期相同的。例如，该持续期为3秒。
视频样品的样品大小、音频样品的样品大小、视频程序块的偏移量值、音频程序块的偏移量值都含在“快时”电影文件的素材中。利用该素材，可以指定和编辑(按编辑单元)每个程序块的每个样品。
接下来，如上所述，将描述用于记录已经被复用(交错)的视频程序块和音频程序块到光盘20上的“快时”电影文件的记录方法。如上所述，“快时”电影文件被粗略地分为电影素材部分和电影数据部分这两个主要部分。当“快时”电影文件被记录在光盘20上时，如图8所示，电影素材是与连续记录长度相匹配的。此外，电影数据(实时数据)的每个程序块(视频程序块和音频程序块)是与盘的连续记录长度相匹配的。连续记录长度意味着该数据长度可以被写入各个连续的地址，并不需要光拾取头23的跳跃操作。
图9表示“快时”电影文件被记录在光盘20上的另一个例子。如上所述，当视频程序块和音频程序块已经被复用时，音频程序块与与之对应相邻的视频程序块的一对是与连续记录长度相匹配的。
如图8和9所示，连续记录长度的位置从物理上讲并不是连续的。因此，在电影素材被再现后，当第一音频程序块和视频程序块被再现(即，两个连续记录长度的数据被再现)时，则发生轨迹跳跃。但是，如上所述，写/读操作的数据转移率高于“快时”电影文件的数据转移率(例如，高于两倍)，即使数据被立即读出也是如此，这样连续的“快时”电影文件可以被再现。
因此，“快时”电影文件的转移率、从光盘的数据读出率、连续记录长度的持续期、和光盘驱动的查找时间(查找时间是从一个轨迹跳到另一个轨迹所必需的持续时间)都是相互相关的。因此，可以按不一定为3秒的各种方式选择记录在连续记录长度上的视频数据和音频数据的持续期。最好是，对于按连续记录长度记录的视频数据的各视频帧的持续期被设置为各个音频样品的整数。
当记录在连续记录长度上的视频数据的持续期和音频数据的持续期不固定时，“快时”电影文件的电影素材含有连续的记录长度。例如，电影素材含有在一个视频程序块中的帧的数量和在一个音频程序块中的样品的数量。
在上面的描述中，本发明被应用到一种具有内置摄像机的便携式光盘记录和再现设备中。应当注意到本发明可以应用到其它各种设备中。例如，本发明可以应用到数字静止图像摄像机和数字音频记录器和播放器中。
此外，按照本发明，如图1的方框图所示的硬件结构的部分或者全部可以由软件来实现。软件被存储在计算机可读介质，诸如CD-ROM中。
在上述实施例中，本发明曾应用“快时”软件。但是，应当注意到本发明可以应用于不需要专门硬件的情况下允许同步地再现多序列数据的计算机软件。
按照本发明，因为MPEG压缩视频数据的至少一个GOP对应于诸如“快时”软件的文件的第一数据单元(样品)，所以访问和编辑多种类型数据中的每一种。此外，当具有文件结构的数据被记录在光盘上时，因为连续记录长度对应于第二数据单元(例如，“快时”的一个程序块)，所以可以改善可访问性和编辑效率。
虽然本发明已经对于其最佳实施例进行了描述，但是本领域的技术人员应当这样理解，即在不脱离本发明的精神和范围的情况下，可以作出上述的和其它的改变，这些其它改变包括在形式上与细节上去掉一些特征和增加一些特征。
权利要求
1.一种用于将视频数据记录到记录介质上的记录设备，包括编码装置，用于对应于作为帧间预测编码处理与运动补偿处理的组合的压缩编码处理而按多帧群结构编码视频数据；变换装置，用于变换从所述编码装置输出的编码视频数据的数据结构为不用专门的硬件部分就可以由计算机软件程序处理的文件结构，使得运动图像等被同步地再现；和记录装置，用于记录具有该文件结构的数据到记录介质上；其中，该文件结构具有第一数据单元和第二数据单元，该第二数据单元是一组第一数据单元，并且其中至少一种数据结构是与第一数据结构相匹配的。
2.一种用于将视频数据记录到可重写光盘上的记录设备，包括编码装置，用于对应于一种压缩编码处理而编码视频数据；变换装置，用于变换从所述编码装置输出的编码视频数据的数据结构为不用专门的硬件部分就可以由计算机软件程序处理的文件结构，使得运动图像等被同步地再现；和记录装置，用于记录具有该文件结构的数据到光盘；其中该文件结构具有第一数据单元和第二数据单元，该第二数据单元是一组第一数据单元；和其中该第二数据单元是与写入光盘的数据的连续记录长度相匹配的。
3.按照权利要求1所述的记录设备，其中，所述压缩编码处理是MPEG；其中，所述群结构是GOP结构；和其中被附加到序列标题的数据是与第一数据单元相匹配的。
4.一种用于将音频数据记录到可重写光盘上的记录设备，包括变换装置，用于变换音频数据或编码的音频数据的数据结构为不用专门的硬件部分就可以由计算机软件程序处理的文件结构，使得运动图像等被同步地再现；和记录装置，用于记录具有该文件结构的数据到光盘上；其中该文件结构具有第一数据单元和第二数据单元，该第二数据单元是一组第一数据单元；和其中该第二数据单元是与写入光盘的数据的连续记录长度相匹配的。
5.一种用于将视频数据和音频数据记录到记录介质上的记录设备，包括视频编码装置，用于对应于作为帧间预测编码处理与运动补偿处理的组合的压缩编码处理而按多帧群结构编码视频数据；音频输出装置，用于输出压缩编码的或非压缩的音频数据；用于变换从所述视频编码装置输出的编码视频数据和从所述音频输出装置输出的音频数据的数据结构为不用专门的硬件部分就可以由计算机软件程序处理的文件结构的装置，使得运动图像等被同步地再现，并复用具有该文件结构的编码的视频数据和音频数据；和记录装置，用于记录复用的具有该文件结构的数据到记录介质；其中该文件结构具有第一数据单元和第二数据单元，该第二数据单元是一组第一数据单元；和其中编码视频数据的至少一种数据结构是与第一数据单元相匹配的。
6.一种用于将视频数据和音频数据记录到可重写光盘上的记录设备，包括视频编码装置，用于对应于作为帧间预测编码处理与运动补偿处理的组合的压缩编码处理而按多帧群结构编码视频数据；音频输出装置，用于输出压缩编码的或非压缩的音频数据；用于变换从所述视频编码装置输出的编码视频数据和从所述音频输出装置输出的音频数据的数据结构为不用专门的硬件部分就可以由计算机软件程序处理的文件结构的装置，使得运动图像等被同步地再现，并复用具有该文件结构的编码的视频数据和音频数据；和记录装置，用于记录复用的具有该文件结构的数据到光盘上；其中该文件结构具有第一数据单元和第二数据单元，该第二数据单元是一组第一数据单元；和其中该第二数据单元是与连续写入光盘的数据的连续记录长度相匹配的。
7.按照权利要求5或6所述的记录设备，其中第二数据单元的编码视频数据的持续期是与已复用的数据中的第二数据单元的编码音频数据的持续期相同的。
8.按照权利要求5或6所述的记录设备，其中第二数据单元的编码视频数据和第二数据单元的编码音频数据被交替地放置在经复用的数据中，第二数据单元的编码视频数据和第二数据单元的编码音频数据的每个是与连续记录长度相匹配的。
9.按照权利要求5或6所述的记录设备，其中音频数据是对应于ATRAC进行压缩编码的；并且其中该文件结构的第一数据单元含有至少一个ATRAC声音单元。
10.按照权利要求1、2、4、5或6所述的记录设备，其中所述文件结构还包括含有管理信息的数据部分。
11.按照权利要求1、2、4、5或6所述的记录设备，其中所述文件结构还包括含有管理信息的数据部分；和其中所述数据部分含有第一数据单元的尺寸信息和第二数据单元的位置信息。
12.一种将视频数据记录到记录介质上的记录方法，包括以下步骤对应于作为帧间预测编码处理与运动补偿处理的组合的压缩编码处理而按多帧群结构编码视频数据；变换编码视频数据的数据结构为不用专门的硬件部分就可以由计算机软件程序处理的文件结构，使得运动图像等被同步地再现；和记录具有该文件结构的数据到记录介质上；其中该文件结构具有第一数据单元和第二数据单元，该第二数据单元是一组第一数据单元；和其中至少一种数据结构是与第一数据结构相匹配的。
13.一种用于将视频数据记录到可重写光盘上的记录方法，包括以下步骤对应于一种压缩编码处理而编码视频数据；变换编码视频数据的数据结构为不用专门的硬件部分就可以由计算机软件程序处理的文件结构，使得运动图像等被同步地再现；和记录具有该文件结构的数据到记录介质上；其中该文件结构具有第一数据单元和第二数据单元，该第二数据单元是一组第一数据单元；和其中该第二数据单元是与写入光盘的数据的连续记录长度相匹配的。
14.一种用于将音频数据记录到可重写光盘上的记录方法，包括以下步骤变换音频数据或编码的音频数据的数据结构为不用专门的硬件部分就可以由计算机软件程序处理的文件结构，使得运动图像等被同步地再现；和记录具有该文件结构的数据到光盘上；其中该文件结构具有第一数据单元和第二数据单元，该第二数据单元是一组第一数据单元；和其中该第二数据单元是与写入光盘的数据的连续记录长度相匹配的。
15.一种用于将视频数据和音频数据记录到记录介质上的记录方法，包括以下步骤对应于作为帧间预测编码处理与运动补偿处理的组合的压缩编码处理而按多帧群结构编码视频数据；输出压缩编码的或非压缩的音频数据；变换编码视频数据和音频数据的数据结构为不用专门的硬件部分就可以由计算机软件程序处理的文件结构，使得运动图像等被同步地再现，并且复用具有该文件结构的编码视频数据和音频数据；和记录经复用的具有该文件结构的数据到记录介质上；其中该文件结构具有第一数据单元和第二数据单元，该第二数据单元是一组第一数据单元；和其中编码视频数据的至少一种数据结构是与第一数据单元相匹配的。
16.一种用于将视频数据和音频数据记录到可重写光盘上的记录方法，包括以下步骤对应于作为帧间预测编码处理与运动补偿处理的组合的压缩编码处理而按多帧群结构编码视频数据；输出压缩编码的或非压缩的音频数据；变换编码视频数据和音频数据的数据结构为不用专门的硬件部分就可以由计算机软件程序处理的文件结构，使得运动图像等被同步地再现，并且复用具有该文件结构的编码视频数据和音频数据；和记录经复用的具有该文件结构的数据到光盘上；其中该文件结构具有第一数据单元和第二数据单元，该第二数据单元是一组第一数据单元；和其中该第二数据单元是与连续写入光盘的数据的连续记录长度相匹配的。
17.一种在其上记录了程序的记录介质，该程序用于将视频数据记录到记录介质上，该程序使计算机执行以下步骤对应于作为帧间预测编码处理与运动补偿处理的组合的压缩编码处理而按多帧群结构编码视频数据；变换编码视频数据的数据结构为不用专门的硬件部分就可以由计算机软件程序处理的文件结构，使得运动图像等被同步地再现；和记录具有该文件结构的数据到记录介质上；其中该文件结构具有第一数据单元和第二数据单元，该第二数据单元是一组第一数据单元；和其中编码视频数据的至少一种数据结构是与第一数据单元相匹配的。
18.一种在其上记录了程序的记录介质，该程序用于将视频数据记录到可重写光盘上，该程序使计算机执行以下步骤对应于一种压缩编码处理而编码视频数据；变换编码视频数据的数据结构为不用专门的硬件部分就可以由计算机软件程序处理的文件结构，使得运动图像等被同步地再现，并且复用具有该文件结构的编码视频数据和音频数据；和记录具有该文件结构的数据到光盘上；其中该文件结构具有第一数据单元和第二数据单元，该第二数据单元是一组第一数据单元；和其中该第二数据单元是与写入光盘的数据的连续记录长度相匹配的。
19.一种在其上记录了程序的记录介质，该程序用于将音频数据记录到可重写光盘上，该程序使计算机执行以下步骤变换音频数据或编码的音频数据的数据结构为不用专门的硬件部分就可以由计算机软件程序处理的文件结构，使得运动图像等被同步地再现；和记录具有该文件结构的数据到光盘上；其中该文件结构具有第一数据单元和第二数据单元，该第二数据单元是一组第一数据单元；和其中该第二数据单元是与写入光盘的数据的连续记录长度相匹配的。
20.一种在其上记录了程序的记录介质，该程序用于将视频数据和音频数据记录到可重写光盘上，该程序使计算机执行以下步骤对应于作为帧间预测编码处理与运动补偿处理的组合的压缩编码处理而按多帧群结构编码视频数据；输出压缩编码的或非压缩的音频数据；变换编码视频数据和音频数据的数据结构为不用专门的硬件部分就可以由计算机软件程序处理的文件结构，使得运动图像等被同步地再现，并且复用具有该文件结构的编码视频数据和音频数据；和记录复用的具有该文件结构的数据到记录介质上；其中该文件结构具有第一数据单元和第二数据单元，该第二数据单元是一组第一数据单元；和其中编码视频数据的至少一种数据结构是与第一数据单元相匹配的。
21.一种在其上记录了程序的记录介质，该程序用于将视频数据和音频数据记录到可重写光盘上，该程序使计算机执行以下步骤对应于作为帧间预测编码处理与运动补偿处理的组合的压缩编码处理而按多帧群结构编码视频数据；输出压缩编码的或非压缩的音频数据；变换编码视频数据和音频数据的数据结构为不用专门的硬件部分就可以由计算机软件程序处理的文件结构，使得运动图像等被同步地再现，并且复用具有该文件结构的编码视频数据和音频数据；和记录复用的具有该文件结构的数据到光盘上；其中该文件结构具有第一数据单元和第二数据单元，该第二数据单元是一组第一数据单元；和其中该第二数据单元是与连续写入光盘的数据的连续记录长度相匹配的。
全文摘要
公开了一种将视频数据记录于记录介质的记录设备,包括:编码装置,对应于作为帧间预测编码处理与运动补偿处理的组合的压缩编码处理而按多帧群结构编码视频数据;变换装置,变换从编码装置输出的数据的结构为不用专门硬件就能由计算机软件程序处理的文件结构,从而同步再现运动图像等;记录装置,记录该文件结构的数据于记录介质,该文件结构具有第一和第二数据单元,第二数据单元是一组第一数据单元,至少一种数据结构与第一数据结构相匹配。
文档编号G11B27/34GK1289209SQ0012862
公开日2001年3月28日申请日期2000年9月15日优先权日1999年9月17日
发明者辻井训, 山田诚, 石坂敏弥申请人:索尼公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：辻井训;山田诚;石坂敏弥
技术所有人：索尼公司
我是此专利的发明人

上一篇：标识数据寻址方法、摆动地址编码电路及检测方法和电路的制作方法
上一篇：集成光学部件

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、毕老师：机构动力学与控制
2、袁老师：1.计算机视觉 2.无线网络及物联网
3、王老师：1.计算机网络安全 2.计算机仿真技术
4、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
5、张老师：1.机械设计的应力分析、强度校核的计算机仿真 2.生物反应器研制 3.生物力学
如您是高校老师，可以点此联系我们加入专家库。