数据处理装置及方法、数据结构、再现装置及方法

文档序号:6778377阅读:140来源:国知局
专利名称:数据处理装置及方法、数据结构、再现装置及方法
技术领域
本发明涉及数据处理装置、数据处理方法及数据处理程序,数据结构及记录介质,以及再现装置、再现方法及再现程序,适合在部分地传送视频数据时使用,视频数据用帧间压缩而被压缩编码。
背景技术
在记录介质中记录或从记录介质再现数字视频信号及数据音频信号的这样的数据记录再现装置是公知的。作为用于记录数字视频信号及数字音频信号的记录介质,近年来,所谓光盘、硬盘、半导体存储器等可随机存取的记录介质,在数字视频信号及数字音频信号的记录再现中大量被使用着。
由于数字视频信号的数据容量庞大,所以通常以规定的方式压缩编码而记录在记录介质中。近年来,MPEG2(活动图像压缩标准2,Moving PictureExperts Group 2)方式作为压缩编码的标准方式为人所知。MPEG2中,使用DCT(离散余弦变换技术,Discrete Cosine Transform)和动态补偿执行数字视频信号的压缩编码,并且使用可变长度代码提高数据的压缩率。
概括地说明MPEG2的数据流结构。MPEG2组合了动态补偿预测编码和通过DCT的压缩编码。MPEG2的数据结构为分层结构,从低位起,为字块(block)层、宏字块层、片段(slice)层、图片(picture)层、GOP层及序列(sequence)层。字块层由作为执行DCT的单位的DCT字块构成。宏字块层由多个DCT字块构成。片段层由首标(header)部分和1个以上的宏字块构成。图片层由首标和1个以上的片段构成。图片对应于1画面。各层的边界能够用各自规定的识别码来识别。
GOP层由首标部分、作为基于帧内编码的图片(picture)的I(Intra-coded)图片、作为基于预测编码的图片的P(Predictive-coded)图片及B(Bi-directionally Predictive coded)图片构成。I图片仅通过其本身的信息就能够解码,P图片及B图片,需要前面或前后的图像作为基准图片,不能单独被解码。例如,P图片将时间上比其本身前面的I图片或P图片用作基准图像进行解码。此外,B图片使用其本身前后的I图片或P图片的2个图片为基准图像进行解码。将以包含最低1个的I图片的其本身结束的群称为GOP(图像群,Group of Picture),是MPEG流中可独立存取的最小单位。
GOP由1个或多个图片构成。下面,为了方便,将仅由1个I图片构成的GOP称为单GOP,将由I图片、P和/或B图片组成的多个图片构成的GOP称为长(long)GOP。在单GOP中,由于仅由I图片构成GOP,在容易进行帧单位中的编辑的同时,不进行帧间的预测编码,所以能够获得更高图像质量。另一方面,在长GOP中,由于进行帧间的预测编码,所以有压缩效率高的优点。
再有,在长GOP中,有闭合GOP和开放GOP两种,闭合GOP在GOP内可完全解码,具有在GOP中闭合的结构,而开放GOP在解码时按编码顺序可使用前1个GOP的信息。开放GOP与闭合GOP比较,由于能够使用更多的信息进行解码,所以能够获得高图像质量,正被常规使用。
作为压缩编码SD(标准清晰度,Standard Definition)格式的视频信号的方法,例如公知有位传送速率25Mbps(兆比特每秒)的DV格式,和仅使用MPEG2的I图片的、位传送速率50Mbps的IMX格式。特别是,在广播电台等中所使用的视频设备中,以上述单GOP方式使用SD格式的视频信号,实现高图像质量和高精度的编辑环境。
另一方面,近年来,随着数字高清晰度电视广播等的实施,逐渐使用分辨率比SD格式高的HD(高分辨率,High Definiton)格式。位传送速率随着高分辨率而升高,HD格式不能以单GOP方式对于记录介质进行长时间的记录。因此,以上述长GOP方式使用HD格式的视频信号。
使用图21说明长GOP(long GOP)时的解码处理。在此,1 GOP由1个I图片,4个P图片及10个B图片,合计15个图片构成。GOP内的I、P及B图片的显示顺序,如图21A中的一个例子所示,为“B0B1I2B3B4P5B6B7P8B9B10P11B12B13P14”。再有,下标代表显示顺序。
在此例中,最初的2个B0图片及B1图片是使用前1个GOP中的最末尾的P14图片和此GOP内的I2图片预测、解码的图片。GOP内最初的P5图片,是由I2图片预测、解码的图片。另一P8图片、P11图片及P14图片是分别使用前1个P图片预测、解码的图片。此外,I图片以后的各B图片,是由各自前后的I和/或P图片预测、解码的图片。
另一方面,由于B图片,使用在时间上前后的I或P图片进行预测解码,所以,需要考虑由解码器中的解码的顺序来决定流和记录介质上的I、P及B图片的排列顺序。即,用于解码B图片的I和/或P图片,通常应该先于该B图片进行解码。
在上述实例中,流和记录介质上的各图片的排列,如图21B所例示,为“I2B0B1P5B3B4P8B6B7P11B9B10P14B12B13”,按此顺序输入到解码器。再有,下标对应于图21A,表示显示顺序。
如图21C所示,解码器中的解码处理首先对I2图片进行解码,根据解码后的此I2图片和前1个GOP中的最末尾(显示顺序)的P14图片,对B0图片和B1图片进行预测解码。然后,按解码顺序从解码器中输出B0图片和B1图片,接着,输出I2图片。如果输出B1图片,接下来就使用I2图片对P5图片进行预测解码。然后,使用I2图片及P5图片对B3图片及B4图片进行预测解码。然后,按解码的顺序从解码器中输出解码后的B3图片及B4图片,接着输出P5图片。
下面,同样地,先于B图片对在B图片的预测中使用的P或I图片进行解码,使用此解码后的P或I图片对B图片进行预测解码,输出解码后的B图片,因此,反复进行输出用于对该B图片进行解码的P或I图片的处理。记录介质上和流中的图21B这样的图片排列是通常使用的排列方式。
近年来,在计算机装置、特别是所谓个人电脑这样的小型、廉价的计算机装置中,处理能力显著提高。因此,频繁使用个人电脑等进行上述视频数据的处理。例如,用作为记录介质使用的上述可随机存取的记录介质的记录再现装置记录的视频数据通过该记录再现装置进行再现,通过规定的接口传送给计算机装置。计算机装置基本上按文件单位处理数据,所以,将传送的数据转换成规定的文件形式,容纳在硬盘驱动器等记录介质中。
此外,在视频数据的记录中使用可随机存取的记录介质的记录再现装置中,通常是预先以文件形式将视频数据记录在记录介质中。例如,使用光盘作为记录介质的时候,按对应于所谓的UDF(通用磁盘格式,Universal DiskFormat)的计算机装置的形式的格式使用光盘,将视频数据作为遵从此UDF的格式的文件进行记录。
这样,在记录再现装置中,如果在以对应于计算机装置的形式格式化的记录介质中记录视频数据的话,例如在通过规定接口连接记录再现装置和计算机装置时,就能够从计算机装置直接存取此记录介质上的文件,读出视频数据。
此外,近年来,还发现通信网络的通信速度也大幅度的提高,通过通信网络传送视频数据也变得可能了。此外,使用计算机装置通过通信网络进行文件传送的时候通常是使用所谓FTP(文件传送协议,File Transfer Protocl)的文件传送的协议。例如,美国专利申请No.6119144中,记述有使用FTP传送视频文件的技术。

发明内容
这里,考虑将记录介质中作为文件记录的视频数据,例如通过通信网络传送的情况。例如,考虑在报道现场等使用摄影机等拍摄的、记录在记录介质中的视频数据发送到广播电台等的演播室的情况。
这种情况下,考虑发送1个整体视频文件的方法,对于该方法,数据量将变大,特别是通过因特网等通信网络发送数据的时候,直到完成1个文件的发送,都会需要大量时间。
因此,考虑从容纳在视频文件中的视频数据中仅取出所需要的部分,将取出的部分作为文件传送。下面将从此整体的文件中部分地取出视频数据并传送称为部分传送。例如,在进行拍摄的现场侧,对于拍摄出的视频数据简易地指定称为IN点及OUT点的编辑点,将指定的IN点及OUT点间的视频数据作为文件传送。
在到目前为止正在使用的单GOP的SD格式中,由于在每一帧中压缩编码视频数据,所以从整体文件中部分地取出视频数据的处理是容易的。
另一方面,在长GOP的HD格式中,如上所述,在视频数据中包含使用帧间的相互关系进行压缩编码,使用时间上前和/或后的图片进行解码的P图片或B图片。为此,部分传送视频数据时,需要认清GOP的结构,传送需要的数据。
例如,在抽出、传送使用长GOP进行压缩编码的视频数据的某一范围时,为了能由传送目的地对传送的视频数据进行解码,需要将包含用于对指定范围的图片解码的图片进行部分传送。
此外,为了相对于指定传送的图片还能同时传送指定范围之外的图片,就需要与部分传送的视频数据一起传送表示指定范围的信息。并且,在长GOP中,由于每一图片的数据尺寸不固定,视频帧边界变化,所以即使对部分传送的文件而言,也需要可识别此边界的结构。
但是,目前,存在所谓不能提供部分传送通过此长GOP压缩编码的视频数据时的结构的问题点。
因此,本发明的目的在于提供数据处理装置、数据处理方法及数据处理程序,数据结构及记录介质,以及再现装置、再现方法及再现程序,能够从容纳了使用长GOP所压缩编码的视频数据的文件中,容易地进行将视频数据部分地取出并传送的处理。
为解决上述课题,本发明提供一种数据处理装置,包括解码区间检测单元,检测必要的基于帧的编码顺序的第2区间,以便对以视频数据的帧的显示顺序所指定的第1区间进行解码,视频数据被使用预测编码的帧间压缩进行压缩编码;和文件制作单元,制作容纳了由解码区间检测单元检测出的第2区间的视频数据的文件,文件制作单元将以帧的显示顺序表示第1区间的信息附加在文件中。
此外,本发明提供一种数据处理方法,包括检测必要的基于帧的编码顺序的第2区间,以便对以视频数据的帧的显示顺序所指定的第1区间进行解码的步骤,视频数据被使用预测编码的帧间压缩进行压缩编码;和制作容纳了由解码区间检测步骤检测出的第2区间的视频数据的文件的步骤;文件制作的步骤包含将以帧的显示顺序表示第1区间的信息附加在文件中的步骤。
此外,本发明提供一种数据处理程序,使计算机装置执行数据处理方法,该数据处理方法包括检测必要的基于帧的编码顺序的第2区间,以便对以视频数据的帧的显示顺序所指定的第1区间进行解码的步骤,视频数据被使用预测编码的帧间压缩进行压缩编码;和制作容纳了由解码区间检测步骤检测出的第2区间的视频数据的文件的步骤;文件制作的步骤包含将以帧的显示顺序表示第1区间的信息附加在文件中的步骤。
此外,本发明提供一种数据结构,至少包含基于帧的编码顺序的第2区间的视频数据,该视频数据是用预测编码的帧间压缩进行过压缩编码的视频数据,需要用该视频数据对以帧的显示顺序所指定的第1区间进行解码;和以帧的显示顺序表示第1区间的信息。
此外,本发明提供一种记录介质,记录了具有数据结构的文件,该数据结构至少包含基于帧的编码顺序的第2区间的视频数据,该视频数据是用预测编码的帧间压缩进行过压缩编码的视频数据,需要用该视频数据对以帧的显示顺序所指定的第1区间进行解码;和以帧的显示顺序表示第1区间的信息。
此外,本发明提供一种再现装置,对视频数据进行再现,视频数据被记录在记录介质中,使用预测编码的帧压缩而被压缩编码,该再现装置包括再现单元,从记录介质进行数据的再现;解码单元,对再现单元所再现的视频数据进行解码;和输出控制单元,以帧为单位控制解码单元所解码的视频数据的输出;在由再现单元再现包含了数据结构的文件,并由解码单元对已被再现的文件中所包含的视频数据进行解码时,输出控制单元基于以帧的显示顺序表示文件中所包含的第1区间的信息进行控制,以从该第1区间的开头帧起输出视频数据,数据结构至少包含基于帧的编码顺序的第2区间的视频数据,该视频数据是用预测编码的帧间压缩进行过压缩编码的视频数据,需要用该视频数据对以帧的显示顺序所指定的第1区间进行解码;和以帧的显示顺序表示第1区间的信息。
此外,本发明提供一种再现方法,对视频数据进行再现,视频数据被记录在记录介质中,使用按照预测编码的帧压缩而被压缩编码,该再现方法包括从记录介质进行数据的再现的步骤;对所再现的视频数据进行解码的步骤;和以帧为单位控制解码后的视频数据的输出的步骤;在再现包含了数据结构的文件,并对已被再现的文件中所包含的视频数据进行解码时,输出控制步骤基于以帧的显示顺序表示文件中所包含的第1区间的信息进行控制,以从该第1区间的开头帧起输出视频数据,数据结构至少包含基于帧的编码顺序的第2区间的视频数据,该视频数据是用预测编码的帧间压缩进行过压缩编码的视频数据,需要用该视频数据对以帧的显示顺序所指定的第1区间进行解码;和以帧的显示顺序表示第1区间的信息。
此外,本发明提供一种再现程序,使计算机装置执行将视频数据再现的方法,视频数据被记录在记录介质中,使用预测编码的帧压缩而被压缩编码,再现方法包括从记录介质进行数据的再现的步骤;对所再现的视频数据进行解码的步骤;和以帧为单位控制解码后的视频数据的输出的步骤;在再现包含了数据结构的文件,并对已被再现的文件中所包含的视频数据进行解码时,输出控制步骤基于以帧的显示顺序表示文件中所包含的第1区间的信息进行控制,以从该第1区间的开头帧起输出视频数据,数据结构至少包含基于帧的编码顺序的第2区间的视频数据,该视频数据是用预测编码的帧间压缩进行过压缩编码的视频数据,需要用该视频数据对以帧的显示顺序所指定的第1区间进行解码;和以帧的显示顺序表示第1区间的信息。
根据本发明,由于检测必要的基于帧的编码顺序的第2区间,以便对使用基于预测编码的帧间压缩所压缩编码的视频数据的、以帧的显示顺序所指定的第1区间进行解码,并制作容纳了检测出的第2区间的视频数据的文件,将以帧的显示顺序表示第1区间的信息附加在文件中,所以能够制作在传送目的地等容易地进行仅再现文件中所容纳的视频数据的第1区间的处理的文件。
此外,按照本发明,由于在数据结构中至少包含必需的按照帧的编码顺序的第2区间的视频数据,以便对使用基于预测编码的帧间压缩所压缩编码的视频数据的、以帧的显示顺序所指定的第1区间进行解码,和按帧的显示顺序表示第1区间的信息;所以,具有此数据结构的数据,容易进行仅包含在该数据中的视频数据的第1区间的再现处理,如果在文件中容纳具有该数据结构的数据,则即使文件的传送目的地等,也可以容易地进行再现第1区间的处理。
此外,根据本发明,由于记录介质记录具有至少含有用于对使用根据预测编码的帧间压缩而被压缩编码了的视频数据的、按帧的显示顺序指定的第1区间进行解码所需的、按照帧的编码顺序的第2区间的视频数据,和按帧的显示顺序表示第1区间的信息的数据结构的文件,所以再现被记录在记录介质中的文件时,容易进行仅再现容纳在文件中的视频数据的第1区间的处理。
此外,根据本发明,由于在再现具备被记录在记录介质中的、至少含有用于对使用根据预测编码的帧间压缩而被压缩编码了的视频数据的、按帧的显示顺序指定的第1区间进行解码所需的、按照帧的编码顺序的第2区间的视频数据,和按帧的显示顺序表示第1区间的信息的数据结构的文件,对再现出的文件中所包含的视频数据进行解码时,根据按帧的显示顺序表示文件中所含的第1区间的信息进行控制,以便从第1区间的开头帧输出视频数据;所以即使从外部传送此文件的情况下,也能容易地进行仅再现容纳在文件中的视频数据的第1区间的处理。


图1是用于说明MXF格式的概述简略线图。
图2是用于说明MXF格式的概述简略线图。
图3是用于说明MXF格式的概述简略线图。
图4是用于说明MXF格式的概述简略线图。
图5是表示索引项中的标志的一例的位分配(bit assign)的概述简略线图。
图6是用于说明本发明的一实施方式的文件的部分传送处理的概述简略线图。
图7是大致表示制作部分传送文件的一个例子的处理流程图。
图8是表示一例用于决定部分传送的区间的处理的流程图。
图9是表示针对开放GOP结构的视频数据求解出容纳在部分传送文件中的编辑单元的例子的概述简略线图。
图10是表示针对开放GOP结构的视频数据求解出容纳在部分传送文件中的编辑单元的例子的概述简略线图。
图11是表示针对闭合GOP结构的视频数据求解出容纳在部分传送文件中的编辑单元的例子的概述简略线图。
图12是表示针对闭合GOP结构的视频数据求解出容纳在部分传送文件中的编辑单元的例子的概述简略线图。
图13是表示一例盘状记录介质中的数据配置的概述简略线图。
图14是用于说明单元逻辑映射处理器(clip)的概述简略线图。
图15是表示一例对光盘形成了年轮数据的样子的概述简略线图。
图16是表示一例MPEG2的长GOP中的数据结构的概述简略线图。
图17是表示记述图片指示信息的图片指示表的更具体的例子的概述简略线图。
图18是表示可适用于本发明的一实施方式的记录再现装置的一个例子的结构的方框图。
图19是表示磁盘驱动单元的一个例子的结构的方框图。
图20是表示一例再现部分传送文件的处理的流程图。
图21是用于说明长GOP时的解码处理的简略线图。
标号说明1 光盘 10 文件11 显示开始文件 12 显示结束帧13 首标 100 记录再现装置102 MPEG编码器103 存储控制器104 RAM 105 磁盘驱动单元106 MPEG解码器121 CPU122 RAM 123 ROM126 通信接口 132 CPU133 RAM 134 通信接口具体实施方式
下面,参照附图,说明本发明的一实施方式。首先,说明可适用本发明的一个实施方式的数据结构。图1~图4表示对于可适用本发明的一个实施方式的、称为MXF(内容转换格式,Material Exchange Format)的数据格式的MPEG(活动图像压缩标准,Moving Picture Experts Group)流的映射(mapping)结构。MXF是在SMPTE(电影与电视工程师协会,Society ofMotion Picture and Television Engineers)中规定的文件格式规格,下面说明的MPEG流的映射结构是在SMPTE-381M中规定的。下面,将具有基于上述的MXF已定的结构的,适用于此发明的一实施方式的文件称为MXF文件。
MXF文件,整体上,如图1A所示,由文件首标(File Header)、文件主体(File Body)及文件脚注(File Footer)组成。文件首标由首标部分配包(headerpartition pack)(HPP)和首标元数据(Header Metadata)组成。首标部分配包容纳用于特定首标的数据、和表示在文件主体配置的数据的形式、文件格式的信息等。首标元数据,容纳例如所谓关于此文件的制作时间的信息和关于在文件主体中配置的数据的信息的文件单位的元数据。
文件主体由主体分配包(Body partition pack)(BPP)、编辑单元(EditUnit)及索引表(Index Table)组成。在主体分配包中容纳着用于指定主体的数据等。在用主体分配包划分的区域,配置0或1的索引表,1个或多个编辑单元。编辑单元容纳每一帧的数据。索引表容纳用主体分配包划分的、包含在前1个区域内的每一编辑单元的信息。后面详细叙述编辑单元及索引表。
文件脚注由脚注分配包、索引表及随机索引包组成。关于文件脚注,由于不是直接与本发明相关的部分,所以为了避免复杂化,省略说明。
由主体分配包划分的每一区域的编辑单元的整体,被称为基本容器(Essence Container)(参照图1B的左侧)。即,基本容器,是在此MXF文件中,实际再现的视频及音频数据的集合体。
配置在文件主体及文件脚注的各索引表段(Index Table Segments)整体,被称为索引表(参照图1B的右侧)。例如,系统读入此MXF文件时,搜索各索引表段并读出,构筑索引表,由此能够参照构筑的索引表获取涉及此MXF文件内的所有的编辑单元的信息。
图1C表示索引表的一个例子的结构。再有,在图1C中,记在各区域的下部的数字用字节表示此区域的尺寸。使用KLV(密钥长度值,Key-Length-value)码对索引表进行编码。在KLV码中,“K(Key)”部是表示以SMPTE 335M/RP210A为基准的、KLV编码了的数据项目的识别符,具有16字节的数据长度。“L(Length)”部,例如具有4字节的数据长度,用字节单位表示“L”部之后连续的数据长度。“V(Value)”部是容纳数据本体的区域。此外,在“V”部内部还能够定义由分别具有2字节的数据长度的、“T(Local Tag)”部及“L(Length)”部,和可变长度的数据部组成的结构。
在索引表的开始,配置数据长度为16字节的索引表段密钥(Index TableSegment Key)。在此例中,接着配置数据长度4字节的“L”部,在配置分别具有2字节的数据长度的“T”部及“L”部后,配置数据长度16字节的实例ID(Instance ID)。再有,索引表内的各项目的顺序不限于此例。使用UUID(通用唯一识别,Univaesally Unique ID)记述实例ID。接着配置“T”部及“L”部,此后,配置数据长度8字节的索引编辑速率(Index Edit Rate)。索引编辑速率表示视频数据的帧速率是29.97Hz、25Hz及23.98Hz的哪一个。
接着配置“T”部及“L”部,此后,配置数据长度8字节的索引开始位置(Index Start Position)。索引开始位置,示出了此索引表管理的编辑单元的开始编号。接着配置“T”部及“L”部,此后,配置数据长度8字节的索引持续时间(Index Duration)。索引持续时间,通过编辑单元的数量示出了此索引表管理的编辑单元的整体长度。
接着,配置“T”部及“L”部,此后,配置数据长度4字节的编辑单元字节计数(Edit Unit Byte Count)。编辑单元字节计数,如果视频帧是固定长度的话,就记述视频帧的数据长度,如果视频帧为可变长度的话就记述为值“0”。接着,配置“T”部及“L”部,此后,配置数据长度4字节的索引SID,然后在“T”部及“L”部后,配置主体SID。这些索引SID及主体SID,例如其各自的值为“1”及“2”的固定值。接着,配置“T”部及“L”部,此后,配置数据长度1字节的片段计数(Slice Count)。片段计数表示由此索引表管理的片段(后述)。
接着,配置“T”部及“L”部,此后,配置数据长度44字节的δ条目阵列(Delta Entry Array)。然后,还接着配置“T”部及“L”部,此后,配置可变长度的索引项阵列(Index Entry Array)。后面叙述这些δ条目阵列及索引项阵列。
在索引项阵列之后,配置“K”部及“L”部,以及文件部。在此例中,通过设置文件部,来使索引表的尺寸与规定值一致。
图2表示编辑单元及δ条目阵列的例子。图2C所示的索引表由于与图1C相同,所以省略其说明。编辑单元由1帧部分的数据组成,如图2A中的一例所示,包含系统数据、MPEG视频数据及音频数据(例如AES)。系统数据及多个声道(channel)部分(此例中为4声道部分)的音频数据分别是固定长度(CBE每个数据的固定字节,Constant Bytes per Element)的,视频数据是可变长度(VBE每个要素的可变字节,Variable Bytes per Element)的。在1个编辑单元内,在每一可变长度数据中划分片段(Slice)。在图2A的例子中,由于视频数据是可变长度的,所以,在视频数据的后端划分片段,前一半为片段0,后一半为片段1。上述的片段计数中记述片段的数量。
δ条目阵列,如图2B中一个例子所示,记述包含在编辑单元中的各数据的、编辑单元内的偏移(offset)信息。再有,在δ条目阵列中,将包含在编辑单元中的每一数据的信息称为δ条目(Delta Entry)。δ条目阵列是包含在编辑单元中的各数据的δ条目的集合。在δ条目的开始,配置具有4字节的数据长度的δ条目数(Number of Delta Entries)。在编辑单元由1个系统数据、1个视频数据及4个音频数据合计6个数据组成的本例中,在δ条目阵列中含有6个δ条目,δ条目数记述为值“6”。在δ条目数之后,配置以字节数表示δ条目的数据长度的δ条目长度(Length of Delta Entries)。
δ条目分别由Pos表索引(Pos Table Index),片段(Slice)及要素δ(Element Delta)组成。Pos表索引在各要素中数据的显示顺序和编码顺序不同,其差分在由索引项阵列内的瞬时偏移值决定的时候取值“1”,在数据显示顺序与编码顺序一致的时候取值“0”。假使,在要素的数据的每一部分显示顺序和编码顺序不同的时候,在索引项阵列中的Pos表中记述每个部分的差分,Pos表索引的值,取记述差分的表的索引值(正的值)。再有,对于Pos表索引而言,由于与此发明的关系不大,所以省略其以上说明。片段表示对应的数据的编辑单元内的片段位置。要素δ表示源自片段开始的偏移。
图3是表示索引项阵列及基本容器流的例子。图3A及图3B表示基本容器的数据流即基本容器流(Essence Container Stream)的例子。抽取MXF文件的编辑单元,顺序排列,形成流。
图3C表示索引项阵列的一个例子。索引项数目(Number of Index Entries)表示包含在索引项阵列中的索引项数目。由于索引项分别对应编辑单元,所以索引项数,换言之,表示由此索引表管理的编辑单元的数目。在索引项数目之后,配置以字节数量表示索引项的数据长度的索引项长度(Length ofIndex Entries)。
索引项分别由瞬时偏移(Temporal Offset)、密钥帧偏移(Key-FrameOffset)、标志(Flags)、流偏移(Stream Offset)及片段偏移(Slice Offset)组成。瞬时偏移具有1字节的数据长度,并表示显示顺序和编码顺序的交替排列的信息。密钥帧偏移具有1字节的数据长度,并表示解码中使用的帧的信息。标志具有1字节的数据长度,并表示帧的类型。再有,在后面详细叙述这些瞬时偏移、密钥帧偏移及标志。流偏移具有8字节的数据长度,并表示相对于此MXF文件整体的基本容器流的开始的偏移。片段偏移具有4字节的数据长度,并表示对应的编辑单元内的片段1的偏移。
使用图4进一步详细地说明上述的瞬时偏移、密钥帧偏移及标志。图4A示出了帧的显示顺序(显示次序,Display Order),图4B以编辑单元单位表示帧的编码顺序(编码次序,Coding Order)。在图4A及图4B中,对对应于某一索引表的显示次序及编码次序,按开始为#0顺序地赋予编号。与图4A的显示次序及图4B的编码次序对应,图4C示出了瞬时偏移、密钥帧偏移及标志。
再有,记在图4A及图4B中的“I”、“P”及“B”,分别表示I图片、P图片及B图片。此外,在显示次序中,将对I图片解码得到的帧记述为帧“I”,在编码次序中,将容纳I图片的编辑单元记述为编辑单元“I”。
在该图4的例子中,为了说明,1GOP由1个I图片、1个P图片、4个B图片构成。此外,由前一半的6个图片组成的GOP为闭合GOP,由后一半的6个图片组成的GOP为开放GOP。此外,对对应于某一索引表的显示次序及编码次序,从#0顺序赋予编号来表示。
如现有技术已说明的,在闭合GOP中,因为在GOP内结束解码,所以该图4所示的结构的情况下,仅从帧“I”#2开始对显示次序中的帧“B”#0及帧“B”#1进行解码。此外,使用帧“I”#2及帧“P”#5对帧“B”#3及帧“B”#4进行解码。
另一方面,在开放GOP中,能够使用其它的GOP图片进行解码。在此图4所示的例子中,使用帧“I”#8和包含在前1个GOP中的帧“P”#5对各帧“B”#6及帧“B”#7进行解码。此时,由于使用帧“I”#2对帧“P”#5进行解码,所以为了对帧“B”#6及帧“B”#7进行解码,就需要帧“I”#8,帧“P”#5及帧“I”#2这3个帧。
瞬时偏移表示编码次序相对于显示次序被交替排列几帧的部分。例如,在显示次序中,位于第3的帧“I”#2,由于对应于编码次序中位于第1的编辑单元“I”#0,所以瞬时偏移的值是“-2”。此外,在显示次序中,位于第7的帧“B”#6,由于对应于编码次序中位于第8的编辑单元“B”#7,所以,瞬时偏移的值是“+1”。
密钥帧偏移表示用于对对应的编辑单元中所包含的视频数据进行解码所需要追溯时的某一编辑单元数目。例如,包含帧“I”#2的编辑单元#0,由于其本身能够进行帧“I”#2的解码,所以,密钥帧偏移的值是“0”。此外,包含帧“B”#3的编辑单元#4,为了对帧“B”#3进行解码,就需要帧“I”#2及帧“P”#5,有必要追溯到包含帧“I”#2的编辑单元#0。因此,编辑单元#4的密钥帧偏移的值是“-4”。
并且,开放GOP时,使用前1个GOP的帧对开头帧“B”进行解码。例如,使用帧“I”#8和前1个GOP的帧“P”#5对帧“B”#7进行解码,并且使用帧“I”#2对帧“P”#5进行解码。因此,包含帧“B”#7的编辑单元#8,就需要追溯到包含帧“I”#2的编辑单元#0。因此,编辑单元#8的密钥帧偏移的值是“-8”。
标志具有1字节即8位的数据长度,在8位的各个位上,分配着涉及对应于此标志的编辑单元的规定的信息。图5表示标志的一个例子的位分配。第0位~第7位的8位中,从高位侧起,第7位表示对应的编辑单元是否含有可随机存取的帧。可随机存取的帧,是序列首标(Sequence-Header),并且,属于闭合GOP的帧。再有,序列首标通常是帧“I”。第6位表示对应的编辑单元是否含有序列首标。
第5位表示是否使用前方预测(Forward Prediction)对对应的编辑单元包含的帧进行解码。第4位表示是否使用后方预测(Backward Prediction)对对应的编辑单元包含的帧进行解码。第3位,表示对应的编辑单元包含的帧的偏移是否超范围(Offset out of range)。第2位是MPEG的映射中不使用的位。
使用第1位及第0位这2位,表示对应的编辑单元包含的帧的图片类型。第1位及第0位这2位分别用“00”表示I图片的帧,用“10”表示P图片的帧,用“11”表示B图片的帧。
如图4所表明的,指定作为显示次序的帧#n时,通过在索引项阵列中参照第n索引项中的瞬时偏移,就能够得知对应于指定的帧#n的编码次序。并且,通过参照与对应于此帧#n的编码次序相对应的索引项阵列中的密钥帧偏移,就能够得知用于对该编码次序的图片进行解码所需要的开始的图片的编码次序。
即,通过使用瞬时偏移及密钥帧偏移,就能够在显示次序中指定帧#n时,以索引表单位得知用于对指定的帧#n进行解码所需要的开始的图片即编辑单元的文件内的位置。因此,系统,对文件进行访问时,首先,通过预先全部读入文件中的索引表,就能够提高对文件内任意帧的存取性。
再有,不限于此,系统能够从文件的开头起,按照对文件存取的顺序来顺次地读入索引表。这种情况下,与预先全部读入文件中的索引表的例子相比,就不能期待对于未读入索引表的部分的取存性。
接着,说明本发明的一实施方式。本发明中,为了能够针对容纳在文件中的视频数据对指定的帧区间进行再现,而从文件中抽取出视频数据,进行将抽取出的视频数据作为新的文件来加以传送的部分传送时,包含未显示却对指定的帧区间进行解码所需要的帧,来制作该新的文件,与此同时,与新的文件中所包含的视频数据相符合来改写索引表。此外,将部分传送的视频数据容纳在新的文件中时,在文件首标中所包含的首标元数据中记述开始显示的显示开始帧及来自显示开始帧的帧数目。
首先,说明从文件中抽取出部分传送的视频数据的处理。使用图6及图7,简略地说明本发明实施方式的文件的部分传送处理。对于图6A中一例示出的文件10,以显示次序从开始帧起仅显示指定帧数目,对如此进行文件的部分传送的情况进行考虑。图7是概括地示出制作部分传送文件的一个例子的处理的流程图。
下面,将表示从此显示开始帧开始的显示的长度的帧数目称为持续时间(Duration)。此外,将由显示开始帧及持续时间指定的帧区间称为指定显示区间。
在步骤S1中,对图6A所示的文件10,指定显示开始帧11和相对于显示开始帧11的持续时间,从而设定指定显示区间。相对于显示开始帧11用持续时间指定的帧数目部分、其前面的帧就成为显示结束帧12。假如设定指定显示区间,就在下一步骤S2中,决定用于执行部分传送所必需的区间。
图6B示出了对图6A所示的文件10指定了显示区间进行指定所生成的部分传送文件的例子。对于指定显示区间,在部分传送文件中包含含有用于对该指定显示区间的帧进行解码所必需的帧(图片)的所有的编辑单元。例如,指定的开始帧11如果是B图片或P图片组成的帧,为了对该帧进行解码,就需要在前一时间的帧。这种情况下,就有必要在部分传送的文件中包含时间上比指定的开始帧11对应的图片在前的图片的编辑单元。同样地,如果结束帧12是B图片的帧,则有必要在部分传送文件中包含时间上比该帧对应的图片在后的图片的编辑单元。
再有,将由包含用于对指定显示区间的帧进行解码的图片的编辑单元组成的、指定显示区间前面的区间称为GOP的预载荷(precharge)区间。此外,将由包含用于对指定显示区间的帧进行解码的图片的编辑单元组成的、指定显示区间后面的区间称为GOP的溢流(overrun)区间。此发明的一实施方式中,包含针对这些指定显示区间的GOP的预载荷区间及GOP的溢流区间,来制作部分传送文件。
这样,若通过部分传送文件决定了必须传送的编辑单元,则在步骤S3中,根据决定内容更新索引表。例如,详细内容后述,重写索引表内的索引项阵列中的每一个编辑单元的信息中的流偏移。此外,按照要求,重写索引表内的索引开始位置及索引持续时间。并且,在接下来的步骤S4中,将指定的开始帧11及持续时间的部分传送文件内的值作为首标元数据记述在首标13中。
在步骤S5中,用通过步骤S2决定的部分传送区间,在步骤S3中制作出的索引表和在步骤S4中制作出的首标元数据来制作部分传送文件。
例如,从源文件中读出通过步骤S2决定的部分传送区间的视频数据,存储在存储器上规定的地址中。将在步骤S3及步骤S4中分别制作的索引表及首标元数据存储在存储器中,以便与已存储在存储器上的部分传送区间的视频数据一起形成部分传送文件的图像。
再有,在上述图7的流程图中,步骤S3及步骤S4的顺序是可以交换的。也可以并列执行步骤S3及步骤S4的处理。
接着,使用图8的流程图更详细地说明上述图7的流程图中的步骤S2的处理。在步骤S10中,在显示次序中指定帧时,在下一步骤S11中,参照索引表中的、对应于指定的帧的显示次序的编码次序的索引项,取得在该索引项中记述的瞬时偏移。
在下一步骤S12中,根据在步骤S11中取得的瞬时偏移中所示出的值,移动要参照的索引项。在求用于对指定显示区间的显示结束帧进行解码所必需的编辑单元的情况下(步骤S13),对应于在此步骤S12中移动的移动方的索引项的编辑单元成为所求编辑单元(步骤S14)。
另一方面,在求用于对指定显示区间的显示开始帧进行解码所必需的编辑单元的情况下(步骤S13),处理向步骤S15移行,在步骤S12中移动的移动方的索引项中取得密钥帧偏移。然后,在接下来的步骤S16中,根据在取得的密钥帧偏移中示出的值,移动要参照的索引项,设对应于移动方的索引项的编辑单元为用于对在步骤S10中指定的指定显示区间的显示开始帧进行解码所必需的开始编辑单元(步骤S17)。
使用图9~图12说明更具体的例子。图9及图10示出了针对开放GOP结构的视频数据求容纳在部分传送文件中的编辑单元的例子。显示次序及编码次序从编号#0开始,从图9到图10为连续的次序。
图9是,在开放GOP结构的视频数据中求用于对显示开始帧进行解码所必需的编辑单元的例子。此图9的例子中,将显示开始帧指定为开放GOP结构中所包含的帧“B”#7。此帧“B”#7,在开放GOP结构中,解码时,相对于自身属于的GOP,需要属于前一GOP的帧。再有,即使是开放GOP结构,也如图9所示,所有的开始的GOP必须为闭合GOP的结构。
在将显示开始帧指定为开放GOP结构的GOP中所包含的帧“B”#7的时候,参照对应于该帧“B”#7的显示次序的编码次序#7的索引项,取得瞬时偏移的值“+1”。然后,将索引项移动相当于该瞬时偏移值“+1”,取得作为移动方的、对应于编码次序#8的索引项的密钥帧偏移值“-8”。从对应于此编码次序8的索引项起,移动了相当于密钥帧偏移值“-8”的索引项中所示出的、对应于编码次序#0的编辑单元#0成为用于对开始帧进行解码所必需的开始的编辑单元。
图10是在开放GOP结构的视频数据中求用于对显示结束帧进行解码所必需的编辑单元的例子。在该图10的例子中,显示结束帧为帧“B”#19。参照对应于作为结束帧的帧“B”#19的显示次序的编码次序#18的索引项,取得瞬时偏移的值“+1”。然后,将索引项移动相当于该瞬时偏移值“+1”,作为移动方的索引项中所示出的、对应于编码次序#20的编辑单元#20成为用于对结束帧进行解码所必需的编辑单元。
图11及图12是针对闭合GOP结构的视频数据求容纳在部分传送文件中的编辑单元的例子。显示次序及编码次序,从编号#0开始,从图11到图12为连续的次序。
图11是在闭合GOP结构的视频数据中求用于对显示开始帧进行解码所必需的编辑单元的例子。此图11的例子中,将显示开始帧指定为帧“B”#7。在闭合GOP结构中,在显示次序中,位于最初的帧“I”之前的帧“B”,不执行前方参照,仅后方参照位于帧“B”之后的帧“I”,由此进行解码。
在将显示开始帧指定为帧“B”#7的时候,参照对应于该帧“B”#7的显示次序的编码次序的索引项,取得瞬时偏移的值“+1”。然后,将索引项移动相当于该瞬时偏移值“+1”,取得作为移动方的、对应于编码次序#8的密钥帧偏移值“-2”。从对应于此编码次序8的索引项起,移动了相当于密钥帧偏移值“-2”的索引项中所示出的、对应于编码次序#6的编辑单元#6成为用于对开始帧进行解码所必需的开始的编辑单元。
图12是在闭合GOP结构的视频数据中求解用于对显示结束帧进行解码所必需的编辑单元的例子。此图12的例子中,显示结束帧为帧“B”#19。参照对应于作为结束帧的帧“B”#19的显示次序的编码次序#18的索引项,取得瞬时偏移的值“+1”。然后,将索引项移动相当于此瞬时偏移值“+1”,作为移动方的索引项中所示出的、对应于编码次序#20的编辑单元#20成为用于对结束帧进行解码所必需的编辑单元。这样,关于显示结束帧,通过开放GOP结构和闭合GOP结构,可得到相同的结果。
如上述那样,在求用于对显示开始帧进行解码所必需的编辑单元,和用于对结束帧进行解码所必需的编辑单元时,分别取得这些编辑单元所属的GOP信息。并且,从源文件中以GOP单位取出从用于对显示开始帧进行解码所必需的编辑单元所属的GOP到用于对显示结束帧进行解码所必需的编辑单元所属的GOP,来制作部分传送文件。
例如,在表示开放GOP结构中的显示开始帧一侧的图9的例子中,在将显示开始帧设为从开头起属于第2的GOP的帧“B”#7的情况下,如上所述,解码所必需的开头的编辑单元,为该帧“B”7所属的GOP的前1个GOP中的帧“I”#2。使用由该帧“I”#2解码了的帧“P”#5和帧“B”#7所属的GOP的帧“I”#8,来对帧“B”#7进行解码。因此,实际上不需要帧“B”#7所属的GOP的前1个GOP中的B图片的帧。
在本实施方式中,在显示开始帧一侧,也包含此不要的B图片,并以GOP单位容纳在部分传送文件中。
此外,在表示显示结束帧一侧的图10的例子中,例如,将显示结束帧指定为在仅对应的I图片中能够解码的帧“I”#20。这种情况下,根据上述的图8的流程图的处理,用于对显示结束帧进行解码所必需的编辑单元是容纳对应的I图片的数据的编辑单元,为对应于编码次序#18的编辑单元#18。但是,在显示次序中帧“I”#20之前,由于存在同一GOP内的帧“B”#18及帧“B”#19,所以,在编码次序中位于帧“I”#20(编码次序中第18)之后的、这些帧“B”#18及帧“B”#19(按编码次序分别为第19及第20)也需要共同进行解码。这在显示结束帧是不需要参照后方的P图片的帧“P”的情况下也是同样的。
在本实施方式中,由于以GOP单位取出数据而制作部分传送文件,所以,在显示结束帧一侧,也包含显示次序和编码次序中与I图片或P图片交换顺序的B图片,并能够容纳在部分传送文件中。
再有,不限于此,也可以从源文件中以图片单位取出视频数据,根据取出的图片制作部分传送文件。这种情况下,就需要适当地进行,在上述显示开始帧一侧去除容纳不需要的B图片的编辑单元,和在显示结束帧一侧追加容纳I图片或P图片在显示次序及编码次序上交换顺序的B图片的编辑单元等工作。
接着,进一步详细地说明上述图7的流程图中的步骤S3的索引表的更新处理。在索引表内的索引项阵列中的各索引项中,由于标志在每个编辑单元中是固定的值,所以不会改变。由于部分传送文件未经解码及再编码处理而被制作,编码单元中所存储的图片数据中没有变化,所以片段偏移不变。此外,瞬时偏移及密钥帧偏移,在以GOP单位将数据容纳在部分传送文件中的时候是不变的。
按照容纳在部分传送文件中的基本容器流的结构,在每一索引项中更新流偏移。即,以执行部分传送的GOP的开始为基准求解各编辑单元的偏移,成为新的流偏移的值。
在部分传送文件中,在相对于源文件在该索引表之前存在的编辑单元的数目变化的情况下,按照该编辑单元数目更新索引表中的索引开始位置。
例如,从源文件中,取出包含某一索引表所管理的区域的后侧,容纳在部分传送文件中,在部分传送文件中没有包含该索引表所管理的区域之前的区域的情况下,变更编辑单元编号。此时,按照变更的编辑单元的编号更新索引开始位置。
此外,在由该索引表管理的编辑单元数目中产生变化的情况下,索引持续时间随着该编辑单元数目而被更新。例如,从某一索引表所管理的区域的中途,取出编辑单元容纳在部分传送文件中的情况下,改变该索引表所管理的编辑单元数目。在这种情况下,更新该索引表内的索引持续时间以便示出该索引表所管理的编辑数目。
接着,更详细地说明上述图7的流程图中的步骤S4的首标元数据的更新处理。如上所述,首标13中,作为首标元数据,记述了显示开始帧及持续时间。根据部分传送文件内的显示次序记述显示开始帧。
使用上述图9说明在首标元数据中事先记述显示开始帧及持续时间的效果。如已说明的,在图9的例子中,在开放GOP结构中,将显示开始帧指定为在显示次序中GOP的起始的帧“B”#7时,该帧“B”#7所属的GOP的前1个的GOP的帧“I”#2成为用于对显示开始帧“B”#7进行解码所必需的起始的帧。此帧“I”#2,在编码次序中对应于GOP的起始的编辑单元。此外,部分传送文件中,由于以GOP单位容纳数据,所以在此例中,从显示开始帧“B”#7所属的GOP的前1个GOP起,容纳在部分传送文件中。
以往,没有进行在首标13中记述对于此种指定显示区间的信息。为此,再现系统,再现如上所述制作的部分传送文件时,只能从可显示的起始帧开始显示,要从显示开始帧起显示的情况下,就需要改变、进行显示开始帧的搜索。例如,在图9的例子中,从显示开始帧“B”#7所属的GOP的前1个GOP的、在显示次序中起始的帧“B”#0起开始再现。
根据本发明的一实施方式,当再现系统在再现部分传送文件时,预先读入首标13,根据记述在首标元数据中的显示开始帧及持续时间的信息,就能够得知部分传送文件内需要显示的区间。由此,在再现部分传送文件时,不再现此显示开始帧前面的帧,就能够从显示开始帧起直接开始再现,就能够容易地进行仅显示指定区间。
接着,进一步具体地说明可适用在本发明的一实施方式的系统。首先,说明可适用在本发明的一实施方式的记录介质。图13表示盘状记录介质的数据配置的一个例子。此图13中一例所示出的数据配置是在可记录光盘、硬盘等可随机存取的盘状记录介质中通常的数据配置。逻辑地址空间是可记录再现任意数据的区域。
在本实施方式中,记录介质为光盘。再有,可适用在此一实施方式的记录介质不限于光盘。即,此实施方式还能够适用于硬盘驱动器和半导体存储器等其它的可随机存取的记录介质。例如,在这种记录介质中记录、提供上述的MXF文件。此外,按照此一实施方式,可以将由根据显示开始帧及持续时间从MXF文件中取出的数据组成的部分传送文件记录在这种记录介质中。
在逻辑地址的前端和后端中配置文件系统FS。任意的数据通常以称为文件的规定形式被记录在逻辑地址空间内。基本上按文件单位管理记录介质上的数据。在文件系统FS中记录文件的管理信息。记录再现装置的系统控制单元(后述)的文件系统层,通过参照及操作此文件系统FS的信息,就能够在一个记录介质上管理多种多样的数据。文件系统FS,例如可使用UDF(通用磁盘格式,Universal Disk Format),按2kB(千字节)单位管理文件。
在逻辑地址空间之外,配置交替区域。交替区域是在记录介质的一部分由于缺陷(缺陷)而物理上不能进行读写时可替代使用的区域。例如,对记录介质进行访问(特别是记录时的存取)时发现缺陷区域的情况下,通常进行交替处理,将该缺陷区域的地址移动到交替区域内。
交替区域的使用状况作为缺陷清单存储在规定区域中,由记录再现装置的驱动控制单元和系统控制单元的低位层使用。即,在后述的驱动控制单元和系统控制单元的低层中,在进行对记录介质的访问时,参照缺陷清单,即使执行交替处理的情况下,也可以进行对适当区域的访问。借助于交替区域这种结构,高位应用程序,不用考虑记录介质上有无不良记录区域和不良记录区域的位置等,就能够对记录介质进行数据的记录再现。
盘状记录介质的情况,交替区域大多配置在磁盘的最内周侧或最外周侧。在通过在磁盘的半径方向上阶段地变更转动速度的容纳区控制来进行磁盘的转动控制的情况下,也存在在每一容纳区设置交替区域的情况。在记录介质不是半导体存储器等盘状记录介质的情况下,大多配置在物理地址最小侧或最大侧。
在使用音频数据及视频数据(以下归纳称为AV数据)的应用程序中,将保障连续同步再现、即实时再现的、作为再现所必需的单位的数据的汇总称为单元逻辑映射处理器(クリツプ)。例如,将从通过摄影机开始拍摄到结束拍摄的汇总的数据作为单元逻辑映射处理器。单元逻辑映射处理器的实体由单一的文件或多个文件组成。在此发明中,单元逻辑映射处理器由多个文件组成。后面详细叙述单元逻辑映射处理器。
例如,对于逻辑地址空间,在起始侧配置能够记录单元逻辑映射处理器以外的任意文件的NRT(非真实时间,Non Real Time)区域,在NRT区域之后,顺次装满单元逻辑映射处理器。避开光盘1上的缺陷位置来配置单元逻辑映射处理器,就不用进行上述的交替处理。各单元逻辑映射处理器中,附加有首标(H)及脚注(F)。在此例中,首标及脚注集中配置在单元逻辑映射处理器的后端侧。
再有,在以下说明中,将在光盘1中最先记录的单元逻辑映射处理器作为单元逻辑映射处理器#1,以后,为单元逻辑映射处理器#2、单元逻辑映射处理器#3、…,增加单元逻辑映射处理器编号。
在逻辑地址空间内,没有记录数据的区域和过去记录过数据而现在不要的区域作为未使用区域在文件系统FS中加以管理。对于记录介质上新记录的文件,按照未使用区域分配记录区域。在文件系统FS中追加该文件管理信息。
作为记录介质使用可记录光盘的情况下,此发明中,按照年轮结构在记录介质中记录单元逻辑映射处理器。使用图14及图15说明年轮结构。图14A是在时间线上表示一个单元逻辑映射处理器50的例子。在此例中,单元逻辑映射处理器50由视频数据51、音频数据52A~52D、辅助AV数据53及实时元数据54这7个文件组成。
视频数据51是将基带的视频数据以例如位传送速率为50Mbps(兆比特每秒)的高位传送速率进行压缩编码的视频数据。作为压缩编码的方式,例如,可使用MPEG2(活动图像压缩标准2,Moving Pictures Experts Group 2)方式。音频数据52A、52B、52C、52D可使用基带的音频数据,是分别2声道的音频数据。不限于此,音频数据52A、52B、52C、52D也可使用以高位传送速率将基带的音频数据压缩编码了的音频数据。视频数据51及音频数据52A~52D是作为实际广播和编辑的对象的数据,被称为本线类数据。
辅助AV数据53是将基带的视频数据及音频数据以相对于本线类的视频数据及音频数据更低的位传送速率压缩编码、多重化了的数据。作为压缩编码方式,例如可使用MPEG4方式,将位传送速率降低到例如几Mbps来进行压缩编码,生成本线类的AV数据。辅助AV数据53是作为用于进行高速搜索再现的本线类数据的代理而使用的数据,也称为代理人(Proxy)数据。
元数据是与某一数据相关的高位数据,作为用于表示各种数据的内容的索引起作用。在元数据中,存在沿上述本线类的AV数据的时间系列产生的实时元数据54,和本线类的AV数据中每一场景(scene)等、相对于规定的区间产生的非时间系列元数据这2种。非时间系列元数据记录在例如用图13说明的NRT区域中。
如图14B中的一个实例所示,以规定的再现时间(例如2秒)为基准来分配单元逻辑映射处理器50,作为年轮结构记录在光盘中。如图14C中的一个实例所示,按具有磁道1周以上的数据尺寸的规定再现时间单位对一个年轮进行分配,以使各再现时间带对应视频数据51、音频数据52A~52D、辅助AV数据53及实时元数据(RM)54,以分配的每一再现时间单位顺序地配置、记录。即,构成单元逻辑映射处理器50的各数据按年轮结构以规定时间单位交错插入(interleave),记录在光盘中。
形成年轮的数据称为年轮数据。年轮数据为磁盘中的最小的记录单位的整数倍的数据量。此外,按使其边界与磁盘的记录单位的字块边界相一致来记录年轮。
图15示出了光盘1形成年轮数据的一个例子的状态。例如,如使用图14B所说明的,从光盘1的内周侧向外周侧,连续地记录以规定的再现时间单位分配1个单元逻辑映射处理器的年轮数据#1、#2、#3、…。即,从光盘1的内周侧向外周侧,配置数据,以使再现的时间序列连续。再有,虽没有图示,但在图15的例子中,NRT区域被配置在起始年轮#1的更内周侧。
图16示出了MPGE2的长GOP中的一个例子的数据结构。例如,如图16A所示,由1个单元逻辑映射处理器构成1个长GOP文件。如图16B所示,长GOP文件具有使用图1已说明的视频MXF文件结构,从起始起配置首标分配包(HPP)和首标元数据来构成首标13,在此后的文件主体中,配置容纳视频数据本体的基本容器。在文件末尾配置脚注分配包(FPP),构成文件脚注(未图示)。
如图16C所示,基本容器为GOP排列的结构。各GOP的内容,如图16D所示,是图片的集合,一个图片的内容,如图16E所示,起始配置KL(Key,Length)信息,接着配置I、P或B图片的本体,然后配置KL信息。在图片的末尾按照要求配置填充位(filler)单位使末尾统一。
在这样的结构中,MPEG2的长GOP中,各图片的信息量、即图16E所示的I、P及B图片的尺寸的值变得不确定。因此,例如,从长GOP视频文件中的某一帧起开始再现的情况下,不能够以字节位置等指定对应于长GOP视频文件中的此帧的图片的起始位置。
为此,以从长GOP视频文件的起始位置起以字节单位示出的文件地址(参照图16F)为基准,对于各个长GOP视频文件中所包含的各图片,准备文件地址、尺寸及图片类型(I、P或B图片),和表示此图片是否是GOP的起始图片的信息来作为图片指示器(pointer)信息。在每一长GOP视频文件中准备此图片指示器信息。
再有,调整在如图16E所示的图片末尾配置的填充位,使各图片的边界调整为在文件地址中看是例如2048字节这样的规定的字节的倍数。作为一个例子,优选使用填充位来调整各图片的边界,以使各图片的边界与所谓光盘10的扇区的最小存取单位的边界一致时,使每个图片的存取变容易。
图17是表示记述图片指示器信息的图片指示器表的更具体的例子。在此例中,图片指示器表以8字节单位记述数据。起始的8字节容纳预约区域及此图片指示器表的版本信息。下面,相对于1帧即1图片,分配8字节,此8字节的信息仅排列包含在长GOP视频文件中的图片的数目。各图片以显示帧顺序排列。
说明每一图片的数据。起始的1位是表示此图片是否是GOP的起始的图片的标志。例如,假设在1GOP内存在多个I图片的情况,仅靠I图片位置不能够特定GOP的边界。考虑在每GOP中可设置时序首标的系统的情况,不能够特定GOP的边界,则不明白MPEG2中所规定的时序首标(SequenceHeader)的位置,有可能导致对解码器输入的流的起始没有时序首标这样的状态。通过在每一图片中都带有表示是否为此GOP起始的图片的标志,就能够避免这种状态。再现时,根据此标志向解码器中输入流。
如图16E所示,接下来的23位容纳图片的尺寸信息。作为尺寸信息,通过确保23位,就能够对应达到8MB(兆字节)的数据尺寸,也可以对应MPEG分布(profile)的422@HL。
以接下来的2位表示图片类型。对于B图片而言,也表示参照方向的信息。图片的类型更具体地,例如如下记述。
00I图片10P图片01从仅未来的帧起,被后方(Backward)参照、解码的B图片。这是例如开放GOP时的、长GOP视频文件起始的B图片,或闭合GOP时的各GOP起始的B图片。
11参照前方及后方的帧,解码的B图片。
接下来的38位表示该图片的长GOP视频文件内的文件地址。通过在文件地址中分配出38位,就能够对应达到尺寸256GB(十亿字节)的长GOP视频文件。例如,1层中具有27GB的记录容量的记录层可与8层构成的光盘1相对应。
将此图片指示器表作为图片指示器文件与非时间序列元数据一起被记录在例如记录介质的NRT区域中。将光盘1装进系统时,由系统读出在此NRT区域记录的非时间序列元数据和图片指示器文件,针对系统进行光盘1的安装。读出的非时间系列元数据和图片指示器文件,例如在系统控制单元具有的存储器中保持。系统的控制单元通过参照保持在存储器中的图片指示器表,就能够对记录在光盘1内的单元逻辑映射处理器中的任意的图片进行访问。
接着,说明可适用本发明的一实施方式的记录再现装置。图18示出了可适用本发明的一实施方式的记录再现装置100的结构的例子。此记录再现装置100可使用光盘1作为记录介质。
记录侧视频信号处理单元101对输入的基带的数字视频信号实施规定的信号处理。MPEG编码器102,对从记录侧视频信号处理单元101供给的数字视频信号实施基于已定MPEG2的压缩编码处理,输出MPEG ES(MPEG通量流(elementary streams))。即,MPEG编码器102,对于供给的数字视频信号通过DCT(离散余弦转换,Discrete Cosine Transform)进行帧内压缩,使用预测编码进行帧间压缩。并且,对于进行了帧内压缩及帧间压缩的数据,实施可变长编码。
存储控制器103与RAM(随机存取存储器,Random Access Memory)104连接,在控制有关记录及再现的视频数据对RAM 104的缓冲环(bufferring)的同时,还控制在执行上述记录侧的视频处理的各部,连接后述的磁盘驱动单元105和执行整体控制的CPU(中央处理器,Central Processing Unit)121的总线120,执行再现侧的视频处理的各部,以及执行音频处理的各部等之间的数据和指令的交换。
RAM 104例如由SDRAM(同步动态RAM,Synchronous Dynamic RAM)构成,按照例如作为光盘1的记录格式的年轮图像,能够暂时容纳1至多个年轮部分的视频数据、音频数据及其它数据。存储控制器103,可不采用后述的CPU 121而通过DMA(直接存储器访问,Direct Memory Access)控制来执行对此RAM 104的存取控制。
磁盘驱动单元105,其详细内容后述,执行对于装入光盘1的数据的记录,和记录在光盘1的数据的再现。磁盘驱动单元105,通过例如称为ATA(高技术附件,AT Attachment)的规定接口与存储控制器103连接,根据通过接口供给的指令和地址信息,就能够对光盘1的规定的地址进行存取。
MPEG解码器106执行从存储控制器103供给的、以基于MPEG2的已定的压缩编码方式压缩编码了视频数据的解码。MPEG解码器106具有多个能够存入多个解码后的帧的帧缓冲器(未图示),可以将解码后的帧存入此帧缓冲器中。例如,MPEG解码器106,在使用存入此帧缓冲器中的帧执行前方和/或后方参照的图片的解码的同时,根据规定的输出控制命令,控制帧的输出定时等。
再现侧视频处理单元108对由MPEG解码器106解码的基带的数字视频信号实施规定的信号处理,并输出到外部。此外,在再现侧视频处理单元108连接着执行辅助AV数据的视频数据侧的处理的辅助AV(V)单元107。
辅助AV(V)单元107执行对辅助AV数据的视频数据部分的处理。例如,辅助AV(V)单元107对从记录侧视频处理单元101供给的视频数据实施规定的压缩编码处理,制作辅助AV数据的视频数据部分。制作的辅助AV数据的视频数据部分,通过再现侧视频处理单元108供给到存储控制器103。此外,辅助AV(V)单元107,还执行对从存储控制器103通过再现侧视频处理单元108供给的、辅助AV数据的视频数据部分的解码处理。辅助AV数据的视频数据部分已解码的数字视频信号被供给到再现侧视频处理单元108。
音频处理单元109,执行涉及数字及模拟音频信号的输入输出处理。例如,针对输入的数字音频信号实施规定的信号处理,供给到存储控制器103和后述的辅助AV(A)单元110。此外,针对从存储控制器103和辅助AV(A)单元110供给的数字音频信号实施规定的信号处理,并输出到外部。并且,音频处理单元109对从外部供给的模拟音频信号进行D/A转换,作为数字音频信号供给到存储控制器103和辅助AV(A)单元110。此外还有,音频处理单元109对从存储控制器103和辅助AV(A)单元110供给的数字音频信号进行A/D转换,作为模拟音频信号输出到外部。
辅助AV(A)单元110执行辅助AV数据的音频数据部分的处理。例如,辅助AV(A)单元110,针对从音频处理单元109供给的数字音频信号实施规定的压缩编码处理,制作辅助AV数据的音频数据部分。制作的辅助AV数据的音频数据部分供给到存储控制器103。此外,辅助AV(A)单元110对从存储控制器103供给的辅助AV数据音频数据部分进行解码,供给到音频处理单元109。
总线120连接着存储控制器103。在总线120上连接着CPU 121。通过总线在CPU 121上还连接有RAM 122、ROM(只读存储器,Read OnlyMemory)123及连接器124。CPU 121根据预存在ROM 123中的程序,使用RAM 122作为工作存储器,控制此记录再现装置100的全体。连接器124被用于安装可装卸的非易失性的存储器125。再有,为了避免繁杂,图18中省略了CPU 121和记录再现装置100的各部之间进行指令和数据交换的路径。
总线120还连接着通信接口126。通信接口126,以基于例如IEEE(电气与电子学工程师协会,Institute of Electrical and Electronics Engineers)1394规格的通信方式执行此再现记录装置100和外部设备之间的通信。适用于通信接口126的通信方式不限于IEEE1394,例如也可以是USB(通用串行总线,Universal Serial Bus)等。
此外还有,总线120通过连接器130连接到131。在总线131上还连接着CPU132、存储器133及通信接口134。例如,通信接口134被连接到LAN(本地区网络,Local Area Nstwork),执行在通信协议中使用TCP/IP(传送控制协议/网络协议,Transmission Control Protocol/Intemet Protocol)的通信。CPU 132根据预存在未图示出的ROM的程序,使用RAM 133作为工作存储器,控制通过通信接口134的通信。例如,CPU 132能够使用FTP(File TransferProtoncol)执行通过通信接口134的文件传送。
再有,例如,如果上述ROM 123是EEPROM(电可擦除可编程只读存储器,Electrically Erasable Promgrammable Read Only Memory)等可擦写的ROM,以后就能够更新在ROM 123中存储的程序。用于更新的程序数据,例如经LAN供给到此记录再现装置100,由通信接口134接受,通过总线131、连接器130及总线120供给到CPU 121,根据CPU 121的控制写入ROM 123。此外,用于更新的程序数据既可以通过通信接口126从外部供给,也可以存储在可装卸的存储器125中,从存储器125通过接口124供给。
从外部对定时脉冲发生器(TG)140供给用于获取视频数据和音频数据的同步的基准同步信号。定时脉冲发生器140根据供给的基准同步信号,生成在此记录再现装置100内部使用的各种计时信号。生成的计时信号按照信号的种类,被供给到记录再现装置100内部的相对应的部分(未图示)。
再有,针对此记录再现装置100的操作,例如通过通信接口126和通信接口134,根据从外部供给的指令就能够执行。即,CPU 121通过通信接口126和通信接口134执行与外部设备的数据和指令的交换,从外部设备中接受操作指令,将记录再现装置100的状态信息发送到外部设备。根据与此外部设备的交换,CPU 121对此记录再现装置100的各部分进行规定的控制。
当然,不限于此,也可以针对记录再现装置100设置操作部,按照对操作部的操作控制记录再现动作。
图19示出了此记录再现装置100的磁盘驱动单元105的一例结构。在记录时,从存储控制器103供给的记录数据通过ECC(纠错码,Eorror CorrectionCoding)单元158及存储控制器156被存入存储器157中。存储控制器156根据控制单元150的控制,控制对存储器157的访问。再有,控制单元150由微型计算机构成,根据来自存储控制器156的控制信号控制此磁盘驱动单元105。
对于存入存储器157中的记录数据,利用ECC单元158在每一纠错单位生成纠错码。作为针对视频数据及音频数据的纠错码,可使用乘积码。乘积码是在视频数据或音频数据的2维排列的纵方向上执行外码的编码,在其横方向上执行内码的编码,对数据码元进行2重编码的代码。作为外码及内码,能够使用里德-索罗门码(Reed-Solomon Code)。将以乘积码结束的数据单位称为ECC字块。ECC字块例如具有64k字节(65536字节)的尺寸。存储控制器156从存储器157中读出ECC字块,作为记录数据供给到调制/解调单元155。调制/解调单元155对此记录数据进行调制,生成记录信号,供给到拾取单元152。
拾取单元152根据从调制/解调单元155供给的记录信号控制激光的输出,将记录信息记录在通过主轴电机151旋转驱动的光盘1中。
再有,拾取单元152对来自光盘1的反射光进行光电转换,生成电流信号,供给到RF(射频,Radio Frequency)放大器153。RF放大器153根据来自拾取单元152的电流信号,生成聚焦误差信号及跟踪误差信号,以及再现信号,将跟踪误差信号及聚焦误差信号供给到伺服控制单元154。此外,RF放大器153在再现时将再现信号供给到调制/解调单元155。
根据从伺服控制单元154供给到拾取单元152的伺服信号将激光的照射位置控制在规定的位置上。即,伺服控制单元154执行聚焦伺服动作及跟踪伺服动作的控制。具体地,伺服控制单元154根据来自FR放大器153的聚焦误差信号和跟踪误差信号分别生成聚焦伺服信号和跟踪伺服信号,供给到拾取单元152的传动器(未图示)。此外,伺服控制单元154生成驱动主轴电机151的主轴电机驱动信号,执行使光盘1以规定的转动速度旋转的主轴伺服动作的控制。
并且,伺服控制单元154执行使拾取单元152向光盘1的径向移动,改变激光的照射位置的线程控制。再有,根据从存储控制器156供给的控制信号,由控制单元150执行光盘1的信号读出的位置的设定,为了能够从设定的读出位置读出信号,控制拾取单元152的位置。
主轴电机151根据来自伺服控制单元154的主轴电机驱动信号,以线速度固定的CLV(恒定线速度,Constant Linear Velocity),或角速度固定的CAV(恒定角速度,Constant Angler Velocity)旋转驱动光盘1。根据来自信号处理单元3的控制信号,通过CLV及CAV可切换主轴151的驱动方式。
当进行再现时,拾取单元152聚集激光将其照射在光盘1上,将光电转换来自光盘1的反射光的电流信号供给到RF放大器153。调制/解调单元155解调自RF放大器153供给的再现信号,生成再现数据,供给到存储控制器156。存储控制器156将供给的再现数据写入存储器157。从存储器157以ECC字块单位读出再现数据,供给到ECC单元158。
ECC单元158对供给的ECC字块单位的再现数据的纠错码进行解码并执行纠错。检测出超出纠错码带有的纠错能力的错误时,不执行纠错,针对纠错单位设立错误标志。从ECC单元158输出的再现数据供给到存储控制器103。
在以上这种结构中,在记录时,对记录再现装置100输入数字视频信号及数字音频信号。数字视频信号由记录侧视频处理单元101对其实施规定的信号处理,由MPEG编码器102以基于MPEG2的规格的方式进行压缩编码,供给到存储控制器156。此外,数字音频信号,由音频处理单元109对其实施规定的信号处理,供给到存储控制器103。
另一方面,从记录侧视频处理单元101对辅助AV(V)单元107供给数字视频信号。辅助AV(V)单元107,例如按照MPEG4中所规定的压缩编码方式对供给的数字视频信号进行压缩编码,以使其位传送速率变为几Mbps左右,获得辅助AV数据的视频数据部分。此辅助AV数据的视频数据部分供给到存储控制器103。此外,从音频处理单元109输出的数字音频信号被供给到辅助AV(A)单元110,例如稀疏时使用A-Law编码,降低取样频率及量化位数目进行压缩编码,供给到存储控制器103。
存储控制器103根据CPU 121的命令,将由MPEG编码器102压缩编码、供给的数字视频信号,从音频处理单元109供给的数字音频信号和由从辅助AV(V)单元107及辅助AV(A)单元110供给的数据构成的辅助AV数据按规定地存在RAM 104中。此时,存储控制器103在RAM 104上映射供给的压缩数字视频信号、数字音频信号和辅助AV数据,以使其对应上述年轮的格式。
存储控制器103根据来自CPU 121的命令,在RAM 104上存入规定的数据后,从RAM 104中读出数据,将读出的数据与写入命令一起供给到磁盘驱动单元105。磁盘驱动单元105,根据写入命令,将供给的记录数据按年轮格式记录在光盘1中。
当进行再现时,将光盘1装入光盘驱动单元105中,光盘驱动单元105读入光盘1上的文件系统FS。CPU 121通过存储控制器103将光盘1上的文件读出命令供给到光盘驱动单元105。光盘驱动单元105按照此命令,对根据读入的文件系统FS指定的文件进行访问。磁盘驱动单元105从光盘1中以年轮单位读入数据,供给到存储控制器103。存储控制器103以年轮图像将供给的数据存入RAM 104中。
存储控制器103存入RAM 104的规定量以上的数据后,从RAM 104中读出数据。从RAM 104中读出的数字视频信号从存储控制器103供给到MPEG解码器106中,对压缩编码进行解码,成为基带的数字视频信号。此数字视频信号供给到再现侧视频处理单元108,实施规定的信号处理,并输出。
从RAM 104读出的数字音频信号也从存储控制器103供给到音频处理单元109,进行规定的信号处理,并输出。
此外,从RAM 104中读出的辅助AV数据的视频数据部分从存储控制器103通过再现侧视频处理单元108供给到辅助AV(V)单元107。辅助AV数据的视频数据部分由辅助AV(V)107对压缩编码进行解码,通过再现侧视频处理单元108输出。此外,从RAM 104读出的辅助AV数据的音频数据部分,从存储控制器103供给到辅助AV(A)单元110,辅助AV数据的音频数据部由辅助AV(A)单元对压缩编码进行解码,通过音频处理单元109输出。
另一方面,从光盘1读出数据,写入RAM 104中时,CPU 121根据写入RAM 104中的数据制作MXF文件的图像,将索引表、各分区表等表信息保存在RAM 122上。例如,CPU 121参照从光盘1读出的、写入RAM 104的图片指示器表的信息,制作出这些索引表、各分区表等表信息。
此外,例如也可以从光盘读出仅NRT区域的数据,抽出图片指示器表,不执行视频数据等的再现,从此图片指示器表中制作索引表和各分区表等表信息。
CPU 121根据保存在此RAM 122上信息对存入RAM 104中的数据进行访问。由此,CPU 121能够对光盘1上的数据进行虚拟访问。通过这样的操作,例如,对由通信接口134和通信接口126连接的外部设备,能够作为MXF格式的数据示出对光盘1中以年轮格式记录的数据。
接着,在上述结构中,说明对于记录在光盘1中的文件,指定显示开始帧及持续时间,制作由指定区间的帧形成的部分传送文件的处理。作为一个例子,考虑从通过LAN连接的外部设备,通过通信接口134接受部分传送指示,将按照此指示制作的部分传送文件从通信接口134通过LAN发送到该外部设备的情况。
当光盘1被装入磁盘驱动单元105中时,如上所述,从光盘1中以年轮单位读出数据,存入RAM 104中。CPU 121根据存入RAM 104的例如图片指示器表的信息,生成索引表及首标信息、各分区表信息等,制作按照以年轮单位记录在光盘1中的数据的MXF格式的图像。此MXF格式的文件图像通过通信接口134发送到所连接的外部设备中。
在此外部设备中,根据此图像,对于对象的文件指定显示开始帧及持续时间,发出作为从显示开始帧起仅进行持续时间长度的显示这样的部分传送文件的命令。此命令,从外部设备对LAN进行发送,在通信接口134接收。接收的此命令从通信接口134提交到CPU 121中。
CPU 121根据提交的命令按照使用图7的流程图说明的处理,制作部分传送文件的图像。例如,决定用于制作部分传送文件所必需的区间,制作对应的索引表和首标元数据。而且,从光盘1中读出对应于用于制作部分传送文件所需区间的实时数据制作编辑单元,与制作的索引表和首标元数据一起制作部分传送文件。
通过通信接口134将部分传送文件传送到外部的情况下,CPU 121在发出命令以便针对CPU 132从通信接口134发送部分传送文件的同时,将在RAM 122中存储的、这些索引表、首标元数据及规定区间的编辑单元从RAM122中读出,通过总线120、连接器130及总线131提交给CPU 132。CPU 132将提交来的这些数据映射成部分传送文件的文件图像,暂时存储在存储器133中。CPU 132对通信接口134发出命令以在发送存储器133中存储的数据时,通信接口134按规定读出在存储器133中映射成部分传送文件的图像而存储的数据,发送到LAN。
再有,部分传送文件不限于从通信接口134传送到外部,例如,也可以从通信接口126传送到外部。这种情况下,部分传送文件的制作及传送要求,例如,从外部设备发送到通信接口126。此外,通过CPU 121将存储在RAM122的索引表、首标元数据及规定区间的编辑单元从RAM 122中由部分传送文件的图像读出,直接供给到通信接口126。
此外,也可以对存储器125传送部分传送文件。此情况下也与通过通信接口126发送上述部分传送文件的情况相同,从RAM 122中由部分传送文件图像读出在RAM 122中存储的索引表、首标元数据及规定区间的编辑单元,通过连接器124传送到存储器125。
再有,部分传送文件的传送目的地能够在规定的记录介质中记录传送的部分传送文件。例如,在传送目的地连接上与此记录再现装置100同等的设备,可由装入该设备中的光盘1记录传送到该设备中的部分传送文件记录在该设备中。
接着,使用图20的流程图概略地说明对按上述方法制作的部分传送文件进行再现处理的例子。作为一个例子,考虑对光盘1记录部分传送文件,将此光盘1装入记录再现装置100中,对记录的部分传送文件进行再现的情况。
将光盘1装入磁盘驱动单元105时,通过磁盘驱动单元105读入光盘1的文件系统。通过CPU 121按规定能够取得读入的文件系统,例如存储在RAM 122中。CPU 121按照文件系统,能够获知有关记录在光盘1中的文件的、文件名和地址信息等、用于对文件访问所必需的信息。此外,此文件信息能够发送到靠通信接口134和通信接口126连接的外部的设备中。这些外部的设备,根据此文件信息,能够要求在记录再现装置100中对记录在光盘1中的文件的访问。
例如,从通过LAN连接的外部设备,发送记录在光盘1中的部分传送文件的再现要求。此文件再现要求通过通信接口134接收,按规定提交给CPU121。CPU 121根据此部分传送文件再现要求对存储控制器103发出命令,执行在光盘1中记录的指定的部分传送文件的读出(步骤S20)。
再有,记录在光盘1上的数据的读出,例如按照从CPU 121对存储控制器103发出的读出命令,通过存储控制器103执行对磁盘驱动单元105的控制。以下的说明中,为了避免复杂,例如,按所谓的“CPU 121从光盘1中读出数据”的方式,简略地记述对于记录在光盘1中的数据的读出处理。
在步骤S21中,CPU 121读出记录在光盘1中的指定的部分传送文件的首标13及索引表。读出的首标13及索引表从存储控制器提交给CPU 121,存储在RAM 122中。CPU 121根据首标13内的首标元数据,就能够获知该部分传送文件的显示开始帧及持续时间。此外,根据索引表,就能够获知容纳在部分传送文件中的数据结构和各数据的位置。
接着,CPU 121根据索引表开始从部分传送文件的起始的图片进行读出(步骤S22)。实际上,按照编码次序读出部分传送文件中的编辑单元。读出的图片存入RAM 104。
此外,从CPU 121通过存储控制器103对MPEG解码器106发出存入RAM 104的图片的解码命令。MPEG解码器106按照从CPU 121发出的解码命令按编码次序顺序地读出存在RAM 104中的图片,进行规定的解码(步骤S23)。解码获得的帧按规定存入内置于MPEG解码器106中的帧缓冲器中。
另一方面,CPU 121监视内置于MPEG解码器106中的帧缓冲器的状态,根据记述在首标内的首标元数据的显示开始帧,判断帧缓冲器内的解码后的帧容纳状态是否成为可输出显示开始帧的状态(步骤S24)。如果判断为不是可输出显示开始帧的状态,则处理返回步骤S22,执行来自部分传送文件的图片的读出处理等。
另一方面,如果判断为帧缓冲器的状态能成为可输出显示开始帧的状态,就对MPEG解码器106发出命令以便能够从显示开始帧中按显示次序的顺序输出存在帧缓冲器中的帧(步骤S25)。从帧缓冲器读出的帧,通过再现侧的视频处理单元108被输出。
接着,在步骤S26中,CPU 121判断是否输出了相当于在首标13的首标元数据中所记述的持续时间所表示的帧数的帧。如果判断为持续时间所示出的帧数的输出完毕,则结束一连串的部分传送文件的再现。另一方面,如果判断为持续时间所示出的帧数的部分的输出没有完毕,则处理返回步骤S22,按顺序执行图片的读出、解码等的处理。
再有,在此,虽然对在光盘1中记录根据本发明的一实施方式的部分传送文件,从此光盘1中再现出部分传送文件情况进行说明,但不限于此例。即,接受由记录再现装置100制作的、通过通信接口134和通信接口126传送的部分传送文件并存储在存储器上的情况也可以使用上述再现方法。
上述说明中,虽然按记录再现装置100是对记录在光盘1中的视频数据进行再现的专门的硬件的方式进行的说明,但不限于此,例如,可以将称为个人计算机的通用的计算机装置(未图示)作为记录再现装置100使用。这种情况下,根据装载在计算机装置中的程序,就能够实现记录再现装置100的功能。此外,这种情况下,视频数据的解码处理也可通过软件处理由CPU进行,也可以将专用的硬件装载在计算机装置中。
此外,上述说明中,说明了本发明以用光盘作为记录介质,以年轮结构记录单元逻辑映射处理器的情况,但不限于此。例如,记录介质上的记录格式不限于年轮结构,也可以是其它的格式。此外,记录介质也不限于光盘,还可以是硬盘驱动器、半导体存储器。
再有,在上述说明中,本发明说明了可适用于MXF格式的情况,但不限于此例。即,本发明,也可以适用其它的格式,只要是像首标部分这样的、能够记述有关文件的属性信息、在文件的存取时具有不同于文件的本体部分的读入部分、能够对容纳在文件本体部分的各图片分别进行存取的文件格式即可。
此外还有,在上述说明中,说明了向外部传送制作的部分传送文件的情况,但这不限于此例。例如,也可以在使用硬盘驱动器等非线性记录介质的视频编辑装置等中,以根据本发明的实施方式的文件制作方法制作保持编辑过程及编辑结果的内部文件。
此外,在上述说明中,说明了相对于容纳在源文件中视频数据指定的区间,制作部分传送文件的情况,但这并不限于此例。例如,对于视频流也可以适用根据本发明的文件制作方法。
权利要求
1.一种数据处理装置,包括解码区间检测单元,检测必要的基于帧的编码顺序的第2区间,以便对以视频数据的帧的显示顺序所指定的第1区间进行解码,视频数据被使用预测编码的帧间压缩进行压缩编码;和文件制作单元,制作容纳了由上述解码区间检测单元检测出的上述第2区间的视频数据的文件,上述文件制作单元将以帧的显示顺序表示上述第1区间的信息附加在上述文件中。
2.根据权利要求1所述的数据处理装置,其中,上述文件制作单元将表示上述第1区间的信息容纳在上述文件的首标部分中。
3.根据权利要求1所述的数据处理装置,其中,上述视频数据包括至少记述了第1位置信息的表,第1位置信息表示了构成该视频数据的各帧的该视频数据内的位置;上述文件制作单元将上述表容纳在上述文件中,上述表根据上述解码区间检测单元检测出的上述第2区间而重写上述第1位置信息。
4.根据权利要求3所述的数据处理装置,其中,上述表还记述了第2位置信息,第2位置信息表示该表的上述视频数据内的位置;上述文件制作单元将上述表容纳在上述文件中,上述表根据上述解码区间检测单元检测出的上述第2区间而重写上述第2位置信息。
5.根据权利要求1所述的数据处理装置,其中,上述视频数据由至少一帧第1类型的帧和一帧或多帧第2类型的帧组成,以可单独存取的群为单位被编码,第1类型的帧可单独解码,第2类型的帧以时间上在前和/或后的其它帧为基准被解码;上述文件制作单元将上述视频数据以上述群单位容纳在上述文件中,上述群单位包含由上述解码区间检测单元检测出的上述第2区间。
6.根据权利要求1所述的数据处理装置,其中,上述解码区间检测单元基于上述第1区间端部的帧的预测编码的类型检测上述第2区间。
7.根据权利要求6所述的数据处理装置,其中,上述视频数据由至少一帧第1类型的帧和一帧或多帧第2类型的帧组成,以可单独存取的群为单位被编码,第1类型的帧可单独解码,第2类型的帧以时间上在前和/或后的其它帧为基准被解码;上述解码区间检测单元还根据上述群是否使用其前1个上述群的帧被编码来检测上述第2区间。
8.一种数据处理方法,包括检测必要的基于帧的编码顺序的第2区间,以便对以视频数据的帧的显示顺序所指定的第1区间进行解码的步骤,视频数据被使用预测编码的帧间压缩进行压缩编码;和,制作容纳了由上述解码区间检测步骤检测出的上述第2区间的视频数据的文件的步骤;上述文件制作的步骤包含将以帧的显示顺序表示上述第1区间的信息附加在上述文件中的步骤。
9.一种数据处理程序,使计算机装置执行数据处理方法,该数据处理方法包括检测必要的基于帧的编码顺序的第2区间,以便对以视频数据的帧的显示顺序所指定的第1区间进行解码的步骤,视频数据被使用预测编码的帧间压缩进行压缩编码;和,制作容纳了由上述解码区间检测步骤检测出的上述第2区间的视频数据的文件的步骤;上述文件制作的步骤包含将以帧的显示顺序表示上述第1区间的信息附加在上述文件中的步骤。
10.一种数据结构,至少包含基于帧的编码顺序的第2区间的视频数据,该视频数据是用预测编码的帧间压缩进行过压缩编码的视频数据,需要用该视频数据对以帧的显示顺序所指定的第1区间进行解码;和以帧的显示顺序表示上述第1区间的信息。
11.根据权利要求10所述的数据结构,其中,还包含至少记述了第1位置信息的表,第1位置信息表示了构成上述视频数据的各帧的该视频数据内的位置。
12.根据权利要求11所述的数据结构,其中,上述表还记述了第2位置信息,第2位置信息表示该表的上述视频数据内的位置。
13.根据权利要求10所述的数据结构,其中,上述视频数据由至少一帧第1类型的帧和一帧或多帧第2类型的帧组成,以可单独存取的群为单位被编码,第1类型的帧可单独解码,第2类型的帧以时间上在前和/或后的其它帧为基准被解码;以包含上述第2区间的上述表单位来容纳上述视频数据。
14.一种记录介质,记录了具有数据结构的文件,该数据结构至少包含必要的基于帧的编码顺序的第2区间的视频数据,以便对以视频数据的帧的显示顺序所指定的第1区间进行解码,视频数据用预测编码的帧间编码进行压缩编码;和以帧的显示顺序表示上述第1区间的信息。
15.根据权利要求14所述的记录介质,其中,表示上述第1区间的信息被容纳在上述文件的首标部分中。
16.根据权利要求14所述的记录介质,其中,上述文件还包含至少记述了第1位置信息的表,第1位置信息表示了构成上述视频数据的各帧的该视频数据内的位置。
17.根据权利要求16所述的记录介质,其中,上述表还记述了第2位置信息,第2位置信息表示该表的上述视频数据内的位置。
18.根据权利要求14所述的记录介质,其中,上述视频数据由至少一帧第1类型的帧和一帧或多帧第2类型的帧组成,以可单独存取的群为单位被编码,第1类型的帧可单独解码,第2类型的帧以时间上在前和/或后的其它帧为基准被解码;上述文件以包含上述第2区间的上述群单位来容纳上述视频数据。
19.一种再现装置,对视频数据进行再现,视频数据被记录在记录介质中,使用预测编码的帧压缩而被压缩编码,该再现装置包括再现单元,从记录介质进行数据的再现;解码单元,对上述再现单元所再现的视频数据进行解码;和输出控制单元,以帧为单位控制上述解码单元所解码的上述视频数据的输出;在由上述再现单元再现包含了数据结构的文件,并由上述解码单元对已被再现的文件中所包含的上述视频数据进行解码时,上述输出控制单元基于以帧的显示顺序表示上述文件中所包含的上述第1区间的信息进行控制,以从该第1区间的开头帧起输出上述视频数据,数据结构至少包含基于帧的编码顺序的第2区间的视频数据,该视频数据是用预测编码的帧间压缩进行过压缩编码的视频数据,需要用该视频数据对以帧的显示顺序所指定的第1区间进行解码;和以帧的显示顺序表示上述第1区间的信息。
20.根据权利要求19所述的再现装置,其中,在上述文件的首标部分中容纳了表示上述第1区间的信息。
21.根据权利要求19所述的再现装置,其中,上述文件还包含至少记述了第1位置信息的表,第1位置信息表示了构成上述视频数据的各帧的该视频数据内的位置。
22.根据权利要求21所述的再现装置,其中,上述表还记述了第2位置信息,第2位置信息表示了该表的上述视频数据内的位置。
23.根据权利要求19所述的再现装置,其中,上述视频数据由至少一帧第1类型的帧和一帧或多帧第2类型的帧组成,以可单独存取的群为单位被编码,第1类型的帧可单独解码,第2类型的帧以时间上在前和/或后的其它帧为基准被解码;上述文件以包含上述第2区间的上述群单位来容纳上述视频数据。
24.一种再现方法,对视频数据进行再现,视频数据被记录在记录介质中,使用按照预测编码的帧压缩而被压缩编码,该再现方法包括从记录介质进行数据的再现的步骤;对所再现的视频数据进行解码的步骤;和以帧为单位控制解码后的上述视频数据的输出的步骤;在再现包含了数据结构的文件,并对已被再现的文件中所包含的上述视频数据进行解码时,上述输出控制步骤基于以帧的显示顺序表示上述文件中所包含的上述第1区间的信息进行控制,以从该第1区间的开头帧起输出上述视频数据,数据结构至少包含基于帧的编码顺序的第2区间的视频数据,该视频数据是用预测编码的帧间压缩进行过压缩编码的视频数据,需要用该视频数据对以帧的显示顺序所指定的第1区间进行解码;和以帧的显示顺序表示上述第1区间的信息。
25.一种再现程序,使计算机装置执行将视频数据再现的方法,视频数据被记录在记录介质中,使用预测编码的帧压缩而被压缩编码,上述再现方法包括从记录介质进行数据的再现的步骤;对所再现的视频数据进行解码的步骤;和以帧为单位控制解码后的上述视频数据的输出的步骤;在再现包含了数据结构的文件,并对已被再现的文件中所包含的上述视频数据进行解码时,上述输出控制步骤基于以帧的显示顺序表示上述文件中所包含的上述第1区间的信息进行控制,以从该第1区间的开头帧起输出上述视频数据,数据结构至少包含基于帧的编码顺序的第2区间的视频数据,该视频数据是用预测编码的帧间压缩进行过压缩编码的视频数据,需要用该视频数据对以帧的显示顺序所指定的第1区间进行解码;和以帧的显示顺序表示上述第1区间的信息。
全文摘要
公开了数据处理装置及方法,可容易地执行部分地传送通过长GOP所压缩编码的视频数据的处理。对于在源文件(10)中所容纳的视频数据,按编码次序检测所必需的编辑单元的区间,以便对按显示次序指定的显示开始帧(11)和根据持续时间的区间的帧进行解码。从文件(10)中,以GOP单位取出指定区间的解码所必需的编辑单元,并容纳在部分传送文件中。将部分传送文件内的显示次序的显示开始帧和持续时间记述在首标(13)内首标元数据中。根据部分传送文件的结构,更新表示了各帧的文件内的位置的索引表。再现时基于首标(13)内的元数据,能够以部分传送文件内的显示顺序获得显示开始帧,容易仅进行指定区间的再现。
文档编号G11B27/10GK101042914SQ20071010355
公开日2007年9月26日 申请日期2007年3月1日 优先权日2006年3月1日
发明者山崎竜司 申请人:索尼株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1