同步流打包的制作方法

文档序号：6772689阅读：108来源：国知局

专利名称：同步流打包的制作方法
技术领域：
本发明总体上涉及先前已知为数字化视频光盘(DVD)、高清晰度数字通用光盘(HD DVD)、以及蓝光盘(RD)的数字通用光盘，更具体地涉及一种有利于嵌入DVD、HD DVD、或BD 的不同音频/视频(A/V)流的子流之间的同步的技术。
背景技术：
当前，DVD、HD DVD和蓝光盘规范定义了用于在多个并行A/V流之间进行无缝切换的机制。然而，在每种情况下，流中的音频和子画面内容受限于在所有流之间逐比特 (bit-for-bit)地相同。这防止可能由一个A/V流与另一个的音频数据的差异所引起的信号尖峰对音频扬声器所产生的任何潜在损坏，并且还减小了关于该数据在每个多路传输 (multiplexed)的A/V流内的组织的限制。然而，这些限制也在很大程度上限制了可以使用无缝多角度特征的应用范围。继光盘(CD)的开发之后，对DVD的开发力求实现针对大视频文件的充足的存储容量，以便单个盘能够携带全长(full length)动画，虽然会使用诸如运动图像专家组压缩 (MPEG)技术之类的压缩技术对该动画进行压缩。由于DVD的首次引入是在20世纪90年代中期，因此DVD已经迅速发展起来，对于消费者而言，变成了针对动画和视频内容的大规模分发的首选介质。已经开发出用于较高质量和较大数量的视听内容的传递的类似光盘格式作为DVD的计划后继者。最主要的两种格式已知为HD DVD和BD。当今的DVD、HD DVD和BD典型地包括至少一个、通常包括彼此并行同步的若干个 A/V流。通常，这种A/V流包括从不同角度对相同场面拍摄的不同记录。因此，通常将这些不同的A/V流称为“角度”。对不同角度(即，不同流)的选择发生在已知为“多角度导航” 的过程中，由此观众通过选择显示屏上的相关图标来选择期望的角度。由这些盘及相关重放设备的制造商所采用的DVD、HD DVD和BD规范定义了被称作“多角度视频”的过程，由此内容作者能够定义多达9个并发A/V流，其中的任何一个流都能够随时出现在显示屏上。在重放期间，观众能够通过DVD、HD DVD和BD播放器上或该播放器的遥控器上的按钮发起命令，由此在一组同步A/V流之间进行无缝切换；这种形式的多角度导航被称作无缝多角度。然而，在已知格式规范和当前可用的DVD、HD DVD和BD创作工具的实现之下，存储在每个A/ V流中的音频和子画面数据保持相同。换言之，在角度之间只允许不同的视频数据。子画面数据描述了通过视频显示的按钮、字幕和其它图形元素的表现(rendering)。这导致当选择并行A/V流时无法自动呈现不同的音频和子画面内容，此外还导致存储在传递介质上的音
3频和子画面数据的冗余拷贝，从而限制了用于其它内容的空间。A/V流是以针对子流(音频、视频和子画面)的数据分组的基本级别构成的，当顺序读取时，这些数据分组一起结合到包括所呈现的流的短单元中。在DVD-Video中，这些基本数据单元被称作视频对象单元或V0BU，并且每个都包括大约0. 4到1秒的呈现数据。在HDDVD-Video中，其被称作EV0BU。这里，为了示例性目的，可以互换地使用术语VOBU和 EVOBU0当并行呈现多个A/V流时，每个流将一个或更多VOBU收集到交错单元或ILVU中，基于视频呈现时间，使其与其它并行A/V流的ILVU同步。因此，当选择新的流时，播放来自当前ILVU的数据，直到该ILVU结束，此时无缝地呈现新流的ILVU。按照这种方式，视频的无缝呈现得以保证。BD表示使用不同术语(即，传输流(TS))的分组的类似组合。BD不限制单元中的呈现数据的持续时间，而是使用每个TS中的角度改变点代替ILVU，以对改变流的同时可以保证视频连续性的点做标记。典型地，为VOBU、TS、RTP或其它分组多媒体格式的所有音频、视频和子画面分组标记第一类型时间戳和第二类型时间戳，其中第一类型时间戳指示应在何时传递以进行解码，而第二类型时间戳指示应在何时呈现。在VOBU的情况下，在IS0/IEC13818-1中定义的 “system_cl0ck_reference”中对传递时间戳进行编码。在传输流(TS)的情况下，典型地将传递时间戳称为如源自IS0/IEC13818-1的一些规范中所定义的“arrival_timestamps”。如这里所使用，术语“arrivaltimestamps”共同地是指VOBU和TS中的传递时间戳。呈现时间戳是如IS0/IEC13818-1中所定义的普通PTS。由于不同的缓冲模型和解码器设计，单个VOBU中的非视频分组(或TS中的角度改变点标记)并非全部涉及类似的呈现时间。例如，音频分组可能涉及呈现时间8，而视频分组可能涉及呈现时间4，针对呈现时间4的音频分组传递自在先V0BU。当音频和子画面/ 字幕数据在并行呈现的不同A/V流的ILVU中的VOBU之间(或TS之间)相同时，切换ILVU 或TS对音频、子画面/字幕和视频的同步或对应/同步没有影响。然而，当音频和子画面数据分组在针对不同A/V流的VOBU或TS之间不同时，可能出现以下情况已经从在先VOBU 或TS中传递与来自新VOBU或TS的视频的呈现时间相对应的音频或子画面/字幕分组，从而导致在正确时间(proper time)所呈现的音频或子画面/字幕呈现与当前上下文失去对应/同步。因此，存在对按照以下方式来存储数据的方法的需要音频和子画面数据并行地上下文不同(contextually different)，根据这些光盘格式中的任何一种格式来播放同步 A/V流，此外，当观众在呈现期间交互地选择不同的A/V流时，还能够保持流的连续性以及与视频数据的同步。

发明内容
本发明解决了现有技术的这些和其它缺点和不足，本发明涉及同步流打包。根据本发明的方面，提供了一种用于对在并行呈现的A/V流之间上下文不同的分组进行同步流打包的方法。该方法包括步骤识别具有与视频分组的到达时间戳和/或呈现时间戳分别相匹配的到达时间戳和/或呈现时间戳的子画面/字幕分组和/或音频分组。该方法还包括步骤利用所识别的子画面/字幕和音频分组以及具有相匹配的时间戳的视频分组，对视频对象单元(VOBU)和/或传输流(TS)进行打包。根据本发明的另一方面，提供了一种用于对在并行呈现的A/V流之间上下文不同的分组进行同步流打包的设备。该设备包括用于识别具有与视频分组的到达时间戳和/ 或呈现时间戳分别相匹配的到达时间戳和/或呈现时间戳的子画面/字幕分组和/或音频分组的装置。该设备还包括用于利用所识别的子画面/字幕和音频分组以及具有相匹配的时间戳的视频分组、对视频对象单元(VOBU)和/或传输流(TS)进行打包的装置。根据本发明的另一方面，提供了一种用于从并行呈现的上下文不同的多个A/V流中呈现出不同A/V流的方法。该方法包括步骤将音频帧报头打包到交错单元(ILVU)中的第一视频对象单元(VOBU)的开始处或传输流(TS)的角度改变点标记处的音频分组中。该方法还包括步骤将最后音频分组打包到多个A/V流中同一流的ILVU或另一个ILVU中的最后VOBU中，或者打包到紧靠TS中另一个角度改变点标记之前，从而以完整的音频帧作为结束。从结合附图而阅读的对示例性实施例的以下详细描述中，本发明的这些和其它方面、特征和优点将变得显而易见。

根据以下示例性附图，可以更好地理解本发明，在附图中图1是根据本发明的示例性实施例示出可应用本发明的DVD播放器的方框图；图2是根据本发明的原理示出用于对在并行呈现的A/V流之间上下文不同的分组进行同步流打包的方法的流程图；图3是根据本发明的原理示出用于对在并行呈现的A/V流之间上下文不同的分组进行同步流打包的方法的流程图；图4是根据本发明的原理示出用于从在并行呈现中上下文不同的多个A/V流中呈现出不同A/V流的方法的流程图；以及图5是示出音频/视觉流、视频对象单元(VOBU)和交错单元(ILVU)之间的关系的方框图。
具体实施例方式本发明涉及同步流打包。根据实施例，提供了一种用于限制音频和子画面分组在多路传输流(例如MPEG节目和传输流)内的组织的方法，以允许在音频内容和/或子画面 /字幕内容不同的多个交错的音频/视频(A/V)呈现之间进行无缝切换。本说明描述了本发明的原理。因此，可以理解的是，尽管这里没有明确地描述或说明，本发明的技术人员将能够设计出体现本发明的原理并被包括在本发明的精神和范围内的各种布置。这里所列举的所有示例和条件语言旨在为了教学目的，以帮助读者理解本发明的原理以及由发明者对技术领域的促进所贡献的概念，并将被解释为不受具体列举的示例和条件的限制。此外，这里列举本发明的原理、方面和实施例的所有陈述及其特定示例都旨在包括其结构性和功能性等同物。此外，该等同物旨在包括当前已知的等同物和在未来开发的等同物，即所开发的用于执行相同功能的任何元件，而不考虑结构。因此，例如，本领域的技术人员将理解的是，这里所呈现出的方框图表示体现本发明原理的示例性电路的概念图。类似地，可以理解的是，任何流程图、状态转移图、伪代码等表示实质上在计算机可读介质中表示并由计算机或处理器所执行的各种过程，无论是否明确地示出了该计算机或处理器。可以通过使用专用硬件以及与能够与适当软件一同执行软件的硬件，来提供图中所示的各种元件的功能。当由处理器提供时，可由单个专用处理器、单个共享处理器、或由多个单独处理器(其中的一些可以共享)来提供这些功能。此外，术语“处理器”或“控制器”的显式使用不应解释为排他地指代能够执行软件的硬件，而且可以不带限制地隐式地包括数字信号处理器(“DSP”)硬件、用于存储软件的只读存储器(“ROM”)、随机存取存储器(“RAM”)、以及非易失性存储器。还可以包括其它硬件(传统的和/或定制的)。类似地，图中所示的所有切换仅仅是概念上的。它们的功能可以通过程序逻辑、专用逻辑、程序控制和专用逻辑的交互、或甚至是手动地来执行，特定技术可由实现者进行选择，更具体的可从上下文中得以理解。在权利要求中，表示为用于执行规定功能的装置的任何元件旨在包括执行以下功能的任何一种方式，例如a)执行该功能的电路元件的组合，或b)任何形式的软件，包括与用于执行用于执行该功能的软件的适当电路相结合的固件、微代码等。由该权利要求所限定的本发明在于如下事实按照权利要求所要求的方式，把各种列举的装置所提供的功能进行组合，并集合到一起。因此，应当注意的是，能够提供该功能的任何装置与这里所示的装置等同。转向图1，可以应用本发明的数字通用光盘(DVD)播放器10由附图标记10大体示出。DVD播放器10包括在伺服装置14控制下使DVD 13旋转的驱动电机12。拾头电机16 也受伺服装置14的控制，用于把光拾头18在DVD 13上移动，以读取其携带的信息。预放大器20放大拾头18的输出信号以输入给解码器22，解码器22对从DVD 13读取的光信息进行解码以产生节目流。多路分离器24将节目流分解成单独分量(a)音频流；(b)视频流；(c)子画面流；以及(d)典型地具有元数据等形式的导航信息。音频、视频和子画面流分别由音频解码器26、视频解码器28、以及子画面解码器 30中单独一个进行解码。同步器32 (有时被称作呈现引擎)，用于对单独解码的音频、视频和子画面流进行同步，并将其组合为视频流，具有根据若干已知电视格式之一(包括但不局限于NTSC或PAL)而用于适合的再现的嵌入音频。视频数模转换器34将视频流转换成用于在诸如电视机之类的显示设备(未示出)上显示的模拟视频，而音频数模转换器36将嵌入音频转换成由显示设备或其它装置(未示出)随后再现的模拟音频。在DVD播放器10内，中央处理单元(CPU) 38 (典型地为具有相关存储器的微处理器，或是微计算机或微控制器)用于根据通过观众接口(υ/Ι)40输入的观众命令来控制DVD 播放器的导航以及其它方面，其中观众接口(U/I)40典型地包括具有遥控形式的红外(I/ R)发射机和I/R接收机的组合。具体关于导航，CPU 38从多路分离器24接收解码后的元数据，并产生针对同步器32的接收的菜单信息。按照这种方式，最终显示菜单信息，以便观众观看。响应所显示的信息，观众典型地通过U/I 40输入由CPU 38接收的一个或更多个命令，而U/I 40控制伺服装置14移动拾头18，以检索期望的节目内容。
DVD 规范(针对只读盘的 DVD 规范 /VIDEO SPECIFICATION,版本 1. 0，1996 年 8 月，第三部分)定义了可应用DVD导航作为视频对象单元(VOBU)的最小对象。VOBU典型地包括与大约0. 4到1. 2秒的重放持续时间相对应的多路传输的视频、音频、子画面、高亮以及其它导航数据。音频和子画面数据的多个子流能够存在于每个VOBU中(例如，立体声和环绕声音频子流和/或德语和葡萄牙语字幕)。这种多路传输数据的组合构成了 “A/V流”。在多角度片断中，将多个A/V流交错于单个视频对象(VOB)流中，以允许为了无缝或接近无缝切换而从一个流到另一个流的快速访问。DVD规范定义了交错单元(ILVU)作为具有一个或更多个VOBU的块，以便将多角度的A/V流内容与公共时间戳对齐，从而提供A/V流的同步。在重放期间，同步器32仅对与当前所选的A/V流相对应的ILVU进行解码和显示。DVD规范定义了基于角度数量(即，可用流的数量)的ILVU的最大尺寸、物理设备的扫描速度、以及解码缓冲器(未示出)的大小。如果超过这个最大尺寸，则不能保证任意角度的无缝重放。根据实施例，提供了如下一种方法对并行呈现的多个视听流中至少一个内的子画面/字幕和/或音频数据进行存储，以保持子画面/字幕、音频和视频数据之间的同步，以及当在呈现期间选择不同的音频/视频(AV)流时提供这些数据之间的连续性。为了保证并行呈现的A/V流之间上下文不同的音频和子画面/字幕与视频的恒定同步和对应，视频对象单元(VOBU)或传输流(TS)应包括其到达时间戳与视频分组的到达时间戳相匹配(分别在子画面/字幕或音频分组的一个时间基准单元内)的子画面/字幕和音频分组。可以理解的是，子画面/字幕典型地不具有固有帧速率，而是其帧速率通常以某种方式得自视频帧速率或与视频帧速率相关。相同规则应用于呈现时间戳，VOBU或TS应包括其呈现时间戳与视频分组的呈现时间戳相匹配(分别在子画面/字幕或音频分组的一个时间基准单元内)的子画面/字幕和音频分组。如果以这种方式来打包VOBU或TS，则音频、子画面/字幕与视频数据之间的同步和上下文对应得以维持，其中音频或子画面/字幕数据在不同A/V流的VOBU或TS之间是上下文不同的。另一个问题是，当呈现新的A/V流的ILVU时音频或子画面/字幕数据的潜在讹误 (corruption)，这是因为该ILVU中的第一 VOBU的开始处(或者在TS的角度改变点标记处)的音频或子画面数据分组可能被分段，并且在后续的整个分组出现之前不能被解码。为了解决这个问题，ILVU中的第一 VOBU的开始处(或TS的角度改变点标记处) 的音频数据分组应包括音频帧报头，而ILVU中的最后VOBU中的最后音频分组(或者在紧靠TS的角度改变点标记之前的最后音频分组)应包括完整的音频帧，即，在任何ILVU边界处(或者在任何角度改变点标记上)都不应出现任何音频帧分段。类似地，子画面/字幕数据必须以子画面单元(SPU)报头或信号出现时间(Epoch)开始报头而开始。转到图2，附图标记200大体示出了一种用于对并行呈现的A/V流之间上下文不同的分组进行同步流打包的方法。方法200包括开始框205，其把控制传递给功能框210。功能框210识别其到达时间戳与视频分组的到达时间戳相匹配的子画面/字幕和/或音频分组，并将控制传递给功能框220。功能框220利用所识别的子画面/字幕和音频分组以及具有相匹配的到达时间戳的视频分组对视频对象单元(VOBU)或传输流(TS)进行打包，并将控制传递给结束框225。结束框225结束此方法。转向图3，附图标记300大体示出了一种用于对并行呈现的A/V流之间上下文不同的分组进行同步流打包的方法。方法300包括开始框305，其把控制传递给功能框310。功能框310识别其呈现时间戳与视频分组的呈现时间戳相匹配的子画面/字幕分组和/或音频分组，并将控制传递给功能框320。功能框320利用所识别的子画面/字幕和音频分组以及具有相匹配的呈现时间戳的视频分组对视频对象单元(VOBU)或传输流(TS)进行打包，并将控制传递给结束框325。结束框325结束此方法。转向图4，附图标记400大体示出了一种用于从在并行呈现中上下文不同的多个 A/V流中呈现出不同A/V流的方法。方法400包括开始框405，其把控制传递给功能框410。功能框410将音频帧报头打包到交错单元(ILVU)中第一视频对象单元(VOBU)开始处的音频分组中，或者将音频帧报头打包到传输流(TS)的角度改变点标记处的音频分组中，并将控制传递给功能框420。功能框420将最后音频分组打包到ILVU(或者相同A/V流中的另一个ILVU)的最后VOBU中，或者将最后音频分组打包到紧靠TS中另一个角度改变点标记之前，从而以完整的音频帧作为结束(任何ILVU边界或角度改变标记上不存在音频帧分段)，并将控制传递给功能框430。功能框430将子画面/字幕分组打包为以子画面单元(SPU)报头或信号出现时间开始报头作为开始，并将控制传递给结束框435。结束框435结束此方法。转向图5，附图标记500大体示出了多路传输的A/V流与多角度视频的VOBU和 ILVU数据结构之间的关系。如图5所示，由图1中的解码器22所解码的节目流中的每个块都包括导航分组(NV_PCK)、视频分组(V_PCK)、音频分组(A_PCK)、以及子画面分组(SP_ PCK)。DVD规范在每个VOBU开始处的NV_PCK的导航数据结构(DSI)部分中定义了无缝角度信息数据结构(SML_AGLI)，其包括由指示每个无缝角度的下一 ILVU所处位置的ILVU开始点组成的表。该信息使图1中的CPU 38能够在准备好开始呈现下一 ILVU时控制伺服装置14移动到VOB流内的何处。此外，DVD规范在每个VOBU开始处的导航数据的部分中定义了若干数据结构，其描述了交错按钮的高亮信息(HLI)。这些数据结构，例如高亮普通信息(HLI_GI)、按钮颜色信息表(BTN_C0LIT)、以及按钮信息表(BTN_IT)定义了在屏幕显示中出现的按钮的数量、位置、外观、以及功能。基于这里的教益，本发明的这些和其它特征和优点可以由相关领域的普通技术人员容易地获知。可以理解的是，本发明的教益可以以各种形式的硬件、软件、固件、专用处理器、或这些的组合来实现。最为优选地，本发明的教益以硬件和软件的组合而实现。此外，软件优选地以有形地体现于程序存储单元上的应用程序而实现。该应用程序可以上载到包括任意适合的体系结构的机器中，并由该机器执行。这里所描述的各种处理和功能可以是能够由CPU执行的微指令代码的一部分、或者应用程序的一部分、或者其任意组合。还可以理解的是，由于附图中所描述的构成系统组件和方法中的一些优选地以软件来实现，所以系统组件或处理功能块之间的实际连接可以根据对本发明的规划方式而有
8所不同。给定这里的教益，相关领域的普通技术人员将能够设想本发明的这些和相似的实现或配置。尽管这里已经参考附图对示例性实施例进行了描述，可以理解的是，本发明并不局限于那些明确的实施例，并且在不背离本发明的范围和精神的前提下，相关技术领域中的普通技术人员可以对其实现各种改变和修改。所有这些改变和修改都将会包括在所附权利要求中所提出的本发明的范围内。
权利要求
一种用于从并行呈现的上下文不同的多个A/V流中呈现出不同的A/V流的方法，所述方法包括将音频帧报头打包(410)到交错单元ILVU中的第一视频对象单元VOBU的开始处的音频分组中或传输流TS的角度改变点标记处的音频分组中；以及将最后音频分组打包(420)到多个A/V流中同一流的ILVU的最后VOBU中或另一个ILVU中的最后VOBU中，或者打包到紧靠TS中另一个角度改变点标记之前，从而以完整的音频帧作为结束。
2.如权利要求1所述的方法，其中，所述方法在以下之一中执行数字通用光盘(DVD) 播放器、数字视频盘(DVD)播放器、高清晰度数字通用光盘(HD DVD)播放器、以及蓝光盘 (BD)播放器。
3.如权利要求1所述的方法，其中，对最后音频分组进行打包，使得任何ILVU边界或角度改变标记上不存在音频帧分段。
4.如权利要求1所述的方法，还包括步骤把子画面/字幕分组打包(430)为以子画面单元(SPU)报头和信号出现时间开始报头之一而开始。
全文摘要
本发明提供了用于对在并行呈现的A/V流之间上下文不同的分组进行同步流打包的方法和设备。该方法包括步骤识别(210)具有与视频分组的到达时间戳和/或呈现时间戳分别相匹配的到达时间戳和/或呈现时间戳的子画面/字幕分组和/或音频分组。该方法还包括步骤利用所识别的子画面/字幕和音频分组以及具有相匹配的时间戳的视频分组，对视频对象单元(VOBU)和/或传输流(TS)进行打包(220)。
文档编号G11B27/30GK101902628SQ20101021838
公开日2010年12月1日申请日期2006年3月16日优先权日2005年4月26日
发明者拉尔夫·奥斯特曼, 约瑟夫·桑德森·里斯, 马克·罗杰斯·约翰逊申请人:汤姆森许可贸易公司;Mx娱乐公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：马克.罗杰斯.约翰逊;拉尔夫.奥斯特曼;约瑟夫.桑德森.里斯
技术所有人：汤姆森许可贸易公司;ＭＸ娱乐公司
我是此专利的发明人

上一篇：光驱传动轮卡锁结构的制作方法
上一篇：比特错误阈值和内容可寻址存储器以寻址重映射存储装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、毕老师：机构动力学与控制
2、袁老师：1.计算机视觉 2.无线网络及物联网
3、王老师：1.计算机网络安全 2.计算机仿真技术
4、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
5、张老师：1.机械设计的应力分析、强度校核的计算机仿真 2.生物反应器研制 3.生物力学
如您是高校老师，可以点此联系我们加入专家库。