处理和接收用于3维字幕的数字广播信号的方法和装置的制作方法

文档序号:7850012阅读:326来源:国知局
专利名称:处理和接收用于3维字幕的数字广播信号的方法和装置的制作方法
技术领域
本发明涉及用于在网络上传输三维(3D)图像的方法以及用于处理包括3D图像的·广播信号的广播接收器,更具体而言,涉及用于向与3D图像一同显示的字幕提供3D效果的广播信号处理方法以及用于接收使用该广播信号处理方法处理的广播信号的广播接收器。
背景技术
一般而言,三维(3D)图像(或立体图像)使用立体感知原理为用户眼睛提供立体效果。人通过彼此分离约65mm的双眼间距导致的双眼视差感觉近和远,所以3D图像使得右眼和左眼分别观看相关的平面图像,导致立体效果和透视效果。上述3D图像显示方法可以分类为立体方案、体积方案、全息方案等。在使用立体方案的情况中,3D图像显示方法提供通过左眼观看的左视像和通过右眼观看的右视像,使得通过偏振眼镜或显示设备,用户的左眼观看左视像且用户的右眼观看右视像,导致3D图像效果的识别。

发明内容
技术问题本发明的目的被设计为解决与广播信号的3D内容一同显示的3D字幕的有效传输中出现的问题。本发明的目的被设计为,在广播接收器在3D广播环境中接收字幕数据的情形中,通过考虑3D视频显示设备的显示条件和在制造过程中设置的内容的3D效果来处理和显示接收到的3D字幕数据,解决在向用户提供有效和方便的广播环境中存在的问题。技术方案为了实现这些和其他优点,按照本发明的目的,作为具体和广义的描述,提出了一种用于处理包括3维即3D内容的数字广播信号的方法。该方法包括以下步骤对用于所述3D内容的3D视频数据进行编码,所述3D视频数据包括用于3D图像的左视图的左画面和用于右视图的右画面;生成包括字幕片段的信令数据,所述字幕片段具有用于以信号方式告知用于所述3D内容的3D字幕的信息,其中,所述字幕片段包括子区域视差信息,所述子区域视差信息指示应用于所述3D图像的针对所述3D字幕的区域的至少一个子区域的视差的值,所述视差是在所述3D图像的所述右视图和所述左视图中表达相同空间点的像素的水平位置之间的差异;以及发送包括编码的3D视频数据和生成的信令数据的数字广播信号。在本发明的另一方面中,此处提供一种用于接收包括3维即3D内容的数字广播信号的装置,该装置包括接收单元,所述接收单元被构造为接收包括用于所述3D内容的3D视频数据和信令数据的数字广播信号;解复用器,所述解复用器被构造为从接收到的所述数字广播信号解复用所述3D视频数据和所述信令数据,所述3D视频数据包括用于3D图像的左视图的左画面和右视图的右画面;提取单元,所述提取单元被构造为从解复用的信令数据提取字幕片段,所述字幕片段具有用于以信号方式告知用于所述3D内容的3D字幕
4的信息,其中,所述字幕片段包括子区域视差信息,所述子区域视差信息指示应用于所述3D图像的针对所述3D字幕的区域的至少一个子区域的视差的值,所述视差是在所述3D图像的所述右视图和所述左视图中表达相同空间点的像素的水平位置之间的差异;以及控制单元,所述控制单元被构造为基于提取的字幕片段控制用于所述3D内容的所述3D字幕的显
/Jn ο在本发明的另一方面中,所述视差的值被对称地应用到所述区域或子区域的每个视图。在本发明的另一方面中,所述字幕片段还包括指示在所述3D图像的所述区域中的子区域的存在的信息,并且其中,当所述信息指示在所述区域中不存在子区域时,由所述子区域视差信息指示的所述视差的值被应用于所述区域。在本发明的另一方面中,所述字幕片段还包括缺省视差信息,所述缺省视差信息指定当数字广播接收器不能向每个区域应用各自的视差值时应用于在所述3D图像中的所有区域的缺省视差值。在本发明的另一方面中,所述子区域视差信息包括指定所述视差的值的整部部分的整数部分信息和指定所述视差的值的小数部分的小数部分信息。在本发明的另一方面中,所述字幕片段还包括指定所述至少一个子区域的水平位置的子区域水平信息和指定所述至少一个子区域的水平宽度的子区域宽度信息。在本发明的另一方面中,对于所述3D字幕,所述字幕片段还包括指定所述视差的值应用于所述左视图和所述右视图中的哪个视图的偏移类型信息。发明的有利效果根据本发明,可以有效地通过广播信号连同3D内容一起发送3D字幕。另外,根据本发明,可以有效地在广播接收器中处理3D字幕。再者,根据本发明,可以根据广播接收器的性能处理3D字幕。另外,根据本发明的实施方式,3D字幕数据处理方法维持与2D遗留广播接收器兼容,并且同时通过能够显示3D视频数据的广播接收器显示具有3D效果的字幕数据。


附图被包括在本说明书中以提供对本发明的进一步理解,附图示出了本发明的实施方式,且与说明书一起用于解释本发明的原理。图I是示出根据本发明的实施方式的扩展显示定义片段的句法的图示。图2是示出根据本发明的实施方式的扩展页面构成片段的句法的图示。图3是示出根据本发明的实施方式根据display_shift_type字段的字幕的显示位置的图示。图4是示出根据本发明的实施方式region_shift_type的字幕的显示位置的图
/Jn ο图5是示出根据本发明的实施方式的扩展对象视差片段的句法的图示。图6示出根据本发明的一个实施方式用作扩展字幕显示信息的扩展显示定义片段(DDS)的句法结构。图7示出根据本发明的一个实施方式用作扩展字幕显示信息的扩展页面构成片
5段(PCS)的句法结构。图8是示出根据本发明的另一实施方式的扩展对象定义片段的句法的图示。图9是示出根据本发明的一个实施方式的用于接收和处理3D字幕数据的广播接收器中的解码块的框图。图10是示出根据本发明的一个实施方式的用于接收数字广播信号的接收器的框图。图11是例示根据本发明的一个实施方式的处理将要传输的3D字幕的方法的流程图。
具体实施例方式现在将详细描述本发明的优选实施方式,在附图中例示出了其示例。下面将参考附图给出的详细说明旨在解释本发明的示例性实施方式,而不是示出可以根据本发明实施的仅有实施方式。在描述本发明之前,应当注意,在本发明中公开的大多数术语考虑本发明的功能来被定义且对应于本领域中公知的一般术语,且可以根据本领域技术人员的发明、通常实践或新技术的引入被不同地确定。在一些情况中,少数术语在必要时被申请人选择且此后在本发明的下文描述中公开。因此,优选地,在本发明中基于其意义理解申请人定义的术语。3D图像显示方法包括考虑两个视点的立体成像方案和考虑三个或更多个视点的多视图成像方案。对照地,现有技术中示出的单视图成像方案可以被称为单视场图像方案。立体成像方案被设计为使用在彼此分开预定距离的左侧照相机和右侧照相机捕获相同目标对象时获取的一对右和左视像。多视图成像方案使用分开预定距离或角度的三个或更多个照相机捕获的三个或更多个图像。尽管下面的描述使用立体成像方案作为示例来公开本发明的实施方式,但是本发明的发明思想也可以应用于多视图成像方案。立体图像和多视像可以根据包括移动图像专家组(MPEG)方案的各种方法来压缩和编码,并且被传输到目的地。例如,立体图像或多视像可以根据H. 264/高级视频编码(AVC)方案来压缩和编码并且被传输。在这种情形中,接收系统可以按照H. 264/AVC编码方案的相反顺序对接收的图像进行解码,使得可以获得3D图像。另外,立体图像的左视像和右视像其中一个或者多视像其中之一可以分配给基本层的图像,且剩余一个可以分配给扩展层的图像。基本层图像可以使用与单视场成像方法相同的方法来编码。与扩展层图像相关,仅基本层图像和扩展层图像之间的关系的信息可以被编码和传输。作为用于基本层图像的示例性压缩编码方案,可以使用JPEG、MPEG-2、MPEG-4或H. 264/AVC方案。为方便说明,H. 264/AVC方案可以在本发明的一个实施方式中示例性地使用。在本发明的一个实施方式中,用于上层或较高层的图像的压缩编码方案可以设置为H. 264/多视图视频编码(MVC)方案。当MVC方案另外地应用于AVC方案或仅使用AVC方案编码右/左图像序列从而实施立体显示时,在广播相应3D内容数据时需要充分考虑的一点是与相关2D广播接收器兼容。对于不能支持3D图像显示的相关广播接收器,如果右和左视像其中之一根据后向兼容方法编码和传输,则2D广播接收器仅识别且输出相应的信号,使得用户可以通过相关设备查看相应内容数据。在下文描述中,传送用于遗留广播接收器的内容数据的时间点的基本层图像可以被称为基本视图视频数据(或基本视频),并且被传送用于显示3D图像的扩展层图像可以被称为扩展视图视频数据(或扩展视频)。在如上所述传送基本视图视频数据和扩展视图视频数据的情形中,遗留2D广播接收器接收基本视频数据,使得它可以显示2D图像,且3D广播接收器接收基本视图视频数据和扩展视图视频数据,使得它可以显示3D图像。在显示3D内容的情况中,根据3D内容的特征或字幕的用途可以在屏幕上显示多个字幕。在这种情形中,多个字幕可以在广播屏幕上具有相同的深度或可以具有不同的深度以有效地产生3D效果。例如,在其中在3D内容中多个演员出现且多个演员同时表演其角色的情形中,角色可以显示为3D字幕,从而提供不同于2D环境的效果。即,可以根据演员在一个屏幕上的深度不同地设置表示演员角色的字幕的深度。作为另一示例,尽管与表达3D效果的3D内容的深度相比,诸如在广播屏幕的右上方显示的广播站标志这样的字幕可以以更靠近观看者的深度显示,与3D内容相关联的字幕可以以相对远离观察者的深度显示。在下文描述中,术语“字幕”不仅可以包括字幕,而且还包括另外地显示到基本视频数据的显示图像、文本数据、图形图像、标志等。广播系统传输作为各种字幕信息的字幕数据。此时,字幕数据不仅可以包括字幕显示信息(包括显示字幕所需的配置、尺寸、位置等),而且还包括字幕的显示颜色的信息。字幕显示信息包括与用于显示字幕所需的显示窗口结构相关联的显示定义信息、页面构成信息、区域构成信息、对象数据信息等。从数据传输的句法结构的视点,显示定义信息可以被称为显示定义片段,页面构成信息可以被称为页面构成片段,区域构成信息可以被称为区域构成片段,并且对象数据信息可以被称为对象数据片段。相关广播信号仅提供基本字幕显示信息。因此,当3D广播接收器希望显示基本字幕显示信息时,基本字幕显示信息可以通过2D广播信号表达或可以不显示。因此,必须传输能够允许甚至以3D格式显示字幕显示信息的信息,并且需要能够使用上述信息以3D格式显示字幕数据的广播接收器及其数据处理方法。在显示立体图像的情形中,左视图视频数据和右视图视频数据水平偏移预定距离从而实施3D效果,并且然后被显示。此时,可以使用能够指示3D效果的各种表达值(诸如偏移距离)。根据本发明的实施方式,此后视差值用作3D效果的这种表达值。在视觉感知中可以从处理获得3D效果,导致世界在眼睛的视网膜上的两个稍有差异的投影的深度的感觉。两个视网膜图像中的差异可以被称为水平视差、视网膜视差或双眼视差。此后,为了方便描述且更好地理解本发明,两个视网膜图像之间的差异将被称为“视差”。例如,在传输3D视频数据的情形中,3D视频数据的相应场景可以具有不同3D效果。在这种情形中,用于相应场景的视差值被发送到广播接收器,使得广播接收器使用视差值控制和显示3D效果。尽管取代上述视差值,可以使用其他表达值(例如,深度值、像素间隔、屏幕尺寸等)来显示3D效果,应当注意,为方便描述且更好地理解本发明,本发明的实施方式将示例性地使用视差值。在使用相关广播传输方案传输字幕数据的情形中,3D广播接收器接收基本视图视频数据和扩展视图视频数据并且将接收到的基本视图视频数据和接收到的扩展视图视频数据显示为3D视频数据。然而,字幕数据不具有用于3D显示的信息,使得它具有这样的缺点它必须将3D视频数据显示为2D格式。在这种情形中,字幕仅显示为基本视图视频数据 或扩展视图视频数据,并且用户以不同于3D图像的方式观看2D格式的字幕,使得用户可能体验眩晕且感觉眼睛的疲劳。因此,必须向相关字幕数据传输3D视频数据和3D效果的信息。这样,3D效果信息可以被插入到相关字幕显示信息中或可以传输另外的字幕显示信息。作为用于通过广播系统传输3D字幕的方法,类似于用于传输3D图像的方法,可以使用分别传输用于左视图的字幕和用于右视图的字幕的方法。作为另一方法,可以使用一同传输一个字幕和用于3D效果的视差值的方法。因为与图像不同,字幕的深度在广播内容屏幕上并不频繁变化且一个字幕内的深度中的变化也是不常见的,所以,鉴于传输效率,使用视差值传输字幕的方法是有利的。为了在网络上传输与视差相关联的信息,可以使用传输与字幕片段的扩展视差相关联的信息的方法,以提供与现有字幕相关联的显示信息。这种方法使得遗留接收器不能接收/处理扩展字幕片段且使得能够使用常规方法实现现有字幕片段,由此即使在提供3D字幕的情形中也维持与常规广播系统的兼容性。扩展字幕片段可以以显示定义片段、页面构成片段、区域构成片段或对象数据片段的扩展形式提供。这种扩展形式可以被称为扩展显示定义片段、扩展页面构成片段、扩展区域构成片段或扩展对象数据片段。作为另一示例,用于提供与视差相关联的信息的片段可以定义为包括在字幕片段中。即,添加的与视差相关联的信息可以组合成一个片段,从而在扩展显示定义片段、扩展页面构成片段、扩展区域构成片段或扩展对象数据片段中定义。类似于常规广播系统中字幕片段的处理,这种字幕片段可以通过发送单元处理,且可以通过广播信号发送到广播接收器。图I是示出根据本发明的实施方式的扩展显示定义片段的句法的图示。根据本发明的实施方式的扩展显示定义片段(EDDS)包括定义用于在3DTV中呈现字幕而添加的图形平面相关信息的信息。EDDS可以提供信息以防止这种现象在提供用于立体视频广播的字幕服务时,3D视频的对象和图形平面交叠,因而妨碍了立体效果。EDDS可以包括对应于扩展视图的显示定义信息。此时,在本发明的一个实施方式中,page_id值被设置为等于与基本视图对应的DDS的page_id值。segment_type字段可以具有用于识别EDDS的值。现在将描述包括在EDDS中的字段。sync byte是将使用值“00001111”编码的8位字段。在PES包内,解码器可以在基于segment_length解析片段时使用sync_byte来验证同步,从而确定传输包丢失。segment_type字段指示包含在片段数据字段中的数据的类型。例如,segment_type字段识别包括该字段的片段是否是显示定义片段、页面构成片段、区域构成片段、对象数据片段、扩展显示定义片段、扩展页面构成片段、扩展区域构成片段、扩展对象数据片段或单独定义的视差相关片段。CN 102918854 A



6/20 页page_id识别包含在该subtitling_segment中的数据的字幕服务。具有作为合成页面id的在字幕描述符中发送的page_id值的片段携带专用于一个字幕服务的字幕数据。因此,具有作为辅助页面id的在字幕描述符中发送的page_id的片段携带可以被多个字幕服务共享的数据。segment_length将指定就在片段的随后有效载荷中包含的字节数。edds_version_number 字段指不扩展 DDS 的版本。display_width字段指示由与扩展DDS相关联的字幕流采取的显示的像素中的最大水平宽度。display_height字段指示由与扩展DDS相关联的字幕流采取的显示行中显示行中的最大垂直高度。display_shift_type字段指定用于输出用于左视图的图形/字幕和用于右视图的图形/字幕的方法。更具体而言,该字段提供指示基于左视图和右视图其中哪一个应用字幕的视差值的信息。在这种情况中,视差可以应用于左视图和右视图其中任意一个,或视差/[目息可以对称地应用于左视图和右视图。尽管根据本发明的一个实施方式,display_shift_type字段值的意义在下文说明中定义,但是每个值的定义并不受限且每个值的意义可以改变。如果display_shift_type字段的值被设置为“00”,则在混合用于3D字幕输出的左和右视形平面的处理中用于左视图的图形/字幕的位置不变。即,通过显示定义片段(DDS)、页面构成片段(PCS)等传输的与字幕相关联的信息用作与左视图的字幕相关联的信息。此时,右视图可以从用于基本视图(例如左视图)的图形/字幕的位置偏移在reference_disparity中指定的值,从而被输出。如果display_shift_type字段值被设置为“01”,则右视形平面使用常规2D坐标或原始坐标,且将要在左视形平面上输出的字幕向右偏移reference_disparity。在这种情况中,右视图变成基本视图且左视图变成扩展视图,使得reference_disparity值应用于左视图。如果display_shift_type字段值被设置为“ 10”,则将要在左视形平面上输出的字幕向右偏移(reference disparity/2)且将要在右视形平面上输出的字幕向左偏移(reference disparity/2),从而被输出。更具体而言,为了确保字幕布置在正确的深度和水平位置,发送的视差偏移值应当对称地应用于每个视图且暗示地应用于每个视图中绑定的对象。正视差偏移值χ将导致左字幕图像中χ个像素向左偏移且右字幕图像中χ个像素向右偏移。负视差偏移值χ将导致左字幕图像中χ个像素向右偏移,且右字幕图像中χ个像素向左偏移。reference_displarity字段指示包括在左和右图像中的字幕之间的视差的绝对值。即,因为视差值可以具有正值或负值,所以在该字段中仅传输视差的绝对值。广播接收器可以使用该值推断在某些坐标输出0SD、图形或字幕时不交叠3DTV的立体图像信号的范围。即,0SD、图形或字幕优选地布置在比3DTV的立体图像信号更靠近用户的位置。在本发明的一个实施方式中,如果3DTV的所有立体图像信号在屏幕(显示器)后面·形成(仅正视差),则reference_disparity可以设置为O。
9
图2是示出根据本发明的实施方式的扩展页面构成片段的句法的图示。参考图2,页面构成片段(PCS)包括显示的字幕的组成成分的信息。PCS可以包括构建显示页面的至少一个区域的用途和位置信息。根据本发明的一个实施方式,图2中示出的扩展PCS (EPCS)被发送,使得接收器可以控制在扩展视图的字幕的输出。sync_byte 字段、segment_type 字段、page_id 字段和 segment_length 字段类似于EDDS的上述字段。Page_time_out指定以秒表达的时段,在该时段之后,页面实例不再有效,并且因此如果它在此之前不被重新定义,它应当从屏幕擦除。超时时段在第一次显示页面实例时开始。Page_time_out值应用于每个页面实例,直到其值被重新定义。超时时段的目的是在集成接收器解码器(IRD)碰巧错过了页面实例的重新定义或删除时避免页面实例“永久”保持在屏幕上。超时时段不需要通过IRD非常精确地计算-0/+5s的反应精度就足够精确。page_version_number指示该页面构成片段的版本。当该页面构成片段的任意内容改变时,该版本号递增。page_state以信号方式告知在该页面构成片段中描述的字幕页面实例的状态。processed_length是在解码器处理的当型(while)循环内源自(多个)字段的字节数。corresponding_region_id 字段识别应用 EPCS 的区域。corresponding_region_id字段可以指定PCS中定义的区域中的相应区域的id。多个区域可以呈现在一个页面上且可以存在在每个区域中显示的字幕。此时,corresponding_region_id字段定义特定字幕与哪个区域相关。region_shift_type字段不同地定义了在区域单元中输出用于左视图的图形/字幕和用于右视图的图形/字幕的方法。即,regi0n_Shift_type字段用于提供与区域单元中的上述display_shift_type相关的信息。此后,将描述根据region_shift_type字段值的定义。如上所述,这种定义不限于region_shift_type字段的特定值。如果region_shift_type字段值被设置为“00”,则在混合用于3D字幕输出的左视形平面和右视形平面的处理中用于左视图的图形/字幕的位置不变。即,在PCS等中接收的信息可以不加改变地应用于左视图。此时,右视图的字幕可以从用于基本视图(例如左视图)的图形/字幕的位置偏移region_disparity字段中指定的值,从而被输出。如果region_shift_type字段值被设置为“01”,则右视形平面使用常规2D坐标或原始坐标且将要在左视形平面上输出的字幕向右偏移region_disparity字段值,从而被输出。即,用于左视图的字幕基于右视图偏移。如果region_shift_type字段值被设置为“ 10”,则将在左视形平面上输出的字幕向右偏移(region_disparity/2)且将要在右视形平面上输出的字幕向左偏移(region_disparity/2),从而被输出。在这种情况中,region_disparity值的应用类似于display_shift_type字段的上文描述。如果region_shift_type字段值被设置为“11”,则将要被输出到基本视图的坐标不分左/右地确定到region_horizontal_address,且将要输出到扩展视图的坐标确定到region_dispairty 值。
10
region_di spar ity 字段表不针对相应 region_id (corresponding_region_id),在基本视图和扩展视图的水平坐标之间的差异。即,region_disparity字段指示应用于相应区域的左图像和右图像之间的视差的绝对值。图3是示出根据本发明的实施方式根据display_shift_type字段的字幕的显示位置的图示。 接收器必须输出对应于构成立体视频的两个视图即基本视图和扩展视图的图形平面以输出3D字幕。接收器使用DDS识别0SD、图形、字幕等输出到的图形平面的基本信息。接收器还使用EDDS识别图形平面的深度信息。因为参考视差值通过EDDS以信号方式告知,所以屏幕中所有不同字幕区域具有相同的视差(深度)。在这种情况中,参考视差值可以用作缺省视差值,该缺省视差值可以被不能根据区域或子区域应用不同视差的接收器使用。可选地,可以使用接收器的算法设置稍不同于参考视差值的视差值。根据本发明的实施方式的接收器接收DDS且识别图形平面的尺寸信息和整个屏幕上的偏置信息。此时,如果DDS不存在,则在本发明的一个实施方式中,分析SD分辨率(720X576)的图形平面。接收器接收PCS且识别关于页面的信息和包括在页面中每个区域的位置信息。接收器可以使用区域构成片段(RCS)、对象定义片段(ODS)和颜色查找表(CLUT)来获取与配置区域的对象相关的信息、关于实际位图对象的信息以及呈现字幕图形数据必须的颜色信息。接收器使用EDDS识别用于3D字幕的参考视差值。每个字幕区域被输出到对应于基本视图和扩展视图的图形平面。此时,应用于字幕的视差在图3中示出。即,确定基本视图和扩展视图是否分别是左视图和右视图、根据disparity_shift_type字段确定参考视差应用到哪个图形平面(左或右)或确定字幕位于哪个坐标。坐标的偏移(偏置)程度使用EDDS的reference_disparity字段。被输出到左和右图形平面且在区域中彼此一致地使用3D效果显示的字幕相同且其间的偏置呈现在图像的输出坐标中。如图3所示,如果display_shift_type字段的值被设置为“00”,则可以基于region_horizontal_address定位左视图的字幕且可以基于考虑region_horizontal_address中的reference_disparity值定位右视图的字幕。如果display_shift_type 的值被设置为 “01 ”,贝U可以基于 region_horizontal_address定位右视图的字幕且可以基于考虑region_horizontal_address中的reference_disparity值定位左视图的字幕。如果display_shift_type的值被设置为“10”,则可以基于考虑region_horizontal_address中reference_disparity值的1/2的值来定位左视图和右视图。可选地,reference_di spar ity值可以用作region_horizontal_address中的左视图和右视图的偏移值。根据本发明的一个实施方式,即使当在3DTV中输出诸如EPG、图形或菜单这样的OSD屏幕时,可以使用通过EDD接收的参考视差。此时,如图3所示,在左和右图形平面上输出的数据的坐标可以被控制,并且如果OSD屏幕超过全屏范围,则适当的裁剪和缩放可能是必要的。接收器可以准备将要在屏幕上输出的EPG、图形、图标和菜单数据并且使用就在输出之前的reference_disparity确定最终的偏置(偏移)值。如果OSD屏幕超出全屏范围,则从屏幕凸出的区域通过参考视差出现。该区域可以被简单地裁剪和输出。如果在裁剪过程中重要或有意义的部分被排除,则在裁剪之前必须执行缩放。SP,如果当具有1920的水平尺寸的图形数据被输出时偏置值是D,则对应于D的区域在输出处理中丢失。此时,在本发明的一个实施方式中,可以使用向整个图形屏幕应用(1920)/(1920+D)的缩放因子并且输出左和右图形数据的方法。如果执行缩放,裁剪不是必须的,但是,如果裁剪是必须的,也可以执行裁剪。图4是示出根据本发明的实施方式的region_shift_type的字幕的显示位置的图
/Jn οregion_shift_type 的值被设置为 “00”、“01” 或“10” 的情形类似于 display_shift_type的值被设置为“00”、“01”或“10”的情形,将省略其描述。如果region_shift_type的值是“ 11”,则左视图和右视图不被区分且基于region_horizontal_address定位基本视图的字幕且使用region_dispartiy值来定位扩展视图的字幕。此时,region_disparity值可以不定义为偏置值,但是可以定义为扩展视图的字幕将被定位到的坐标。如上所述,如果EPCS用于以信号的方式发送字幕的视差值,则因为可以针对每个区域指定扩展视图的坐标,每个字幕区域可以具有独立的视差(深度)。现在将描述使用EPCS显示3D字幕的处理。通过与2D字幕相同的处理来确定字幕区域的坐标且使用EPCS的region_disparity_value来识别每个区域的左和右图形平面的视差值。每个字幕区域在对应于基本视图或扩展视图的图形平面上输出。此时,使用图4中示出的方法确定包括在每个基本视图或扩展视图中的字幕的最终坐标。即,确定基本视图和扩展视图是否分别是左视图和右视图、根据disparity_shift_type确定基本字幕和具有偏置的字幕被输出到哪个图形平面(左或右)或者确定字幕定位在什么坐标。坐标的偏移(偏置)程度可以使用相应区域的region_disparity_value。EDDS可以不存在。在这种情况中,当诸如EPG、图形或菜单这样的OSD屏幕被输出时可以使用的参考视差不存在。在这种情况中,接收器可以在当前显示的区域的region_disparity值中选择最大绝对值且可以随机使用最大绝对值作为参考视差值。现在将描述根据本发明的实施方式在接收器中处理3D字幕的过程。接收器接收广播流。广播流包括服务信息。接收器解析在服务信息中的节目映射表(PMT)。接收器解析在已被解析的PMT内的subtitiling_descriptor并且使用subtitiling_descriptor的subtitiling_type字段确定特定3D内容的3D字幕是否存在。此时,如果确定特定3D内容的3D字幕存在,则指示特定3D内容的3D字幕存在的信息可以通过OSD等显示在屏幕上,使得观看者选择3D字幕。接收器识别用于传输片段的包,该片段包括在广播流中包括的字幕相关信息。例如,假设具有 0x20 的 data_identif ier 字段值和 0x00 的 subtitle_stream_id 值的 PES 包被识别并且与包中的字幕的信令相关联的片段被解析。此时,接收器可以使用segmentjype字段的值确定片段的类型。
例如,如果segment_type字段值是0x10,则片段是用于基本视图的页面构成片段,如果segmentjype字段值是0x11,则片段是用于基本视图的区域构成片段,如果segment_type字段值是0x12,则片段是用于基本视图和扩展视图二者的CLUT定义片段,如果segment_type字段值是0x13,则片段是用于基本视图的对象数据片段,如果segment_type字段值是0x14,则片段是用于基本视图的显示定义片段,如果segmentjype字段值是0x40,则片段是用于扩展视图的页面构成片段,如果segmentjype字段值是0x41,则片段是用于扩展视图的区域构成片段,如果segmentjype字段值是0x43,则片段是用于扩展视图的对象数据片段,且如果segmentjype字段值是0x44,则片段是用于扩展视图的显示定义片段。接收器可以使用DDS和/或PCS获取用于基本视图的字幕的显示信息。另外,接收器可以解码包括在对象数据片段(ODS)中的像素数据子块数据(piXel-data_SUb-bl0Ck),并且获取将要在基本视形平面上输出的标志或字幕的伪颜色值。另外,使用CLUT定义片段,该伪颜色可以转换成在显示器上实际输出的颜色信息。即,可以获取将要在基本视形平面上输出的字幕的颜色信息。接下来,接收器使用EDDS和/或EPCS识别诸如用于扩展视图的字幕的尺寸、位置、对象配置信息之类的信息。此时,定位在基本视图和扩展视图中的字幕的坐标可以通过display_shift_type或retion_shift_type来校正。在该处理中,在本发明的实施方式中,当以每个区域级别确定字幕的坐标时,可以在关于EDDS的信息之前设置关于EPCS的信息。即,当在disparity_shift_type或视差值中出现冲突时,关于EPCS的信息可以与关于EDDS的信息重叠。图5是示出根据本发明的实施方式的扩展对象视差片段的句法的图示。根据本发明的一个实施方式,可以根据3D图像中包括的区域或根据区域中的子区域或对象不同地应用视差信息。另外的信息可以被包括在扩展对象视差片段(EODS)中或用于提供与视差相关联的信息的新定义的片段中。ODS可以包括多个显示对象的数据。在本发明的一个实施方式中,图5中示出的EODS被发送,使得接收器可以控制在扩展视图的字幕的输出。sync_byte 字段、segment_type 字段、page_id 字段和 segment_length 字段类似于如上所述的EDDS。disparity_version_number 字段识别 EODS 的版本 / 更新信息。region_id字段识别页面中的区域且object_id字段识别包括在区域中的对象。target_VieW_p0Siti0n字段可以指示基于哪个视图使用关于对象视差片段的信息实施了应用视差的3D字段。例如,在使用常规2D字幕方案计算的水平地址是N的情况中,如果该字段的值是“0”,则基本视图和扩展视图分别变成N和N+objeCt_disparity_value。对照地,如果该字段的值是“1”,基本视图和扩展视图的对象的水平地址分别具有N object_disparity_value 和 N。object_disparity_value 字段表不应用于 target_view_position 的对象和应用于另一视图位置的对象之间的视差值且该值指示左和右视图之间的相应字幕对象的水平位移。通过target_view_position 字段和 ob ject_view_position 字段确定的视差可以应用于由region_id字段和object_id字段识别的对象。现在将描述向每个对象应用视差且在接收器中显示3D字幕的处理。下面的处理仅是示例且可以部分地改变或省略。可选地,一些步骤可以被添加到以下处理。接收器接收广播流。广播流包括服务信息。接收器解析包含在服务信息中的节目映射表(PMT)。接收器解析PMT 内的 subtitling_descriptor 并且使用 subtitling_descriptor的subtitling_type字段确定特定3D内容的3D字幕是否存在。如果确定特定3D内容的3D字幕存在,则指示特定3D内容的3D字幕存在的信息可以通过OSD等显示在屏幕上,使得观察者选择3D字幕的显示。接收器识别用于传输片段的包,该片段包括在广播流中包括的字幕相关信息。例如,具有 0x20 的 data_identif ier 字段值和 0x00 的 subtitle_stream_id 的 PES 包被识别且与包中的字幕的信令相关联的片段被解析。此时,接收器可以使用segmentjype字段值确定片段的类型。例如,如果segment_type字段的值是0x10,则接收器可以确定片段是用于基本视图的页面构成片段,如果segmentjype字段值是0x11,则片段是用于基本视图的区域定义片段,如果segmentjype字段的值是0x12,则片段是用于扩展视图的CLUT定义片段,如果segment_type字段是0x13,则片段是用于基本视图的对象数据片段,如果segment_type字段值是0x14,则片段是用于基本视图的显示定义片段,且如果segmentjype字段的值是0x43,则片段是用于扩展视图的对象数据片段。接收器使用包括在EODS中的region_id字段和objectjd字段识别应用3D字幕的区域和对象。接收器可以使用DDS和/或PCS获取用于基本视图的字幕的显示信息。接收器可以解码包括在对象数据片段(ODS)中的像素数据子块数据,并且获取将要在基本视形平面上输出的标志或字幕的伪颜色值。另外,使用CLUT定义片段,伪颜色可以转换成在显示器上实际输出的颜色信息。即,可以获取将要在基本视形平面上输出的字幕的颜色信息。接下来,使用包括在EODS中的object_disparity_value识别指示将在扩展视图平面上的哪里输出已经解码的对象的位置信息。接收器使用target_view_position信息确定3D字幕的在每个视图平面中的坐标并且执行两个图形平面的3D格式化,由此输出3D
图形/字幕/标志。图6示出根据本发明的一个实施方式用作扩展字幕显示信息的扩展显示定义片段(DDS)的句法结构。DDS包括其中呈现DVB字幕的TV图像的显示宽度信息和显示高度信息。换句话说,DDS指示包括将要被显示的字幕流的视频图像的显示尺寸。在本发明的一个实施方式中,图6中示出的扩展DDS (DDS_EXT)被发送,使得接收器可以控制在扩展视图的字幕的输出。
图6中示出的扩展DDS的各个字段如下。‘dds_version_number’字段可以指不扩展DDS的版本。‘display_Wind0W_flag’字段可以指示与扩展DDS相关联的字幕显示集是否旨在呈现在由‘display_width’和‘display_height’字段定义的显示尺寸内的窗口中,或直接呈现在由‘display_width’和‘display_height’字段定义的显示尺寸内。‘display_Width’字段可以指示与扩展DDS相关联的字幕流采取的显示的像素中的最大水平宽度。‘display_height’字段可以指示与扩展DDS相关联的字幕流采取的显示行中显示行中的最大垂直高度。‘display_window_horizontal_position_minimum’ 字段可以指不相对于显不器
的最左手边像素,字.显不集的最左手边像素。‘display_window_horizontal_position_maximum’ 字段可以指不相对于显不器
的最左手边像素,字.显不集的最右手边像素。‘display_window_vertical_position_minimum’ 字段可以指不相对于显不器的顶行,字幕显示集的最上面的行。‘display_window_vertial_position_maximum’ 字段可以指不相对于显不器的顶行,字幕显示集的底行。上述字段可以预包含在DDS中,并且然后被发送。在这种情况中,在DDS中已经被传输的相同或复制字段的信息被省略并且这样可以仅发送以下信息。‘page_id’字段可以指示在其上显示字幕的页面的标识符(ID)。在‘page_id’值的情况中,在基本视图和扩展视图,字幕将显示在相同的页面上,使得‘page_id’值可以等于与基本视图对应的DDS的‘page_id’值,并且然后被发送。‘segment_type’字段可以具有不同于相关DDS值(例如0x14)的值,并且必须具有能够识别扩展DDS的特定值(例如0x44)。‘target_view_position’字段可以指示应用扩展DDS的视图位置。换句话说,‘target_view_position’字段指示用于显示立体字幕的视点信息。例如,如果相应扩展DDS的字幕显示应用于左图像,则‘target_view_position’字段可以设置为‘0’的值。如果相应扩展DDS的字幕显示应用于右图像,则‘target_view_position’字段可以设置为‘I’的值。‘minimum_disparity_value’字段可以指示能够由左图像和右图像表达的视差的最小值。‘minimum_disparity_value’ 字段的视差值越低(即 ‘minimum_disparity_value’字段的视差值越靠近负值),则图像形成位置逐渐移向屏幕的前部。‘maximum_disparity_value’字段可以指示能够由左图像和右图像表达的视差的最大值。‘maximum_disparity_value’ 字段的视差值越大(即 ‘maximum_disparity_value’字段的视差值越靠近正值),则图像形成位置逐渐移向屏幕的内部。扩展DDS 可以通过 ‘minimum_disparity_value’ 字段 1040 和 ‘maximum_disparity_value’字段定义能够在显示字幕时分配的视差值的范围。如上所述,与DDS相关,扩展DDS不仅包括用于各个字幕的视点分配信息,还包括3D效果信息(即视差值),使得接收器可以显示具有3D效果的字幕。
图7示出根据本发明的一个实施方式用作扩展字幕显示信息的扩展页面构成片段(PCS)的句法结构。参考图7,PCS包括显示的字幕的组成成分的信息。PCS可以包括构成显示页面的至少一个区域的使用和定位信息。根据本发明的一个实施方式,图7中示出的扩展PCS(PCS_EXT)被发送,使得接收器可以控制在扩展视图的字幕的输出。图7中示出的扩展PCS的各个字段如下。‘page_id’字段可以指示在其上显示字幕的页面的标识符(ID)。在‘page_id’值的情况中,在基本视图和扩展视图,字幕将显示在相同的页面上,使得‘page_id’值可以等于与基本视图对应的DDS的“page_id”值,且然后被发送。‘Page_time_0Ut’字段可以指示以秒表达的时段,在该时段之后,页面实例不再有效,并且因此如果它在此之前不被重新定义,它应当从屏幕擦除。‘page_version_number’字段可以指示扩展PCS的版本。‘page_state’字段可以指示在扩展PCS中描述的字幕页面实例的状态。‘region_id’字段可以指示页面内的区域的唯一标识。‘region_id’字段可以在基本视图和扩展视图在相同的区域中显示字幕,使得它等于与基本视图对应的PCS的“regionjd”值并且然后被发送。‘region_horizontal_address’字段指示该区域的顶部左边像素的水平地址。有效像素的最左边像素具有零的水平地址,并且像素地址从左向右增加。‘region_vertical_address’字段可以指示该区域的顶行的垂直地址。巾贞的顶行是零行,且行地址在帧内从顶部向底部逐一增加。‘target_view_position’字段可以指示应用扩展PCS的视图位置。S卩,‘target_VieW_p0Siti0n’字段可以指示用于显示立体字幕的视点信息。例如,如果相应扩展PCS的字幕显示应用于左图像,贝1J‘target_view_position’字段可以设置为‘0’的值。如果相应扩展PCS的字幕显示应用于右图像,则‘targetjie^position’字段可以设置为‘I’的值。‘region_disparity_value’字段可以指示应用于左图像的第一区域和应用于右图像的第二区域之间的视差。‘region_disparity_value’字段可以基于目标视图指示其他视图的水平位移。在发送‘region_disparity_value’字段值的情况中,‘region_horizontal_address’字段和‘region_vertical_address’字段可能是冗余的,使得冗余字段可以在必要时被省略。例如,假设扩展PCS 的 ‘target_view_position’ 字段具有 I 的值,‘region_disparity_value’ 字段具有 20 的值,且 ‘region_horizontal_address’ 字段具有 N 的值。在这种情况中,用于扩展PCS的字幕显示为右图像,且用于PCS的字幕显示为左图像。在这种情况中,在左图像上显示的字幕的水平位置是“N”,在右图像上显示的字幕的水平位置是“N-20”,使得响应于左图像和右图像之间的水平位置中的差异生成双眼视差,导致3D效果的出现。此后将描述根据本发明的一个实施方式用于显示立体字幕的字幕显示信息的配置和用于处理字幕显示信息的方法。此后将描述根据本发明的一个实施方式用于显示立体字幕的显示定义片段(DDS)和页面构成片段(PCS)的配置和处理。
16
为了允许接收器显示立体字幕,接收器必须接收两个视图的字幕信息,即,用于基本视图的一个字幕信息和用于扩展视图的另一字幕信息。传输系统可以传输用于基本视图的DDS和PCS以及用于扩展视图的扩展DDS和扩展PCS。在这种情况中,如果不能被相关2D广播接收器识别的值在扩展DDS和扩展PCS其中每一个的片段类型中确立并且然后被发送,则相关2D广播接收器丢弃扩展DDS和扩展PCS,且使用DDS和PCS控制字幕显示。3D广播接收器使用DDS和PCS控制用于基本视图的字幕显示,并且使用扩展DDS和扩展PCS控制用于扩展视图的字幕显示,使得它可以显示具有3D效果的字幕。接下来,此后将描述根据本发明的另一实施方式用于显示立体显示的区域构成片段(RCS)的配置和处理。RCS可以包括关于显示对象列表的信息和关于区域中对象的位置的信息。在发送扩展PCS的情况中,不能通过相关2D广播接收器分析的片段类型值可以在与包含在扩展PCS中的区域标识符(ID)对应的扩展RCS中确立,从而防止相关2D广播接收器的操作受到影响,且确立的片段类型值然后被发送。根据本发明的一个实施方式,在发送扩展RCS的情况中,片段类型值可以设置为‘0x41’。在这种情况中,扩展RCS可以具有与相关RCS相同的结构。另外,取代使用扩展RCS,可以使用RCS (即,片段类型=0x11)发送用于扩展视图的区域构成信息。在这种情况中,该RCS的区域ID在接收到的PCS中不可用,使得相关2D广播接收器可以丢弃上述RCS。此后将详细描述根据本发明的另一实施方式用于显示立体字幕的对象数据片段(ODS)的配置和处理。RCS或扩展RCS包括用于构建区域的对象信息,并且相应对象的详细信息可以包含在ODS中且然后被发送。在这种情况中,为了防止相关2D广播接收器的操作受到影响,可以发送用于描述用于扩展视图的字幕对象的扩展0DS。扩展ODS具有与相关ODS相同的结构,并且可以被分配与相关ODS的片段类型值不同的另一片段类型值(例如0x43),并且然后被发送。另外,取代使用扩展0DS,可以使用相关ODS发送用于扩展视图的对象信息。在这种情况中,接收到的ODS的对象ID不可用,使得相关2D广播接收器可以丢弃上述0DS。根据本发明的一个实施方式,可以根据上述‘DDS_EXT’、‘PCS_EXT’、‘RCS_TXT’(或‘RCS’)和‘0DS_EXT’(或‘0DS’)的配置以及用于发送这些片段的方法来构建各种组合。即,‘DDS_EXT’、‘PCS_EXT’、‘RCS_TXT’和‘0DS_EXT’不构建为具有相同的3D效果,且构建为具有不同的3D效果。例如,不同视差值可以分配给‘DDS_EXT’、‘PCS_EXT’、‘RCS_TXT’和‘0DS_EXT’。因此,可以根据各个字幕的页面、区域和对象显示具有不同3D效果的各种3D字幕组合。根据本发明的另一实施方式,广播接收器接收DVB广播流,且从接收的广播流提取字幕数据。更具体地,广播接收器解析来自DVB广播流的节目映射表(PMT),获得具有流类型(stream_type=0x06)的流的PID值,并且接收对应于DVB字幕的打包基本码流(PES)。在这种情况中,广播接收器可以从PMT获得字幕的基本信息。根据本发明的一个实施方式,广播接收器通过参考包含在PMT中的‘subtitiling_descriptor’字段的‘subtitiling_type’字段确定当前数据是否是3D字幕,使得它可以告知用户与3D字幕的可用性或不可用性相关的信息。广播接收器读取具有‘data_identifier’字段值‘0x20’和‘subtitle_stream_id’字段值‘0x00’的PES包,使得它可以使用读取的PES包提取字幕数据。广播接收器执行对提取的字幕数据的节过滤(section-filtering)。广播接收器执行包含在字幕数据中的详细信息的过滤,并且向相应缓存输出经过滤后的信息。在这种情况中,字幕数据可以根据‘segmentjype’字段值分类如下。0x10 用于基本视图的页面构成片段(PCS)Oxll 用于基本视图的区域构成片段(RCS)0x12 用于基本视图和扩展视图二者的CLUT定义片段0x13 用于基本视图的对象数据片段(ODS)0x14 用于基本视图的显示定义片段(DDS)0x40 用于扩展视图的扩展页面构成片段(PCS_EXT)0x41 用于扩展视图的扩展区域构成片段(RCS_EXT)0x43 用于扩展视图的扩展对象数据片段(0DS_EXT)0x44 用于扩展视图的扩展显示定义片段(DDS_EXT)广播接收器从分类的DDS、PCS、RCS和ODS解码用于基本视图的字幕显示信息。广播接收器解码DDS、PCS、RCS和DDS,使得它可以获得将要显示的字幕的尺寸信息、字幕的位置信息、对象配置信息、对象的唯一信息等。广播接收器在基本视图显示字幕所需的信息也可以称为字幕控制信息。广播接收器解码0DS,且解析颜色查找表(CLUT),使得它确定在基本视图的字幕显示颜色信息。广播接收器解码包含在ODS中的“像素数据子块”数据,使得它可以获取将要显示在基本视形平面上的字幕的伪颜色值。广播接收器解析CLUT,使得它可以将伪颜色值转换成将实际显示的颜色的信息。广播接收器从扩展DDS、扩展PCS、扩展RCS (或RCS)和扩展ODS (或0DS)解码用于扩展视图的扩展字幕显示信息。广播接收器解码扩展DDS、扩展PCS、扩展RCS和扩展ODS(或0DS),使得它可以识别将要显示的字幕的尺寸信息、字幕的位置信息、对象配置信息、对象的唯一信息等。如有必要,广播接收器在扩展视图显示字幕所需的信息也可以称为扩展字幕控制信息。广播接收器解码扩展ODS (或0DS),并且解析CLUT,使得它确定在扩展视图的字幕显示颜色信息。广播接收器解码包含在扩展ODS (或0DS)中的“像素数据子块”数据,使得它可以获取将要显示在扩展视形平面上的字幕的伪颜色值。广播接收器解析CLUT,使得它可以将伪颜色值转换成将实际显示的颜色信息。在3D显示中,左视图字幕的颜色可以等于右视图字幕的颜色。在这种情况中,广播接收器可以仅确定将显示的字幕的颜色信息一次,并且可以通过读取确定的颜色信息而使用另一视点的字幕颜色信息。广播接收器根据各个字幕控制信息控制用于基本视图的字幕和用于扩展视图的字幕,并且输出控制的字幕。广播接收器根据字幕控制信息连同基本视图视频数据一起输出基本视图字幕,并且根据扩展字幕控制信息连同扩展视图视频数据一起输出扩展视图字幕,从而它可以显示3D字幕。
在上述步骤中,用于处理用于基本视图字幕的字幕显示信息的步骤和用于处理扩展视图字幕的扩展字幕显示信息的另一步骤不需要总是按照上述顺序实施。如有必要,可以首先实施用于扩展视图的字幕显示信息,或者可以同时实施用于基本视图的字幕显示信息和用于扩展视图的字幕显示信息。图8是示出根据本发明的另一实施方式的扩展对象定义片段的句法的图示。因为观察者可以使用各种类型的接收器但是使用相同格式发送广播信号,所以不可能分别向接收器发送各种类型的广播信号。因此,用于各种接收器的选项必须包括在相同广播信号中。根据本发明的实施方式,根据属于一个页面的多个区域或根据属于每个区域的子区域或对象,视差可以不同地应用到3D字幕。然而,一些接收器不能根据区域、子区域或对象向3D字幕应用视差。对于接收与3D字幕相关联的信息和甚至在这种接收器无误差地处理信息的方法存在需要。根据本发明,用于这种接收器的缺省视差值可以与每个子区域的视差信息一起发送。这种接收器可以等同地向整个区域应用缺省视差值。现在将描述根据本发明的另一实施方式包括在扩展对象定义片段中的每个字段的描述。sync_byte 字段、segment_type 字段、page_id 字段、region_id 字段和 segment_length字段类似于在上述片段中包括的相同字段且将省略其描述。subregion_version_number 字段指不版本信息。subregion_extent_flag字段指示在区域中是否存在子区域。S卩,subregion_eXtent_flag字段提供指示区域是否划分为子区域的信息。在本发明的一个实施方式中,如果SUbregi0n_extend_flag的值为“ 1”,则它指示区域不划分为子区域。即,区域仅包括一个子区域。region_disparity_integer_part字段指示特定区域的视差值的整数部分。region_disparity_fractional_part字段指示特定区域的视差值的小数部分。根据本发明的实施方式,如果subregion_extent_flag是“I”,因为区域不包括多个子区域(即,区域仅包括一个子区域),所以应用于区域的视差值被以信号方式告知。因此,发送器使用 region_disparity_integer_part 字段和 region_disparity_fractional_part字段发送区域的视差值。subregion_id字段识别子区域。子区域可以定义为属于区域的低级区域。在区域中可以存在多个子区域。如果在区域中仅存在一个子区域,则区域与子区域具有相同的意义。subregion_position_flag字段指示是否提供子区域的位置信息。region_disparity_f lag 字段指不以下字段即 subregion_deparity_integer_part的值和/或subregion_disparity_fractional_part字段的值是否用作整个区域的视差值。例如,如果region_disparity_flag字段被设置为“ 1”,则以下子区域的视差值可以识别为页面和/或区域的缺省视差值。在这种情况中,用于其他子区域的region-disparity_flag字段被设置为“0”,且子区域的视差值不被识别为缺省视差值。subregion_horizontal_position字段指定该子区域的最左手边像素位置。该值将总是落在区域(子区域)的宣称范围内。
19
subregion_width字段指定以像素表达的该子区域的水平宽度。subregion_horizontal_position和subregion_width的组合将总是落在被引用区域的宣称范围内。subregion_disparity_integer_part字段指示应用于子区域的视差值的整数部分。subregion_disparity_fractional_part字段指示应用于子区域的视差值的小数部分。接收器大致可以分成两种类型,一种是接收器(“A”类型):其中一个视差值可以应用于一个区域和/或页面,且另一个是接收器(“B”型)其中可以根据区域中的子区域和/或对象不同地应用视差值。如果subregion_extent_flag是“I”,因为区域不划分为子区域,所以A型和B型接收器可以处理字幕片段。如果subregion_extent_flag是“O”,因为在区域中存在子区域,所以B型接收器可以使用上述字段根据子区域应用视差值。因为A型接收器不可以根据多个子区域应用视差值,所以缺省视差值应用于整个区域。例如,如果region_diparity_flag的值为“I”,则以下字段的值即 subregion_disparity_integer_parr 字段值和 / 或 subregion_disparity_fractional_part字段值用作整个区域的缺省视差值。现在将描述基于上述说明在接收器处理3D字幕的过程。接收器接收广播流。广播流包括服务信息。接收器解析服务信息中的节目映射表(PMT)0接收器解析已被解析的PMT内的subtitiling_descriptor,且使用subtitiling_descriptor的subtitling_type字段确定是否存在特定3D内容的3D字幕。如果确定存在特定3D内容的3D字幕,则指示存在特定3D内容的3D字幕的信息可以通过OSD等显示在屏幕上,使得观察者选择3D字幕的显示。接收器识别用于发送片段的包,该片段包括在广播流中包括的字幕相关信息。例如,具有 0x20 的 data_identif ier 字段值和 0x00 的 subtitle_stream_id 的 PES 包被识别且与包中的字幕的信令相关联的片段被解析。此时,接收器可以使用segment_type字段值确定片段的类型。例如,如果segment_type字段的值是0x10,则接收器可以确定片段是用于基本视图的页面构成片段,如果segmentjype字段值是0x11,则片段是用于基本视图的区域构成片段,如果segmentjype字段的值是0x12,则片段是用于扩展视图的CLUT定义片段,如果segment_type字段的值是0x13,则片段是用于基本视图的对象数据片段,如果segment_type字段的值是0x14,则片段是用于基本视图的显示定义片段,如果segmentjype字段的值是0x43,则片段是用于扩展视图的对象数据片段。接收器使用包括在扩展对象数据片段(EODS、0DS_EXT)中的region_id字段和subregion_id字段识别关于显示字幕的区域的信息。在这种情况中,可以基于每个subregion_id的位置和宽度信息确定显示字幕的区域。接收器使用DDS、PCS和区域构成片段(RCS)识别用于基本视图的字幕的尺寸、位置和对象配置信息以解码区域的字幕。接收器可以解码包括在对象数据片段(ODS)中的像素数据子块数据,并且获取将要在基本视形平面上输出的标志或字幕的伪颜色值。另外,使用CLUT定义片段,伪颜色可以转换成将在显示器上实际输出的颜色信息。即,可以获取将要在基本视形平面上输出的字幕的颜色信息。接收器使用在0DS_EXT中包括的每个子区域的视差计算与扩展视形平面中的已经解码的区域的每个子区域对应的区域。另外,接收器使用每个子区域的视差校正3D字幕数据的每个视频平面的坐标并且执行两个图形平面的3D格式化,由此在立体显示中输出3D图形/字幕/标志。如果难以在子区域单元中应用显示,则从子区域中选择具有I的regi0n_disparity_flag值的子区域并且所选子区域的视差应用于整个区域。图9是示出根据本发明的一个实施方式用于接收和处理3D字幕数据的广播接收器中的解码块的框图。参考图9,广播接收器包括解复用器(通过‘MPEG2 TS Demux (PID过滤器)’)6010、节过滤器6020、扩展视图(EV)字幕解码器6030、基本视图(BV)字幕解码器6040、构成缓存6050、CLUT处理器(由‘CLUT’指示)6060、EV像素缓存6070、BV像素缓存6080和3D图形控制器6090。在广播接收器中,接收单元(未示出)接收包括字幕数据的移动图像专家组2传输流(MPEG2TS),并且解复用器6010使用对应于字幕数据的PID来执行接收到的MPEG2TS的过滤,使得它提取并且输出字幕数据。节过滤器6020执行字幕数据的节过滤,使得它输出PCS、PCS_EXT、RCS、RCS_EXT、DDS、DDS_EXT、ODS, 0DS_EXT以及颜色查找表定义片段(CLUTDS)数据。在下文描述中,如有必要,用于从接收到的广播信号提取字幕数据的解复用器600和用于提取并且输出字幕的显示信息和CLUTDS的节过滤器6020可以包括在一个提取单元中。在这种情况中,PCS、RCS、DDS、ODS,PCS_EXT、RCS_EXT、DDS_EXT 以及 0DS_EXT 可以缓存在构成缓存6050中,并且缓存的结果可以应用于3D图形控制器6090。另外,PCS、RCS、DDS 和 ODS 可以应用于 BV 字幕解码器 6040,并且 PCS_EXT、RCS_EXT、DDS_EXT 和 0DS_EXT可以应用于EV字幕解码器6030。CLUT处理器6060处理CLUTDS,使得它向BV像素缓存6080和EV像素缓存6070
输出显不颜色信息。BV字幕解码器6040解码PCS、RCS、DDS和0DS,使得它解码用于基本视图的字幕数据和用于基本视图的字幕显示信息,并且向BV像素缓存6080输出经解码后的字幕数据和经解码后的字幕显示信息。EV字幕解码器6030解码PCS_EXT、RCS_EXT、DDS_EXT和0DS_EXT,使得它解码用于扩展视图的字幕数据和用于扩展视图的字幕显示信息,并且向EV像素缓存6070输出经解码后的字幕数据和经解码后的字幕显示信息。3D 图形控制器 6090 从构成缓存 6050 接收 PCS、RCS、DDS、ODS、PCS_EXT、RCS_EXT、DDS_EXT和0DS_EXT,并且从BV像素缓存6080接收用于基本视图的字幕显示信息以及用于基本视图的ODS和颜色信息。3D图形控制器6090从EV像素缓存6070接收用于扩展视图的字幕显示信息、ODS EXT和用于扩展视图的颜色信息。3D图形控制器6090读取接收的信息,使得它控制各个视点的字幕并且输出受控制的字幕。
21
根据本发明的另一实施方式,BV字幕解码器6040解码ODS并且EV字幕解码器6030解码0DS_EXT,使得BV字幕解码器6040和EV字幕解码器6030获取显示的字幕对象的信息。3D图形控制器6090接收显示的字幕对象的坐标、尺寸和配置信息(例如,PCS、RCS、DDS、PCS_EXT、RCS_EXT和DDS_EXT),使得它可以使用接收到的信息控制3D字幕显示。图10是示出根据本发明的实施方式用于接收数字广播信号的接收器的框图。根据本发明的实施方式的接收器包括调谐器&解调制器10010、VSB解码器10020、传输流解复用器(DEMUX) 10030、视频解码器10040、节过滤器10050、字幕解码器10060、图形引擎10070、ODS处理器10080和格式器10090。调谐器&解调制器10010调谐到用于传输广播信号的信道并且解调制信号。VSB解码器10020解码使用VSB方案调制的信号。VSB解码器可以根据广播系统解码使用不同于VSB方案的方案调制的信号。传输流DEMUX 10030解复用传输流数据。例如,传输流DEMUX 10030可以分离信
令信号和视频/音频信号。视频解码器10040解码从传输流数据解复用的视频数据。在本发明中,3D视频基本流被传送到视频解码器10040。视频解码器10040将3D视频基本流解码成3D视频数据。节过滤器10050用来过滤用于3D字幕的信令数据。即,节过滤器10050过滤诸如DDS、EDDS (DDS_EXT)、PCS、EPCS (PCS_EXT)、RCS、ERCS (RCS_EXT)、ODS、EODS (0DS_EXT)、CLUTDS (颜色查找表定义片段)等数据。字幕解码器10060解码用于显示3D字幕的信令信息。例如,字幕解码器10060解码用于3D字幕的视差信息。节过滤器10050和字幕解码器10060可以统称为提取单元。图形引擎10070使用由字幕解码器10060解码的信令信息生成与字幕相关联的图形元素。通过图形引擎10070传送的字幕以3D格式输出。另外,图形引擎10070执行用于显不3D子眷的一系列控制功能。OSD处理器10080执行与接收器的OSD处理相关联的一系列功能。例如,OSD处理器10080可以生成左视图和右视图,其中,向该左视图和右视图应用视差值,以用于向OSD应用3D效果。另外,OSD处理器10080执行用于3D OSD的一系列控制功能。格式器10090用来格式化由视频解码器10040解码的3D视频数据和由图形引擎10070和/或OSD处理器10080处理的3D字幕和/或OSD的组合。格式化的图像包括3D视频图像、3D字幕和/或3D 0SD。另外,格式器10090执行用于显示3D图像的一系列控制功能。图11是说明根据本发明的实施方式处理将被发送的3D字幕的方法的流程图。用于发送广播信号的发送器对用于3D内容的3D视频数据进行编码(sllOlO)。3D视频数据包括用于3D图像的左视像和右视像。发送器生成信令数据,该信令数据包括字幕片段,该字幕片段用于以信号方式告知将要与3D内容一同显示的3D字幕(S11020)。字幕片段包括指示应用于包括在区域中的至少一个子区域的视差值的信息。视差是在3D图像的右和左视图中表达相同空间点的像素的水平位置之间的差异。发送器发送包括编码的3D视频数据和生成的信令数据的广播信号(S11030)。尽管已经结合有限的实施方式和附图描述了本发明,但是本发明不限于此。本领域技术人员将意识到可以从本说明书得出各种修改、添加和替换。因此,本发明的范围不应限制于示例性实施方式的描述,并且应当通过所附权利要求书及其等同来确定。本发明的模式以用于实施本发明的最佳模式描述了各个实施方式。工业应用性如上所述,本发明部分地或整体地应用于数字广播系统。
2权利要求
1.一种用于处理包括3维即3D内容的数字广播信号的方法,所述方法包括以下步骤对用于所述3D内容的3D视频数据进行编码,所述3D视频数据包括用于3D图像的左视图的左画面和用于右视图的右画面;生成包括字幕片段的信令数据,所述字幕片段具有用于以信号方式告知用于所述3D内容的3D字幕的信息,其中,所述字幕片段包括子区域视差信息,所述子区域视差信息指示应用于所述3D图像的针对所述3D字幕的区域的至少一个子区域的视差的值,所述视差是在所述3D图像的所述右视图和所述左视图中表达相同空间点的像素的水平位置之间的差异;以及发送包括编码的3D视频数据和生成的信令数据的数字广播信号。
2.根据权利要求I所述的方法,其中,将所述视差的值对称地应用到所述区域或子区域的每个视图。
3.根据权利要求I所述的方法,其中,所述字幕片段还包括指示在所述3D图像的所述区域中的子区域的存在性的信息,并且其中,当所述信息指示在所述区域中不存在子区域时,将由所述子区域视差信息指示的所述视差的值应用于所述区域。
4.根据权利要求I所述的方法,其中,所述字幕片段还包括缺省视差信息,所述缺省视差信息指定当数字广播接收器不能向每个区域应用各自的视差值时应用于在所述3D图像中的所有区域的缺省视差值。
5.根据权利要求I所述的方法,其中,所述子区域视差信息包括指定所述视差的值的整部部分的整数部分信息和指定所述视差的值的小数部分的小数部分信息。
6.根据权利要求I所述的方法,其中,所述字幕片段还包括指定所述至少一个子区域的水平位置的子区域水平信息和指定所述至少一个子区域的水平宽度的子区域宽度信息。
7.根据权利要求I所述的方法,其中,对于所述3D字幕,所述字幕片段还包括指定所述视差的值应用于所述左视图和所述右视图中的哪个视图的偏移类型信息。
8.一种用于接收包括3维即3D内容的数字广播信号的装置,所述装置包括接收单元,所述接收单元被构造为接收包括用于所述3D内容的3D视频数据和信令数据的数字广播信号;解复用器,所述解复用器被构造为从接收到的所述数字广播信号解复用所述3D视频数据和所述信令数据,所述3D视频数据包括用于3D图像的左视图的左画面和右视图的右画面;提取单元,所述提取单元被构造为从解复用的信令数据提取字幕片段,所述字幕片段具有用于以信号方式告知用于所述3D内容的3D字幕的信息,其中,所述字幕片段包括子区域视差信息,所述子区域视差信息指示应用于所述3D图像的针对所述3D字幕的区域的至少一个子区域的视差的值,所述视差是在所述3D图像的所述右视图和所述左视图中表达相同空间点的像素的水平位置之间的差异;以及控制单元,所述控制单元被构造为基于提取的字幕片段控制用于所述3D内容的所述3D子眷的显不。
9.根据权利要求8所述的装置,其中,所述视差的值被对称地应用到所述区域或子区域的每个视图。
10.根据权利要求8所述的装置,其中,所述字幕片段还包括指示在所述3D图像的所述区域中的子区域的存在性的信息,并且其中,当所述信息指示在所述区域中不存在子区域时,由所述子区域视差信息指示的所述视差的值被应用于所述区域。
11.根据权利要求8所述的装置,其中,所述字幕片段还包括缺省视差信息,所述缺省视差信息指定当数字广播接收器不能向每个区域应用各自的视差值时应用于在所述3D图像中的所有区域的缺省视差值。
12.根据权利要求8所述的装置,其中,所述子区域视差信息包括指定所述视差的值的整部部分的整数部分信息和指定所述视差的值的小数部分的小数部分信息。
13.根据权利要求8所述的装置,其中,所述字幕片段还包括指定所述至少一个子区域的水平位置的子区域水平信息和指定所述至少一个子区域的水平宽度的子区域宽度信息。
14.根据权利要求8所述的装置,其中,对于所述3D字幕,所述字幕片段还包括指定所述视差的值应用于所述左视图和所述右视图中的哪个视图的偏移类型信息。
全文摘要
用于处理包括3维即3D内容的数字广播信号的方法包括以下步骤对用于所述3D内容的3D视频数据进行编码,所述3D视频数据包括用于3D图像的左视图的左画面和用于右视图的右画面;生成包括字幕片段的信令数据,所述字幕片段具有用于以信号方式告知用于所述3D内容的3D字幕的信息;以及,发送包括编码的3D视频数据和生成的信令数据的数字广播信号。
文档编号H04N13/00GK102918854SQ201180027085
公开日2013年2月6日 申请日期2011年5月27日 优先权日2010年5月30日
发明者徐琮烈, 洪昊泽, 崔智铉, 李俊徽, 李硕柱 申请人:Lg电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1