用于再现记录在记录介质上的文本字幕流的记录介质、方法和装置的制作方法

文档序号：7634377阅读：120来源：国知局

专利名称：用于再现记录在记录介质上的文本字幕流的记录介质、方法和装置的制作方法
技术领域：
本发明涉及记录介质，尤其涉及用于再现记录在记录介质上的文本字幕流的记录介质、方法和装置。尽管本发明适用于广泛范围的应用，但它特别适用于将文本字幕流文件记录在记录介质内并有效地再现所记录的文本字幕流。
背景技术：
光盘被广泛地用作用于记录大量数据的光学记录介质。目前，在广泛范围的光盘中，诸如蓝光盘(下文称为“BD”)之类的新的高密度光学记录介质(下文称为“HD-DVD”)正在开发中，用于写入和存储高清晰度的视频和音频数据。当前，众所周知作为下一代技术的蓝光盘(BD)的全球标准技术规范正在被建立成为能具有大大超越传统DVD以及许多其它数字装置的数据的下一代光学记录方案。
因此，还在开发应用蓝光盘(BD)标准的光学再现装置。然而，因为蓝光盘(BD)标准仍有待完成，所以在开发完备的光学再现装置的过程中存在许多困难。特别是为了有效地从蓝光盘(BD)再现数据，不仅应提供主AV数据以及方便用户所需的各种数据，诸如作为与主AV数据相关的补充数据的字幕信息，而且应系统化和提供管理信息，用于再现记录在光盘中的主数据和字幕数据。
然而，在现有的蓝光盘(BD)标准中，因为创建补充数据特别是字幕流文件的优选方法尚未完成，所以在基于蓝光盘(BD)的光学再现装置的全面研发中存在许多限制。并且，在向用户提供诸如字幕之类的补充数据的过程中这些限制会引起一些问题。

发明内容
因此，本发明涉及一种记录介质以及用于再现记录在该记录介质上的文本字幕流的方法和装置，它基本上避免了由于相关技术的限制和缺点而引起的一个或多个问题。
本发明的一个目的是提供一种根据本发明在将文本字幕流文件记录于记录介质内时创建一组调色板信息的方法。
本发明的另一个目的是提供一种根据本发明用于再现文本字幕流的方法和装置，它能有效地再现上述文本字幕流。
本发明的其它优点、目的和特征的一部分将在下面的说明书中阐述，一部分将在本领域普通技术人员阅读以下说明后变得显而易见，或者可以从本发明的实践中认识到。本发明的目的和其它优点可以通过在书面说明书及其权利要求、以及附图中特别指出的结构来实现和获得。
为了实现这些目的和其它优点，并根据在本文中体现并广泛说明的本发明用途，用于再现文本字幕流的记录介质包括存储至少一个文本字幕流的数据区，各文本字幕流包括定义一组区域样式的对话样式片段和多个对话呈现片段，各对话呈现片段包含至少一个对话文本区域，且各对话文本区域链接到这组区域样式的一个选定样式，其中该对话样式片段还定义调色板信息，并且各对话呈现片段还包含调色板更新标志，它指示在再现各对话呈现片段时是使用在对话样式片段中定义的调色板信息、还是使用新的调色板信息。
在本发明的另一方面中，用于再现记录在记录介质上的文本字幕流的方法包括读取文本字幕流中所包括的对话样式片段，该对话样式片段定义一组区域样式和调色板信息；读取文本字幕流中所包括的多个对话呈现片段的每一个，各对话呈现片段包含至少一个对话文本区域，且各对话文本区域链接到这组区域样式的一个选定样式；读取各对话呈现片段中所包括的调色板更新标志，该调色板更新标志指示在再现各对话呈现片段时是使用在对话样式片段中定义的调色板信息、还是使用新的调色板信息；以及根据该调色板更新标志的指示来呈现各对话呈现片段。
在本发明的又一方面中，用于再现记录在记录介质上的文本字幕流的装置包括被配置成预载文本字幕流的缓冲器，所预载的文本字幕流包括对话样式片段和多个对话呈现片段，该对话样式片段定义一组区域样式和调色板信息，且各对话呈现片段包含至少一个对话文本区域，各对话文本区域链接到这组区域样式的一个选定样式；以及文本字幕解码器，它被配置成读取各对话呈现片段中所包括的调色板更新标志，该调色板更新标志指示是使用在对话样式片段中定义的调色板信息、还是使用新的调色板信息，文本字幕解码器根据该调色板更新标志的指示来呈现各对话呈现片段。
应当理解本发明的在前概述及下列详述是示例性和解释性的，且旨在提供对所要求保护的本发明的进一步解释。

包括在内提供对本发明的进一步理解、并结合其中构成本申请的一部分的附图示出本发明的各个实施例，并与说明书一起用于解释本发明的原理。在附图中图1示出根据本发明的记录在光盘中的数据文件的结构；图2示出根据本发明的光盘的数据存储区；图3示出根据本发明的呈现在显示屏上的文本字幕和主图像；图4示出根据本发明的文本字幕流的再现控制的示意图；图5A-5C示出根据本发明的用于再现文本字幕流的再现控制信息的应用；图6示出根据本发明的文本字幕流文件的结构；图7A和7B示出根据本发明一组调色板信息对文本字幕流文件的应用；图8示出根据本发明的文本字幕流文件的句法；图9A-9D示出根据本发明的文本字幕流文件的句法的另一个示例；图10A示出根据本发明的文本字幕流文件的句法的又一个示例；图10B示出根据本发明第一实施例的文本字幕流文件当中区域字幕的句法的一个示例；图11A和11B示出根据本发明的包括再现文本字幕流文件的再现的光学记录和/或再现装置。
具体实施例方式
现在将详细参考本发明的优选实施例，其示例在附图中示出。在可能的情况下，在全部附图中用相同的标号来指示相同或相似的部件。另外，虽然本发明中使用的术语选自众所周知和已使用的术语，但本发明的说明书中提到的某些术语是由申请人根据他或她的判断选择的，其详细含义在本说明书的相关部分中描述。此外，本发明需要不仅仅通过所使用的实际术语而通过各术语内蕴含的意义来理解。
在本详细说明书中，“记录介质”指能记录数据的所有类型的介质，并且广义地包括不论采取何种记录方法的所有类型的介质，例如光盘、磁带等。在下文中，为了简化本发明的说明，光盘特别是“蓝光盘(BD)”将作为本文提出的记录介质的一个示例给出。然而，可将本发明的精神和范围同等地应用于其它类型的记录介质是显而易见的。
在本详细说明中，“主数据”表示属于由作者记录在光盘中的标题(例如电影标题)的音频/视频(AV)数据。通常，AV数据以MPEG2格式记录并常常被称为AV流或主AV流。另外，“补充数据”表示再现主数据所需的所有其它数据，其示例是文本字幕流、交互式图形流、呈现图形流和补充音频流(例如，用于可浏览幻灯片)。这些补充数据流可以用MPEG2格式或任何其它数据格式记录。它们能与AV流多路复用或能在光盘中作为独立数据文件存在。
“字幕”表示对应于所再现的视频(图像)数据的字幕说明信息，并且它可用预定语言表示。例如，当用户在观看显示屏上的图像时选择观看以各种语言表示的多个字幕之一的选项时，对应于所选择字幕的字幕说明信息被显示在显示屏的预定部分上。如果所显示的字幕说明信息是文本数据(例如字符)，则所选择的字幕常被称为“文本字幕”。并且，在本发明中，“调色板信息”是指在屏幕上再现文本字幕数据时向用户提供的颜色信息和不透明度信息。根据本发明，多个MPEG2格式的文本字幕流可记录在一张光盘中，并且它们可作为多个独立的流文件存在。各个“文本字幕流文件”被创建并记录在一张光盘内。并且，本发明的目的在于提供一种用于再现所记录的文本字幕流文件的方法和装置。
图1示出根据本发明的记录在蓝光盘(下文称为“BD”)中的数据文件的文件结构。参见图1，根目录(root)中包括至少一个BD目录(BDMV)。各BD目录包括用于与一个或多个用户交互的索引文件(index.bdmv)和对象文件(MovieObject.bdmv)。例如，索引文件可包含表示具有多个可选择菜单和电影标题的索引表的数据。各BD目录还包括四个文件目录，它们包括所要再现的音频/视频(AV)数据和再现这些AV数据所需的各种数据。
各BD目录中所包括的文件目录是流目录(STREAM)、剪辑信息目录(CLIPINF)、播放列表目录(PLAYLIST)、和辅助数据目录(AUX DATA)。首先，流目录(STREAM)包括具有特定数据格式的音频/视频(AV)流文件。例如，AV流文件可以是MPEG2传输分组的形式，并命名为“*.m2ts”，如图1所示。该流目录还可包括一个或多个文本字幕流文件，其中各文本字幕流文件包括用特定语言表示的文本字幕的文本(例如字符)数据和该文本数据的再现控制信息。文本字幕流文件作为独立的流文件存在于流目录内，并可命名为“*.m2ts”或“*.txtst”，如图1所示。流目录中所包括的AV流文件或文本字幕流文件常称为剪辑流文件。
接着，剪辑信息目录(CLIPINF)包括分别对应于流目录中所包括的诸流文件(AV或文本字幕)的剪辑信息文件。各剪辑信息文件包含相应流文件的属性或再现定时信息。例如，剪辑信息文件可包括映射信息，在其中呈现时戳(PTS)和源分组号(SPN)是一一对应关系并根据剪辑类型通过入口点映射(EPM)来映射。使用该映射信息，可根据由播放项或子播放项提供的一组定时信息(进入时间In-Time和跳出时间Out-Time)确定流文件的特定位置，下面将对此进行详细讨论。在工业标准中，每一由流文件及其相应的剪辑信息文件构成的文件对被指定为一个剪辑。例如，CLIPINF中所包括的01000.clpi包含STREAM中所包括的01000.m2ts的属性和再现定时信息，且01000.clpi和01000.m2ts形成一个剪辑。
再参看图1，播放列表目录(PLAYLIST)包括一个或多个播放列表文件(*.mpls)，其中每个播放列表文件包括至少一个播放项，它指定至少一个主AV剪辑和该主AV剪辑的再现时间。更具体来说，播放项包含指定进入时间和跳出时间的信息，进入时间和跳出时间表示由播放项内的Clip_Information_File_Name(剪辑信息文件名)指定的主AV剪辑的再现开始和结束时间。因此，播放列表文件表示一个或多个主AV剪辑的基本再现控制信息。另外，播放列表文件还可包括子播放项，它表示用于文本字幕流文件的基本再现控制信息。当子播放项被包括在播放列表文件中以再现一个或多个文本字幕流文件时，该子播放项与(诸)播放项同步。另一方面，当子播放项用于再现可浏览幻灯片时，它可不与(诸)播放项同步。根据本发明，子播放项的主要功能在于控制一个或多个文本字幕流文件的再现。
最后，辅助数据目录(AUX DATA)可包括补充数据流文件，其示例是字体文件(例如，aaaaa.font或aaaaa.otf)、弹出式菜单文件(未示出)、和用于产生点击声的声音文件(例如，Sound.bdmv)。上述文本字幕流文件可包括在辅助数据目录而非流目录中。
图2示出根据本发明的光盘的数据存储区。参见图2，光盘包括占用盘卷的最里面部分的文件系统信息区、占用盘卷的最外面部分的流区、以及占用文件系统信息区和流区之间的区域的数据库区。在文件系统信息区中，存储用于管理图1所示的全部数据文件的系统信息。接着，主数据和补充数据(即，AV流和一个或多个文本字幕流)被存储在流区中。主数据可包括音频数据、视频数据和图形数据。并且，补充数据(即，文本字幕)被独立地存储在流区中而不与主数据多路复用。图1所示的通用文件、播放列表文件和剪辑信息文件被存储在盘卷的数据库区中。如上所述，通用文件包括索引文件和对象文件，而播放列表文件和剪辑信息文件包括再现存储在流区中的AV流和文本字幕流所需的信息。使用存储在数据库区和/或流区中的信息，用户能选择特定回放模式并以所选择的回放模式再现主AV和文本字幕流。
下面将详细说明根据本发明的文本字幕流文件的结构。首先，将新定义用于再现文本字幕流的控制信息。然后是创建包括新定义的控制信息的文本流文件的方法、和用于再现文本字幕流从而再现所记录的流文件的方法和装置的详细说明。图3示出根据本发明呈现在显示屏上的文本字幕和主图像。当同步再现主AV流和相应的文本字幕流时，所述主图像和文本字幕被同时显示在显示屏上。
图4是示出根据本发明的主AV剪辑和文本字幕剪辑的再现控制的示意图。参见图4，播放列表文件包括控制至少一个主AV剪辑的再现的至少一个播放项、和控制多个文本字幕剪辑的再现的子播放项。图4所示的用作英文和韩文文本字幕的文本字幕剪辑1和文本字幕剪辑2中的一个可与主AV剪辑同步，从而主图像和相应的文本字幕在特定呈现时间同时显示在显示屏上。为了在显示屏上显示该文本字幕，需要显示控制信息(例如位置和大小信息)和呈现时间信息，其示例在图5A到图5C中示出。
图5A示出根据本发明的在显示屏上呈现的对话。对话表示在给定呈现时间期间显示屏上显示的全部文本字幕数据。通常，对话的呈现时间可用呈现时戳(PTS)表示。例如，图5A所示的对话的呈现在PTS(k)处开始并在PTS(k+1)处结束。因此，图5A所示的对话表示在PTS(k)和PTS(k+1)之间显示在显示屏上的文本字幕数据的整个单元。对话最多包括一个文本字幕中的100个字符码。
此外，图5B示出根据本发明的对话的多个区域。区域表示在给定呈现时间期间在显示屏上显示的文本字幕数据(对话)的细分部分。换言之，对话包括至少一个区域，且各区域可包括至少一行字幕文本。可根据分配给一个区域的区域样式(全局样式)在显示屏上显示表示该区域的全部文本字幕数据。应根据字幕数据的期望解码速率来确定包括在一个对话中的最多区域数目，因为较多数目的区域通常导致较低的解码率。例如，可以将一个对话的最多区域数目限制为2，以实现合理高的解码速率。据此，当再现文本字幕流时，因为解码负荷的缘故，所以单个对话内的最多区域数目被限制为2个。在本发明的另一个实施例中，单个对话内可存在最多n个(其中n＞2)区域。
图5C示出根据本发明的对话的多个区域的样式信息。样式信息表示定义显示对话中所包括区域的至少一部分所需的属性的信息。样式信息的某些示例是位置、区域大小、背景颜色、文本对齐、文本流向信息等等。样式信息可分类成区域样式信息(全局样式信息)和内联(inline)样式信息(局部样式信息)。
区域样式信息定义应用于对话的整个区域的区域样式(全局样式)。例如，区域样式信息可包含区域的区域位置、区域大小、字体颜色、背景颜色、文本流向、文本对齐、行间距、字体名称、字形和字体大小的至少之一。例如，如图5C所示将两个不同的区域样式应用于区域1和区域2。具有“位置1、大小1及颜色＝蓝色”的区域样式被应用于区域1，而具有“位置2、大小2及颜色＝红色”的不同区域样式被应用于区域2。
另一方面，局部样式信息定义应用于区域中所包括的文本串的特定部分的内联样式信息(局部样式)的信息。例如，内联样式信息可包含字体类型、字体大小、字形、和字体颜色的至少之一。文本串的特定部分可以是区域中的整个文本行或该文本行的特定部分。参见图5C，特定内联样式被应用于区域1中包括的文本部分“mountain”。换言之，文本串特定部分的字体类型、字体大小、字形和字体颜色的至少之一与区域1中文本串的其余部分不同。
因此，取决于是否存在特定内联样式，上述文本数据被记录和描述为“文本串”。图6示出根据本发明的文本字幕流文件(例如，图1所示的10001.m2s)。该文本字幕流文件可由包括多个传输分组(TP)的MPEG2传输流形成，所有传输分组都具有相同的分组标识符(例如，PID＝0x18xx)。当盘片播放器接收到包括特定文本字幕流在内的许多输入流时，它用它们的PID找到属于该文本字幕流的所有传输分组。参见图6，传输分组的每个子集形成一个分组基本流(PES)分组。图6所示的PES分组之一对应于定义一组区域样式的对话样式片段(DSS)。第二PES分组之后的所有其余PES分组对应于对话呈现片段(DPS)。
在上述图6的文本字幕流结构中，图5A到5C所示的每个对话信息表示一个对话呈现片段(DPS)。并且，对话信息中所包括的样式信息表示链接在对话样式片段(DSS)中定义的多个区域样式组(也可称为“region_style_id”)的任一个的一组信息、以及内联样式。因此，在本发明中，应用于对话呈现片段(DPS)的区域样式组和调色板信息被记录在对话样式片段(DSS)中，如下进行详细描述。
图7A示出记录在文本字幕流中的对话样式片段(DSS)、以及对话呈现片段(DPS)的结构。因此，在后面将参照图8描述文本字幕流的详细句法。更具体地，对话样式片段(DSS)最多包括记录其中的60组区域样式，其每一组由一个region_style_id(区域样式id)描述。包括各种区域样式信息的区域样式组、以及用户可改变样式组被记录在各个region_style_id中。在本文中，区域样式信息的详细内容将在图9B中描述，而用户可改变的样式信息的详细内容将在图9C中描述。
此外，对话样式片段包括通常应用于相应对话字幕流内的调色板信息，且该调色板信息包括各调色板条目ID(palette_entry_ID)的色彩信息(Y、Cr和值)和透明度信息(T_value)。并且，为在样式信息中指示(或显示)特定色彩信息，就指定相应的palette_entry_ID，从而使所需色彩得以表示。此外，对话呈现片段(DPS)包括文本数据和指示该文本数据的呈现时间的定时信息(即PTS组)。对话呈现片段(DPS)还包括将各区域的任一样式信息链接到上述对话样式中所包括的特定区域样式信息的信息。
并且，一般而言，对话呈现片段(DPS)通常应用上述对话样式片段(DSS)中所定义的调色板信息。然而，还应该新定义单独的调色板信息，并将其应用于对话呈现片段中。在本文中，指示调色板信息的这种更改(或更新)的信息被称为“palette_update_flag”(调色板更新标志)。更具体地，当palette_update_flag＝0b时，应用在对话样式片段(DSS)中定义的通用调色板信息，因其未作任何更改(或更新)。相反，当palette_update_flag＝1b时，定义并使用应用于相应对话样式片段(DSS)中的新调色板信息(即，palette())。
此时，通过仅更新相应对话呈现片段(DPS)所需的调色板信息来记录新定义的调色板信息。并且，当相应的对话呈现时间结束时，将从DSS提供的通用调色板信息应用于后续DPS。更具体地，当palette_update_flag＝0b时，应用从DSS提供的通用调色板信息。并且，当palette_update_flag＝1b时，应用在相应对话呈现片段(DPS)中新定义的调色板信息。
因此，参看图7A，在DPS#1、DPS#2和DPS#6中，应用于各组文本数据(文本数据#1、文本数据#2和文本数据#3)的区域样式分别链接于和应用于对话呈现片段(DPS)内的region_style_id＝k、region_style_id＝n和region_style_id＝m的每一个。并且，因为palette_update_flag＝0b，所以使用从DSS中提供的通用调色板信息。另一方面，在DPS#3、DPS#4和DPS#5中，应用于各文本数据(文本数据#2)的区域样式分别链接于和应用于对话呈现片段(DPS)内的region_style_id＝n。并且，因为palette_update_flag＝1b，所以应用在相应DPS中新定义的调色板信息，而不是从DSS中提供的通用调色板信息。同时，由区域样式ID(region_style_id)链接的样式信息同等地应用于相应区域内的所有文本数据(即全局样式信息)。然而，当请求改变(或更改)文本数据内一特定文本串的样式信息时，定义并使用作为仅应用于该文本串的局部样式信息的内联样式信息。
图7B示出图7A中所示的DPS#1-DPS#6的调色板信息的使用，并且最特别地说明了用于表示显示淡入和淡出效果的淡化效果的方法。更具体地，参看图7B，在DPS#1和DPS#2中，应用了palette_update_flag＝0b，从而使用了从DSS中提供的通用调色板信息。然而，当用淡出效果处理DPS#2时，palette_update_flag＝1b应用于DPS#3、DPS#4和DPS#5中的每一个，以便于逐步更改(或改变)指定色彩和/或透明度的调色板信息，从而产生淡出效果。因此，如DPS#3、DPS#4和DPS#5中所示地仅新定义和更改(或改变)调色板信息，并不作任何更改地重新定义如在DPS#2中使用的上述样式信息和文本数据的过程，也被称为“仅调色板的显示更新”。
因此，当诸如在DPS#1、DPS#2和DPS#6中palette_update_flag＝1b时，使用DSS中所定义的通用调色板信息的DPS可被命名为第一对话呈现片段(DPS)。并且，当诸如在DPS#3、DPS#4和DPS#5中palette_update_flag＝0b时，在相应DPS内具有特定调色板信息并使用该特定调色板信息的DPS可被命名为第二对话呈现片段(DPS)。因此，显然文本字幕流由对话样式片段(DSS)、第一对话呈现片段(DPS)、和第二对话呈现片段(DPS)构成。此外，考虑各DPS的显示时间，当在第一DPS中palette_update_flag＝0b时，最好确保至少1秒的显示时间作为正常回放(或再现)时间(例如PTS2＞＝PTS1+1秒)。并且，当在第二DPS中palette_update_flag＝1b(它仅指示调色板信息中更改(或改变))时，，最好确保至少2个视频帧的显示时间(例如PTS4＞＝PTS 3+2个视频帧的持续时间)。此外，尽管图7B示出淡出效果的一个示例，但是淡入效果也可使用同样的原理应用其中。
上述对话样式片段(DSS)和对话呈现片段(DPS)的句法结构将参照图8-10B进行详细地描述。更具体地，通过详细说明句法结构，可更精确地描述对根据本发明的上述样式信息和调色板信息的使用。图8示出根据本发明的文本字幕流(Text_subtitle_stream())的句法。参看图8，Text_subtitle_stream()包括dialog_style_segment()(对话样式片段)句法和dialog_presentation_segment()(对话呈现片段)句法。更具体地，dialog_style_segment()句法对应于定义样式信息组的单个对话样式片段(DSS)，并且dialog_presentation_segment()句法对应于其中记录有实际对话信息的多个对话呈现片段(DPS)。
图9A-9D示出表示对话样式片段(DSS)的dialog_style_segment()的详细结构。更具体地，图9A示出dialog_style_segment()的整个结构，其中定义了应用于对话中的定义各种样式信息组的dialog_style_set()(对话样式组)。图9B示出根据本发明的在dialog_style_segment()中定义的dialog_style_set()。除区域样式(region_style())之外，dialog_style_set()包括Player_style_flag(播放器样式标志)、user_changeable_style set()(用户可改变样式组)和palette()(调色板)。Player_style_flag指示是否授权播放器改变样式信息。同样，user_changeable_styleset()定义播放器对样式信息的改变的范围，而palette()指示颜色信息。
区域样式信息(region_style())表示对各区域定义的全局样式信息，如上所述。给各区域分配region_style_id，并定义对应于特定region_style_id的样式信息组。因此，当通过将应用于相应对话的region_style_id记录在对话呈现片段(DPS)中来再现对话时，应用由dialog_style set()内的相同region_style_id定义的样式信息组的值以再现对话。因此，现在将描述提供给各region_style_id的样式信息组内所包括的各个样式信息。
在本文中，region_horizontal_position(区域横向位置)、region_vertical_position(区域纵向位置)、region_width(区域宽度)和region_height(区域高度)被提供为用于定义相应区域在屏幕内的位置和大小的信息。并且，还提供了决定相应区域的背景颜色的region_bg_color_entry_id(区域背景颜色条目id)信息。更具体地，region_bg_color_entry_id信息是指定调色板信息内特定palette_entry_id的一组信息，它将在后面过程中参照图9D进行描述。在此，region_bg_color_entry_id信息对相应区域的背景颜色使用分配给相应palette_entry_id的颜色信息(Y、Cr和Cb值)和透明度(T_value)。
此外，作为定义文本在相应区域内的原始(或起始)位置的信息，提供text_horizontal_position(文本横向位置)和text_vertical_position(文本纵向位置)。此外，提供定义文本方向(例如左→右、右→左、上→下)的text_flow(文本流向)、以及定义文本对齐方向(例如左、中、右)的text_alignment(文本对齐)。更具体地，当特定对话中包括多个区域时，相应对话中所包括的各区域的text_flow被定义为具有相同的text_flow值，以防止用户看到混乱的图像。
此外，指定区域内各行之间间距的line_space(行间距)被提供作为样式信息组内所包括的个体样式信息。并且，font_type(字体类型)、font_size(字体大小)和font_color_entry_id(字体颜色条目id)被提供作为用于实际字体信息的字体信息。更具体地，font_color_entry_id是指定调色板信息内的特定palette_entry_id的一组信息，它将在后面过程中参照图9D进行描述。在本文中，font_color_entry_id信息将分配给相应palette_entry_id的颜色信息(Y、Cr和Cb值)用作相应字体的颜色值。
同时，dialog_style set()内所记录的Player_style_flag(播放器样式标志)指示作者是否可应用提供给播放器的样式信息。例如，当Player_style_flag＝1b时，播放器被授权通过应用播放器本身内所提供的样式信息以及记录在盘片内的dialog_style set()里定义的样式信息来再现文本字幕流。另一方面，当Player_style_flag＝0b时，仅授权记录在盘片内的dialog_style set()中所定义的样式信息的使用。
图9C示出根据本发明的在dialog_style set()中定义的uset_changeable_styleset()。该user_changeable_style set()预定义可由用户改变的样式信息的类型和改变的范围，并且user_changeable_style set()用于简便地改变文本字幕数据的样式信息。然而，当用户被允许改变如图9B所述的所有样式信息时，用户会更加困惑。因此，在本发明中，只可改变font_size、region_horizontal_position、以及region_vertical_position的样式信息。并且，相应地，可根据font_size改变的文本位置和行间距的变化也在user_changeable_style set()中定义。更具体地，为每个region_style_id定义user_changeable_style set()。例如，在user_changeable_style set()中，可定义特定region_style_id＝k内最多25个user_style_id。
此外，各user_style_id包括region_horizontal_position_direction(区域横向位置方向)、region_vertical_position_direction(区域纵向位置方向)信息，它们指定各可变region_horizontal_position和region_vertical_position的改变后位置的方向。各user_style_id还包括region_horizontal_position_delta(区域横向位置增量)和region_vertical_position_delta(区域纵向位置增量)信息，用于将各方向上的单个位置移动单位指定为像素单位。更具体地，例如，当region_horizontal_position_direction＝0时，区域的位置向右移动。而当region_horizontal_position_direction＝1时，区域的位置向左移动。此外，当region_vertical_position_direction＝0时，区域的位置向下移动。最后，当region_vertical_position_direction＝1时，区域的位置向上移动。
此外，各user_style_id包括指定各可变font_size的改变方向的font_size_inc_dec(字体大小增减)信息、以及用于将各方向上的单个位置移动单位指定为像素单位的font_size_delta(字体大小增量)信息。更具体地，例如，font_size_inc_dec＝0表示font_size的增大方向，而font_size_inc_dec＝1表示font_size的减小方向。此外，取决于font_size的增或减改变的“文本位置”和“行间距”的增或减，可通过与font_size、region_horizontal_position和region_vertical_position相同的方法来定义。
相应地，以下将详细描述根据本发明的user_changeable_style set()的特征。在对话样式片段(DSS)中所包括的所有region_style()内定义了相同数目的user_control_style()。因此，可应用于各对话呈现片段(DPS)的user_control_style的数目也是相同的。此外，各user_control_style()由不同的user_style_id表示。并且，当用户选择随机的user_style_id时，相同顺序的user_control_style()等同地应用于所有region_style()。此外，所有可变样式的组合都在单个user_control_style()中定义。更具体地，region_postion和font_size同时定义，而非分别定义。最后，无论各位置移动单位(*_delta)如何都独立地记录各方向(*_direction)或增减指示(*_inc_dec)。更具体地，通过只定义位置移动单位(*_delta)，实际改变的样式信息(或样式值)的最终值可通过将region_style()中定义的值加上位置移动单位(*_delta)来获得。
图9D示出根据本发明的在dialog_style set()中定义的调色板信息(palette())。该palette()提供记录在对话内的文本字幕数据的颜色改变信息。在本文中，palette()包括多个palette_entry(调色板条目)，其中每个palette_entry都由一palette_entry_id描述。并且，各palette_entry设置有特定亮度值(Y_value)、特定颜色值(Cr_value、Cb_value)、以及指定文本数据透明度的特定T_value。
因此，亮度值(Y_value)在16-235的范围内，颜色值(Cr_value、Cb_value)在16-240的范围内，而用于指定透明度的T_Value在0-255的范围内。更具体地，T_Value＝0表示全透明，而T_Value＝255表示全不透明。此外，T_Value＝0通常被指定为缺省值，从而T_Value＝0可表示全透明。因此，盘片制作者(或作者)将用于各palette_entry_id的调色板信息记录在对话样式片段(DSS)中，其中调色板信息用于整个文本字幕流中。因而，可从上述样式信息中指定和使用特定的palette_entry_id。
图10A和10B示出根据本发明表示对话呈现片段(DPS)的dialog_presentation_segment()的详细结构。图10A示出dialog_presentation_segment()的整体结构，其中定义dialog_start_PTS(对话开始PTS)和dialog_end_PTS(对话结束PTS)。dialog_start_PTS和dialog_end_PTS指定相应对话的呈现时间。然后，dialog_presentation_segment()包括指示相应对话内信息的改变的palette_update_flag。如上所述，当palette_update_flag＝1b时，在DDS内单独定义仅在相应DPS中使用的新调色板信息(palette())，而非如图9D所示的通用调色板信息。因此，作者使用palette_update_flag来允许广泛范围的应用。最具体地，为了产生(或呈现)淡入/淡出效果，连续提供仅更改了调色板信息的DPS(例如图7B所示的DPS#3-DPS#5)，从而在视觉上向用户提供文本字幕的淡入或淡出效果。
随后，定义区域信息的dialog_region()被记录在dialog_presentation_segment()中。在本发明中，最多有两个区域可设置在单个对话内，并且因此dialog_region()信息被提供给各区域。dialog_region()包括region_style_id信息和continuous_present_flag(连续呈现标志)信息。region_style_id信息指定如图9B所示的区域样式的任一个，并且continuous_present_flag信息标识是否要执行与前一对话区域的无缝再现。此外，在dialog_region()中还包括文本数据和region_subtitle()信息。文本数据被包括在实际相应区域中，并且region_subtitle()信息定义局部样式信息。
图10B示出在dialog_region()内定义的region_subtitle()(区域字幕)信息。在本文中，region_subtitle()由文本串和应用于该文本串的内联样式信息组成的一个组(或对)构成。更具体地，在dialog_presentation_segment()中，当palette_update_flag＝1b时，region_style_id和region_subtitle()应当与前一对话样式片段(PSS)的相同。在该情形中，continuous_present_flag应被确定为continuous_present_flag＝1b。更具体地，region_subtitle()内的type(类型)＝0x01表示文本串。因此，字符码(char_data_byte)被记录在text_string()内。
此外，当region_subtitle()内的类型不等于type＝0x01时，region_subtitle()表示内联样式信息。例如，type＝0x02表示字体集中的变化，并且因此由相应剪辑信息指定的字体ID值被记录在特定字段内(即inline_style_value()(内联样式值))，而type＝0x03表示字形中的变化，并且因此相应的字形值被记录在特定字段内(即inline_style_value())。此外，type＝0x04表示字体大小中的变化，并且因此相应的字体大小值被记录在特定字段内(即inline_style_value())，而type＝0x05表示字体颜色中的变化，并且因此由相应调色板指定的索引值被记录在特定字段内(即inline_style_value())。并且，type＝0x0A表示断行。
更具体地，如上所述，type＝0x05表示字体颜色中的变化。在该情形中，经更改的palette_entry_id被记录在inline_style_value()中，从而使应用于各文本串的字体颜色能被更改。例如，如图5C所示的区域1中包括的文本部分“mountain”被写成为text_string(例如text_string＝“mountain”)，而该文本部分被设置成“inline_style type＝0x05(字体颜色变化)”作为局部样式信息。并且，通过将文本部分设置成“inline_style_value()＝palette_entry_id(k)”，相应text_string＝“mountain”的字体颜色可被再现为具有如图9D所示的palette_entry_id(k)中所定义的颜色信息(Y、Cr和Cb值)以及透明度(T值)。
在下文中，将参照图11A和11B详细描述用于再现如上所述记录在光盘中的文本字幕流的方法和装置。图11A示出根据本发明的用于再现光盘的装置，尤其是解码器，更特别地示出单独包括的文本字幕解码部件40的一个示例。更具体地，该装置包括分组标识符(PID)过滤器5，用于基于其分组标识符将输入流分成视频流、音频流、图形流、和文本字幕流；视频解码部件20，用于再现视频流；音频解码部件10，用于再现音频流；图形解码部件30，用于再现图形流；以及文本字幕解码部件40，用于再现文本字幕流。
这些文本字幕流可从光盘中提取，或者它们可从其它外部源中输入，如图11A所示。因此，该装置包括选择输入数据源的开关6。因此，如果从光盘中提取MPEG格式的文本字幕流，则开关6选择与PID过滤器5相连的数据线A。另一方面，如果它们通过其它外部源输入，则开关6选择与该外部源相连的数据线B。
视频解码部件20、音频解码部件10、图形解码部件30分别包括传输缓冲器21、11和31，用于存储预定大小的要解码的数据流。视频平面23和图形平面33分别包括在视频解码部件20和图形解码部件30中，用于将经解码信号转换成可显示图像。图形解码部件30包括颜色查找表(CLUT)34，用于控制可显示图像的颜色和透明度。
当文本字幕解码部件40从开关6处接收一个或多个文本字幕流时，所有这些流在开始时就一次性地预载入文本预载缓冲器(SPB)41中。假设用于一种语言的文本字幕流文件的典型大小约为0.5兆字节，则字幕预载缓冲器41的大小应根据文本字幕流文件的总数来确定。例如，为了确保当用户在支持两种语言的字幕流文件之间切换时文本字幕的无缝呈现，字幕预载缓冲器41的大小应大于或等于1兆字节。字幕预载缓冲器41的大小应大到足以一次性地预载所有所需的文本字幕流文件。
因为如上所述整个文本字幕流可记录在小容量内，所以文本字幕流被全部预载到缓冲器41中并使用。因此，文本字幕流被记录为单独的文件，从而便于只读取和使用文本字幕数据。此外，因为全部文本字幕数据都被预载到缓冲器中，所以可更简便地控制该缓冲器。在特定类型的光学记录和再现装置中，假设未发生缓冲器下溢，则文本字幕流可在未预载文本字幕流的情况下结合主AV数据实时再现。在下文中，将给出并详细描述根据本发明的正在预载的文本字幕流的一个示例。
文本字幕解码部件40还包括文本字幕解码器42，它解码存储在字幕预载缓冲器41中的一个或多个文本字幕流；图形平面43，它将解码后的字幕流转换成可显示图像；以及颜色查找表(CLUT)44，它控制转换后图像的颜色信息(Y、Cr和Cb值)和透明度信息(T值)。
图11A所示的装置中所包括的图像叠加部件50组合从视频解码部件20、图形解码部件30和文本字幕解码部件40中输出的图像。这些组合图像在显示屏上显示。从视频解码部件20的视频平面23中输出的视频图像被显示为显示屏的背景，并且从图形解码部件30和/或文本字幕解码部件40输出的图像被叠加在所显示的视频图像上。例如，如果图形解码部件30的输出图像是交互式图形图像，则由第一加法器52在开始时将从文本字幕解码部件40输出的文本字幕图像叠加在视频图像之上。然后，再由第二加法器53将交互式图形图像进一步叠加在已叠加字幕的图像之上。图11A所示的装置还包括用于解码所输入传输流(例如MPEG传输流)的系统解码器4，以及用于控制装置的所有所述组件的操作的微处理器3。
将详细参考根据本发明用于再现文本字幕流的方法。当光盘播放器(其示例如图11A所示)预载入光盘时，在开始时从盘片中提取再现记录在盘片上的数据所需的信息，并将其存储在存储器(未示出)中。当用户选择与一播放列表相关联的特定标题时，开始时将播放列表文件中所指定的至少一个完整(整个)文本字幕流文件预载入字幕预载缓冲器41，并且与该字幕流文件相关的字体文件被预载入字体预载缓冲器410。
例如，当用户选择与图4所示播放列表相关联的标题时，开始时将文本字幕剪辑No.1(韩语)和文本字幕剪辑No.2(英语)的文本字幕文件预载入字幕预载缓冲器41。此外，与这些文本字幕文件相关的字体文件被预载入字体预载缓冲器410，这些字体文件可在文本字幕剪辑的剪辑信息文件中指定。然后，开始播放列表的回放。在播放列表回放期间，主AV剪辑No.1和No.2的AV流分别由音频解码部件10和视频解码部件20解码，且所预载的文本字幕流的选定之一由文本字幕解码器42解码。然后经解码的文本字幕图像被叠加在经解码的主视频图像上，并且在显示屏上显示整个图像。
如上所述，当完成所有操作、并且由播放项控制的主视频数据被显示到屏幕上时，通过图像叠加部件50(如图11A所示)叠加相关的文本字幕。并且，当提供了经叠加的文本字幕时，启动文本字幕流的解码。同时，为了执行文本字幕流的解码，对话样式片段(DSS)内配置了第一分组流(PES)的区域样式信息和调色板信息被分别读取并存储以便于稍后在再现该DPS时使用。更具体地，当读取调色板信息时，同时向CLUT 44提供调色板信息，以便于在将文本字幕显示在屏幕上时提供用户所需的颜色和透明度。
图11B详细地示出图11A所示的文本字幕解码器42。由文本字幕解码器42执行的解码过程包括语法分析、绘制和排版步骤。在语法分析步骤中，根据对话呈现片段(DPS)中所包括的信息，存储在字幕预载缓冲器(SPB)41中的文本字幕流被语法分析成排版信息、绘制信息和对话文本数据。对话表示在可由呈现时戳(PTS)定义的预定时段期间显示的所有文本字幕。因此，排版信息对应于与文本字幕显示到屏幕上时的显示时间和显示位置相关的信息，并且还对应于由调色板信息更新(palette_update_fag＝1b)新定义的新调色板信息。绘制信息对应于实际上描绘(或呈现)各对话中各区域的文本的信息。这种绘制信息包括“区域宽度和高度”、“背景颜色”、“文本流向”、“文本对齐”、和“字体id/字形/大小”。此外，对话文本信息对应于应用到实际文本数据的内联样式信息、以及记录在DPS内的特定文本串。
参看图11B，文本字幕解码器42中所包括的文本字幕处理器421将存储在字幕预载缓冲器41内的字幕流文件语法分析成排版和绘制信息以及对话文本数据。然后将排版和绘制信息存储在对话排版缓冲器(DCB)425中，并将对话文本数据存储在对话缓冲器(DB)422中。更具体地，调色板更新信息(palette_update_flag＝1b)被包括在由语法分析步骤语法分析的排版信息内。并且，当palette_update_flag＝0b时，开始时从对话样式片段(DSS)提供给CLUT 44的通用调色板信息可在不经更新的情况下连续使用。相反，当palette_update_flag＝1b时，忽略DSS内的通用调色板信息，并且新的调色板信息在相应DPS内新定义、并被更新到CLUT 44并使用。然而，当相应DPS的呈现(或再现)完成时，清除调色板更新，并再次使用开始时从CLUT 44提供的通用调色板信息。此时，CLUT 44的更新应在呈现(或再现)后续DPS之前完成。
在绘制步骤中，经语法分析的对话文本数据使用绘制信息绘制成位图数据，该绘制信息表示绘制对话文本数据所需的样式信息。在对话呈现控制器426的控制下，文本绘制器423将对话缓冲器422内所存储的对话文本数据绘制成位图数据。为了执行绘制功能，文本绘制器423从字体预载缓冲器410中接收与对话文本数据相关联的字体数据、从对话呈现控制器426中接收绘制信息和内联样式信息、并使用绘制信息和内联样式信息将对话文本数据绘制成位图数据，这适用于对话文本数据的各个文本串。此后，所绘制的文本数据作为位图对象被存储在位图对象缓冲器(BOB)424中。因此，记录在BOB缓冲器424内的“对象”对应于被转换成位图对象的各对话内各区域的文本数据。因此，每个区域最多有两个对象被语法分析并存储在BOB缓冲器424内。
最后，在排版步骤中，所绘制的文本数据根据排版信息被添加到图形平面(GP)43中，该排版信息表示指示用于在显示屏内显示文本字幕的时间的信息。最后，根据由对话呈现控制器426提供的排版信息，存储在位图对象缓冲器424中的位图对象被传送(添加)到图形平面43。颜色查找表44使用排版信息中包括的调色板信息以调节图形平面43的输出的颜色和透明度。
由此，在palette_update_flag＝1b的DPS中，将省略绘制步骤，并且保留并使用与前一DPS相关并被存储在BOB缓冲器424内的位图对象。在此，通过使用在palette_update_flag＝1b的DPS中定义的调色板信息来仅修改CLUT，图形平面中保留的前一DPS的位图对象中仅色彩信息(Y、Cr和Cb值)和透明度信息(T值)被更新。如上所述，这被称作“仅调色板的显示更新”。通过使用“仅调色板的显示更新”，还可表示DPS的淡入/淡出效果。
工业实用性对本领域技术人员而言，显然可在本发明中进行各种更改和变化而不背离本发明的精神或范围。因而，本发明旨在涵盖本发明的更改和变化，只要它们落在所附权利要求及其等效方案的范围内即可。
权利要求
1.一种用于再现文本字幕流的记录介质，所述记录介质包括存储至少一个文本字幕流的数据区，各文本字幕流包括定义一组区域样式的对话样式片段和多个对话呈现片段，各对话呈现片段包含至少一个对话文本区域，且各对话文本区域链接到所述一组区域样式的一个选定样式，其中所述对话样式片段还定义调色板信息，并且各对话呈现片段还包含调色板更新标志，它指示在再现各对话呈现片段时是使用在对话样式片段中定义的调色板信息、还是使用新的调色板信息。
2.如权利要求1所述的记录介质，其特征在于，当所述调色板更新标志指示使用所述新的调色板信息时，在各对话呈现片段中定义所述新的调色板信息。
3.如权利要求1所述的记录介质，其特征在于，定义在所述对话样式片段中的调色板信息包括调色板条目的颜色和不透明度值。
4.如权利要求3所述的记录介质，其特征在于，所述颜色值包括Y、Cr和Cb值的至少之一。
5.如权利要求3所述的记录介质，其特征在于，定义在所述对话样式片段中的调色板信息还包括标识所述调色板条目的调色板条目标识(ID)。
6.如权利要求1所述的记录介质，其特征在于，当所述调色板更新标志指示使用所述新的调色板信息时，所述至少一个文本区域和链接到各对话文本区域的选定区域样式与前一对话呈现保持不变。
7.如权利要求1所述的记录介质，其特征在于，所述调色板更新标志被设置成“1b”以指示使用所述新的调色板信息。
8.如权利要求1所述的记录介质，其特征在于，当所述调色板更新标志指示使用所述新的调色板信息时，各对话呈现片段的呈现时间大于或等于再现至少两个视频帧所需的时间。
9.一种用于再现文本字幕流的记录介质，所述记录介质包括存储至少一个文本字幕流的数据区，各文本字幕流包括定义一组区域样式的对话样式片段和调色板信息、被配置成使用在所述对话样式片段中定义的调色板信息的至少一个第一对话呈现片段、以及被配置成使用新的调色板信息的至少一个第二对话呈现片段，所述第一和第二对话呈现片段的每一个都包含至少一个对话文本区域，且各对话文本区域链接到所述一组区域样式的一个选定样式。
10.如权利要求9所述的记录介质，其特征在于，所述第一和第二对话呈现片段根据其调色板更新标志值来彼此区分。
11.如权利要求10所述的记录介质，其特征在于，所述第二对话呈现片段的调色板更新标志被设置成“1b”以指示使用所述新的样式片段。
12.如权利要求9所述的记录介质，其特征在于，所述第一对话呈现片段的呈现时间大于或等于1秒。
13.如权利要求9所述的记录介质，其特征在于，所述第二对话呈现片段的呈现时间大于或等于再现至少两个视频帧所需的时间。
14.如权利要求9所述的记录介质，其特征在于，所述的新调色板信息在所述第二对话呈现片段中定义。
15.一种用于再现文本字幕流的记录介质，所述记录介质包括存储至少一个文本字幕流的数据区，各文本字幕流包括定义一组区域样式和调色板信息的对话样式、被配置成使用在所述对话样式片段中定义的调色板信息的第一对话呈现片段、以及被配置成通过仅改变其调色板信息来淡入或淡出所述第一对话呈现片段的呈现的至少一个第二对话呈现片段，所述第一和第二对话呈现片段的每一个都包含至少一个对话文本区域，且各对话文本区域链接到所述对话样式片段中所定义的所述一组区域样式的一个选定样式。
16.如权利要求15所述的记录介质，其特征在于，所改变的调色板信息在所述第二对话呈现片段中定义。
17.一种用于再现记录在记录介质上的文本字幕流的方法，所述方法包括读取文本字幕流中所包括的对话样式片段，所述对话样式片段定义一组区域样式和调色板信息；读取文本字幕流中所包括的多个对话呈现片段的每一个，各对话呈现片段包含至少一个对话文本区域，且各对话文本区域链接到所述一组区域样式的一个选定样式；读取各对话呈现片段中所包括的调色板更新标志，所述调色板更新标志指示在再现各对话呈现片段时是使用在对话样式片段中定义的调色板信息、还是使用新的调色板信息；以及根据该调色板更新标志的指示来呈现各对话呈现片段。
18.如权利要求17所述的方法，其特征在于，所述调色板更新标志被设置成“1b”以使用各对话呈现片段中所包括的新的调色板信息。
19.如权利要求17所述的方法，其特征在于，还包括将所述文本字幕流预载入缓冲器中。
20.一种用于再现记录在记录介质上的文本字幕流的装置，所述装置包括被配置成预载文本字幕流的缓冲器，所预载的文本字幕流包括对话样式片段和多个对话呈现片段，所述对话样式片段定义一组区域样式和调色板信息，且各对话呈现片段包含至少一个对话文本区域，各对话文本区域链接到所述一组区域样式的一个选定样式；以及文本字幕解码器，它被配置成读取各对话呈现片段中所包括的调色板更新标志，所述调色板更新标志指示是使用在对话样式片段中定义的调色板信息、还是使用新的调色板信息，文本字幕解码器根据该调色板更新标志的指示来呈现各对话呈现片段。
全文摘要
缓冲器开始时预载记录在记录介质上的文本字幕流。所预载的文本字幕流包括对话样式片段以及多个对话呈现片段。该对话样式片段定义一组区域样式和调色板信息。各对话呈现片段包含至少一个对话文本区域，其中各对话文本区域链接到在对话样式片段中定义的一组区域样式中的一个选定样式。文本字幕解码器读取各对话呈现片段中所包括的调色板更新标志，并根据该调色板更新标志的指示呈现各对话呈现片段。调色板更新标志指示在呈现各对话呈现片段时是使用对话样式片段中定义的调色板信息，还是使用新的调色板信息。
文档编号H04N5/445GK1934624SQ200580009397
公开日2007年3月21日申请日期2005年3月3日优先权日2004年3月26日
发明者徐康洙, 金柄辰, 刘齐镛申请人:Lg电子株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：徐康洙;金柄辰;刘齐镛
技术所有人：LG电子株式会社
我是此专利的发明人

上一篇：一种键组件的制作方法
上一篇：通信系统中对网络接入实体的选择的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。