用于再现记录在记录介质上的文本字幕流的记录介质以及方法和设备的制作方法

文档序号：7634297阅读：151来源：国知局

专利名称：用于再现记录在记录介质上的文本字幕流的记录介质以及方法和设备的制作方法
技术领域：
本发明涉及一种记录介质，尤其涉及用于再现记录在记录介质上的文本字幕流的记录介质以及方法和设备。虽然本发明适合大范围的应用，但其尤其适合用于在记录介质内记录文本字幕流文件以及有效地再现所记录的文本字幕流。
背景技术：
光盘作为用于记录大量数据的光学记录介质被广泛使用。当前，各种各样的光盘中，一种诸如蓝光盘(此后称之为“BD”)的用于写入和存储高清晰度视频和音频数据的新型高密度光学记录介质(此后称之为“HD-DVD”)正在研发之中。如今正在建立蓝光盘(BD)即下一代技术的全球标准技术规范，以作为能够具有大大超过传统DVD以及许多其它数码装置的数据量的下一代光学记录方案。相应地，应用了蓝光盘(BD)标准的光学再现设备也正在研发中。然而，由于蓝光盘(BD)标准尚不完整，所以研发完整的光学再现设备还有许多困难。特别地，为了有效地从蓝光盘(BD)再现数据，不仅应提供主AV数据以及为方便用户所需的诸如作为与主AV数据有关的补充数据的字幕信息等各种数据，还需要系统化并提供用于再现记录在光盘中的主数据和字幕数据的管理信息。
然而，在当前的蓝光盘(BD)标准中，由于创建补充数据特别是字幕流文件的优选方法尚不完整，所以蓝光盘(BD)基础光学再现设备的全面研发还有许多限制。并且，在向用户提供诸如字幕等补充数据时此类限制会造成各种问题。

发明内容
相应地，本发明针对用于再现记录在记录介质上的文本字幕留的记录介质以及方法和设备，从而基本上避免了由于相关技术的局限和缺点引起的一个或多个问题。
本发明的其它优点、目的以及特征一部分将在以下描述中阐述，一部分本领域的普通技术人员可通过细读下面的内容来明白或通过对本发明的实施来学习。本发明的这些目的以及其它优点可通过在书面描述和所附权利要求书以及附图中所特别指出的结构来实现和获得。
为实现这些目的和其它优点，并根据如本文中所体现并宽泛地描述的本发明的用途，用于再现文本字幕流的记录介质包括用于存储至少一个文本字幕流的数据区，每个文本字幕流包括定义了一组区域样式的对话样式片段和多个对话呈现片段，每个对话呈现片段包含至少一个对话文本区域，并且对话文本区域与这组区域样式中选定的一个相关联，其中对话样式片段与多个对话呈现片段分别被封装在多个PES分组中。
在本发明的另一方面，一种用于再现记录在记录介质上的文本字幕流的方法包括读取包含在文本字幕流中的定义一组区域样式的对话样式片段；读取包含在文本字幕流中的多个对话呈现片段中的每一个，每个对话呈现片段包含至少一个对话文本区域，并且每个对话文本区域与这组区域样式中选定的一个相关联，对话样式片段与多个对话呈现片段分别被封装在多个PES分组中；以及根据包含在每个对话呈现片段中的连续呈现标记来呈现每个对话呈现片段，该连续呈现标记指示每个对话呈现片段是否需要与前一对话呈现片段连续呈现。
在本发明的另一方面，一种用于再现记录在记录介质上的文本字幕流的设备包括配置成预载文本字幕流的缓冲器，被预载的文本字幕流包括定义了一组区域样式的对话样式片段以及多个对话呈现片段，每个对话呈现片段包含至少一个对话文本区域，并且每个对话文本区域与这组区域样式中选定的一个相关联，其中对话样式片段与多个对话呈现片段分别被封装在多个PES分组中；以及配置成根据包含在每个对话呈现片段中的连续呈现标记来解码并呈现每个对话呈现片段的文本字幕解码器，该连续呈现标记指示每个对话呈现片段是否需要与前一对话呈现片段连续呈现。
需要理解的是，本发明以上的一般描述以及以下的详细描述都是示例性和说明性的，并旨在提供如权利要求所述的本发明的进一步解释。

包括附图是为提供对本发明更深入的理解，附图被收录并构成此申请的一部分，它们示出了本发明的实施例，并与本描述一同起到解释本发明的原理的作用。
附图中图1示出了根据本发明的记录在光盘中的数据文件的结构；
图2示出了根据本发明的光盘的数据存储区；图3示出了根据本发明的呈现在显示屏上的文本字幕和主图像；图4是示出根据本发明的文本字幕流的再现控制的示意图；图5A到5C示出了根据本发明的用于再现文本字幕流的再现控制信息的应用；图6A和6B示出了根据本发明的在文本字幕流内写入再现控制信息的方法的示例；图7A到7C示出了根据本发明的文本字幕流文件和包含在文本字幕流文件中的再现控制信息的结构；图8示出了根据本发明的文本字幕流文件的句法；图9A到9D示出了根据本发明的文本字幕流文件句法的另一示例；图10A示出了根据本发明的文本字幕流文件句法的另一示例；图10B示出了根据本发明第一实施例的文本字幕流文件当中的区域字幕句法的示例；以及图11示出了根据本发明的包括文本字幕流文件再现的光学记录和/或再现设备。
实施本发明的最佳模式现在将详细参照本发明的优选实施例，其示例在附图中示出。在任何可能的场合，在全部附图中使用相同的标记来表示相同或类似的部分。另外，虽然本发明中所用的术语选自公知公用的术语，但是本发明的描述中提到的一些术语是申请人根据他或她的判断选择的，其具体含义在此描述的相关部分中说明。另外，本发明需要从每条术语所含的意义去理解而不该仅仅从所使用的实际术语去理解。
在此详细描述中，“记录介质”是指能够记录数据的所有类型的介质并宽泛地包括诸如光盘、磁带等所有样式的介质而不论及其记录方法为何。下文中，为了简化本发明的描述，光盘，更具体地，“蓝光盘(BD)”将作为这里提到的记录介质的示例给出。然而，显然本发明的精神实质或范围也可以同等地应用于其它类型的记录介质。
在此详细描述中，“主数据”代表属于由作者记录在光盘中的标题(例如，影片标题)的音频/视频(AV)数据。通常，AV数据以MPEG2格式记录并经常被称为AV流或主AV流。另外，“补充数据”代表例如文本字幕流、交互式图形流、呈现图形流和补充音频流(例如，用于可浏览的幻灯片)等再现主数据所需的其它所有数据。这些补充数据流可用MPEG2格式或以其它任何数据格式记录。它们可与AV流多路复用或者作为独立数据文件存在于光盘内。
“字幕”代表与再现的视频(图像)数据相对应的说明信息，它可用预定的语言来表示。例如，当用户选择在观看显示屏上图像的同时观看以各种语言表示的多个字幕中的一个字幕的选项时，对应于所选字幕的说明信息被显示在显示屏的预定部分上。如果所显示的说明信息是文本数据(例如字符)，则所选字幕通常被叫做“文本字幕”。同样，在本发明中，“调色板信息”是指当文本字幕数据被再现在屏幕上时提供给用户的颜色信息和不透明度信息。根据本发明，MPEG2格式的多个文本字幕流可被记录在光盘中，并且它们可作为多个独立的流文件存在。每个“文本字幕流文件”都被创建和记录在光盘内。并且，本发明的目的是提供用于再现所记录的文本字幕流文件的方法和设备。
图1示出了根据本发明的记录在蓝光盘(下文称为“BD”)中的数据文件的文件结构。参照图1，在根目录(root)下包括至少一个BD目录(BDMV)。每个BD目录包括用于和一个或多个用户交互的索引文件(index.bdmv)和对象文件(MovieObiect.bdmv)。例如，索引文件可包含表示具有多个可选菜单和影片标题的索引表的数据。每个BD目录还包括四个文件目录，它们包括将被再现的音频/视频(AV)数据和再现这些AV数据所需的各种数据。
包括在每个BD目录中的文件目录为流目录(STREAM)，剪辑信息目录(CLIPINF)，播放列表目录(PLAYLIST)，以及辅助数据目录(AUXDATA)。首先，流目录(STREAM)包括具有特定数据格式的音频/视频(AV)流文件。例如，AV流文件可为MPEG2传输分组的形式并被命名为“*.m2ts”，如图1所示。流目录还可包括一个或多个文本字幕流文件，其中每个文本字幕流文件包括以特定语言表示的文本字幕的文本(例如，字符)数据、以及这些文本数据的再现控制信息。文本字幕流文件作为独立的流文件存在于流目录内，并可被命名为“*.m2ts”或“*.txtst”，如图1所示。包括在流目录中的AV流文件或文本字幕流文件通常被称为剪辑流文件。
其次，剪辑信息目录(CLIPINF)包括分别对应于包括在流目录中的诸流文件(AV或文本字幕)的剪辑信息文件。每个剪辑信息文件包含对应流文件的属性和再现定时信息。例如，剪辑信息文件可包括映射信息，其中呈现时间戳(PTS)和源分组号(SPN)一一对应，并根据剪辑类型由入口点映射(EPM)来映射。使用映射信息，就可从播放项或子播放项所提供的一组定时信息(进入时间(In-Time)和跳出时间(Out-Time))确定流文件的特定位置，这将在后面更加详细地讨论。在工业标准中，由流文件与其对应的剪辑信息文件构成的每个文件对被指定为一个剪辑。例如，包含在CLIPINF中的01000.clpi包括STREAM中所包含的01000.m2ts的属性和再现定时信息，并且01000.clpi和01000.m2ts构成一个剪辑。
回到图1，播放列表目录(PLAYLIST)包括一个或多个播放列表文件(*.mpls)，其中每个播放列表文件包括至少一个播放项，播放项指定至少一个主AV剪辑和该主AV剪辑的再现时间。具体而言，播放项包含指定进入时间和跳出时间的信息，它们代表了由播放项中的Clip_Information_File_Name(剪辑信息文件名)指定的主AV剪辑的再现开始和结束时间。因此，播放列表文件代表了一个或多个主AV剪辑的基本再现控制信息。另外，播放列表文件还可包括代表文本字幕流文件的基本再现控制信息的子播放项。当播放列表文件中包括用于再现一个或多个文本字幕流文件的子播放项时，该子播放项与(诸)播放项同步。另一方面，当子播放项被用于再现可浏览幻灯片时，它可以不与(诸)播放项同步。根据本发明，子播放项的主要功能是控制一个或多个文本字幕流文件的再现。
最后，辅助数据目录(AUXDATA)可包括例如字体文件(例如，aaaaa.font或aaaaa.otf)、弹出式菜单文件(未示出)、以及用于生成点击声的声音文件(例如，Sound.bdmv)等补充数据流文件。之前提到的文本字幕流文件也可被包括在辅助数据目录中而不是流目录中。
图2示出了根据本发明的光盘的数据存储区。参照图2，光盘包括占据盘卷最内部分的文件系统信息区，占据盘卷最外部分的流区，以及占据文件系统信息区与流区之间的数据库区。用于管理如图1中所示的全部数据文件的系统信息存储在文件系统信息区中。接着，主数据和补充数据(即，AV流和一个或多个文本字幕流)被存储在流区中。主数据可包括音频数据、视频数据以及图形数据。并且补充数据(即，文本字幕)被独立地存储在流区中而不与主数据多路复用。如图1中所示的通用文件、播放列表文件以及剪辑信息文件被存储在盘卷的数据库区中。如上所讨论的，通用文件包括索引文件和对象文件，并且播放列表文件和剪辑信息文件包括再现存储在流区中的AV流和文本字幕流所需的信息。使用存储在数据库区和/或流区中的信息，用户就能够选择特定的回放模式，并用所选回放模式来再现主AV和文本字幕流。
以下，将详细描述根据本发明的文本字幕流文件的结构。首先，将新定义用于再现文本字幕流的控制信息。接着是用于创建包括该新定义的控制信息的文本流的方法、以及用于再现文本字幕流以再现所记录的流文件的方法和设备的具体描述。图3示出了根据本发明的呈现在显示屏上的文本字幕和主图像。当主AV流与对应的文本字幕流被同时再现时，主图像与文本字幕将同时显示在显示屏上。
图4是示出了根据本发明的主AV剪辑与文本字幕剪辑的再现控制的示意图。参照图4，播放列表文件包括至少一个播放项，用于控制至少一个主AV剪辑的再现；以及一子播放项，用于控制多个文本字幕剪辑的再现。如图4所示，可将英文和韩文文本字幕的文本字幕剪辑1和文本字幕剪辑2中的个与主AV剪辑同步，从而使得主图像与对应的文本字幕在特定呈现时间被同时显示在显示屏上。为了在显示屏上显示文本字幕，将需要显示控制信息(例如，位置和大小信息)和呈现时间信息，其示例如图5A到图5C所示。
图5A示出了根据本发明的呈现在显示屏上的对话。对话代表了在给定的呈现时间里显示在显示屏上的全部文本字幕数据。通常，对话的呈现时间可用呈现时间戳(PTS)来表示。例如，如图5A中所示的对话的呈现开始于PTS(k)并结束于PTS(k+1)。因此，图5A中所示的对话代表了PTS(k)与PTS(k+1)之间显示在显示屏上的整个单元的文本字幕数据。在一个文本字幕中，对话最多包括100个字符码。另外，图5B示出了根据本发明的对话区域。区域代表在给定的呈现时间里显示在显示屏上的文本字幕数据(对话)的细分部分。换而言之，对话包括至少一个区域，并且每个区域可包括至少一行文本字幕。代表一个区域的全部文本字幕数据可根据对该区域指定的区域样式(全局样式)被显示在显示屏上。一个对话中包括的区域的最大数目应该根据所需的字幕数据解码率来确定，因为区域的数目越多一般会导致解码率越低。例如，一个对话的最多区域数目可被限制在两个，从而达到合理的高解码率。相应地，由于再现文本字幕流时的解码负荷，单个对话内的最大区域数目被限制在两个。在本发明的另一实施例中，在单个对话内可存在最多为n(其中，n＞2)个区域。
图5C示出了根据本发明的对话区域的样式信息。样式信息代表定义显示包含在对话中的区域的至少一部分所需的属性的信息。样式信息的一些例子为位置、区域大小、背景颜色、文本对齐、文本流向信息，以及其它信息。样式信息可被分类为区域样式信息(全局样式信息)和内联样式信息(局部样式信息)。
区域样式信息定义应用于对话的整个区域的区域样式(全局样式)。例如，区域样式信息可包含区域的区域位置、区域大小、字体颜色、背景颜色、文本流向、文本对齐、行间距、字体名称、字型，以及字体大小中的至少一个。例如，如图5C所示，两种不同的区域样式被应用于区域1和区域2。位置1、大小1且颜色＝蓝色的区域样式被应用于区域1，位置2、大小2且颜色＝红色的不同区域样式被应用于区域2。
另一方面，局部样式信息定义应用于包含在区域中的文本串的特定部分的内联样式(局部样式)。例如，内联样式信息可包含字体类型、字体大小，字形以及字体颜色中的至少一个。文本串的特定部分可为区域内的整个文本行、或是该文本行的特定部分。参照图5C，特定的内联样式被应用于包括在区域1中的文本部分“mountain”。换句话说，文本串的特定部分的字体类型、字体大小、字形以及字体颜色中的至少一个不同于区域1内文本串的其余部分。相应地，根据是否存在特定的内联样式，上述文本数据作为“文本串”被记录和描述。
图6A和6B示出了文本字幕流的再现控制信息以及，尤其是，一种通过使用对话信息、区域信息和样式信息来提供文本字幕流的方法。图6A示出了一种定义应用于每个呈现时间戳(PTS)部分的每个对话的方法。参照图6A，PTS1到PTS6之间存在四(4)个对话。这里，对话#1在PTS1与PTS2之间的部分中将文本#1作为文本数据显示，而对话#2在PTS2与PTS3之间的部分中具有两(2)个区域(区域1和区域2)，其中文本#1作为文本数据被显示在区域1中，而文本#2作为文本数据被显示在区域2中。同样，对话#3在PTS3与PTS4之间的部分中将文本#2作为文本数据显示，而对话#4在PTS5与PTS6之间的部分中显示文本#3。这里，在PTS4与PTS5之间的部分中不包括文本字幕数据。
在描述用于定义每个对话信息的方法时，要求每个对话包括显示对应的对话的定时信息(PTS组)，样式信息，以及与实际文本数据相关的信息。相应地，所显示的定时信息(PTS组)包括相互区别的PTS开始信息和PTS结束信息。样式信息包括被定义以相互区别的全局样式信息和局部样式信息，在本发明中，全局和局部样式信息分别被记录为区域样式信息(region_style)和内联样式信息(inline_style)。并且，文本数据被记录为实际显示的文本数据。具体而言，由于对话#2由区1和区2组成，所以要为区域1和区域2中的每一个记录样式信息和文本数据。
图6B示出了在相邻对话之间进行连续再现的方法。例如，对话#1和对话#2的区域1被连续再现，并且对话#2的区域2和对话#3被连续再现。特别地，为了执行相邻对话之间的连续再现，应满足以下条件。首先，PTS应该是连续的而不应该中断(例如，对话#1的呈现结束时间和对话#2的呈现开始时间是相同的，以使再现能够连续)。此后，连贯的(或连续的)对话的样式信息也应该是相同的。从而，由于对话#3的PTS和对话#4的PTS不是连贯的(或连续的)对话，所以该部分变得间断(或中断)和不连续。相应地，通过在当前(现时)对话内提供指示是否从前一对话执行连续再现的continuous_present_flag(连续呈现标记)，从而可帮助执行连续再现。上述continuous_present_flag将参照图7C更加详细地描述。
图7A示出了根据本发明的文本字幕流文件(例如，图1中所示的10001.m2ts)。文本字幕流文件可由包括多个全部具有相同分组标识符(例如，PID＝0x18xx)的传输分组(TP)的MPEG2传输流构成。当盘播放器接收到包括特定文本字幕流的许多输入流时，它使用它们的PID找到属于该文本字幕流的所有传输分组。参照图7A，传输分组的每个子集形成一个分组基本流(PES)分组。图7A中所示的PES分组中的一个对应于定义一组区域样式的对话样式片段(DSS)。第二PES分组后的所有其余的PES分组对应于对话呈现片段(DPS)。
在图7A的上述文本字幕流结构中，图5A到5C中所示的每个对话信息代表一个对话呈现片段(DPS)。并且，包括在对话信息中的样式信息代表将对话样式片段(DSS)中所定义的多个区域样式集(也可称为“region_style_id(区域样式id)”)中的任何一个与内联信息相关联的一组信息。相应地，在本发明中，应用于对话呈现片段(DPS)的区域样式集和调色板信息被记录在对话样式片段(DSS)中，现在将详细描述。
相应地，在本发明中，区域样式信息集的最大数目被记录在对话样式片段(DSS)中，其中最大数目是根据相关技术的标准来决定的。例如，可记录最大数目为60个的特定样式信息集，每个样式信息集由region_style_id来标识。因此，在文本字幕解码器(图11中的标记17)中，一次只有一个对话呈现片段(DPS)，以执行解码过程。同时，根据本发明的文本字幕流以MPEG2标准来记录，并且分组基本流(PES)也是根据MPEG2标准来创建。以下，构成文本字幕流的分组基本流(PES)的结构将参照图7C详细描述。
图7B示出了构成根据本发明的文本字幕流的分组基本流(PES)的详细结构，并且，特别示出了将PES应用于文本字幕流时的约束。具体而言，根据本发明的每个分组流(PES)被区分为分组流头部(PES头部)和分组数据。对话样式片段(DSS)和对话呈现片段(DPS)中的任何一个被记录在分组数据中。同样，根据MPEG2标准，还可将各种不同的信息记录在分组流(PES)头部中。然而，根据文本字幕流的属性，其中一些信息应该被记录为有限(或受约)值。具体而言，分组流头部(PES头部)内作为决定分组流类型的一组信息的“stream_id(流id)”字段被设置为“stream_id＝1011 1111”以指定专用流2。这是为了保持文本字幕流为可以与视频流或音频流区分的流格式，而保持分组基本流(PES)的结构为与视频/音频流相类似。
另外，对话样式片段(DSS)和对话呈现片段(DPS)中的任何一个被记录在分组基本流(PES)的分组数据中。例如，在本发明中，对话样式片段(DSS)被记录在第一分组基本流(PES)中。然后，使用该对话样式片段(DSS)的对话呈现片段(DPS)被记录在第二分组基本流(PES)接下来(或其后所跟)的分组基本流(PES)中。同时，当分组基本流(PES)以专用流2被记录时，不在分组基本流头部(PES头部)内记录呈现时间戳(PTS)和解码时间戳(DTS)作为定时信息。
具体而言，不在PES头部内记录呈现时间戳(PTS)的值是为了避免在记录了分组数据的对话呈现片段(DPS)内重复记录dialog_start_PTS(对话开始PTS)和dialog_end_PTS(对话结束PTS)。另外，不在PES头部内记录解码时间戳(DTS)是为了不改变(或修改)文本字幕流的解码顺序，这与一般的MPEG2视频或音频流不同。不在PES头部内记录DTS值的另一个原因是，孤立的DTS值是不需要的，因为整个文本字幕流被存储在预载缓冲器中然后被顺序解码。除了文本字幕流的特征属性这一例外，其它信息将根据MPEG-2标准被记录在PES头部内。
图7C示出了根据本发明的文本字幕流文件的结构，并且特别示出了将对话呈现片段(DPS)作为单个组来控制的方法。具体地，文本字幕流文件包括指示是否在相邻对话呈现片段(DPS)的区域之间执行连续呈现的continuous_present_flag(连续呈现标记)，如图6A所示。因此，如果当前DPS的再现(或呈现)是从前一DPS连续进行的，则指定“continuous_present_flag＝1”，如果不连续再现，则指定“continuous_present_flag＝0”。此时，如果包括在DPS中的至少一个区域被设置为要连续再现，则对应的DPS被定义为“连续呈现DPS”。因此，例如，作为连续呈现DPS的DPS#2，DPS#3和DPS#4被分组为“连续呈现组#2”。并且，当上述连续呈现组#2被再现(或呈现)时，连续呈现组#2的第一DPS(即，DPS#2)首先被再现。此后，不清除屏幕上显示的文本数据，继续该呈现直到呈现结束，即直到DPS#4显示结束。
记录在包含于分组基本流(PES)中的分组数据中的上述对话样式片段(DSS)和对话呈现片段(DPS)的句法结构将参照图8到10B详细描述。图8示出了根据本发明的文本字幕流(Text_subtitle_stream())的句法。参照图8，Text_subtitle_stream()包括如图7A中所示的dialog_style_segment()句法和dialog_presentation_segment()句法。具体而言，dialog_style_segment()句法对应于定义样式信息集的单个对话样式片段(DSS)，而dialog_presentation_segment()句法对应于其中记录了实际对话信息的多个对话呈现片段(DPS)。
图9A到9C示出了代表对话样式片段(DSS)的dialog_style_segment()的具体结构。具体而言，图9A示出了dialog_style_segment()的总体结构，其中定义了在对话中应用的各种不同的样式信息集的dialog_styleset()。图9B示出了根据本发明的定义在dialog_style_segment()中的dialog_styleset()。除了region_styles(region_style())外，dialog_style_set()还包括Player_style_flag、user_changeable_style set()，以及指示颜色信息和透明度的palette()。Player_style_flag指示用户对样式信息的修改是否是经授权的。同样，user_changeable_style set()定义用户可对样式信息进行修改的范围，而palette()指示颜色信息。
区域样式信息(region_style())代表如上所述的为每个区域定义的全局样式信息。向每个区域分配region_style_id，并定义对应特定region_style_id的样式信息集。因此，当通过在对话呈现片段(DPS)内记录被应用于对应对话的region_style_id来再现对话时，由dialog_style set()内相同的region_style_id定义的样式信息集的值被应用以再现对话。相应地，提供给每个region_style_id的样式信息集中所包括的各个样式信息将被描述。
这里，提供了region_horizontal_position(区域横向位置)、region_vertical_position(区域纵向位置)、region_width(区域宽度)以及region_height(区域高度)作为用于定义屏幕内对应区域的位置和大小的信息。并且，还提供了决定对应区域的背景颜色的region_bg_color_entry_id(区域背景颜色条目id)信息。另外，作为定义相应区域内文本的原始(或开始)位置的信息，提供了text_horizontal_position(文本横向位置)和text_vertical_position(文本纵向位置)。并且，还提供了定义文本方向(例如，左→右，右→左，上→下)的text_flow(文本流向)、以及定义文本对齐方向(例如，左，中，右)的text_alignment(文本对齐)。特别地，当特定对话中包括多个区域时，包括在对应对话中的每个区域的text_flow被定义为具有相同的text_flow值，从而防止用户看到打乱的图像。
此外，提供了指定区域内每行之间的间距的line_space(行间距)作为样式信息集中所包括的单独的样式信息。并且，提供了font_type(字体类型)、font_style(字形)、font_size(字体大小)以及font_color_index(字体颜色索引)作为实际字体信息的字体信息。同时，记录在dialog_style set()内的Player_style_flag(播放器样式标记)指示作者是否可应用提供给播放器的样式信息。例如，当Player_style_flag＝1b，并且定义在dialog_style set()中的样式信息被记录在光盘中时，播放器被授权通过应用播放器本身内部所提供的样式信息来再现文本字幕流。另一方面，当Player_style_flag＝0b时，只有在记录于光盘内的dialog_style set()中所定义的样式信息的使用是被授权的。
图9C示出了根据本发明的在dialog_style set()中定义的user_changeable_styleset()。user_changeable_style set()预定义可由用户修改的样式信息的类型和修改的范围，并且user_changeable_style set()被用于方便地修改文本字幕数据的样式信息。然而，如果如图9B中所述地使用户能够修改所有的样式信息，则用户可能更加困惑。因此，在本发明中，只有font_size、region_horizontal_position，以及region_vertical_position的样式信息可被修改。并且，相应地，可根据font_size而改变的文本位置和行间距的变更也被定义在user_changeable_style set()中。特别地，为每个region_style_id定义user_changeable_style set()。例如，在user_changeable_style set()中，在region_style_id＝k内最多可定义25个user_style_id(用户样式id)。
同样，每个user_style_id包括region_horizontal_position_direction(区域横向位置方向)和region_vertical_position_direction(区域纵向位置方向)，它们指定可修改的region_horizontal_position和region_vertical_position各自的修改后位置的方向。每个user_style_id还包括region_horizontal_position_delta(区域横向位置增量)和region_vertical_position_delta(区域纵向位置增量)信息，用于指定在每个方向上的单个位置移动单位作为像素单位。具体地，例如，当region_horizontal_position_direction＝0时，区域的位置向右方移动。而当region_horizontal_position_direction＝1时，区域的位置向左方移动。同样，当region_vertical_position_direction＝0时，区域的位置向下方移动。最后，当region_vertical_position_direction＝1时，区域的位置向上方移动。
此外，每个user_style_id包括指定每个可修改的font_size的改变方向的font_size_inc_dec信息，以及用于指定在每个方向上单个位置移动单位作为像素单位的font_size_delta(字体大小增量)信息。具体地，例如，font_size_inc_dec＝0代表font_size的增大方向，而font_size_inc_dec＝1代表font_size的减小方向。此外，根据于font_size的减小或增大而改变的“文本位置”和“行间距”的减小或增大可由和font_size、region_horizontal_position以及region_vertical_position相同的方法来定义。
现在将详细描述根据本发明的user_changeable_style set()的特性。在对话样式片段(DSS)中所包含的每个region_style()中所定义的user_control_style()的数目是相同的。换而言之，可应用于每个对话呈现片段(DPS)的user_control_style的数目是相同的。另外，每个user_control_style()由不同的user_style_id表示。而且，当用户选择随机的user_style_id时，相同顺序的user_control_style()被同等地应用于每个region_style()。此外，可改变样式所有可能的组合在单个user_control_style()中定义。换而言之，region_position和font_size在组合中被同时定义，而不是分别被定义。而且，最后，移动方向(*_direction)或增大/减小指示(*_inc_dec)独立地区别于每个位置移动单位(*_delta)并被相应地记录。具体地，只是定义位置移动单位(*_delta)而不具有样式值，即实际所改变的值。随后，所定义的位置移动单位(*_delta)被加到region_style()中所定义的值，由此获得实际所改变的样式值的最终值。
图9D示出了根据本发明的在dialog_style set()中定义的调色板信息(palette())。palette()提供记录在对话内的文本字幕数据的颜色改变信息。这里，palette()包括多个palette_entries(调色板条目)，其中每个palette_entry由palette_entry_id(调色板条目id)描述。而且，对于每个palette_entry_id，为每个palette_entry提供了特定的亮度值(Y_value)、特定的颜色值(Cr_value、Cb_value)，以及指定文本数据透明度的特定T_value。相应地，根据本发明的文本字幕流的一个特性是仅定义一个基本(或公用)调色板，该调色板被应用到包括在文本字幕流文件中的每个对话呈现片段(DPS)。具体地，在对话样式片段(DSS)中定义调色板后，所定义的调色板在每个对话呈现片段(DPS)中被公用。然而，如果在一特定对话呈现片段(DPS)中要使用新的特定调色板来替代公用调色板，则通过使用palette_update_flag(调色板更新标记)来新定义该特定调色板，接下来参照图10A对此进行描述。
图10A和10B示出了代表根据本发明的对话呈现片段(DPS)的dialog_presentation_segment()的具体结构。图10A示出了dialog_presentation_segment()的总体结构，其中定义了dialog_start_PTS和dialog_end_PTS。dialog_start_PTS和dialog_end_PTS指定对应对话的呈现时间。然后，dialog_presentation_segment()包括指示对应对话内的颜色信息改变的palette_update_flag。这里，当palette_update_flag＝1b时，颜色和透明度(T_value)被改变(或更新)，从而新定义颜色的palette()信息被单独记录。在这种情形中，在对话呈现片段(DPS)中新定义的palette()必须仅被应用于对应的对话呈现片段(DPS)。假设palette_update_flag＝0b，在呈现(或再现)对应的对话呈现片段(DPS)时，如图9A中所示的在对话样式片段(DSS)中定义的上述公用调色板应该被恢复(或保持)。
随后，定义区域信息的dialog_region()被记录在dialog_presentation_segment()中。在本发明中，在单个对话内最多提供两个区域，因此，dialog_region()信息被提供给每个区域。dialog_region()包括region_style_id信息和continuous_present_flag信息。region_style_id如图9B中所示地指定任何一个区域样式，而continuous_present_flag信息标识是否执行与前一对话区域的无缝再现，如图7B中所示。此外，文本数据和region_subtitle()信息也被包括在dialog_region()中。文本数据被包括在实际对应区域中，而region_subtitle()信息定义局部样式信息。
图10B示出了定义在dialog_region()内的region_subtitle()信息。这里，region_subtitle()由文本串和应用于该文本串的内联样式信息组成的一个组(或一个对)所构成。另外，当region_subtitle()内的类型不等于type＝0x01时，region_subtitle()代表内联样式信息。例如，type＝0x02代表字体设置的改变，从而由对应的ClipInfo(剪辑信息)指定的字体ID值被记录在特定字段(即inline_style_value())中，而type＝0x03代表字型的改变，从而对应的字型值被记录在特定字段(即inline_style_value())中。同样，type＝0x04代表字体大小的改变，而对应的字体大小值被记录在特定字段(即inline_style_value())中；而type＝0x05代表字体颜色的改变，从而由对应的调色板指定的索引值被记录在特定字段(即inline_style_value())中。此外，type＝0x0A代表行中断。例如，如图5C中所示的包括在区域1中的文本部分“mountain”被写为text_string(文本串)(即text_string＝“mountain”)，而该文本部分被设置成“inline_style_value()＝0x04(字体大小改变)”作为局部样式信息。并且，通过设置inline_style_value＝xxx，对应的text_string＝mountain的Font_size可被表示为不同于由region_style()指定的值的一个值(xxx)。
图11示出了根据本发明的包括文本字幕文件再现的光学记录和/或再现设备10的详细视图。光学记录和/或再现设备10基本包括拾取单元11，用于再现记录在光盘上的主数据、文本字幕流和对应的再现控制信息；伺服14，用于控制拾取单元11的操作；信号处理器13，用于将从拾取单元11接收的再现信号恢复到所需信号值，或者将要被记录的信号调制为光盘可记录信号并发送已调制信号；以及微型计算机16，用于控制上述操作。
另外，AV解码器和文本字幕(文本ST)解码器17根据控制器12的控制执行输出数据的最终解码。而且为了执行在光盘上记录信号的功能，AV编码器18根据控制器12的控制将输入信号转换为特定格式(例如MPEG2传输流)的信号，然后将经转换的信号提供给信号处理器13。为了描述简便起见，相应地，AV解码器和文本字幕(文本ST)解码器17作为单个解码器包括在本发明中。然而，显然只有文本字幕(文本ST)解码器可作为本发明的要素被独立包括。
缓冲器18用于事先预载和存储文本字幕流，以根据本发明来解码文本字幕流。控制器12控制光学记录和/或再现设备的操作。并且，当用户输入请求显示特定语言的文本字幕的命令时。则对应的文本字幕流被预载并存储在缓冲器18中。随后，在已预载并存储在缓冲器18中的文本字幕流数据当中，控制器12参照上述的对话信息，区域信息，样式信息等，并控制文本字幕解码器17以使得实际文本数据以特定大小显示在屏幕上的特定位置处。
特别地，在根据本发明的用于再现文本字幕流的方法中，记录在文本字幕流内的第一分组基本流(PES)中的对话样式片段(DSS)被读取。然后，特定样式被应用于第二PES接下来(或之后)的分组基本流(PES)中所记录的每个对话呈现片段(DPS)以进行再现。然而，再现是通过根据记录在用户想要再现的当前对话呈现片段(DPS)中的continuous_presentation_flag来决定前一DPS的应用来执行的。换而言之，当记录在所要再现(或呈现)的当前对话呈现片段(DPS)内的连续呈现信息被设置为continuous_presentation_flag＝0b时，当前对话呈现片段(DPS)被独立于前一对话呈现片段(DPS)而呈现。另一方面，当记录在所要再现(或呈现)的当前对话呈现片段(DPS)内的连续呈现信息被设置为continuous_presentation_flag＝1b时，通过使用来自前一对话呈现片段的解码结果来再现(或呈现)当前对话呈现片段。
工业实用性本领域的技术人员可显见，可对本发明进行各种修改和变更而不会脱离本发明的精神实质和范围。因此，旨在使本发明覆盖落在所附权利要求及其等效技术方案范围之内的对本发明的修改和变更。
权利要求
1.一种用于再现文本字幕流的记录介质，所述记录介质包括用于存储至少一个文本字幕流的数据区，每个所述文本字幕流包括定义一组区域样式的对话样式片段和多个对话呈现片段，每个所述对话呈现段包含至少一个对话文本区域，并且每个所述对话文本区域与所述一组区域样式中选定的一个相关联，其中所述对话样式片段和所述多个对话呈现片段分别被封装在多个PES分组中。
2.如权利要求1所述的记录介质，其特征在于，封装所述对话样式片段的PES分组位于所述文本字幕流内的最前部。
3.如权利要求1所述的记录介质，其特征在于，每个所述PES分组包含至少一个传输分组。
4.如权利要求3所述的记录介质，其特征在于，包括在所述多个PES分组中的所有传输分组具有相同的分组标识(PID)值。
5.如权利要求1所述的记录介质，其特征在于，所述多个PES分组中的至少一个是专用流2PES分组。
6.如权利要求1所述的记录介质，其特征在于，每个所述PES分组都包括PES头部和分组数据。
7.如权利要求6所述的记录介质，其特征在于，所述PES头部包括指示每个PES分组的类型的流标识(ID)。
8.如权利要求6所述的记录介质，其特征在于，包含在每个所述PES分组中的PES头部不包含任何呈现和解码时间信息。
9.如权利要求1所述的记录介质，其特征在于，所述多个对话呈现片段包含至少一个连续呈现组，每个所述连续呈现组包括需要连续呈现的一个或多个对话呈现片段。
10.如权利要求1所述的记录介质，其特征在于，每个所述对话呈现片段包含指示该对话呈现片段是否需要与前一对话呈现片段连续呈现的连续呈现标记。
11.如权利要求1所述的记录介质，其特征在于，所述对话样式段定义配置成被公共地应用于所述多个对话呈现片段的调色板信息。
12.如权利要求11所述的记录介质，其特征在于，所述多个对话呈现片段中选定的一个包括调色板更新标记，并定义新的调色板信息，所述调色板更新标记指示所述新的调色板信息被配置成应用于所选的对话呈现片段。
13.如权利要求12所述的记录介质，其特征在于，所述新的调色板信息被配置成仅应用于所选的对话呈现片段。
14.一种用于再现文本字幕流的记录介质，所述记录介质包括用于存储至少一个文本字幕流的数据区，每个文本字幕流包括定义一组区域样式的对话样式片段和多个对话呈现片段，每个对话呈现片段包含至少一个对话文本区域，并且每个所述对话文本区域与所述一组区域样式中选定的一个相关联，其中每个所述对话呈现片段包含指示该对话呈现片段是否需要与前一对话呈现片段连续呈现的连续呈现标记。
15.如权利要求14所述的记录介质，其特征在于，所述对话样式片段和所述多个对话呈现片段分别被封装到多个PES分组中。
16.一种用于再现记录在记录介质上的文本字幕流的方法，所述方法包括读取包含在所述文本字幕流中的对话样式片段，所述对话样式片段定义一组区域样式；读取包含在所述文本字幕流中的多个对话呈现片段中的每一个，每个对话呈现片段包含至少一个对话文本区域，并且每个所述对话文本区域与所述一组区域样式中选定的一个相关联，所述对话样式片段与所述多个对话呈现片段分别被封装在多个PES分组中；以及根据包含在每个所述对话呈现片段中的连续呈现标记来呈现每个所述对话呈现片段，所述连续呈现标记指示每个所述对话呈现片段是否需要与前一对话呈现片段连续呈现。
17.如权利要求16所述的方法，其特征在于，每个所述对话呈现片段包含指示该对话呈现片段的呈现开始和结束时间的信息。
18.如权利要求16所述的方法，其特征在于，还包括将所述文本字幕流预载到缓冲器中。
19.一种用于再现记录在记录介质上的文本字幕流的设备，所述设备包括缓冲器，所述缓冲器被配置成预载所述文本字幕流，被预载的文本字幕流包括定义一组区域样式的对话样式片段以及多个对话呈现片段，每个所述对话呈现片段包含至少一个对话文本区域，并且每个对话文本区域与所述一组区域样式中选定的一个相关联，其中所述对话样式片段与所述多个对话呈现片段分别被封装在多个PES分组中；以及文本字幕解码器，所述文本字幕解码器被配置成根据包含在每个所述对话呈现片段中的连续呈现标记来解码并呈现每个所述对话呈现片段，所述连续呈现标记指示每个所述对话呈现片段是否需要与前一对话呈现片段连续呈现。
全文摘要
缓冲器起初预载记录在记录介质上的文本字幕流。预载的文本字幕流包括定义了一组区域样式的对话样式片段和多个对话呈现片段，每个对话呈现片段包含至少一个对话文本区域。每个对话文本区域与对话样式片段中所定义的这组区域样式中选定的一个相关联。对话样式片段与多个对话呈现片段分别被封装在多个PES分组中。文本字幕解码器根据包括在每个对话呈现片段中的连续呈现标记来解码和呈现每个对话呈现片段。连续呈现标记指示每个对话呈现片段是否需要与前一对话呈现片段连续呈现。
文档编号H04N5/781GK1934642SQ200580008629
公开日2007年3月21日申请日期2005年3月3日优先权日2004年3月18日
发明者徐康洙, 金柄辰, 刘齐镛, 朴成浣, 李承勋申请人:Lg电子株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：徐康洙;金柄辰;刘齐镛;朴成浣;李承勋
技术所有人：LG电子株式会社
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。