用于再现和记录文本字幕流的记录介质以及方法和设备的制作方法

文档序号：6784061阅读：105来源：国知局

专利名称：用于再现和记录文本字幕流的记录介质以及方法和设备的制作方法
技术领域：
本发明涉及记录介质，尤其涉及一种用于记录和再现文本字幕流的记录介质以及方法和设备。尽管本发明的适用范围很广，但它尤其适用于将文本字幕流文件记录在记录介质内并有效地再现所记录的文本字幕流。
背景技术：
光盘被广泛地用作记录大量数据的光学记录介质。当前在多种光盘中，新的高密度光学记录介质(下文中称之为“HD-DVD”)，诸如蓝光盘(下文中称之为“BD”)正被研发，用于写入和存储高清晰度的视频和音频数据。当前，称为下一代技术的蓝光盘(BD)全球标准技术规范作为能够具有远超常规DVD的数据的下一代光学记录方案正在建立当中，同时建立的还有许多其它数字设备。
因此，应用了蓝光盘(BD)标准的光学再现设备也正在研发中。然而，由于蓝光盘(BD)标准尚未完善，因此在研发完善的光学再现设备时有许多困难。尤其是为了有效地从蓝光盘(BD)再现数据，不仅应当提供主AV数据以及为了用户方便所需的各种数据，诸如作为与主AV数据相关的补充数据的字幕信息，还应当系统化和提供用于再现记录在光盘中的主数据和字幕数据的管理信息。
然而，在目前的蓝光盘(BD)标准中，由于补充数据、尤其是字幕流文件的标准尚未完全统一，因此蓝光盘(BD)基础光学再现设备的全范围研发中有许多限制。而此类约束在将诸如字幕等补充数据提供给用户时会引起问题。

发明内容
因此，本发明针对一种用于再现和记录文本字幕流的记录介质以及方法和设备，它能基本规避由于相关技术的局限和缺点所引起的一个或多个问题。
本发明的一个目的是提供一种根据本发明的、当将文本字幕流文件记录在记录介质中时创建一组样式信息的方法。
本发明的另一个目的是提供一种根据本发明的、用于再现文本字幕流的方法和设备，所述方法和设备能有效地再现上述文本字幕流。
本发明的其它优点、目的和特征一部分将在后面的说明中展开，另一部分可由本领域普通技术人员通过对下文的细阅而变得明白，或可从本发明的实施中获知。本发明的目的和其它优点可由书面说明、所附权利要求以及附图中特别指出的结构实现和达成。
为了实现这些目的和其它优点，并根据如本文中所体现和宽泛地说明的本发明的目的，一种用于再现文本字幕流的记录介质包括存储至少一个文本字幕流的数据区，每个文本字幕流包括定义一组区域样式的对话样式段和至少一个对话呈现段，每个对话呈现段包含至少一个对话文本区域，每个对话文本区域链接到这组区域样式中的一个，并包括至少一个由内联样式和文本串构成的对，内联样式被配置以改变由文本串所链接的区域样式规定的区域呈现属性中的一个。
每个对话文本区域可包括一个数据类型字段，它指示紧随数据类型字段后的数据表示文本串，并且每个对话文本区域可包括紧居于数据类型字段前的转义码以将表示文本串的数据与居于转义码前的数据区别开来。另外，每个对话文本区域可包括一个数据类型字段，它指示紧随数据类型字段后的数据表示内联样式。
此外，每个对话文本区域可包括一个紧居于数据类型字段前的转义码，以将表示内联样式的数据与居于转义码前的数据区别开来。在此，数据类型字段还指示内联样式的类型。另外，每个对话文本区域可包括一个指示在新的一行中绘制文本串的断行字段，并且每个对话文本区域还可包括一个指示内联样式被复位到由所链接的区域样式规定的区域呈现属性的内联样式结束字段。
在本发明的另一方面，一种再现文本字幕流的方法包括再现至少一个记录在记录介质上的文本字幕流，每个文本字幕流包括定义一组区域样式的对话样式段和至少一个对话呈现段，每个对话呈现段包含至少一个对话文本区域，每个对话文本区域链接到这组区域样式中的一个，并包括至少一个由内联样式和文本串构成的对，内联样式被配置以改变由文本串所链接的区域样式规定的区域呈现属性中的一个。
在本发明的另一方面，一种用于再现文本字幕流的设备包括驱动器，它被配置成驱动光学再现装置再现记录在记录介质上的数据；以及控制器，它被配置成控制驱动器再现记录在记录介质上的至少一个文本字幕流，每个文本字幕流包括定义一组区域样式的对话样式段以及至少一个对话呈现段；每个对话呈现段包含至少一个对话文本区域，每个对话文本区域链接到这组区域样式中的一个，并包括至少一个由内联样式和文本串构成的对，内联样式被配置以改变由文本串所链接的区域样式规定的区域呈现属性中的一个。
在本发明的另一方面，一种用于记录文本字幕流的方法包括将至少一个文本字幕流记录在记录介质上，每个文本字幕流包括定义一组区域样式的对话样式段以及至少一个对话呈现段，每个对话呈现段包含至少一个对话文本区域，每个对话文本区域链接到这组区域样式中的一个，并包括至少一个由内联样式和文本串构成的对，内联样式被配置以改变由文本串所链接的区域样式规定的区域呈现属性中的一个。
在本发明的又一方面，一种用于记录文本字幕流的设备包括驱动器，它被配置成驱动光学记录装置将数据记录在记录介质上；以及控制器，它被配置成控制驱动器将至少一个文本字幕流记录在记录介质上，每个文本字幕流包括定义一组区域样式的对话样式段以及至少一个对话呈现段，每个对话呈现段包含至少一个对话文本区域，每个对话文本区域链接到这组区域样式中的一个，并包括至少一个由内联样式和文本串构成的对，内联样式被配置以改变由文本串所链接的区域样式规定的区域呈现属性中的一个。
应当理解，本发明前面的概括说明以及后面的详细说明均为示例性和说明性的，并且旨在为如要求保护的本发明提供进一步的解释。
附图简要说明包括附图是为提供对本发明进一步的理解，它们被收录并构成本申请的一部分，附图示出了本发明诸实施例，并且与说明书一起用来解释本发明的原理。在附图中

图1示出根据本发明的记录在光盘中的数据文件的结构；图2示出根据本发明的光盘的数据存储区；图3示出根据本发明的呈现在显示屏上的文本字幕和主图像；图4示出根据本发明的例示文本字幕流的再现控制的示意图；图5A到5C示出根据本发明的用于再现文本字幕流的再现控制信息的应用；图6示出根据本发明的文本字幕流文件的结构；图7示出根据本发明的将一组样式信息应用于文本字幕流文件的结构的情形；图8示出根据本发明的文本字幕流文件的句法；图9A到9D示出根据本发明的文本字幕流文件的句法的另一个例子；图10示出根据本发明的文本字幕流文件的句法的另一个例子；图11A和11B示出根据本发明第一实施例的文本字幕流文件当中的区域字幕的句法的一个例子；图12A和12B示出根据本发明第二实施例的文本字幕流文件当中的区域字幕的句法的一个例子；图13A和13B示出根据本发明第三实施例的文本字幕流文件当中的区域字幕的句法的一个例子；图14示出根据本发明的包含文本字幕流文件再现的光学记录和/或再现设备。
实施本发明的最优方式下面将详细参照本发明诸优选实施例，其范例在附图中示出。在任何可能的情况下，在所有附图中使用相同的标号来表示相同或相似的部分。此外，尽管本发明中所使用的术语是从公知公用的术语中选择的，然而在本发明的说明中提到的一些术语是申请人根据他或她的判断而选择的，其详细含义在本文说明的相关部分中描述。此外，要求不是单纯地根据实际的术语，而是根据每个术语蕴含的意义来理解本发明。
在此详细说明中，“记录介质”表示能记录数据的所有类型的介质，并广义地包括诸如光盘、磁带等所有类型的介质而不管其记录方法如何。在下文中，为便于本发明的说明，光盘、更具体地说是“蓝光盘(BD)”将作为这里提出的记录介质的一个例子给出。然而，显然本发明的精神或范围可等同地应用于其它类型的记录介质。
在详细说明中，“主数据”表示属于由作者记录在光盘中的标题(例如，电影标题)的音频/视频(AV)数据。一般来说，AV数据以MPEG2格式记录并通常被称为AV流或主AV流。另外，“补充数据”表示再现主数据所需的所有其它数据，其例子有文本字幕流、交互式图形流、呈现图形流以及辅助音频流(例如，可浏览幻灯片所使用)。这些补充数据流可用MPEG2格式或任何其它数据格式记录。它们可与AV流多路复用或作为独立数据文件存在于光盘内。
“字幕”表示与正在再现的视频(图像)数据对应的文字说明信息，并且它能以预定语言表示。例如，当用户在观看显示屏上的图像的同时选择观看以各种语言表示的多个字幕中的一个的选项时，则与所选字幕对应的文字说明信息被显示在显示屏的预定部分上。如果所显示的文字说明信息是文本数据(例如，字符)，则所选的字幕通常被称为“文本字幕”。根据本发明的一个方面，MPEG2格式的多个文本字幕流记录在光盘中，并且它们可作为多个独立的流文件存在。每个“文本字幕流文件”被创建和记录在光盘内。并且本发明的目的是提供一种用于再现所记录的文本字幕流文件的方法和设备。
图1示出根据本发明的、记录在蓝光盘(下文中称之为“BD”)中的数据文件的文件结构。参阅图1，至少一个BD目录(BDMV)被包含在根目录(root)下。每个BD目录包括一个索引文件(index.bdmv)和一个对象文件(MovieObject.bdmv)，它们用来与一个或多个用户进行交互。例如，索引文件可包含表示具有多个可选菜单和电影标题的索引表的数据。每个BD目录还包括四个文件目录，这些文件目录包括所要再现的音频/视频(AV)数据以及再现这些AV数据所需的各种数据。
包含在每个BD目录中的文件目录是流目录(STREAM)、剪辑信息目录(CLIPINF)、播放列表目录(PLAYLIST)以及辅助数据目录(AUX DATA)。首先，流目录(STREAM)包括具有一种特定数据格式的音频/视频(AV)流文件。例如，AV流文件可以是MPEG2传输分组的形式并且被命名为“*.m2ts”，如图1所示。流目录还可包括一个或多个文本字幕流文件，其中每个文本字幕流文件包括以特定语言表示的文本字幕的文本(例如，字符)数据以及这些文本数据的再现控制信息。文本字幕流文件作为独立流文件存在于流目录中并被命名为“*.m2ts”或“*.txtst”，如图1所示。包含在流目录中的AV流文件或文本字幕流文件常被称为剪辑流文件。
其次，剪辑信息目录(CLIPINF)包括分别与包含在流目录中的流文件(AV或文本字幕)对应的剪辑信息文件。每个剪辑信息文件包含相应流文件的属性和再现定时信息。例如，剪辑信息文件可包括映射信息，其中呈现时间戳(PTS)与源分组号(SPN)呈一一对应，并根据剪辑类型由入口点映射(EPM)所映射。使用映射信息，就可从由播放项或子播放项所提供的一组定时信息(进入时间(In-Time)和离开时间(Out-Time))确定流文件的具体位置，这将在后面进行更详细地讨论。在工业标准中，每个流文件及其对应的剪辑信息文件构成的文件对被指定为一个剪辑。例如，包含在CLIPINF中的01000.clpi包括STREAM中所含的01000.m2ts的属性和再现定时信息，并且01000.clpi与01000.m2ts构成一个剪辑。
再次参阅图1，播放列表目录(PLAYLIST)包括一个或多个播放列表文件(*.mpls)，其中每个播放列表文件包括指示至少一个主AV剪辑和该主AV剪辑的再现时间的至少一个播放项。更具体地说，播放项包含指示进入时间和离开时间的信息，进入时间和离开时间表示由播放项内的Clip_Information_File_Name(剪辑信息文件名)指定的主AV剪辑的再现开始时间和再现结束时间。因此，播放列表文件表示一个或多个主AV剪辑的基本再现控制信息。另外，播放列表文件还可包括子播放项，它表示文本字幕流文件的基本再现控制信息。当子播放项被包含在播放列表文件中以再现一个或多个文本字幕流文件时，子播放项与这一个或多个播放项同步，另一方面，当子播放项被用来再现可浏览幻灯片时，子播放项可不与这一个或多个播放项同步。根据本发明，子播放项的主要功能是控制一个或多个文本字幕流文件的再现。
最后，辅助数据目录(AUX DATA)可包括补充数据流文件，例如字体文件(如aaaaa.font或aaaaa.otf)、弹出式菜单文件(未图示)以及产生点击声的声音文件(例如Sound.bdmv)。之前提到的文本字幕流文件可包含在辅助数据目录而不是流目录中。
图2示出根据本发明的光盘的数据存储区域。参阅图2，该光盘包括占据盘卷最内部部分的文件系统信息区、占据盘卷最外部部分的流区、以及占据文件系统信息区与流区之间的数据库区。在文件系统信息区中存储有用于管理图1所示的全部数据文件的系统信息。接着，主数据和补充数据(即，AV流以及一个或多个文本字幕流)被存储在流区内。主数据可包括音频数据、视频数据以及图形数据。并且，补充数据(即文本字幕)被独立存储在流区中而不与主数据多路复用。图1所示的通用文件、播放列表文件和剪辑信息文件被存储在盘卷的数据库区中。如上所述，通用文件包括索引文件和对象文件，而播放列表文件和剪辑信息文件包括再现流区中所存储的AV流和文本字幕流所需的信息。使用存储在数据库区和/或流区中的信息，用户就能选择特定的回放模式，并以所选回放模式再现主AV流和文本字幕流。
下文中将对根据本发明的文本字幕流文件的结构进行详细说明。首先，将新定义用于再现文本字幕流的控制信息。接下来是对创建含有新定义的控制信息的文本流文件的方法、以及再现文本字幕流以再现所记录的流文件的方法和设备的详细说明。图3示出根据本发明的呈现在显示屏上的文本字幕和主图像。当主AV流和相应的文本字幕流被同步再现时，主图像和文本字幕被同时显示在显示屏上。
图4是示出根据本发明的主AV剪辑和文本字幕剪辑的再现控制的示意图。参阅图4，播放列表文件包括控制至少一个主AV剪辑的再现的至少一个播放项、以及控制多个文本字幕剪辑的再现的一个子播放项。如图4所示，可使对应于英语和韩语文本字幕的文本字幕剪辑1和文本字幕剪辑2的其中一个与主AV剪辑同步，以使主图像和相应文本字幕在特定呈现时间同时显示在显示屏上。为了将文本字幕显示在显示屏上，需要显示控制信息(例如位置和大小信息)以及呈现时间信息，在图5A到图5C中示出其示例。
图5A示出根据本发明的呈现在显示屏上的对话。对话表示在给定呈现时间内显示在显示屏上的整个文本字幕数据。一般来说，对话的呈现时间可用呈现时间戳(PTS)来表示。例如，图5A所示的对话的呈现开始于PTS(k)并结束于PTS(k+1)。因此，图5A所示的对话表示在PTS(k)与PTS(k1)之间显示在显示屏上的整个文本字幕数据单元。一个对话最多包括一个文本字幕中的100个字符。另外，图5B示出根据本发明的对话区域。区域表示在给定呈现时间内显示在显示屏上的文本字幕数据(对话)的细分部分。换句话说，对话包括至少一个区域，而每个区域可包括至少一行字幕文本。可根据赋予一个区域的区域样式(全局样式)来将表示该区域的全部字文本字幕数据显示在显示屏上。应当基于合乎需要的字幕数据解码率来确定包含在对话中的最大区域数目，这是因为区域数目越多一般导致解码比率越低。例如，一个对话的区域数目可限于两个以获得合理的高解码率。
图5C示出根据本发明的对话的区域的样式信息。样式信息表示定义显示包含在对话中的区域的至少一部分所需的属性的信息。样式信息的一些例子有位置，区域大小、背景色、文本对齐、文本流向信息及其它。可将样式信息分类为区域样式信息(全局样式信息)和内联样式信息(局部样式信息)。
区域样式信息定义作用于整个对话区域的区域样式(全局样式)。例如，区域样式信息可包含区域的区域位置、区域大小、字体颜色、背景色、文本流向、文本对齐、行间距、字体名称、字体样式以及字体大小中的至少一个。例如，两个不同的区域样式作用于区域1和区域2，如图5C所示。位置为1、大小为1且背景色为蓝色的区域样式被作用于区域1，而位置为2、大小为2且背景色为红色的不同区域样式被作用于区域2。
另一方面，内联样式信息定义作用于包含在区域中的文本串的特定部分的内联样式(局部样式)。例如，内联样式信息可包含字体类型、字体大小、字体样式和字体颜色中的至少一个。文本串的特定部分可以是区域中的整行文本或是文本行的特定部分。参阅图5C，特定内联样式被作用于包含在区域1中的文本部分“mountain”。换句话说，文本串特定部分的字体类型、字体大小、字体样式和字体颜色中至少有一个不同于区域1内的文本串的剩余部分。
因此，根据是否存在特定内联样式，上述文本数据被记录并被描述为“文本串”，并且将结合图11A到图13B对文本数据进行更详细的说明。图6示出根据本发明的文本字幕流文件(例如，图1所示的10001.m2ts)。该文本字幕流文件可由包含多个传输分组(TP)的MPEG2传输流构成，其中所有分组具有相同的分组标识符(例如，PID＝0x18xx)。当盘播放器接收到包括特定文本字幕流在内的许多输入流时，它使用它们的PID寻找属于该文本字幕流的所有传输分组。参阅图6，传输分组的每个子集形成一个分组基本流(PES)分组。图6所示的PES分组的其中一个与定义一组区域样式的对话样式段(DSS)对应。第二PES分组之后的所有其余的PES分组与对话呈现段(DPS)对应。
在图6所示的上述文本字幕流结构中，图5A到图5C所示的每个对话信息表示一个对话呈现段(DPS)。并且，包含在对话信息中的样式信息表示将在对话样式段(DSS)中定义的也被称为“region_style_id(区域样式id)”的多个区域样式组中的任何一个与内联样式链接的一组信息。标准化的、有限数目的区域样式组被记录在对话样式段(DSS)中。例如，记录最多为60组特定的样式信息，每个由一个region_style_id来描述。
图7示出记录在文本字幕流中的对话样式段(DSS)以及对话呈现段(DPS)的结构。因此，将参考图8在后面的过程中描述文本字幕流的详细句法。更具体地说，对话样式段(DSS)包括记录于其中的最多60组区域样式，每一组由一个region_style_id描述。包含不同区域样式信息的区域样式组以及用户可改变样式组被记录在每个region_style_id中。在此，将在图9B中对区域样式信息的详细内容进行说明，并在图9C中对用户可改变样式信息的详细内容进行说明。
此外，样式呈现段(DPS)包括文本数据和指示该文本数据的呈现时间的定时信息(即，PTS组)。对话呈现段(DPS)还包括链接到每个区域的样式信息和包含在上述对话样式中的特定区域样式信息的任何一个的信息。因此，DPS#1由单个区域构成，而作用于文本数据(文本数据#1)的区域样式被作用于对话呈现段(DPS)中所包括的region_style_id＝k。DPS#2由两个区域构成，而作用于第一区域的文本数据(文本数据#1)的区域样式被应用于对话呈现段(DPS)中所包括的region_style_id＝k。并且，作用于第二区域的文本数据(文本数据#2)的区域样式被应用于对话呈现段(DPS)中所包括的region_style_id＝n。类似地，DPS#3和DPS#4将region_style_id＝n和region_style_id＝m分别应用于对话呈现段(DPS)内的每个相应样式信息。
因此，当一个对话内存在两个区域(诸如在DPS#2中)时，作用于各区域的每个region_style_id应当被给予不同的值。更具体地说，如上所述，将region_style_id＝k应用于DPS#2内的第一区域，而将region_style_id＝n应用于DPS#2内的第二区域，从而分别应用不同的区域样式组。当将相同的region_style_id应用于每个区域时，两个区域重叠在屏幕上，这将造成显示文本字幕的困难。同时，由region_style_id链接的样式信息(即全局样式信息)被相同地应用于相应区域内的所有文本数据。然而，当要修改文本数据内的特定文本串的样式信息时，作为仅作用于相应文本串的一组局部样式信息的内联样式信息被新定义并被应用。
下面将参照图8到图10B对上述对话样式段(DSS)和对话呈现段(DPS)的句法结构进行详细的说明。图8示出根据本发明的文本字幕流(Text_subtitle_stream())的句法。参阅图8，Text_subtitle_stream()包括dialog_style_segment()句法和dialog_presentation_segment()句法。更具体地说，dialog_style_segment()句法与定义样式信息组的一个对话样式段(DSS)对应，而dialog_presentation_segment()句法与其中记录有实际对话信息的多个对话呈现段(DPS)对应。
图9A到9C示出表示语法样式段(DSS)的dialog_style_segment()的详细结构。更具体地说，图9A示出dialog_style_segment()的总体结构，其中定义了dialog_style set()，它定义作用于该对话中的不同样式信息组。图9B示出根据本发明的dialog_style set()，该句法被定义在dialog_style_segment()中。除诸region_style外，dialog_style_set()还包括Player_style_flag、user_changeable_styleset()和palette()。Player_style_flag指示由播放器在样式信息中作出的改变是否被授权。并且，user_changeable_style set()定义由播放器在样式信息中作出的改变的范围，而palette()指示颜色信息。
如上所述，区域样式信息(region_styles)表示为每个区域定义的全局样式信息。给每个区域赋region_style_id，并且定义与特定的region_style_id对应的样式信息组。因此，当通过将作用于相应对话的region_style_id记录在对话呈现段(DPS)内来再现对话时，应用由region_style set()中的相同region_style_id定义的样式信息组的值，从而再现对话。因此，现在将对提供给每个region_style_id的样式信息组中所包括的各样式信息进行描述。
本文中，提供region_horizontal_position(区域横向位置)、region_vertical_position(区域纵向位置)、region_width(区域宽度)和region_height(区域高度)作为用来定义屏幕内相应区域的位置和大小的信息。并且，还提供用来决定相应区域的背景色的region_bg_color_index(区域背景色索引)信息。此外，将提供text_horizontal_position(文本横向位置)和text_vertical_position(文本纵向位置)作为定义文本在相应区域内的原始(或起始)位置的信息。并且还提供定义文本方向(例如左→右、右→左、上→下)的text_flow(文本流向)以及定义文本对齐方向(例如，左、中、右)的text_alignment(文本对齐)。更具体地说，当特定对话中包含多个区域时，包含在相应对话中的每个区域的text_flow被定义成具有相同的text_flow值，从而防止用户观看到混乱的图像。
此外，提供指定区域内每行之间的间距的line_space(行间距)作为样式信息组中所包括的个体样式信息。并且提供font_type(字体类型)、font_size(字体大小)以及font_color_index(字体颜色索引)作为实际字体信息所使用的字体信息。同时，记录在dialog_style set()中的dialog_style_fag(对话样式标志)指示作者是否可应用提供给播放器的样式信息。例如，当Player_style_flag＝1b时，，播放器被授权通过应用播放器本身提供的样式信息，以及记录在盘中的dialog_style set()中所定义的样式信息来再现文本字幕流。另一方面，当Player_style_flag＝0b时，仅授权使用记录在盘片内的dialog_style set()中所定义的样式信息。
图9C示出根据本发明的user_changeable_style set()，它被定义在dialog_style set()中。user_changeable_style set()预定义可由用户改变的样式信息的类型以及改变的范围，并且user_changeable_style set()被用来方便地改变文本字幕数据的样式信息。然而，如图9B所示，当允许用户改变所有样式信息时，用户可能会更困惑。因此，在本发明中，仅可改变font_size、region_horizontal_position和region_vertical_position的样式信息。因此，可根据font_size改变的文本位置和行间距的变化也在user_changeable_style set()中定义。更具体地说，为每个region_style_id定义user_changeable_style set()。例如，在user_changeable_style set()中最多可定义特定region_style_id＝k内的25个user_style_id。
并且，每个user_style_id包括region_horizontal_position_direction(区域横向位置方向)和region_vertical_position_direction(区域纵向位置方向)信息，它们指定可变region_horizontal_position和region_vertical_position每一个的改变后的位置的方向。每个user_style_id还包括用于指定每个方向上的单个位置移动单位为像素单位的region_horizontal_position_delta(区域横向位置增量)和region_vertical_position_delta(区域纵向位置增量)信息。更具体地说，例如当region_horizontal_position_direction＝0时，区域位置向右移动。而当region_horizontal_position_direction＝1时，区域位置向左移动。同样，当region_vertical_position_direction＝0时，区域位置向下移动。最后，当region_vertical_position_direction＝1时，区域位置向上移动。
此外，每个user_style_id包括指定每个可改变的font_size的改变方向的font_size_inc_dec(字体大小增减)信息；以及指定每个方向上的单个位置移动单位为像素单位的font_size_delta(像素大小增量)信息。更具体地说，例如font_size_inc_dec＝0表示font_size的增大方向，而font_size_inc_dec＝1表示font_size的减小方向。此外，根据font_size的减小或增大而改变的“文本位置”和“行间距”的减小或增大可用与font_size、region_horizontal_position以及region_vertical_position相同的方式来定义。
因此，现将描述根据本发明的user_changeable_style set()的特性如下。在对话样式段(DSS)中所包括的所有region_style()中定义相同数目的user_control_style()。因此，可应用于所有对话呈现段(DPS)的user_control_style的数目也是相同的。此外，每个user_control_style()由不同的user_style_id表示，并且当用户选择一随机的user_id_style时，对所有region_style()应用相同顺序的user_control_style()。此外，所有可改变样式的组合被定义在单个user_control_style()中。更具体地说，region_position和font_size被同时定义，而不是被分开定义。最后，方向(*_direction)和增减指示(*_inc_dec)每一个都被独立地记录，而不管各位置移动单位(*_delta)为何。更具体地说，通过仅定义位置移动单位(*_delta)，就可通过将region_style()中所定义的值加上位置移动单位(*_delta)而获得实际改变的样式信息(或样式值)的最终值。
图9D示出根据本发明的调色板信息(palette())，它被定义在dialog_styleset()中。palette()提供记录在对话内的文本字幕数据的颜色改变信息。在本文中，palette()包括多个palette_entry(调色板条目)，其中每个palette_entry由一palette_entry_id(调色板条目id)描述。并且给每个palette_entry提供特定的亮度值(Y_value)、特定的颜色值(Cr_value，Cb_value)和特定的T_value，T_value表示文本数据的透明度。
因此，亮度值(Y_value)在16到235的范围内，颜色值(Cr_value，Cb_value)在16到240的范围内，而指定透明度的T_value在0到255的范围内。更具体地说，T_value＝0表示完全透明，而T_value＝255表示完全不透明。然而，较佳的是将T_value设置成具有默认值‘0’。因此，盘制造商(或作者)将每个palette_entry_id的调色板信息记录在对话样式段(DSS)内，其中调色板信息在整个文本字幕流中被使用。由此，可从上述样式信息指定和使用特定palette_entry_id。
图10到图13B示出表示根据本发明的对话呈现段(DPS)的dialog_presentation_segment()的详细结构。图10示出dialog_presentation_segment()的总体结构，其中定义了dialog_start_PTS(对话开始PTS)和dialog_end_PTS(对话结束PTS)。dialog_start_PTS和dialog_end_PTS指定相应对话的呈现时间。接着，dialog_presentation_segment()包括指示相应对话中的信息改变的palette_update_flag(调色板更新标志)。当palette_update_flag＝1b时，则发生颜色改变(或更新)。并且，定义新改变的颜色的palette()信息被单独记录。
接着，定义区域信息的dialog_region()被记录在dialog_presentation_segment()中。在本发明中，在一个对话中提供最多两个区域，并因此给每个区域提供dialog_region()信息。dialog_region()包括region_style_id(区域样式id)信息和continuous_present_flag(连续呈现标志)信息。region_style_id信息指定任何一种区域样式，如图9B所示，而continuous_present_flag信息标识是否执行与前一对话区域的无缝再现。此外，文本数据和region_subtitle()信息也被包含在dialog_region()中。文本数据被包含在实际对应区域中，而region_subtitle()信息定义局部样式信息。
更具体地说，region_subtitle()由一个文本串和作用于该文本串的内联样式信息构成，该文本串与该内联样式信息成对(或成组)。并且，现在将参考图11A到图13B对根据本发明第一、第二和第三实施例的记录region_subtitle()的方法进行详细说明。
图11A和图11B示出根据本发明第一实施例的记录region_subtitle()的一个例子，其中region_subtitle()包括一个文本串和应用于该文本串并用于标识每个内联样式的一组标识信息(类型)。并且，一组1字节的信息(即，escape_code(转义码))被记录在由标识信息(类型)标识的信息之间。更具体地说，当将文本串和内联样式记录在region_subtitle()内时，首先提供该文本串和用于标识每个内联样式的标识信息(类型)。在此，由类型信息标识的详细内容与图11B的内容相同。
换句话说，当region1_subtitle()内的类型为type＝0x01时，该类型表示文本串的开头，并且因此字符代码被记录在text_string()内的特定字段(即，char_data_byte(字符数据字节))中。另外，type＝0x02、type＝0x03、type＝0x04和type＝0x05每一个里包括特定的一组内联样式信息。例如，type＝0x02表示字体集的改变，并因此由相应的剪辑信息指定的字体ID值被记录在特定字段(即inline_style_value())中，而type＝0x03表示字体样式的改变，并因此相应的字体样式值被记录在特定字段(即，inline_style_value())中。并且，type＝0x04表示字体大小的改变，而相应的字体大小值被记录在特定字段(即inline_style_value())中，而type＝0x05表示字体颜色的改变，并因此由相应的调色板所指定的索引值被记录在特定字段(即inline_style_value)中。
最后，type＝0x0A在本发明中表示断行。在本文中，断行是指通过在文本字幕流解码期间换一行、而不是将补充数据记录在相应的类型信息中来执行再现。并且，type＝0x0B表示内联样式的完成(或结束)(即内联样式的结束)。end-of-inline-style(内联样式结束)字段指示内联样式被复位到由所链接的区域样式规定的区域呈现属性。此外，在记录由标识信息(或类型信息)标识的信息前，插入一个escape_code(转义码)，它是一组1字节的信息。紧居于标识信息前的转义码将表示内联样式的数据与转义码之前的数据区别开来。因此，现在将对根据本发明第一实施例的应用于特定文本串的内联样式的例子进行详细说明。
首先，按escape_code→type(0x02、0x03、0x04、0x05中的一个)+inline_style_data_byte→escape_code→type(0x01)+char_data_byte+escape_code→type(0x0B)的顺序将一种内联样式应用于特定文本串。当不存在应用了内联样式的文本串时，根据一组区域样式信息将相同的样式应用于该区域内的所有文本数据。此外，可应用内联样式直到检测到指示内联样式结束的信息(type(0x0B))。或者，按escape_code→type(0x02、0x03、0x04和0x05中的一个)+inline_style_data_byte→escape_code→type(0x02、0x03、0x04和0x05中的一个)+inline_style_data_byte→escape_code→type(0x01)+char_data_byte+escape_code→type(0x0B)的顺序将至少两个内联样式应用于特定文本串。当将至少两个内联样式应用于一个文本串时，内联样式被连续定义，并且随后记录应用这些内联样式的文本串。因此，文本串不是被记录在内联样式之间。此外，可应用多个内联样式直到检测到指示行内样式结束的信息(type(0x0B))。
图12A和12B示出根据本发明第二实施例的记录region_subtitle()的一个例子，其中region_subtitle()包括一个文本串和应用于该文本串并用于标识每个内联样式的一组标识信息(string_flag(串标志))。内联样式由一组内联样式数目信息(number_of_inline_style)和一组内联样式类型信息(inline_style_type)控制。更具体地说，在本发明的第一实施例中，文本串、各内联样式、断行以及内联样式的结束均由一组标识信息(类型)所标识。然而，在本发明的第二实施例中，首先使用一组标识信息(string_flag)来标识文本串和内联样式。此后，使用另一组标识信息(inline_style_type)按每种类型来标识内联样式。
换句话说，当根据本发明第二实施例将文本串和内联样式记录在region_subtitle()内时，首先提供用于标识文本串和内联样式的一组标识信息(string_flag)。在此，string_flag＝0b表示内联样式，而string_flag＝1b表示文本串。因此，当string_flag＝1b时，将文本串作为字符代码记录在text_string()的特定字段(即，char_data_byte)中。另外，当string_flag＝0b时，记录内联样式，然而，这些内联样式由至少一个inline_style_type构成。
更具体地说，参阅图12B，inline_style_type＝0x01表示字体集的改变，并因此由相应的剪辑信息指定的字体ID值被记录在特定字段(即，inline_style_value())中，而inline_style_type＝0x02表示字体样式的改变，因此相应字体样式值被记录在特定字段(即，inline_style_value())中。并且，inline_style_type＝0x03表示字体大小的改变，从而将相应的字体大小值记录在特定字段(即，inline_style_value())中，而inline_style_type＝0x04表示字体颜色的改变，并因此由相应调色板指定的索引值被记录在特定字段(即，inline_style_value())中。最后，inline_style_type＝0x0A在本发明中表示断行，而inline_style_type＝0x0B表示内联样式的完成(或结束)(即，内联样式的结束)。
此外，当string_flag＝0b时，则记录内联样式，然而还记录一组number_of_inline_styles信息。在此，number_of_inline_styles指示相应inline_style内所含的inline_style的数目。如上所述，本发明中存在最多6个inline_style_type，由此，number_of_inline_styles的值在1到6的范围内。然而，除上面提到的inline_style_type外，inline_style_type还可定义其它inline_style_type。并且，在这种情况下，必须改变number_of_inline_styles的最大值。因此，包含在inline_style内的至少一个inline_style_type作为一个单位被连续地记录。然后，当相应inline_style的记录完成时，一组1字节的信息(即，escape_code)被记录在由标识信息(string_flag)标识的信息之间。
图13A和13B示出根据本发明第三实施例的记录region_subtitle()的一个例子，其中region_subtitle()包括一个文本串应用于该文本串并标识每个内联样式的一组标识信息(data_type)。内联样式由总长值(即，inline_style_length)控制，一组1字节的信息(即escape_code)被记录在由标识信息(data_type)标识的信息之间。
当根据本发明第三实施例将文本串和内联样式记录在region_subtitle()内时，首先提供用来标识文本串和内联样式的一组标识信息(data_type)。在此，data_type＝0b表示内联样式，而data_type＝1b表示文本串。因此，当data_type＝1b时，则将文本串作为字符代码记录在text_string()内的特定字段(即，char_data_byte)中。此外，当data_type＝0b时，记录内联样式，然而，这些内联样式由至少一个inline_style_type构成。因此，根据本发明第三实施例的每个inline_style_type的定义与本发明第二实施例中所描述的定义(如图12B所示)相同。
另外，当data_type＝0b时，记录内联样式，然而还记录一组inline_style_length。在此，inline_style_length指示相应内联样式的总长。并且，每个相应的大小(长度)包括inline_style_type和记录每种类型的信息的inline_style_data_byte。因此，包含在inline_style内的至少一个inline_style_type作为一个单位被连续地记录。然后，当相应inline_style的记录完成后，一组1字节的信息(即escape_code)被记录在由标识信息(data_type)标识的信息之间。
图14示出根据本发明的包括文本字幕数据的再现的光学记录和/或再现设备10的详细视图。光学记录和/或再现设备10基本包括拾取单元11，用来再现记录在光盘上的主数据、文本字幕流和相应的再现控制信息；伺服14，用来控制拾取单元11的操作；信号处理器13，用来将从拾取单元11接收的再现信号恢复成所需的信号值，或将待记录的信号调制成光盘可记录信号并发送已调制的信号；以及微机16，用来控制上述操作。
另外，AV解码器和文本字幕(文本ST)解码器17根据控制器12的控制来执行输出数据的最终解码。并且，为了执行将信号记录在光盘上的功能，AV编码器18根据控制器12的控制将输入信号转换成特定格式(例如MPEG-2传输流)的信号，随后将经转换的信号提供给信号处理器13。因此，为便于说明，AV解码器和文本字幕(文本ST)解码器17在本发明中作为一个解码器包括。然而，很明显的是只有文本字幕(文本ST)解码器可作为本发明的要素被独立包括。
根据本发明，缓冲器18用来事先预加载和存储文本字幕流以解码文本字幕流。控制器12控制光学记录和/或再现设备的操作。并且，当用户输入请求显示特定语言的文本字幕的命令时，相应文本字幕流被预加载并存储在缓冲器18中。随后，在被预加载并存入缓冲器18的文本字幕流数据当中，控制器12参照上述对话信息、区域信息、样式信息等并控制文本字幕解码器17以使实际文本数据以特定大小显示在屏幕上的特定位置处。更具体地说，文本字幕解码器17将记录在预加载到缓冲器18内的文本字幕流中的对话呈现段(DPS)解码。然而，文本字幕流是通过使用上述对话呈现段(DPS)内的特定区域样式信息(由记录在对话呈现段(DPS)中的region_style_id指定)，并且还通过使用应用于记录在对话呈现段(DPS)内的特定文本串的诸inline_style来再现的。
更具体地说，在图11A到图13B所示的上述诸方法当中，当记录了一组inline_style时，可将一组region_style而不是inline_style应用于相应文本串。然而，当再现其中未记录任何inline_style的文本串时，再次应该组region_style以再现文本串。
如上所述，用于再现和记录文本字幕流的该记录介质以及方法和设备具有下列优点。可将文本字幕流文件作为标准化信息记录在光盘内，从而允许所记录的文本字幕流文件的高效再现。
工业实用性对本领域内技术人员而言，显然可对本发明作出各种修改和变更，而不会偏离本发明的精神或范围。因此，本发明旨在覆盖落在所附权利要求及其等效技术方案范围内的本发明的修改和变更方案。
权利要求
1.一种用于再现文本字幕流的记录介质，所述记录介质包括用于存储至少一个文本字幕流的数据区，每个所述文本字幕流包括定义一组区域样式的一个对话样式段以及至少一个对话呈现段，每个所述对话呈现段包含至少一个对话文本区域，每个所述对话文本区域链接到所述一组区域样式中的一个并包括至少一个由一内联样式和一文本串构成的对，所述内联样式被配置以改变由所述文本串所链接的区域样式规定的区域呈现属性中的一个。
2.如权利要求1所述的记录介质，其特征在于，由所链接的区域样式规定的所述区域呈现属性包括字体相关属性。
3.如权利要求2所述的记录介质，其特征在于，所述字体相关属性包括字体标识、字体样式、字体大小和字体颜色。
4.如权利要求1所述的记录介质，其特征在于，所述每个对话文本区域还包括一个数据类型字段，所述数据类型字段指示紧随于所述数据类型字段之后的数据表示所述文本串。
5.如权利要求4所述的记录介质，其特征在于，所述每个对话文本区域还包括紧居于所述数据类型字段之前的一个转义码，以将表示所述文本串的数据与居于所述转义码之前的数据区别开来。
6.如权利要求1所述的记录介质，其特征在于，所述每个对话文本区域还包括一个数据类型字段，所述数据类型字段指示紧随于所述数据类型字段之后的数据表示所述内联样式。
7.如权利要求6所述的记录介质，其特征在于，所述每个对话文本区域还包括紧居于所述数据类型字段之前的一个转义码，以将表示所述内联样式的数据与居于所述转义码之前的数据区别开来。
8.如权利要求6所述的记录介质，其特征在于，所述数据类型字段还指示所述内联样式的类型。
9.如权利要求1所述的记录介质，其特征在于，所述每个对话文本区域还包括第一数据类型字段和第二数据类型字段，所述第一数据类型字段指示紧随于所述第一数据类型字段之后的第一数据表示所述内联样式，所述第二数据类型字段指示紧随于所述第二数据类型字段之后的第二数据表示所述文本串。
10.如权利要求9所述的记录介质，其特征在于，所述每个对话文本区域还包括第一转义码和第二转义码，所述第一转义码紧居于所述第一数据类型字段之前，以将所述第一数据与居于所述转义码之前的数据区分开来，所述第二转义码紧居于所述第二数据类型字段之前，以将所述第二数据与居于所述转义码之前的数据区分开来。
11.如权利要求9所述的记录介质，其特征在于，所述第一数据类型字段还指示所述内联样式的类型。
12.如权利要求1所述的记录介质，其特征在于，所述每个对话文本区域还包括一个串标志和一个内联样式类型字段，所述串标志指示紧随于所述串标记之后的数据是否表示所述文本串，所述内联样式类型字段指示所述内联样式的类型。
13.如权利要求1所述的记录介质，其特征在于，所述每个对话文本区域还包括一个指示在新的一行绘制所述文本串的断行字段。
14.如权利要求1所述的记录介质，其特征在于，所述每个对话文本区域还包括一个内联样式结束字段，用于指示所述内联样式被复位到由所链接的区域样式规定的区域呈现属性。
15.一种用于再现文本字幕流的记录介质，所述记录介质包括用于存储至少一个文本字幕流的数据区，每个所述文本字幕流包括定义一组区域样式的一个对话样式段以及至少一个对话呈现段，每个所述对话呈现段包含至少一个对话文本区域，每个所述对话文本区域链接到所述一组区域样式中的一个，并包括至少一个由至少两个内联样式和一文本串构成的对，每个所述内联样式被配置以改变由所述文本串所链接的区域样式规定的区域呈现属性中的一个。
16.如权利要求15所述的记录介质，其特征在于，表示所述文本串的数据跟随在表示所述至少两个内联样式的数据之后。
17.一种用于再现文本字幕流的记录介质，所述记录介质包括用于存储至少一个文本字幕流的数据区，每个所述文本字幕流包括一组区域样式和要在预定呈现时隙期间呈现的至少一个对话文本区域，每个所述对话文本区域链接到所述一组区域样式中的一个，并包括至少一个由一内联样式和一文本串构成的对，所述内联样式被配置以改变由所述文本串所链接的区域样式规定的区域呈现属性中的一个。
18.一种再现文本字幕流的方法，所述方法包括再现记录在记录介质上的至少一个文本字幕流，每个所述文本字幕流包括定义一组区域样式的对话样式段以及至少一个对话呈现段，每个所述对话呈现段包含至少一个对话文本区域，每个所述对话文本区域链接到所述一组区域样式中的一个，并包括至少一个由一内联样式和一文本串构成的对，所述内联样式被配置以改变由所述文本串所链接的区域样式规定的区域呈现属性中的一个。
19.一种用于再现文本字幕流的设备，所述设备包括驱动器，被配置成驱动光学再现装置再现记录在记录介质上的数据；以及控制器，被配置成控制所述驱动器再现记录在所述记录介质上的至少一个文本字幕流，每个所述文本字幕流包括定义一组区域样式的对话样式段以及至少一个对话呈现段，每个所述对话呈现段包含至少一个对话文本区域，每个所述对话文本区域链接到所述一组区域样式中的一个，并包括至少一个由一内联样式和一文本串构成的对，所述内联样式被配置以改变由所述文本串所链接的区域样式规定的区域呈现属性中的一个。
20.一种记录文本字幕流的方法，所述方法包括将至少一个文本字幕流记录在记录介质上，每个所述文本字幕流包括定义一组区域样式的对话样式段以及至少一个对话呈现段，每个所述对话呈现段包含至少一个对话文本区域，每个所述对话文本区域链接到所述一组区域样式中的一个，并包括至少一个由一内联样式和一文本串构成的对，所述内联样式被配置以改变由所述文本串所链接的区域样式规定的区域呈现属性中的一个。
21.一种用于记录文本字幕流的设备，所述设备包括驱动器，被配置成驱动光学再现装置将数据记录在记录介质上；以及控制器，被配置成控制所述驱动器将至少一个文本字幕流记录在所述记录介质上，每个所述文本字幕流包括定义一组区域样式的对话样式段以及至少一个对话呈现段；每个所述对话呈现段包含至少一个对话文本区域，每个所述对话文本区域链接到所述一组区域样式中的一个，并包括至少一个由一内联样式和一文本串构成的对，所述内联样式被配置以改变由所述文本串所链接的区域样式规定的区域呈现属性中的一个。
全文摘要
公开了一种用于再现和记录文本字幕流的记录介质以及方法和设备。每个文本字幕流包括定义一组区域样式的一个对话样式段和至少一个对话呈现段，每个对话呈现段包含一个或多个对话文本区域，每个对话文本区域链接到对话样式段中定义的这组区域样式中的一个，并且包括至少一个由内联样式和文本串构成的对。内联样式被配置以改变由文本串所链接的区域样式规定的区域呈现属性中的一个。
文档编号G11B27/10GK1934625SQ200580009431
公开日2007年3月21日申请日期2005年3月3日优先权日2004年3月26日
发明者徐康洙, 金柄辰, 刘齐镛, 鲁时祯申请人:Lg电子株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：徐康洙;金柄辰;刘齐镛;鲁时祯
技术所有人：ＬＧ电子株式会社
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、毕老师：机构动力学与控制
2、袁老师：1.计算机视觉 2.无线网络及物联网
3、王老师：1.计算机网络安全 2.计算机仿真技术
4、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
5、张老师：1.机械设计的应力分析、强度校核的计算机仿真 2.生物反应器研制 3.生物力学
如您是高校老师，可以点此联系我们加入专家库。