用于再现文本字幕流的记录介质、方法和装置的制作方法

文档序号：7634408阅读：188来源：国知局

专利名称：用于再现文本字幕流的记录介质、方法和装置的制作方法
技术领域：
本发明涉及记录介质，尤其涉及用于再现文本字幕流的记录介质、方法和装置。尽管本发明适用于广泛范围的应用，但它特别适用于将文本字幕流文件记录在记录介质内并有效地再现所记录的文本字幕流。
背景技术：
光盘被广泛地用作用于记录大量数据的光学记录介质。目前，在广泛范围的光盘中，诸如蓝光盘(下文称为“BD”)之类的新的高密度光学记录介质(下文称为“HD-DVD”)正在开发中，用于写入和存储高清晰度的视频和音频数据。当前，众所周知作为下一代技术的蓝光盘(BD)的全球标准技术规范正在被建立成为能具有大大超越传统DVD以及许多其它数字装置的数据的下一代光学记录方案。
因此，还在开发应用蓝光盘(BD)标准的光学再现装置。然而，因为蓝光盘(BD)标准仍有待完成，所以在开发完备的光学再现装置的过程中存在许多困难。特别是为了有效地从蓝光盘(BD)再现数据，不仅应提供主AV数据以及方便用户所需的各种数据，诸如作为与主AV数据相关的补充数据的字幕信息，而且应系统化和提供管理信息，用于再现记录在光盘中的主数据和字幕数据。
然而，在现有的蓝光盘(BD)标准中，因为补充数据特别是字幕流文件的标准尚未完全统一，所以在基于蓝光盘(BD)的光学再现装置的全面研发中存在许多限制。并且，在向用户提供诸如字幕之类的补充数据的过程中这些限制会引起一些问题。

发明内容
因此，本发明涉及一种用于再现文本字幕流的记录介质、方法和装置，它基本上避免了由于相关技术的限制和缺点而引起的一个或多个问题。
本发明的一个目的是提供能将文本字幕流文件记录在诸如蓝光盘(BD)的记录介质中的用于再现文本字幕流的方法和装置。
本发明的其它优点、目的和特征的一部分将在下面的说明书中阐述，一部分将在本领域普通技术人员阅读以下说明后变得显而易见，或者可以从本发明的实践中认识到。本发明的目的和其它优点可以通过在书面说明书及其权利要求、以及附图中特别指出的结构来实现和获得。
为了实现这些目的和其它优点，并根据在本文中体现并广泛说明的本发明用途，用于再现文本字幕流的记录介质包括存储至少一个文本字幕流的数据区，各文本字幕流包括定义一组区域样式的对话样式片段以及多个对话呈现片段，各对话呈现片段包含至少一个对话文本区域，各对话文本区域链接到这组区域样式中的一个选定样式，其中当前对话呈现片段内所包括的第一对话文本区域包含连续呈现标志，该连续呈现标志指示先前对话呈现片段内所包括的第一对话文本区域与第二对话文本区域之间需要连续呈现。
在本发明的另一方面中，用于再现文本字幕流的记录介质包括存储至少一个文本字幕流的数据区，各文本字幕流包括定义一组区域样式的对话样式片段以及多个对话呈现片段，该多个对话呈现片段的至少之一包含第一和第二对话文本区域，它们分别链接到从这组区域样式中选择出来的第一和第二区域样式，其中第一和第二区域样式定义同一文本流。
在本发明的又一方面中，用于再现文本字幕流的方法包括读取记录在记录介质上的文本字幕流中所包括的对话样式片段，该对话样式片段定义一组区域样式，该文本字幕流还包括第一和第二对话样式片段；在图形平面中呈现第一对话呈现片段中所包括的第一对话文本区域，该第一对话文本区域链接到这组区域样式中的一个样式；读取第二对话呈现片段中所包括的连续呈现标志，该第二对话呈现片段包括链接到这组区域样式中的一个样式的第二对话文本区域；并且如果连续呈现片段指示在第一和第二对话文本区域之间需要连续呈现，则通过保留第一对话文本区域在图形平面中的呈现来呈现第二对话文本区域。
在本发明的再一方面中，用于再现文本字幕流的装置包括被配置成预载文本字幕流的缓冲器，该预载文本字幕流包括定义一组区域样式的对话样式片段、以及第一和第二对话呈现片段；以及文本字幕解码器，它被配置成在图形平面中呈现第一对话呈现片段中所包括的第一对话文本区域，并读取包括第二对话文本区域的第二对话呈现片段中所包括的连续呈现标志，其中如果连续呈现片段指示在第一和第二对话文本区域之间需要连续呈现，则文本字幕解码器通过保留第一对话文本区域在图形平面中的呈现来呈现第二对话文本区域。
应当理解本发明的在前概述及下列详述是示例性和解释性的，且旨在提供对所要求保护的本发明的进一步解释。

包括在内提供对本发明的进一步理解、并结合其中构成本申请的一部分的附图示出本发明的各个实施例，并与说明书一起用于解释本发明的原理。在附图中图1示出根据本发明的记录在光盘中的数据文件的结构；图2示出根据本发明的光盘的数据存储区；图3示出根据本发明的呈现在显示屏上的文本字幕和主图像；图4示出根据本发明的文本字幕流的再现控制的示意图；图5A-5C示出根据本发明的用于再现文本字幕流的再现控制信息的应用；图6示出根据本发明的文本字幕流文件的结构；图7示出根据本发明用于将再现控制信息写入文本字幕流内的一方法示例；图8A-8C示出根据本发明文本字幕流的间断呈现和连续呈现的示例；图9示出根据本发明的文本字幕流文件的句法；图10A-10C示出根据本发明的表示对话样式片段(DSS)的dialog_style_segment()的详细结构；图11A和11B示出根据本发明的表示对话呈现片段(DPS)的dialog_presentation_segment()的详细结构；图12A和12B示出根据本发明的包括文本字幕流文件再现的光学记录和/或再现装置。
具体实施例方式
现在将详细参考本发明的优选实施例，其示例在附图中示出。在可能的情况下，在全部附图中用相同的标号来指示相同或相似的部件。另外，虽然本发明中使用的术语选自众所周知和已使用的术语，但本发明的说明书中提到的某些术语是由申请人根据他或她的判断选择的，其详细含义在本说明书的相关部分中描述。此外，本发明需要不仅仅通过所使用的实际术语而通过各术语内蕴含的意义来理解。
在本详细说明书中，“记录介质”指能记录数据的所有类型的介质，并且广义地包括不论采取何种记录方法的所有类型的介质，例如光盘、磁带等。在下文中，为了简化本发明的说明，光盘特别是“蓝光盘(BD)”将作为本文提出的记录介质的一个示例给出。然而，可将本发明的精神和范围同等地应用于其它类型的记录介质是显而易见的。
在本详细说明中，“主数据”表示属于由作者记录在光盘中的标题(例如电影标题)的音频/视频(AV)数据。通常，AV数据以MPEG2格式记录并常常被称为AV流或主AV流。另外，“补充数据”表示再现主数据所需的所有其它数据，其示例是文本字幕流、交互式图形流、呈现图形流和补充音频流(例如，用于可浏览幻灯片)。这些补充数据流可以用MPEG2格式或任何其它数据格式记录。它们能与AV流多路复用或能在光盘中作为独立数据文件存在。
“字幕”表示对应于所再现的视频(图像)数据的字幕说明信息，并且它可用预定语言表示。例如，当用户在观看显示屏上的图像时选择观看以各种语言表示的多个字幕之一的选项时，对应于所选择字幕的字幕说明信息被显示在显示屏的预定部分上。如果所显示的字幕说明信息是文本数据(例如字符)，则所选择的字幕常被称为“文本字幕”。在本发明中，“MPEG-2格式”指根据建立为ISO/IEC 13818标准的国际标准的编码和解码方法。根据本发明的一个方面，多个MPEG2格式的文本字幕流可记录在一张光盘中，并且它们可作为多个独立的流文件存在。各个“文本字幕流文件”被创建并记录在一张光盘内。并且，本发明的目的在于提供一种用于再现所记录的文本字幕流文件的方法和装置。
图1示出根据本发明的记录在蓝光盘(下文称为“BD”)中的数据文件的文件结构。参见图1，根目录(root)中包括至少一个BD目录(BDMV)。各BD目录包括用于与一个或多个用户交互的索引文件(index.bdmv)和对象文件(MovieObject.bdmv)。例如，索引文件可包含表示具有多个可选择菜单和电影标题的索引表的数据。各BD目录还包括四个文件目录，它们包括所要再现的音频/视频(AV)数据和再现这些AV数据所需的各种数据。
各BD目录中所包括的文件目录是流目录(STREAM)、剪辑信息目录(CLIPINF)、播放列表目录(PLAYLIST)、和辅助数据目录(AUX DATA)。首先，流目录(STREAM)包括具有特定数据格式的音频/视频(AV)流文件。例如，AV流文件可以是MPEG2传输分组的形式，并命名为“*.m2ts”，如图1所示。该流目录还可包括一个或多个文本字幕流文件，其中各文本字幕流文件包括用特定语言表示的文本字幕的文本(例如字符)数据和该文本数据的再现控制信息。文本字幕流文件作为独立的流文件存在于流目录内，并可命名为“*.m2ts”或“*.txtst”，如图1所示。流目录中所包括的AV流文件或文本字幕流文件常称为剪辑流文件。
接着，剪辑信息目录(CLIPINF)包括分别对应于流目录中所包括的诸流文件(AV或文本字幕)的剪辑信息文件。各剪辑信息文件包含相应流文件的属性或再现定时信息。例如，剪辑信息文件可包括映射信息，在其中呈现时戳(PTS)和源分组号(SPN)是一一对应关系并根据剪辑类型通过入口点映射(EPM)来映射。使用该映射信息，可根据由播放项或子播放项提供的一组定时信息(进入时间In-Time和跳出时间Out-Time)确定流文件的特定位置，下面将对此进行详细讨论。在工业标准中，每一由流文件及其相应的剪辑信息文件构成的文件对被指定为一个剪辑。例如，CLIPINF中所包括的01000.clpi包含STREAM中所包括的01000.m2ts的属性和再现定时信息，且01000.clpi和01000.m2ts形成一个剪辑。
再参考图1，播放列表目录(PLAYLIST)包括一个或多个播放列表文件(*.mpls)，其中每个播放列表文件包括至少一个播放项，它指定至少一个主AV剪辑和该主AV剪辑的再现时间。更具体来说，播放项包含指定进入时间和跳出时间的信息，进入时间和跳出时间表示由播放项内的Clip_Information_File_Name(剪辑信息文件名)指定的主AV剪辑的再现开始和结束时间。因此，播放列表文件表示基本再现文件信息，它执行一个或多个播放项的组合所预期的剪辑组合的再现。另外，播放列表文件还可包括子播放项，它表示用于文本字幕流文件的基本再现控制信息。当子播放项被包括在播放列表文件中以再现一个或多个文本字幕流文件时，该子播放项与(诸)播放项同步。另一方面，当子播放项用于再现可浏览幻灯片时，它可不与(诸)播放项同步。根据本发明，子播放项的主要功能在于控制一个或多个文本字幕流文件的再现。
最后，辅助数据目录(AUX DATA)可包括补充数据流文件，其示例是字体文件(例如，aaaaa.font或aaaaa.otf)、弹出式菜单文件(未示出)、和用于产生点击声的声音文件(例如，Sound.bdmv)。上述文本字幕流文件可包括在辅助数据目录而非流目录中。
图2示出根据本发明的光盘的数据存储区。参见图2，光盘包括占用盘卷的最里面部分的文件系统信息区、占用盘卷的最外面部分的流区、以及占用文件系统信息区和流区之间的区域的数据库区。在文件系统信息区中，存储用于管理图1所示的全部数据文件的系统信息。接着，主数据和补充数据(即，AV流和一个或多个文本字幕流)被存储在流区中。主数据可包括音频数据、视频数据和图形数据。并且，补充数据(即，文本字幕)被独立地存储在流区中而不与主数据多路复用。图1所示的通用文件、播放列表文件和剪辑信息文件被存储在盘卷的数据库区中。如上所述，通用文件包括索引文件和对象文件，而播放列表文件和剪辑信息文件包括再现存储在流区中的AV流和文本字幕流所需的信息。使用存储在数据库区和/或流区中的信息，用户能选择特定回放模式并以所选择的回放模式再现主AV和文本字幕流。
下面将详细说明根据本发明的文本字幕流文件的结构。首先，将新定义用于再现文本字幕流的控制信息。然后是创建包括新定义的控制信息的文本流文件的方法、和用于再现文本字幕流从而再现所记录的流文件的方法和装置的详细说明。图3示出根据本发明呈现在显示屏上的文本字幕和主图像。当同步再现主AV流和相应的文本字幕流时，所述主图像和文本字幕被同时显示在显示屏上。
图4是示出根据本发明的主AV剪辑和文本字幕剪辑的再现控制的示意图。参见图4，播放列表文件包括控制至少一个主AV剪辑的再现的至少一个播放项、和控制多个文本字幕剪辑的再现的子播放项。图4所示的用作英文和韩文文本字幕的文本字幕剪辑1和文本字幕剪辑2中的一个可与主AV剪辑同步，从而主图像和相应的文本字幕在特定呈现时间同时显示在显示屏上。为了在显示屏上显示该文本字幕，需要显示控制信息(例如位置和大小信息)和呈现时间信息，其示例在图5A到图5C中示出。
图5A示出根据本发明的在显示屏上呈现的对话。对话表示在给定呈现时间期间显示屏上显示的全部文本字幕数据。通常，对话的呈现时间可用呈现时戳(PTS)表示。例如，图5A所示的对话的呈现在PTS(k)处开始并在PTS(k+1)处结束。因此，图5A所示的对话表示在PTS(k)和PTS(k+1)之间显示在显示屏上的文本字幕数据的整个单元。对话最多包括一个文本字幕中的100个字符码。
此外，图5B示出根据本发明的对话的多个区域。区域表示在给定呈现时间期间在显示屏上显示的文本字幕数据(对话)的细分部分。换言之，对话包括至少一个区域，且各区域可包括至少一行字幕文本。可根据分配给一个区域的区域样式(全局样式)在显示屏上显示表示该区域的全部文本字幕数据。应根据字幕数据的期望解码速率来确定包括在一个对话中的最多区域数目，因为较多数目的区域通常导致较低的解码率。例如，可以将一个对话的最多区域数目限制为2，以实现合理高的解码速率。据此，当再现文本字幕流时，因为解码负荷的缘故，所以单个对话内的最多区域数目被限制为2个。在本发明的另一个实施例中，单个对话内可存在最多n个(其中n＞2)区域。
图5C示出根据本发明的对话的多个区域的样式信息。样式信息表示定义显示对话中所包括区域的至少一部分所需的属性的信息。样式信息的某些示例是位置、区域大小、背景颜色、文本对齐、文本流向信息等等。样式信息可分类成区域样式信息(全局样式信息)和内联(inline)样式信息(局部样式信息)。
区域样式信息定义应用于对话的整个区域的区域样式(全局样式)。例如，区域样式信息可包含区域的区域位置、区域大小、字体颜色、背景颜色、文本流向、文本对齐、行间距、字体名称、字形和字体大小的至少之一。例如，如图5C所示将两个不同的区域样式应用于区域1和区域2。具有“位置1、大小1及颜色＝蓝色”的区域样式被应用于区域1，而具有“位置2、大小2及颜色＝红色”的不同区域样式被应用于区域2。
另一方面，内联样式信息定义应用于区域中所包括的文本数据串的特定部分的内联样式信息(局部样式信息)。例如，内联样式信息可包含字体类型、字体大小、字形、和字体颜色的至少之一。文本串的特定部分可以是区域中的整个文本行或该文本行的特定部分。参见图5C，特定内联样式被应用于区域1中包括的文本部分“mountain”。换言之，文本串特定部分的字体类型、字体大小、字形和字体颜色的至少之一与区域1中文本串的其余部分不同。因此，上述文本数据被记录和描述为应用于特定内联样式信息(inline_style)的“文本串”。
图6示出根据本发明的文本字幕流文件(例如，图1所示的10001.m2s)。该文本字幕流文件可由包括多个传输分组(TP)的MPEG2传输流形成，所有传输分组都具有相同的分组标识符(例如，PID＝0x18xx)。当盘片播放器接收到包括特定文本字幕流在内的许多输入流时，它用它们的PID找到属于该文本字幕流的所有传输分组。参见图6，传输分组的每个子集形成一个分组基本流(PES)分组。图6所示的PES分组之一对应于定义一组区域样式的对话样式片段(DSS)。第二PES分组之后的所有其余PES分组对应于对话呈现片段(DPS)。
在上述图6的文本字幕流结构中，图5A到5C所示的每个对话信息表示一个对话呈现片段(DPS)。并且，对话信息中所包括的样式信息表示一组信息，该组信息将在对话样式片段(DSS)中定义的多个区域样式组(也可称为“region_style_id”)的任一个链接到内联样式。标准化有限数目的区域样式组被记录在对话样式片段(DSS)中。例如，最多记录60组特定样式信息，其每一组由region_style_id描述。因此，在文本字幕解码器中(如图12B所示)，一次仅读取和解码一个对话呈现片段(DPS)。
图7示出根据本发明用于创建文本字幕流的方法，其中定义了应用于各呈现时间(PTS)部分的各个对话呈现片段(DPS)。更具体地，参见图7，DPS#n-1由两(2)个区域(区域#1和区域#2)构成，其中在每个区域中记录一个特定对话文本。在PTS1_start(PTS1开始)～PTS1_end(PTS1结束)部分内DPS#n-1呈现在屏幕上。并且，DPS#n由一(1)个区域构成，其中在相应区域中记录一个特定对话文本。在PTS2_start～PTS2_end部分内DPS#n呈现在屏幕上。最后，DPS#n+1由两(2)个区域(区域#1和区域#2)构成，其中在每个区域中记录一个特定对话文本。在PTS3_start～PTS3_end部分内DPS#n+1呈现在屏幕上。
因此，如上所述在一个图片内形成的DPS的特征将参照图8A到8C进行详细的描述。首先，可在相邻DPS之间执行连续呈现或间断呈现。图8A示出DPS之间的间断呈现(即间断DPS)，而图8B示出DPS之间的连续呈现(即连续DPS)。
参看图8A，三(3)个相邻DPS，即DPS#n-1、DPS#n和DPS#n+1全部是间断的。例如，DPS#n-1的结束PTS(＝PTS2)与DPS#n的开始PTS(＝PTS3＞PTS2)不同。类似地，DPS#n的结束PTS(＝PTS4)与DPS#n+1的开始PTS(＝PTS5＞PTS4)不同。因此，图8A所示的各个DPS形成为彼此不相关的DPS。各不相关(或间断)的DPS包括特定的区域样式信息(region_style_id)，且内对话文本的位置、背景颜色、字体大小、字体颜色等根据相应的区域样式信息来判定。更具体地，可对DPS#n-1指定“region_style_id＝k”，可对DPS#n指定“region_style_id＝k+1”，而可对DPS#n+1指定“region_style_id＝k+2”。然而，即使各DPS是彼此不相关的，相同的区域样式信息(region_style_id)也可相同地应用于各DPS。
参见图8B，三个相邻的DPS，即DPS#n-1、DPS#n、DPS#n+1全部是连续的。例如，DPS#n-1的结束PTS(＝PTS2)与DPS#n的开始PTS(＝PTS2)相同。类似地，DPS#n的结束PTS(＝PTS3)与DPS#n+1的开始PTS(＝PTS3)相同。因此，图8B所示的各个DPS形成为彼此相关联的DPS。各连续的DPS(DPS#n-1、DPS#n和DPS#n+1)包括相同的特定区域样式信息(例如，region_style_id＝k)。并且由此，DPS#n-1、DPS#n和DPS#n+1每一个内对话文本的位置、背景颜色、字体大小、字体颜色等根据相应的区域样式信息来等同地判定。
图8C示出用于呈现(或再现)间断DPS和连续DPS的方法。更具体地，文本字幕流文件包括continuous_present_flag(连续呈现标志)，它指示是否在如图所示的相邻对话呈现片段(DPS)的各个区域之间执行连续呈现。因此，如果当前DPS的再现(或呈现)与前一DPS连续，则分配“continuous_present_flag＝1”，而如果再现不连续，则分配“continuous_present_flag＝0”。此时，如果DPS中所包括的区域的至少之一被设置成连续再现，则相应的DPS被定义为“连续呈现DPS”。因而，例如，作为连续呈现DPS的DPS#2、DPS#3和DPS#4被分组为“连续呈现组#2”。并且，当上述连续呈现组#2再现(或呈现)时，首先再现连续呈现组#2(即DPS#2)的第一DPS。然后，不清除显示到屏幕上的文本数据，继续呈现直到呈现结束，即直到DPS#4的显示结束。相反，因为DPS#1和DPS#5是间断DPS，所以DPS#1和DPS#5不管其相邻DPS如何而独立呈现(或再现)。
此外，不管DPS是连续DPS还是间断DPS，各DPS中的对话文本应当是新定义的。并且，即使在同一DPS内存在两(2)个区域，在各区域内的对话文本流向也应定义为朝着同一方向。更具体地，各DPS应包括表示(或引用)相应DPS的对话文本信息，并且该规则等同地适用于连续DPS。此外，当一个DPS中包括两(2)个区域时，各区域应具有相同的文本流向。换言之，在第一区域具有从左到右(左→右)的文本流向的情形中，不能接受或允许第二区域具有从上到下(上→下)的文本流向，因为两个文本流向是彼此不同的。这种条件应当理解为强制条件以防止用户看到混乱的图像。
现在将参照图9到11C详细描述上述对话样式片段(DSS)和对话呈现片段(DPS)的句法结构。图9示出根据本发明的文本字幕流(Text_Subtitle_Stream())的句法。如图6所示，Text_Subtitle_Stream()包括dialog_style_segment()句法和dialog_presentation_segment()句法。更具体地，dialog_style_segment()句法对应于定义样式信息组的单个对话样式片段(DSS)，而dialog_presentation_segment()句法对应于实际对话信息记录其中的多个对话呈现片段(DPS)。
图10A-10C示出表示对话样式片段(DSS)的dialog_style_segment()的详细结构。更具体地，图10A示出dialog_style_segment()的整体结构，其中定义了应用于对话中的不同样式信息组的dialog_style_set()。图10B示出根据本发明的在dialog_style_segment()中定义的dialog_style_set()。除了诸region_style外，dialog_style_set()还包括Player_style_flag(播放器样式标志)、user_changeable_styleset()(用户可改变样式组)和palette()(调色板)。Player_style_flag指示是否授权播放器改变样式信息。同样，user_changeable_style set()定义播放器对样式信息的改变的范围，而palette()指示颜色信息和透明度。
区域样式信息(region_styles)表示对各区域定义的全局样式信息，如上所述。给各区域分配region_style_id，并定义对应于特定region_style_id的样式信息组。因此，当通过将应用于相应对话的region_style_id记录在对话呈现片段(DPS)中来再现对话时，应用由dialog_style set()内的相同region_style_id定义的样式信息组值以再现对话。因此，现在将描述提供给各region_style_id的样式信息组内所包括的各个样式信息。
在本文中，region_horizontal_position(区域横向位置)、region_vertical_position(区域纵向位置)、region_width(区域宽度)和region_height(区域高度)被提供作为用于定义相应区域在屏幕内的位置和大小的信息。并且，还提供了决定相应区域的背景颜色的region_bg_color_index(区域背景颜色索引)信息。此外，作为定义文本在相应区域内的原始(或起始)位置的信息，提供region_horizontal_position(区域横向位置)和text_vertical_position(区域纵向位置)。此外，提供定义文本方向(例如左→右、右→左、上→下)的text_flow(文本流向)、以及定义文本对齐方向(例如左、中、右)的text_alignment(文本对齐)。更具体地，当特定对话中包括多个区域时，相应对话中所包括的各区域的text_flow被定义为具有相同的text_flow值，以防止用户看到混乱的图像。
此外，指定区域内各行之间间距的line_space(行间距)被提供作为样式信息组内所包括的个体样式信息。并且，font_type(字体类型)、font_size(字体大小)和font_color_index(字体颜色索引)被提供作为用于实际字体信息的字体信息。同时，dialog_style set()内记录的Player_style_flag(播放器样式标志)指示作者是否可应用提供给播放器的样式信息。例如，当Player_style_flag＝1b时，播放器被授权通过应用播放器本身内所提供的样式信息以及记录在盘片内的dialog_styleset()里定义的样式信息来再现文本字幕流。另一方面，当Player_style_flag＝0b时，仅授权记录在盘片内的dialog_style set()中所定义的样式信息的使用。
图10C示出根据本发明的在dialog_style set()中定义的user_changeable_styleset()。该user_changeable_style set()预定义可由用户改变的样式信息的类型和改变的范围，并且user_changeable_style set()用于简便地改变文本字幕数据的样式信息。然而，当用户被允许改变如图10B所述的所有样式信息时，用户会更加困惑。因此，在本发明中，只可改变font_size、region_horizontal_position、以及region_vertical_position的样式信息。并且，相应地，可根据font_size改变的文本位置和行间距的变化也在user_changeable_style set()中定义。更具体地，为每个region_style_id定义user_changeable_style set()。例如，在user_changeable_style set()中，可定义特定region_style_id＝k内最多25个user_style_id。
此外，各user_style_id包括region_horizontal_position_direction(区域横向位置方向)、region_vertical_position_direction(区域纵向位置方向)信息，它们指定各可变region_horizontal_position和region_vertical_position的改变后位置的方向。各user_style_id还包括region_horizontal_position_delta(区域横向位置增量)和region_vertical_position_delta(区域纵向位置增量)信息，用于将各方向上的单个位置移动单位指定为像素单位。更具体地，例如，当region_horizontal_position_direction＝0时，区域的位置向右移动。而当region_horizontal_position_direction＝1时，区域的位置向左移动。此外，当region_vertical_position_direction＝0时，区域的位置向下移动。最后，当region_vertical_position_direction＝1时，区域的位置向上移动。
此外，各user_style_id包括指定各可变font_size的改变方向的font_size_inc_dec(字体大小增减)信息、以及用于将各方向上的单个位置移动单位指定为像素单位的font_size_delta(字体大小增量)信息。更具体地，例如，font_size_inc_dec＝0表示font_size的增大方向，而font_size_inc_dec＝1表示font_size的减小方向。类似地，与“文本位置”和“行间距”相关的改变后信息(数据字段)也可根据相同的原理来定义。
现在详细描述根据本发明的user_changeable_style set()的特征。对话样式片段(DSS)中所包括的各region_styles()内所定义的user_control_styles()的数目是相同的。换言之，可应用于各对话呈现片段(DPS)的user_control_styles()的数目是相同的。此外，各user_control_style()由不同的user_style_id表示。并且，当用户选择随机的user_style_id时，相同顺序的user_control_styles()等同地应用于各region_style()。此外，可变样式的所有可能组合都在单个user_control_styles()中定义。换言之，region_postion和font_size同时组合定义，而非分别定义。并且，最后，移动方向(*_direction)或增减指示(*_inc_dec)不相关地与各位置移动单位(*_delta)区别开来，并相应地记录。更具体地，在不具有作为实际正在变化的值的样式值的情况下只定义位置移动单位(*_delta)。随后，将region_style()中定义的值加上所定义的位置移动单位(*_delta)，从而获得实际正在变化的样式值的最终值。
图10D示出根据本发明的在dialog_style set()中定义的调色板信息(palette())。该palette()提供记录在对话内的文本字幕数据的颜色改变信息。在本文中，palette()包括多个palette_entry(调色板条目)，其中每个palette_entry都由一palette_entry_id描述。并且，各palette_entry设置有对应于各palette_entry_id的特定亮度值(Y_value)、特定颜色值(Cr_value、Cb_value)、以及指定文本数据透明度的特定T_value。因此，根据本发明的文本字幕流的特征之一是仅定义一基本(或通用)调色板，该调色板应用于文本字幕流中所包括的各对话呈现片段(DPS)。更具体地，在定义对话样式片段(DSS)中的调色板之后，所定义的调色板通常被用于各个对话呈现片段(DPS)中。然而，如果要在特定的对话呈现片段(DPS)中使用新的特定调色板而非通用的调色板，则通过使用palette_update_flag(调色板更新标志)来新定义特定的调色板，palette_update_flag将参照图11A如下所述。
图11A和11B示出根据本发明表示对话呈现片段(DPS)的dialog_presentation_segment()的详细结构。图11A示出dialog_presentation_segment()的整体结构，其中定义dialog_start_PTS(对话开始PTS)和dialog_end_PTS(对话结束PTS)。dialog_start_PTS和dialog_end_PTS指定相应对话的呈现时间。然后，dialog_presentation_segment()包括指示相应对话内颜色信息的改变的palette_update_flag。在本文中，当palette_update_flag＝1b时，颜色和透明度(T_value)被改变(或更新)，因此新定义颜色的palette()信息被单独记录。在该情形中，在对话呈现片段(DPS)中新定义的palette()必须只应用于相应的对话呈现片段(DPS)。假设palette_update_flag＝0b，则当呈现(或再现)相应的对话呈现片段(DPS)时，已在如图10A所示的对话样式片段(DSS)中定义的上述通用调色板应当恢复(或保留)。
随后，定义区域信息的dialog_region()被记录在dialog_presentation_segment()中。在本发明中，最多有两个区域可设置在单个对话内，并且因此dialog_region()信息被提供给各区域。dialog_region()包括region_style_id信息和continuous_present_flag信息。region_style_id信息指定如图10B所示的区域样式的任一个，并且continuous_present_flag信息标识是否要执行如图8C所示的与前一对话区域的无缝再现。更具体地，continuous_present_flag被包括在各区域内。如果在一个DPS中包括两(2)个区域，并且当至少一个区域被设置成continuous_present_flag＝1b时，相应的DPS变成上述连续呈现DPS。此外，在dialog_region()中还包括文本数据和region_subtitle()信息。文本数据被包括在实际相应区域中，并且region_subtitle()信息定义局部样式信息。
图11B和11C示出记录region_subtitle()的一个示例，该region_subtitle()包括文本串和标识应用于该文本串的内联样式信息(即inline_style)的标识信息(即data_type)。此外，1-字节信息(即escape_code(转义码))被记录在由标识信息(即data_type)标识的信息之间。更具体地，文本串和inline-style(内联类型)被记录在region_subtitle()内，以包括文本串和标识内联样式信息的标识信息(即data_type)。在本文中，当data_type＝0b时，数据类型是内联样式信息(即inline_style)，而当data_type＝1b时，数据类型是文本串。因此，当data_type＝1b时，文本串被记录为text_string()中所包括的特定字段(即char_data_byte(字符数据字节))内的字符码。换言之，char_data_byte被用于记录文本数据，诸如“Goodmorning”或“Good afternoon”，如图8A和8B所示，并且，文本数据被记录在各DPS内的各区域中，而不管DPS是否为连续呈现DPS。
此外，当data_type＝0b时，记录内联样式信息(即inline_style)，其中内联样式信息被配置成具有至少一个内联样式类型(即inline_style_type)。例如，inline_style_type＝0x01表示字体集中的变化，并且因此由相应ClipInfo(剪辑信息)指定的字体ID值被记录在特定字段(即inline_style_data_byte(内联样式数据字节))内；并且，inline_style_type＝0x02表示字形中的变化，并且因此相应的字形值被记录在特定字段(即inline_style_data_byte)内。此外，inline_style_type＝0x03表示字体大小的变化，并且相应的字体大小值被记录在特定字段(即inline_style_data_byte)内；而inline_style_type＝0x04表示字体颜色中的变化，并且因此由相应调色板指定的索引值被记录在特定字段(即inline_style_data_byte)内。此外，inline_style_type＝0x0A表示断行。在该情形中，不另外记录数据，除非在读取相应类型(inline_style_type＝0x0A)时在再现(或呈现)之前解码文本字幕流时应换行。
此外，当data_type＝0b时，记录内联样式信息(inline_styles)，其中记录指示诸inline_style总长的信息，即inline_style_length。并且，至少一个inline_style_type和记录各类型的改变后的值的inline_style_data_byte值被记录在相应大小内。因此，内联样式信息(诸inline_style)中所包括的至少一个inline_style_type作为单个单元被连续记录。然后，当相应内联样式信息的记录完成时，在由连续(或后续)标识信息(即data_type)记录的文本串之间插入1-字节信息(escape_code)并记录之。
在下文中，将参照图12A和12B详细描述用于再现如上所述记录在光盘中的文本字幕流的方法和装置。图12A示出用于根据本发明的用于再现光盘的装置，尤其是解码器，更特别地示出单独包括的文本字幕解码部件40的一个示例。更具体地，该装置包括分组标识符(PID)过滤器5，用于基于其分组标识符将输入流分成视频流、音频流、图形流、和文本字幕流；视频解码部件20，用于再现视频流；音频解码部件10，用于再现音频流；图形解码部件30，用于再现图形流；以及文本字幕解码部件40，用于再现文本字幕流。
这些文本字幕流可从光盘中提取，或者它们可从其它外部源中输入，如图12A所示。因此，该装置包括选择输入数据源的开关6。因此，如果从光盘中提取MPEG格式的文本字幕流，则开关6选择与PID过滤器5相连的数据线A。另一方面，如果它们通过其它外部源输入，则开关6选择与该外部源相连的数据线B。
视频解码部件20、音频解码部件10、图形解码部件30分别包括传输缓冲器21、11和31，用于存储预定大小的要解码的数据流。视频平面23和图形平面33分别包括在视频解码部件20和图形解码部件30中，用于将经解码信号转换成可显示图像。图形解码部件30包括颜色查找表(CLUT)34，用于控制可显示图像的颜色和透明度。
当文本字幕解码部件40从开关6处接收一个或多个文本字幕流时，所有这些流在开始时就一次性地预载入文本预载缓冲器(SPB)41中。假设用于一种语言的文本字幕流文件的典型大小约为0.5兆字节，则字幕预载缓冲器41的大小应根据文本字幕流文件的总数来确定。例如，为了确保当用户在支持两种语言的字幕流文件之间切换时文本字幕的无缝呈现，字幕预载缓冲器41的大小应大于或等于1兆字节。字幕预载缓冲器41的大小应大到足以一次性地预载所有所需的文本字幕流文件。
因为如上所述整个文本字幕流可记录在小容量内，所以文本字幕流被全部预载到缓冲器41中并使用。因此，文本字幕流被记录为单独的文件，从而便于只读取和使用文本字幕数据。此外，因为全部文本字幕数据都被预载到缓冲器中，所以可更简便地控制该缓冲器。在特定类型的光学记录和再现装置中，假设未发生缓冲器下溢，则文本字幕流可在未预载文本字幕流的情况下结合主AV数据实时再现。在下文中，将给出并详细描述根据本发明的正在预载的文本字幕流的一个示例。
文本字幕解码部件40还包括文本字幕解码器42，它解码存储在字幕预载缓冲器41中的一个或多个文本字幕流；图形平面43，它将解码后的字幕流转换成可显示图像；以及颜色查找表(CLUT)44，它控制转换后图像的颜色信息(Y、Cr和Cb值)和透明度信息(T值)。
图12A所示的装置中所包括的图像叠加部件50组合从视频解码部件20、图形解码部件30和文本字幕解码部件40中输出的图像。这些组合图像在显示屏上显示。从视频解码部件20的视频平面23中输出的视频图像被显示为显示屏的背景，并且从图形解码部件30和/或文本字幕解码部件40输出的图像被叠加在所显示的视频图像上。例如，如果图形解码部件30的输出图像是交互式图形图像，则由第一加法器52在开始时将从文本字幕解码部件40输出的文本字幕图像叠加在视频图像之上。然后，再由第二加法器53将交互式图形图像进一步叠加在已叠加字幕的图像之上。图12A所示的装置还包括用于解码所输入传输流(例如MPEG传输流)的系统解码器4，以及用于控制装置的所有所述组件的操作的微处理器3。
将详细参考根据本发明用于再现文本字幕流的方法。当光盘播放器(其示例如图12A所示)预载入光盘时，在开始时从盘片中提取再现记录在盘片上的数据所需的信息，并将其存储在存储器(未示出)中。当用户选择与一播放列表相关联的特定标题时，开始时将播放列表文件中所指定的至少一个完整(整个)文本字幕流文件预载入字幕预载缓冲器41，并且与该字幕流文件相关的字体文件被预载入字体预载缓冲器410。
例如，当用户选择与图4所示播放列表相关联的标题时，开始时将文本字幕剪辑No.1(韩语)和文本字幕剪辑No.2(英语)的文本字幕文件预载入字幕预载缓冲器41。此外，与这些文本字幕文件相关的字体文件被预载入字体预载缓冲器410，这些字体文件可在文本字幕剪辑的剪辑信息文件中指定。然后，开始播放列表的回放。在播放列表回放期间，主AV剪辑No.1和No.2的AV流分别由音频解码部件10和视频解码部件20解码，且所预载的文本字幕流的选定之一由文本字幕解码器42解码。然后经解码的文本字幕图像被叠加在经解码的主视频图像上，并且在显示屏上显示整个图像。
如上所述，当完成所有操作、并且由播放项控制的主视频数据被显示到屏幕上时，通过图像叠加部件50(如图12A所示)叠加相关的文本字幕。并且，因为提供了经叠加的文本字幕，所以启动了文本字幕流的解码。同时，为了执行文本字幕流的解码，对话样式片段(DSS)内配置了第一分组流(PES)的区域样式信息和调色板信息被分别读取并存储以便于在再现该DPS时使用。更具体地，当读取调色板信息时，同时向CLUT 44提供调色板信息，以便于在将文本字幕显示在屏幕上时提供用户所需的颜色和透明度。
图12B详细地示出图12A所示的文本字幕解码器42。由文本字幕解码器42执行的解码过程包括语法分析、绘制和排版步骤。在语法分析步骤中，根据对话呈现片段(DPS)中所包括的信息，存储在字幕预载缓冲器(SPB)41中的文本字幕流被语法分析成排版信息、绘制信息和对话文本数据。对话表示在可由呈现时戳(PTS)定义的预定时段期间显示的所有文本字幕。因此，排版信息对应于与文本字幕显示到屏幕上时的显示时间和显示位置相关的信息，并且还对应于由调色板信息更新(palette_update_flag＝1b)新定义的新调色板信息。绘制信息对应于实际上描绘(或呈现)各对话中各区域的文本的信息。这种绘制信息包括“区域宽度和高度”、“背景颜色”、“文本流向”、“文本对齐”、和“字体id/字形/大小”。此外，对话文本信息对应于应用到实际文本数据的内联样式信息、以及记录在DPS内的特定文本串。
参看图12B，文本字幕解码器42中所包括的文本字幕处理器421将存储在字幕预载缓冲器41内的字幕流文件语法分析成排版和绘制信息以及对话文本数据。然后将排版和绘制信息存储在对话排版缓冲器(DCB)425中，并将对话文本数据存储在对话缓冲器(DB)422中。更具体地，调色板更新信息(palette_update_flag＝1b)被包括在由语法分析步骤语法分析的排版信息内。并且，当palette_update_flag＝0b时，开始时从对话样式片段(DSS)提供给CLUT 44的通用调色板信息可在不经更新的情况下连续使用。相反，当palette_update_flag＝1b时，忽略DSS内的通用调色板信息，并且新的调色板信息在相应DPS内新定义、更新到CLUT 44并使用。然而，当相应DPS的呈现(或再现)完成时，清除调色板更新，并再次使用开始时从CLUT 44提供的通用调色板信息。此时，CLUT 44的更新应在呈现(或再现)后续DPS之前完成。
在绘制步骤中，经语法分析的对话文本数据使用绘制信息绘制成位图数据，该绘制信息表示绘制对话文本数据所需的样式信息。在对话呈现控制器426的控制下，文本绘制器423将对话缓冲器422内所存储的对话文本数据绘制成位图数据。为了执行绘制功能，文本绘制器423从字体预载缓冲器410中接收与对话文本数据相关联的字体数据、从对话呈现控制器426中接收绘制信息和内联样式信息、并使用绘制信息和内联样式信息将对话文本数据绘制成位图数据，这适用于对话文本数据的各个文本串。此后，所绘制的文本数据作为位图对象被存储在位图对象缓冲器(BOB)424中。因此，记录在BOB缓冲器424内的“对象”对应于被转换成位图对象的各对话内各区域的文本数据。因此，每个区域最多有两个对象被语法分析并存储在BOB缓冲器424内。
最后，在排版步骤中，所绘制的文本数据根据排版信息被添加到图形平面(GP)43中，该排版信息表示指示用于在显示屏内显示文本字幕的时间的信息。最后，根据由对话呈现控制器426提供的排版信息，存储在位图对象缓冲器424中的位图对象被传送(添加)到图形平面43。颜色查找表44使用排版信息中包括的调色板信息以调节图形平面43的输出的颜色和透明度。
因此，在呈现(或再现)构成如图8C所示的连续呈现的连续DPS#2、DPS#3和DPS#4时，居先的DPS#2通过使用全部上述呈现过程来呈现。然后，在呈现DPS#3和DPS#4时，允许DPS#3和DPS#4的连续呈现的区域使用与前面的DPS#2相同的区域样式。因此，在该情形中，略去绘制过程，并且保留和使用与图形平面(GP)内前面的DPS#2相关的信息。更具体地，图形平面(GP)被保留到其中完成连续呈现的DPS#$的dialog_end_PTS。然而，当DPS#5的间断呈现开始时，图形平面(GP)内的信息全部复位。即使DPS是连续呈现组内的连续呈现DPS，也可包括间断区域，并且在该情形中，不相关区域应通过单独的绘制过程配置位图对象。
工业实用性对本领域技术人员而言，显然可在本发明中进行各种更改和变化而不背离本发明的精神或范围。因而，本发明旨在涵盖本发明的更改和变化，只要它们落在所附权利要求及其等效方案的范围内即可。
权利要求
1.一种用于再现文本字幕流的记录介质，所述记录介质包括存储至少一个文本字幕流的数据区，各文本字幕流包括定义一组区域样式的对话样式片段和多个对话呈现片段，各对话呈现片段包含至少一个对话文本区域，各对话文本区域链接到所述一组区域样式的一个选定样式，其中当前对话呈现片段内所包括的第一对话文本区域包含连续呈现标志，所述连续呈现标志指示所述第一对话文本区域与前一对话呈现片段内所包括的第二对话文本区域之间需要连续呈现。
2.如权利要求1所述的记录介质，其特征在于，所述第一和第二对话文本区域的每一个都包括至少一个由内联样式和文本串构成的对。
3.如权利要求2所述的记录介质，其特征在于，所述第一和第二对话文本区域中分别包括的所述由内联样式和文本串构成的对彼此相同。
4.如权利要求1所述的记录介质，其特征在于，所述多个对话呈现片段的至少之一包括两个对话文本区域，它们链接到指定相同文本流向的第一和第二区域样式。
5.如权利要求1所述的记录介质，其特征在于，所述第一和第二对话文本区域链接到从在所述对话样式片段中定义的所述一组区域样式中选择的同一区域样式。
6.如权利要求1所述的记录介质，其特征在于，通过保留先前对话呈现片段中所包括的第二对话文本区域在图形平面中的呈现，当前对话呈现片段中所包括的第一对话文本区域在所述图形平面中呈现。
7.一种用于再现文本字幕流的记录介质，所述记录介质包括存储至少一个文本字幕流的数据区，各文本字幕流包括定义一组区域样式的对话样式片段和多个对话呈现片段，所述多个对话呈现片段的至少之一包含第一和第二对话文本区域，它们分别链接到从所述一组区域样式中选择出来的第一和第二区域样式，其中第一和第二区域样式定义相同文本流向。
8.如权利要求7所述的记录介质，其特征在于，所述相同文本流向指示字符渐进和行渐进之一。
9.一种用于再现文本字幕流的方法，所述方法包括读取记录在记录介质上的文本字幕流中所包括的对话样式片段，所述对话样式片段定义一组区域样式，所述文本字幕流还包括第一和第二对话呈现片段；在图形平面中呈现第一对话呈现片段中所包括的第一对话文本区域，所述第一对话文本区域链接到所述一组区域样式中的一个样式；读取第二对话呈现片段中所包括的连续呈现标志，所述第二对话呈现片段包括链接到所述一组区域样式中的一个样式的第二对话文本区域；并且如果连续呈现片段指示在第一和第二对话文本区域之间需要连续呈现，则通过保留第一对话文本区域在图形平面中的呈现来呈现第二对话文本区域。
10.如权利要求9所述的方法，其特征在于，所述第一和第二对话文本区域链接到从在所述对话样式片段中定义的所述一组区域样式中选择的同一区域样式。
11.如权利要求9所述的方法，其特征在于，如果所述连续呈现标志指示在所述第一和第二对话呈现片段之间需要连续呈现，则所述第二对话呈现片段的呈现开始时间与所述第一对话呈现片段的呈现结束时间相同。
12.如权利要求9所述的方法，其特征在于，还包括将所述文本字幕流预载入缓冲器中。
13.一种用于再现文本字幕流的装置，所述装置包括被配置成预载文本字幕流的缓冲器，所述预载的文本字幕流包括定义一组区域样式的对话样式片段、以及第一和第二对话呈现片段；以及文本字幕解码器，它被配置成在图形平面中呈现第一对话呈现片段中所包括的第一对话文本区域，并读取第二对话呈现片段中所包括的连续呈现标志，所述第二对话呈现片段包括第二对话文本区域，其中如果连续呈现片段指示在第一和第二对话文本区域之间需要连续呈现，则文本字幕解码器通过保留第一对话文本区域在图形平面中的呈现来呈现第二对话文本区域。
全文摘要
公开了一种用于再现文本字幕流的记录介质、方法和装置。缓冲器开始时预载包括定义一组区域样式的对话样式片段以及第一和第二对话呈现片段的文本字幕流。文本字幕解码器开始时在图形平面中呈现第一对话呈现片段中所包括的第一对话文本区域，并读取包括第二对话文本区域的第二对话呈现片段中所包括的连续呈现标志。如果连续片段指示在第一和第二对话文本区域之间需要连续呈现，则文本字幕解码器通过保留第一对话文本区域在图形平面中的呈现来呈现第二对话文本区域。
文档编号H04N5/445GK1934638SQ200580009434
公开日2007年3月21日申请日期2005年3月22日优先权日2004年3月26日
发明者徐康洙, 金柄辰, 刘齐镛申请人:Lg电子株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：徐康洙;金柄辰;刘齐镛
技术所有人：LG电子株式会社
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。