生成带有浮动标题的视频内容的设备的制作方法

文档序号：7589677研发日期：2004年阅读：147来源：国知局

技术简介：
本专利针对传统字幕在嘈杂环境易干扰观看的问题，提出动态生成讲话框字幕的解决方案。通过分析电视内容自动生成包含时间、区域、形状及字幕文本的XML结构数据，内容回放设备可根据环境音量、移动速度等参数自动切换字幕显示模式，实现视频信号与字幕信号的智能组合与分离，提升多场景下的观看体验。
关键词：讲话框字幕,动态显示,XMl数据结构

专利名称：生成带有浮动标题的视频内容的设备的制作方法
背景技术：
发明领域本发明涉及电视内容生成装置、发送装置、回放装置、提供系统和所使用的数据结构与记录媒体。更具体地说，本发明涉及生成、发送、回放和提供带字幕电视内容的装置与系统及其所应用的数据结构与记录媒体。
背景技术：
说明通常，为便于理解外语影片的内容，一般把片中角色对话译成观众的母语。在屏幕内沿用母语文本显示译文。这样，即便角色用外语讲，但观众完全理解对话。近年来，举一例电视广播的管理技术，即使角色讲观众的母语时，仍在屏幕内沿示出角色间的对话原文。另为了描绘场景，屏内沿会示出不是角色对话的原文。屏内沿示出的这类文本都称为字幕。显示在图像上的这类字幕能帮助观众理解电视中角色间的对话，还能明白电视内容。
近年来，为便于理解屏上讲话者与字幕的关系，提出了各种方案，如女士讲话字幕着色成暖色调，男士讲话字幕为冷色调。在另一例中，字幕均配上讲话者姓名。
在又一例中，为增强在视觉上理解屏上讲话者与字幕的关系，字幕放在讲话者嘴边(参照日本国立相PCT待公开报No.9-505671)。该公报揭示的装置以三维方式计算讲话者在屏上的位置、讲话者嘴的位置和讲话者身体的定向。而且，该装置还以三维方式计算讲话者在屏上讲话的朝向，让二维平面上的讲话方向成为一条显示讲话原文的基准线。
一般，即使有字幕，观众也要求发出话音，因而根据话音特征，如音调的高或低，就能知道讲话者是谁。因此，在用普通字幕而完全没有话音时，观众就确定不了屏上谁在讲话，当屏上同时出现多个讲话者时，尤其成问题。
另在常规技术中，可通过改变文本颜色来指示讲话者，但这仅是向观众提示谁在讲话。没有话音，观众不能完全肯定谁在讲话。
另外，显示讲话人姓名也能指明谁在讲话，但该技术有很大缺点，如字幕字数增多了。
还有，上述公报揭示的从讲话者嘴边沿基准线显示字幕的方案也有问题，如字幕文本会遮盖非讲话者角色的脸部或重要的结果。
因而在使用字幕的常规电视显示方案中，不易理解讲话者与字幕的关系。另外，即使讲话者与字幕的关系很清楚，但观众在收看整个屏幕时常常感觉不舒服。

发明内容
因此，本发明的目的是提供电视内容的生成、发送、回放和提供的装置与系统及所使用的数据结构与记录媒体，以便容易理解讲话者与字幕的关系，便于观看整个屏幕。
本发明的另一个方面是提供电视内容的生成、发送、回放和提供装置与系统及所使用的数据结构与记录媒体，因而即使无话音也容易理解讲话者与字幕的关系，易观看整个屏幕。
为实现上述目的，本发明具有以下特征。本发明针对一内容生成装置，用于生成提供带讲话框字幕的电视内容所需的数据。该内容生成装置包括讲话框显示时间提取装置、讲话框区域确定装置、讲话框图像确定装置、字幕文本确定装置和讲话框数据生成装置。讲话框显示时间提取装置根据作为原始数据的电视内容数据，提取在电视中显示讲话框的时间。讲话框区域确定装置确定在讲话框显示时间提取装置所提取的时间适合在电视中显示讲话框的讲话框区域。讲话框图像确定装置确定准备与讲话框区域确定装置所确定的讲话框区域相结合的讲话框图像。字幕文本确定装置确定准备与讲话框图像确定装置所确定的讲话框图像相结合的字幕文本。讲话框数据生成装置利用信息中至少一段有关讲话框显示时间、讲话框区域、讲话框图像和字幕文本的信息，生成讲话框数据。由讲话框数据生成装置所生成的讲话框数据与电视内容数据一起回放，从而提供有讲话框字幕的电视内容。
较佳地，讲话框区域确定装置根据电视内容数据检测电视里的色调变化，提取浅的色调里的浅的部分，把其中所含的一帧取作讲话框区域。讲话框图像确定装置把允许在该帧里显示字幕文本的图像取为讲话框图像。
更佳地，讲话框区域确定装置根据用户指令改变提取的帧，确定该讲话框区域。而且，讲话框图像确定装置还按用户指令改变讲话框图像的形状。另外，字幕文本确定装置按用户指令确定字幕文本。
而且，字幕文本确定装置可判断单位时间的字幕文本字母数在讲话框显示时间内是否等于或是大于预定数，并在字母数等于或大于预定数时，通知用户要更改字幕文本。
较佳地，字幕文本确定装置按用户指令确定字幕文本的属性。
再者，内容生成装置还包括多路复用装置，用来多路复用电视内容数据和讲话框数据生成装置的讲话框数据。另外，内容生成装置还包括多路复用数据发送装置，可通过网络发送多路复用装置通过多路复用而得到的数据。还有，内容生成装置还包括封装媒体存贮装置，把多路复用装置通过多路复用得到的数据存入封装媒体。
另外，内容生成装置还包括音量确定装置，可在回放电视内容数据期间确定音量。此时，字幕文本确定装置可按音量确定装置确定的音量改变字幕文本的属性。
再者，内容生成装置还包括脸大小提取装置，根据电视内容数据提取电视中人脸的大小。此时，讲话框图像确定装置可按脸大小提取装置提取的脸大小，确定讲话框图像的始点。
较佳地，电视内容数据通过MPEG(活动图片专家组)编码，讲话框数据以XML(可扩充的标记语言)描述。
同时，本发明还针对一内容发送装置，用于发送提供带讲话框字幕电视内容所需的数据。内容发送装置包括讲话框数据获取装置、电视内容数据获取装置、多路复用装置和发送装置。讲话框数据获取装置获取用至少一条以下信息生成的讲话框数据根据作为原始数据的电视内容数据在电视中显示讲话框的时间、准备在电视上显示讲话框的区域、区域中讲话框的形状和准备插入讲话框的字幕文本。电视内容数据获取装置获取该电视内容数据。多路复用装置复用讲话框数据得到的讲话框数据和电视内容数据获取装置得到的电视内容数据。发送装置发送多路复用装置通过复用得到的数据。
例如，发送装置向广播设备发送复用的数据作无线广播，或向内容回放设备发送复用的数据而回放电视内容数据与讲话框数据。
本发明还针对一种内容存贮封装媒体生成装置，用于形成一封装媒体，其内存有带讲话框字幕电视内容所需的数据。内容存贮封装媒体生成装置包括讲话框数据获取装置、电视内容数据获取装置、复用装置与存贮装置。讲话框数据获取装置获取用以下至少一条信息生成的讲话框数据根据用作原始数据的电视内容数据在电视中显示讲话框的时间、准备在电视上显示讲话框的区域、该区域内讲话框的形状和准备插入讲话框的字幕文本。电视内容数据获取装置获取电视内容数据，多路复用装置复用讲话框数据得到的讲话框数据和电视内容数据获取装置得到的电视内容数据，存贮装置在封装媒体中存贮多路复用装置通过复用得到的数据。
本发明还针对一内容回放设备，可回放带讲话框字幕的电视内容，它包括讲话框数据获取装置、电视内容数据获取装置、讲话框信号生成装置、字幕文本信号生成装置、电视信号生成装置和组合传递装置。讲话框数据获取装置获取用以下至少一条信息生成的讲话框数据根据用作原始数据的电视内容数据在电视中显示讲话框的时间、准备在电视上显示讲话框的区域、该区域内讲话框的形状和准备插入讲话框的字幕文本。电视内容数据获取装置获取电视内容数据，讲话框信号生成装置按讲话框数据生成有关讲话框图像的信号，字幕文本信号生成装置按讲话框数据生成有关字幕文本的信号，电视信号生成装置按电视内容数据生成有关电视的信号。组合传递装置组合讲话框信号生成装置生成的讲话框信号、字幕文本信号生成装置生成的字幕文本信号和电视信号生成装置生成的电视信号而生成一组合信号，然后把组合信号传到显示设备。
再者，内容回放设备还包括组合/不组合命令装置，它可命令组合传递装置将讲话框信号和字幕文本信号同电视信号相组合或不组合。此时，在收到来自组合/不组合命令装置将讲话框信号和字幕文本信号同电视信号相组合的命令后，组合传递装置立刻向显示设备传递组合的信号，但在收到不组合讲话框信号、字幕文本信号与电视信号的命令时，组合传递装置向显示设备只传递电视信号。
另外，内容回放设备还包括音量测量装置和音量阈值确定装置，前者测量周围声音量，后者判断前者测量的周围声音量是否超过阈值。此时，组合/不组合命令装置根据音量阈值确定装置的判断结果，命令组合传递装置将讲话框信号和字幕文本信号面电视信号相组合或不组合。
较佳地，当音量阈值确定装置确定周围声音量未超过阈值时，组合/不组合命令装置就令组合传递装置把讲话框信号和字幕文本信号同电视信号相组合，并防止音频输出设备输出音频。
当音量阈值确定装置确定周围声音量超过阈值时，组合/不组合命令装置就令组合传递装置把讲话框信号和字幕文本信号同电视信号相组合。
再者，内容回放设备还包括移速测量装置，可测量内容回放设备的移动速度。组合/不组合命令装置判断移速测量装置测出的移速是否超过预定阈值，在移速超过预定阈值时，令组合传递装置把讲话框信号和字幕文本信号同电视信号相组合。
而且，组合/不组合命令装置可按用户指令命令组合传递装置是否把讲话框信号和字幕文本信号同电视信号相组合。
另外，根据用户指令，字幕文本信号生成装置可生成正常字幕文本信号，根据讲话框数据在屏内沿显示字幕文本。此时，当字幕文本信号生成装置生成正常字幕文本信号时，组合传递装置只组合正常字幕文本信号与电视信号而生成组合信号，并把该组合信号传到显示设备。
较佳地，组合传递装置对每帧都组合讲话框信号、字幕文本信号和电视信号。
更佳地，内容回放设备还包括显示装置，根据来自组合传递装置的组合信号，显示组合后的电视。
本发明还针对一种在其上记录了数据的计算机可读记录媒体，数据结构可让计算机设备显示带讲话框字幕的电视内容。记录媒体上记录的数据包括存贮根据用作原始数据的电视内容数据显示电视讲话框的时间信息的结构存贮相应于该时间信息准备在电视中显示讲话框的区域信息的结构；存贮相应于时间信息的区域中讲话框形状信息的结构；和存贮要插在相应于时间信息的讲话框内的字幕文本信息的结构。
较佳地，存贮时间信息的结构包括存贮指示字幕开始时间信息的结构；和存贮指示字幕持续时间信息的结构。
本发明还针对上述让计算机设备显示带讲话框字幕电视内容的数据结构。
本发明还针对一内容提供系统，包括用以下至少一条信息生成讲话框数据的讲话框数据生成设备根据作为原始数据的电视内容数据在电视中显示讲话框的时间信息、讲话框显示在电视上的区域信息、区域内讲话框形状信息和插入讲话框的字幕文本信息；内容提供装置复用讲话框数据生成设备生成的讲话框数据和电视内容数据而产生复用的数据，并把复用的数据提供为电视内容；和内容回放设备，根据内容提供装置提供的复用数据，回放带讲话框字幕的电视内容。
内容提供装置可通过网络分布或封装媒体向内容回放设备发送复用数据。
按本发明，在电视内容中，可将字幕文本插入讲话框里作显示，这样能明白讲话者与字幕的关系。再者，字幕文本显示在讲话框内，便于观看整个屏幕。讲话框的始点代表讲话者，因而即使无声也能把讲话者与字幕文本相互联系起来，故能弄清电视内容。这在有些地方尤其有用，诸如禁止发声的寂静场合，或者相反，由于周围声音大而听不到扬声器声响的地方。而且，若便携式通信终端引用本发明，用户不必用耳机等听音响就能弄清电视内容。
而且，讲话框置于浅的色调部分，以免讲话框遮掉屏上重要部分。另可按用户指令改变讲话框图像显示区，避免重要部分被讲话框无意遮盖。还有，讲话框图像形状可变，因而可按讲话者的话语选择合适的讲话框，如为了表示某种想法，可用云状讲话框。另可改变字幕文本而予以加强。
在字幕字母数大时，会自动通知用户，故用户能建立合适的字幕文本。
把MPEG数据用作电视内容数据而把遵守XML的数据用作讲话框数据，增强了数据相似性，有助于标准化。
内容回放设备可按周围音量控制音频输出和字幕文本显示，故能自动设置符合周围状况的输出。
通过以下结合附图对本发明的详述，本发明的种种目的、特征、方面和优点就更清楚了。
附图简介

图1是本发明一实施例广播系统整个配置的框图，用于广播带讲话框字幕的电视内容；图2是内容生成设备1功能结构的框图；图3示出一例字幕表数据的数据结构；图4示出一例讲话框数据的数据结构；图5是内容发送设备2的功能结构框图；图6是内容回放设备4的功能结构框图；图7是内容显示设备5的功能结构框图；图8是内容生成设备1的工作流程图；图9A示出内容生成设备1上的显示；
图9B示出内容生成设备1上的另一显示；图9C示出内容生成设备1上的又一种显示；图9D示出内容生成设备1上的再一种显示；图10示出一例最终生成的讲话框数据；图11是内容发送设备2的工作流程图；图12是内容回放设备4的工作流程图；图13A示出一例基于内容回放设备4生成的电视信号的图像；图13B示出一例基于内容回放设备4生成的讲话框信号的图像；图13C示出一例基于内容回放设备4生成的字幕文本信号的图像；图13D示出另一例基于内容回放设备4生成的字幕文本信号的图像；图14示出内容回放设备4的组合/传递部件43的操作；图15A示出一例内容显示设备5上的显示；图15B示出另一例内容显示设备5上的显示；图16示出经因特网提供内容数据和讲话框数据的整个系统配置；和图17示出分布DVD等封装媒体的整个系统配置，媒体内存贮了与内容数据和讲话框数据所复用的数据。
较佳实施例的描述下面参照附图描述本发明一实施例。图1是本发明一实施例的用讲话框广播带字幕电视内容的广播系统整个配置的框图。图1中，广播系统包括内容生成设备1、内容发送设备2、广播设备3、内容回放设备4和内容显示设备5。为简化描述，图1中对内容生成设备1、内容发送设备2、广播设备3、内容回放设备4和内容显示设备5都只示出一台设备，但每种设备可配置两台或更多台。
内容生成设备1根据预先存贮的内容数据生成指示对应于电视的字幕表的数据(下称字幕表数据)，并用讲话框生成讲话框数据，用于把基于内容数据的电视与带字幕电视组合起来。
内容发送设备2获取内容数据和讲话框数据，对它们复用，通过本地线路、公共网、因特网、电波网等把它们作为复用数据传输到广播设备3。内容生成设备1和内容发送设备3位于例如内容创制者一侧，如内容制作公司。这里经网络把复用数据发送到广播设备3，或把复用数据存入DVD等记录媒体供广播设备3阅读。
广播设备3接收内容发送设备2发出的复用数据，通过天线广播。广播设备3位于例如广播公司，如电视广播台。
内容回放设备4接收广播设备3发出的复用数据作分析，再令内容显示设备5用讲话框显示带字幕的电视。按内容回放设备4发出的信号，内容显示设备5用讲话框显示带字幕的电视。设备4和5位于例如观众房内。
图2是内容生成设备1的功能结构框图，设备1包括数据生成控制部11、输入部12、显示/输出部13、计时部14和存贮部15。
输入部12是一输入设备，如鼠标、键盘、触板与操纵杆，用于向数据生成控制部11输入用户送入的操作信息。
存贮部15是记录设备，如硬盘，里面存有内容数据、字幕表数据、讲话框形状数据和讲话框数据。
内容数据是编码的音视频流数据，通过编码诸如MPEG(运动图片专家组)得到。
字幕表数据里存有字幕文本和字幕文本显示时间信息。图3示出一例字幕表数据的数据结构。如图3所示，字幕表数据里记录了例如字幕开始时间、字幕持续时间和字幕文本。这里，字幕开始时间指由内容开始计算的时间，用于启动显示相应的字幕文本。字幕持续时间指连续显示相应字幕文本的时段。在图3的字幕表数据例中，在内容开始持续2分钟后，在第15帧后从24分30秒开始显示字幕文本“我同意你的想法”。注意，顺序帧位置仅为举例，不表示限制，而每秒帧数也不表示限制。
讲话框形状数据是限定讲话框形状的数据，如在讲话框形状数据中，讲话框形状名称与讲话框形状信息相关联。
图4示出一例讲话框数据的数据结构。如图4所示，讲话框数据描述了例如字幕持续时间、字幕文本展示速度、字幕文本属性、讲话框范围、讲话框始点、讲话框形状与字幕文本，这些项目在各字幕开始时相应于内容数据名称描述。字幕开始时间和字幕持续时间是讲话框显示时间信息，字幕文本展示速度、字幕文本属性和字幕文本是字幕文本信息，讲话框范围和讲话框始点是电视中适合显示讲话框的讲话框区域信息，讲话框形状是组合了讲话框区域的讲话框图像信息。讲话框数据是以某种数据格式用以下至少一条信息生成的数据讲话框显示时间信息、讲话框区域信息、讲话框图像信息和字幕文本信息。例如，讲话框数据以无语言描述。这里的字幕开始时间、字幕持续时间和字幕文本都与字幕表数据里的类似。字幕文本展示速度指在字幕持续时间内从字幕文本头部依次显示字幕文本的速度。字幕文本属性指字幕文本的字体、颜色、背景与透光度、帧型等。讲话框范围指屏上组合讲话框的位置。讲话框始点指讲话框在屏上开始的位置。讲话框形状指记录在讲话框数据里的讲话框名称。
如上所述，讲话框数据的结构可让计算机设备用讲话框显示带字幕的电视内容。该结构包括根据用作原始数据的电视内容数据在电视上存贮讲话框显示时间信息(如上述的字幕开始时间与待续时间)的结构、在电视上存贮与时间相关信息关联的讲话框显示区域信息(如上述的讲话框范围与讲话框始点)的结构、存贮与时间相关信息关联的区域内讲话框形状信息(如上述的讲话框形状)的结构，和存贮要插入讲话框的字幕信息(如上述的字幕文本展示速度，字幕文本属性与字幕文本)的结构。本例中，存贮时间相关信息的结构包括存贮字幕开始时间指示信息的结构和存贮字幕持续时间指示信息的结构。带这种结构的数据可存入计算机可读记录媒体。
计时部14测量时间。按照来自数据生成控制部11的信号，显示/输出部13显示生成电视与讲话框的图像并产生音响。
为得到字幕的开始与持续时间，数据生成控制部11回放内容数据，检测音响的开始与结束时间。数据生成控制部11把得到的字幕的开始与持续时间同用户通过输入部12送入的字幕文本关联起来而生成字幕表数据，再将其存入存贮部15。数据生成控制部11参照字幕表数据而检出音响开始时间，让显示/输出部13在显示时间内显示和输出声像。数据生成控制部11把讲话框形状与显示的电视组合，还在讲话框形状内组合字幕文本。若用户最终批准组合结果，数据生成控制部11就在字幕开始时间生成讲话框数据，再将每一字幕开始时间生成的此段讲话框数据合在一起而生成最终讲话框数据，接着把生成的最终讲话框数据存入存贮部15。
图5是内容发送设备2的功能结构框图，它包括多路复用控制部21、操作部22、纠错码添加部23、数字调制部24和发送部25。
操作部22是鼠标或键盘等输入设备，按用户指令向多路复用控制部21提供要播送的内容数据信息。
多路复用控制部21根据来自操作部22的信息，从内容生成设备1的存贮部15中读用户所需的内容数据及其相应的讲话框数据，然后复用这两段数据。以下把复用得出的数据称为复用数据。
纠错码添加部23对多路复用控制部21多路复用得到的复用数据加纠错码，数字调制部24用对其添加的纠错码以数字方法调制复用数据，发送部25向广播设备3发送数字调制的复用数据。这里，内容生成设备1可预先复用内容数据与讲话框数据，而复用数据发送功能也可包括在内容生成设备里。
广播设备3把内容发送设备2发送的复用数据转换成电波供发射。广播设备3的内部结构与常规技术里的相似，故不再详述。
图6是内容回放设备4的功能结构框图，该设备4包括回放控制部41、操作部42、组合传递部43、计时部44、讲话框形状存贮部45、接收部46、解调部47和纠错部48。
接收部46接收广播设备3广播的电波，解调部47解调接收部46收到的电波，而纠错部48参照包含在解调部47解调的复用数据里的纠错码纠错。
操作部42是用户控制内容回放设备4操作的输入设备，例子有遥控器与按钮开关。计时部44在回放内容数据时计时。如同内容生成设备1的存贮部15一样，讲话框形状存贮部45里存有讲话框形状数据。
回放控制部41从被纠错部48纠错的复用数据中读出内容，再对各帧向组合传递部43传送声像信号(下称视频信号与音频信号)；还从被纠错部48纠错的复用数据中读出讲话框数据，然后根据包含在讲话框数据里的讲话框形状信息，从讲话框形状存贮部45读出讲话框形状数据。另外，回放控制部41生成讲话框图像信号(下称讲话框信号)，并把它送到组合传递部43。注意，虽可对许多帧发送同一讲话框信号，但这里假定回放控制部41对每帧向组合传递部43发送讲话框信号。回放控制部41为各帧生成准备插入该讲话框的字幕文本信号(下称字幕文本信号)，并把它送到组合传递部43。注意，接收部46可设置在内容回放设备4的外面。
组合传递部43把回放控制部41送来的信号组合后传到内容显示设备5。
图7是内容显示设备5的功能结构框图，它包括显示/输出设备部51和驱动电路部52，前者由阴极射线管、液晶显示器、扬声器等构成，后者根据内容回放设备4发来的组合信号与音频信号让前者回放声像。
图8是内容生成设备1的操作流程图，图9A~9D示出几例内容生成设备1上的显示。下面参照图8和9A~9D描述内容生成设备1操作。
首先，根据通过输入部12来自用户的指令，内容生成设备1的数据生成控制部11读取存在存贮部15里的所需的内容数据，再令显示/输出部13显示电视并输出音响(步骤S101)。
接着通过音响识别，数据生成控制部11判断是否已到音响开始时间(步骤S102)，若未到音响开始时间，数据生成控制部11就进入步骤S104的操作；反之，若已到音响开始时间，则数据生成控制部11提醒用户输入对应于在音响开始时间(取作为字幕开始时间)算起的一时段内要产生的音响的字幕文本，直到音响结束，而该时段取作为字幕持续时间。然后，数据生成控制部11把字幕开始时间、持续时间和字幕文本存入存贮部15作为字幕表数据一部分(步骤S103)，再进入步骤S104的操作。此时，用户最好在字幕文本的字幕字母之间留一空间。
在步骤S104，数据生成控制部11判断内容数据回放是否已结束，若未结束，返回步骤S102的操作，生成下一音响开始时间的字幕文本；反之，若已结束，则数据生成控制部11收集在步骤S103生成的几段字幕表数据而生成内容的最终字幕表数据，并把它存入存贮部15(步骤S105)。然后，数据生成控制部11进到步骤S106的操作。
在步骤S106，数据生成控制部11参照字幕表数据，得出字幕的开始与持续时间。接着参照内容数据，数据生成控制部11对起自字幕开始时间的字幕持续时间令显示/输出部13回放声像(步骤S107)。
接着，数据生成控制部11对起自字幕开始时间的字幕持续时间计算电视里色彩的深浅度，提取浅色调部分(下称浅色部分)(步骤S108)。然后，数据生成控制部11设置能配入提取的浅色部分的矩形框(步骤S109)。接着，数据生成控制部11令显示/输出部13在字幕开始时间显示组合了电视的该设置的矩形框，从而用虚线框代表该矩形框(下称矩形框)(步骤S110)。此时，数据生成控制部11使矩形框四角呈黑圈。图9A示出一例步骤S110显示的屏。如图9A所示，矩形框Sa示成在浅色调的浅色部分Fa具有最大尺寸。这里的框的形状可以不是矩形。
接着，数据生成控制部11令显示/输出部13显示图像，询问用户步骤S110显示的矩形框是否置成要显示讲话框的范围。根据用户的纠正指令，数据生成控制部11按指令把另一矩形框置成要显示讲话框的范围(步骤S111)。此时，数据生成控制部11把该矩形框四角的坐标临时存入存储器(未示出)。同时，用户用输入部12作框纠正，如用户先将鼠标指针置于四边或四角的任一处，然后拉出边或角，从而纠正矩形框的尺寸和/或位置。这种方法为图像软件领域所共知，故不再描述。
然后，数据生成控制部11识别电视中人的脸部(步骤S112)。识别方法有多种，如数据生成控制部11可按肤色、脸形等识别人脸部，这类方法已为图像识别领域所共知，故不再描述。
接着，数据生成控制部11找出被识别脸部区域，判断该区域是否超出预定阈值(步骤S113)，若超出，就检测嘴部，令显示/输出部13显示一条从嘴画到矩形框对角线交点(该点下称矩形框中心)的基准线，还在该基准线上示出临时的讲话框始点(步骤S114)。于是，数据生成控制部11进到步骤S116的操作。
反之，若该区域未超出阈值，数据生成控制部11则识别脸中心部，然后令显示/输出部13显示一条从该中心部画到矩形框中心的基准线，还在该基准线上示出临时的讲话框始点，于是进到步骤S116的操作。在图9B的例中，在步骤S115示出这种临时讲话框始点。如图9B所示，在从脸中心到矩形框Sa中心的基准线La上显示出讲话框始点Pa。这样，数据生成控制部11就按脸的大小确定讲话框图像的始点。
在步骤S116，根据用户通过输入部12发来的指令，数据生成控制部11校正讲话框始点，把校正的讲话框始点的坐标存入存储器(未示出)，再进到步骤S117的操作。若用户不发校正指令，数据生成控制部11就存贮临时讲话框始点的坐标。
在步骤S117，数据生成控制部11读出预先置成标准讲话框形状的讲话框形状数据，需要的话改变该讲话框形状的尺寸，使讲话框在步骤S111确定的矩形框内具有最大尺寸，然后在矩形框内改变尺寸后，令显示/输出部13显示讲话框图像。图9C示出一例步骤S117显示的讲话框图像，如图所示，讲话框图像Ba被示成适合矩形框Sa。
然后，根据用户指令，数据生成控制部11校正该讲话框图像(步骤S118)。具体地说，校正讲话框的形状、大小、取向等。例如用户从代表可能的讲话框形状的对话框里选择需要的形状，就可作这样的校正，也可在显示器上拉动讲话框来校正大小。还可用其它各种方法作校正。
若用户完成了校正或用户不发出校正指令，数据生成控制部11就确定最终讲话框图像(步骤S119)，此时数据生成控制部11就把指示讲话框图像形状的名称暂时存入存储器(未示出)。而且，若改变了讲话框图像尺寸，数据生成控制部11就把存在存储器里的四角坐标改为最小尺寸矩形框四角的坐标，以围着尺寸改变的讲话框的作为要显示的讲话框范围。
接下来，数据生成控制部11从字幕表数据里读出字幕开始时间的字幕文本，然后把它们插入确定的讲话框(步骤S120)。此时，在起自字幕开始时间的字幕持续时间内，数据生成控制部11令显示/输出部13开始对各帧显示字幕文本。同样在此时，数据生成控制部11还确定字幕文本展示速度。字幕文本展示速度是通过测定一帧内逐段新显示多少字母而规定的，比如可规定以正常速度在一帧内新显示6个字母。数据生成控制部11还暂时存贮该字幕文本展示速度。图9D示出一例插播字幕文本时的显示，如图所示，字幕文本Ca显示在讲话框图像Ba内。
然后按用户指令，数据生成控制部11校正字幕文本(步骤S121)。这里假定，可作校正的字幕文本属性包括字幕文本类型、字幕文本颜色、字幕背景、字幕透光度、字幕边沿类型和字幕文本加亮。数据生成控制部11还把字幕文本属性暂时存入存储器。注意，数据生成控制部11最好还包括音量确定部，用于确定音响在回放电视内容数据期间的音量。此时，内容生成设备1较佳地按音量确定部所确定的音量改变字幕文本属性，如对大音量，内容生成设备1就放大字幕文本或改变其颜色。
接着，数据生成控制部11读出暂存在存储器里的信息，把字幕持续时间、字幕文本展示速度、字幕文本属性、讲话框范围(矩形框四角坐标)、讲话框始点坐标、讲话框形状和字幕文本存入存贮部15(步骤S122)。
然后，数据生成控制部11判断是否完成了整个内容的讲话框数据生成(步骤S123)，若未完成，就对每个字幕开始时间继续生成讲话框数据；若完成了，它就把对每一字幕开始时间生成的诸讲话框数据段合起来，生成对应于所需内容数据的最终讲话框数据，再将它存入存贮部15(步骤S124)。于是，数据生成控制部11结束操作。
图10示出一例最终讲话框数据，该例为了提供与用于内容数据MPEG数据格式的相似并便于标准化，以遵循XML(可扩充的标记语言)的格式描述该讲话框数据。如图10所示，讲话框数据包括字幕文本展示速度、字幕持续时间、字幕范围、字幕始点、讲话框形状和对各字幕开始时间规定的字幕文本。图10中，诸字幕文本属性都用于整个内容，或者对各字幕开始时间不用诸字幕文本属性。
图11是内容发送设备2的操作流程图，下面参照图描述内容发送设备2的操作。
首先，根据用户通过操作部22发来的指令，内容发送设备2的多路复用控制部21读取存在内容生成设备1的存贮部15里的所需的内容数据(步骤S201)，然后从存贮部15中读取相应于内容数据的讲话框数据(步骤S202)，接着把读出的内容数据与讲话框数据复用(步骤S203)。这里可以采用任一种多路复用方法，如嵌入内容数据头部的讲话框数据。
然后，纠错码添加部23对复用数据添加纠错码(步骤S204)，于是数字调制部24用对其添加的纠错码数字调制该复用数据(步骤S205)。接着，发送部25向广播设备3发送数字调制数据(步骤S206)，于是结束处理。
图12是内容回放设备4的操作流程图。图13A~13D示出的实例是基于电视信号、讲话框信号和内容回放设备4所生成的字幕文本信号的图像。下面参照图12和13A~13D描述内容回放设备4的操作。
首先，在内容回放设备4中，接收部36收到的信号被解调部47解调、纠错部48纠错，被输入回放控制部41(步骤S301)。然后，与步骤S303~S312的下述操作同时进行，回放控制部41从纠错的复用数据里读内容数据，再把回放该内容数据所需的视频信号与音频信号送到组合传递部(步骤S302)。图13A示出一列基于视频信号的图像。如图13A所示，在步骤S302，除了讲话框信息外，只传递声像信息。
然后，回放控制部41从复用数据里读取讲话框数据，得到字幕的开始与持续时间(步骤S303)。接着根据来自计时部44的信息，回放控制部41判断是否到了字幕开始时间(步骤S304)，若未到，就进到步骤S312的操作。
反之，若到了字幕开始时间，若字幕开始时间到了，则根据讲话框数据包含的讲话框范围，回放控制部41在屏上设置插讲话框的范围(步骤S305)，然后根据讲话框数据包含的讲话框形状从讲话框形状存贮部45中读出指定讲话框形状的信息，再确定讲话框图像大小，使该讲话框适合步骤S305找出的范围(步骤S306)。接着，回放控制部41生成讲话框信号，使确定了尺寸的讲话框图像显示在设置的范围内，再把该讲话框信号送到组合传递部43(步骤S307)。这时，即使讲话框形状在字幕持续时间内不变，在作其它操作的同时，回放控制部41也对各帧送出讲话框信号，以便与视频信号和字幕文本信号同步。图13B示出一例基于讲话框信号的图像(讲话框图像)，如图所示，该讲话框信号只提供讲话框图像信息。
然后根据存在讲话框数据里的字幕持续时间，回放控制部41查出字幕持续时间内的帧数(步骤S308)，再把字幕字母数除以步骤S308查出的帧数，得出每帧显示的字幕字母数，生成每帧显示字幕文本的字幕文本信号(步骤S309)，并将该信号送到组合传递部(步骤S310)。图13C示出一例第一帧内基于该字幕文本信号的图像，图13D示出一例第二帧内基于字幕文本信号的图像。如图13C和13D所示，根据字幕文本信号，在字幕持续时间内，逐渐出现要显示的字幕文本。
然后，回放控制部41判断在字幕持续时间内是否回放了所有的帧(步骤S311)，若未完成，就返回步骤S308的操作，生成下一帧所需的字幕文本信号以传到组合传递部43；若完成了，则判断是否完成了内容回放(步骤S312)；若未完成，回放控制部41就返回步骤S304的操作，对下一个字幕开始时间传递讲话框信号和字幕文本信号；反之若完成了，则结束操作。
图14示出内容回放设备4的组合传递部43的操作，图15A与15B示出几例内容显示设备5上的显示，下面参照这些图描述组合传递部43的操作。
首先，组合传递部43接收回放控制部41发出的每帧视频信号(步骤S401)，然后接收回放控制部41发出的讲话框信号和每帧字幕文本信号，并把视频信号与讲话框信号和字幕文本信号组合起来(步骤S402)，同音频信号一起传到内容显示设备5(步骤S403)。然后组合传递部43返回步骤S401，进入下一帧处理。
从组合传递部43收到信号后，内容显示设备与立即显示第一帧内的一部分字幕，如图15A所示，然后与第一帧内显示的字幕部分一起显示第二帧内剩余的字幕部分，如图15B所示。
这样，根据本发明该实施例，字幕文本被插入电视内容的讲话框部分供显示，这样很容易理解讲话者与字幕的关系。再者，利用显示在讲话框部分里的字幕文本，很容易观看屏幕。
在本实施例的内容回放设备和内容显示设备中，即使无音响，只要看一下讲话框始点就可明白谁在讲话，因而在必须不发出音响的环境中，可帮助用户理解电视内容，这样用户不用耳机之类的设备便能欣赏电视内容。
例如，若内容回放设备和内容显示设置放在要禁声的地方，诸如图书馆、医院、公共场所等，用户能欣赏电视内容而不打扰别人。此时，可在个人计算机上容易地实现内容回放设备和内容显示设备。另在周围噪声大得难以倾听音响的环境中，当把内容回放设备和内容显示设备安置成室外广告设备或公共导向服务设备时，用户观看使用讲话框的字幕就能欣赏电视内容，不必收听音响。
本例中，内容回放设备和内容显示设备分开设置，也可把这些设备合成一台设备，做成小得可携带。有了这种便携式信息终端，即使在按一般规矩要将音响置成最小的环境中(如火车内、公共汽车内、船上、飞机上、图书馆、医院里)，用户也能欣赏电视内容。这样，能以各种方式有效地使用本发明。
另外，在内容回放设备和内容显示设备的功能中，某一功能可以包含在另一功能内。而对于内容生成设备和内容发送设备，某一功能也可含在另一功能内。
如上所述，为了以各种方式更有效地应用本发明，内容回放设备(包括里面配有内容显示设备)包括下述诸功能则更佳。
例如，较佳地把内容回放设备配置成选择是否按用户指令显示讲话框。具体而言，当用户发出不显示讲话框指令时，内容回放设备的回放控制部就会组合传递部只组合视频与音频信号。
或者，内容回放设备自动选择是否显示讲话框。例如，内容回放设备还可包括测量周围音量的音量测量部，内容回放设备把扬声器输出而被音量测量部测得的音量与周围音量作比较，若周围音量大于预定阈值，内容回放设备的回放控制部就停止扬声器的音响输出，令组合传递部切换到组合处理作字幕文本显示。这样，在周围声音变大时，显示就自动切换到讲话框字幕显示，因此即使在声音不易通过的环境中，用户也能欣赏电视内容。
或者，在周围音量小于预定阈值时，内容回放设备的回放控制部以某种模式自动处理，停止扬声器的音响输出，令组合传递部切换到组合处理，作讲话框字幕显示。这样在用蜂窝电话或PDA等移动终端构成内容回放设备时，该移动终端便自动进入周围寂静的工作模式，用户在这种环境里欣赏电视内容。
或者，内容回放设备还可包括移速测量部，利用加速度传感器或考虑到接收电波的多普勒效应测量移动终端的速度。当移速测量部测出的移动速度快于步行速度时，内容回放设备的回放控制部断定用户正在驾车或坐在车内，并令组合传递部切换到某种模式的讲话框字幕显示。
或者，根据用户指令，内容回放设备在常规定幕显示与讲话框字幕显示之间切换。具体地说，按用户的常规定幕显示指令，内容回放设备只参照字幕的开始与持续时间和字幕文本信息，生成字幕文本信号，让字幕文本在起自字幕开始时间的字幕持续时间内位于屏内沿。然后，组合传递部把字幕文本信号与视频信号组合起来，在内容显示设备上显示。这样，也可作常规字幕显示。
或者，在生成字幕表数据时，内容生成设备生成的字幕表数据里记录了按声压电平增亮文本的信息。具体而言，内容生成设备可以包括声压检测设备，用压电传感器等检测声压。当声压在字幕持续时间内的平均值大于阈值时，就在字幕表数据里记录扩大文本的属性；当平均值小于阈值时，在字幕表数据里记录缩减文本的属性。
这时，当字幕文本因字幕持续时间短而不适合讲话框时，内容生成设备令显示/输出部显示一标记等，指示字幕文本不适合该讲话框，由此通知了用户，按此通知，用户改变讲话框或字幕文本的大小。内容生成设备通过判断单位时间(如每帧)的字幕字母数在字幕持续时间内是否等于或大于预定数，断定字幕文本是否适合讲话框。若字幕字母数等于或大于预定数，内容生成设备就断定字幕不适合讲话框，通知用户要更改字幕文本。
若字幕字母数很大，则先显示适合讲话框的一部分字幕字母，再新显示其适合同一讲话框的下面剩余部分。具体而言，内容回放设备在步骤S309生成一指示下面剩余部分字幕字母的字幕文本信号，很容易实现这一要求。
讲话框形状数据最好实现标准化，但若在内容生成设备与内容回放设备之间使用不同类型的讲话框形状数据，则内容回放设备用按指南预定的标准数据作为讲话框形状数据。
本例中，内容生成设备分别生成字幕表数据和讲话框数据，或者与讲话框数据一起生成字幕表数据。具体地说，内容生成设备在检出音频开始后，可同时记录讲话框形状和字幕文本。
本例中，字幕表数据在正好生成讲话框数据之前生成，或者预先生成，与讲话框数据分开。
本例中，内容生成设备先自动选一讲话框形状，需要时再由用户校正。或者，内容生成设备阻止用户校正，而是自动生成讲话框数据。再或者，以人工方式生成整个讲话框数据。
本例中，播发内容数据与讲话框数据，但这并不表示限制提供内容的系统。
图16示出的整个系统配置，用于经因特网提供内容数据与讲话框数据。如图16所示，内容发送设备2a可经因特网3a向内容回放设备4a发送复用内容数据与讲话框数据所得到的数据，此时应用了上述实施例的内容生成设备1和内容显示设备5。内容发送设备2a经因特网按TCP/IP对复用数据作分组传输，内容回放设备4a接收经因特网以分组为单位发送的复用数据。
图17示出的整个系统配置，用于分布复用内容数据与讲话框数据而得到并存入封装媒体里的数据。如图17所示，封装媒体形成设备2b把复用数据存入DVD之类的记录媒体而形成封装媒体，通过分布系统3b供给观众。封装媒体回放设备4b读取存在封装媒体里的复用数据，与讲话框字幕一起回放电视内容。
用于生成、发送、回放和提供带讲话框字幕的电视内容的诸设备与系统以及这些设备所使用的数据结构与记录媒体，可便于理解讲话者与字幕的关系，也便于观看整个屏幕，适用于内容制作等领域。
虽已详述了本发明，但前面描述在各方面都是示例而非限制。应该理解，可以设想出各种其它修正与变化而不违背本发明的范围。
权利要求
1.一种生成提供带讲话框字幕电视内容所需的数据的内容生成设备，其特征在于包括讲话框显示时间提取装置，可根据用作原始数据的电视内容数据，提取电视中显示讲话框的时间；讲话框区域确定装置，可确定适合在讲话框显示时间提取装置提取的时间在电视中显示讲话框的讲话框区域；讲话框图像确定装置，可确定准备与讲话框区域确定装置确定的讲话框区域组合的讲话框图像；字幕文本确定装置，可确定准备与讲话框图像确定装置确定的讲话框图像组合的字幕文本；和讲话框数据生成装置，可用以下至少一条信息生成讲话框数据讲话框显示时间，讲话框区域，讲话框图像和字幕文本，其中讲话框数据生成装置生成的讲话框数据与电视内容数据一起回放，从而提供带讲话框字幕的电视内容。
2.如权利要求1所述的内容生成设备，其中讲话框区域确定装置根据电视内容数据检测电视中的色调变化，在浅色调中提取浅色部分，并把包含在浅色部分里的一帧取作讲话框区域，而讲话框图像确定装置把允许字幕文本显示在该帧内的图像作为讲话框图像。
3.如权利要求2所述的内容生成设备，其中讲话框区域确定装置按用户指令通过改变提取的帧来确定讲话框区域。
4.如权利要求2所述的内容生成设备，其中讲话框图像确定装置按用户指令改变讲话框图像的形状。
5.如权利要求2所述的内容生成设备，其中字幕文本确定装置按用户指令确定字幕文本。
6.如权利要求5所述的内容生成设备，其中字幕文本确定装置判断单位时间字幕文本的字幕字母数在讲话框显示时间内是否等于或大于一预定数，在字幕字母数等于或大于该预定数时，通知用户要更改变字幕文本。
7.如权利要求2所述的内容生成设备，其中字幕文本确定装置按用户指令确定字幕文本的属性。
8.如权利要求1所述的内容生成设备，其特征在于还包括多路复用装置，可复用电视内容数据与讲话框数据生成装置生成的讲话框数据。
9.如权利要求8所述的内容生成设备，其特征在于还包括多路复用数据发送装置，可通过网络发送复用装置通过复用得到的数据。
10.如权利要求8所述的内容生成设备，其特征在于还包括封装媒体存贮装置，可在封装媒体中存贮多路复用装置通过复用得到的数据。
11.如权利要求1所述的内容生成设备，其特征在于还包括音量确定装置，可确定回放电视内容数据期间的音量，其中字幕文本确定装置按照音量确定装置确定的音量改变字幕文本的属性。
12.如权利要求1所述的内容生成设备，其特征在于还包括脸大小提取装置，可根据电视内容数据提取电视中人脸的大小，其中讲话框图像确定装置按照脸大小提取装置提取的脸大小确定讲许框图像的始点。
13.如权利要求1所述的内容生成设备，其中电视内容数据通过MPEG(运动图片专家组)编码，而讲话框数据用XML(可扩充的标记语言)描述。
14.一种内容发送设备，用于发送提供带讲话框字幕的电视内容所需的数据，其特征在于包括讲话框数据获取装置，可获取通过用以下至少一条信息产生的讲话框数据基于用作原始数据的电视内容数据在电视中显示讲话框的时间、准备在电视上显示讲话框的区域、区域内讲话框的形状和准备插入讲话框内的字幕文本；电视内容数据获取装置，可获取电视内容数据；复用装置，可复用讲话框数据获取装置得到的讲话框数据与电视内容数据获取装置得到的电视内容数据；和发送装置，可发送通过多路复用装置复用得到的数据。
15.如权利要求14所述的内容发送设备，其中发送装置向广播设备发送复用数据以作无线广播。
16.如权利要求14所述的内容发送设备，其中发送装置向内容回放设备发送复用数据，以回放电视内容数据和讲话框数据。
17.一种存贮内容的封装媒体生成设备，用于制作内存带讲话框字幕电视内容所需数据的封装媒体，其特征在于包括讲话框数据获取装置，可获取用以下至少一条信息生成的讲话框数据基于用作原始数据的电视内容数据在电视中显示讲话框的时间、电视上准备显示讲话框的区域、区域内讲话框的形状和准备插入讲话框的字幕文本；电视内容数据获取装置，可获取电视内容数据；多路复用装置，可复用讲话框数据获取装置得到的讲话框数据与电视内容数据获取装置得到的电视内容数据；和存贮装置，可在封装媒体内存贮通过多路复用装置复用得到的数据。
18.一种回放带讲话框字幕电视内容的内容回放设备，其特征在于包括讲话框数据获取装置，可获取用以下至少一条信息生成的讲话框数据基于用作原始数据的电视内容数据在电视中显示讲话框的时间、电视上准备显示讲话框的区域、区域内讲话框的形状和准备插入讲话框的字幕文本；电视内容数据获取装置，可获取电视内容数据讲话框信号生成装置，可根据讲话框数据生成讲话框图像信号；字幕文本信号生成装置，可根据讲话框数据生成字幕文本信号；视频信号生成装置，可根据讲话框数据生成字幕文本信号；视频信号生成装置，可根据电视内容数据生成电视信号；和组合传递装置，可组合讲话框信号生成装置生成的讲话框信号、字幕文本信号生成装置生成的字幕文本信号和视频信号生成装置生成的视频信号而生成组合信号，并把该组合信号传到显示设备。
19.如权利要求18所述的内容回放设备，其特征在于还包括组合/不组合命令装置，可令组合传递装置把讲话框信号和字幕文本信号同视频信号相组合或不组合，其中在收到来自组合/不组合命令装置的把讲话框信号和字幕文本信号同视频信号相组合的指令时，组合传递装置把组合的信号传到显示设备，而在收到不组合讲话框信号、字幕文本信号和视频信号的指令时，组合传递装置向显示设备只传送视频信号。
20.如权利要求18所述的内容回放设备，其特征在于还包括音量测量装置，可测量周围的音量；和音量阈值确定装置，可确定音量测量装置测出的周围音量是否超出阈值，其中组合/不组合命令装置根据音量阈值确定装置的判断结果，令组合传递装置把讲许框信号和字幕文本信号组合或不组合视频信号。
21.如权利要求20所述的内容回放设备，其中当音量阈值确定装置断定周围音量不超出阈值时，组合/不组合命令装置就令组合传递装置把讲话框信号和字幕文本信号同视频信号相组合，并防止音响输出设备输出音响。
22.如权利要求20所述的内容回放设备，其中当音量阈值确定装置断定周围音量超出阈值时，组合/不组合命令装置令组合传递装置把讲话框信号和字幕文本信号同视频信号相组合/
23.如权利要求18所述的内容回放设备，其特征在于还包括移速测量装置，可测量内容回放设备的移动速度，其中组合/不组合命令装置判断移速测量装置测出的移速是否超出预定阈值，当移速超预定阈值时，令组合传递装置把讲话框信号和字幕文本信号同视频信号相组合。
24.如权利要求19所述的内容回放设备，其中组合/不组合命令装置按用户指令，令组合传递装置把讲话框信号和字幕文本信号组合或不组合视频信号。
25.如权利要求18所述的内容回放设备，其中按用户指令，字幕文本信号生成装置根据讲话框数据生成正常字幕文本信号，在屏内沿显示字幕文本，而当字幕文本信号生成装置生成正常字幕文本信号时，组合传递装置只组合正常字幕文本信号和视频信号而生成组合信号，并把组合信号传到显示设备。
26.如权利要求18所述的内容回放设备，其中组合传递装置对每一帧都组合讲话框信号、字幕文本信号与视频信号。
27.如权利要求18所述的内容回放设备，其特征在于还包括显示装置，可根据组合传递装置传来的组合信号，在组合后显示电视。
28.一种在其上记录了数据的计算机可读记录媒体，数据结构使计算机设备显示带讲话框字幕的电视内容，其特征在于数据包括根据用作原始数据的电视内容数据，存贮电视中显示讲话框的时间信息的结构；在相应于时间信息的电视中存贮准备显示讲话框的区域信息的结构；在对应于时间信息的区域内存贮讲话框形状信息的结构；和在对应于时间信息的讲话框内存贮要插入字幕文本信息的结构。
29.如权利要求28所述的计算机可读记录媒体，其中存贮时间信息的结构包括存贮指示字幕开始时间信息的结构；和存贮指示字幕持续时间信息的结构。
30.一种让计算机设备显示带讲话框字幕电视内容的数据结构，其特征在于该数据结构包括根据用作原始数据的电视内容数据存贮电视中显示讲话框的时间信息的结构；在对应于时间信息的电视中存贮准备显示讲话框区域信息的结构；在对应于时间信息的区域中存贮讲话框形状信息的结构；和在对应于时间信息的讲话框内存贮准备插字幕文本信息的结构。
31.一种内容提供系统，其特征在于包括讲话框数据生成设备，可用以下至少一条信息生成讲话框数据基于用作原始数据的电视内容数据在电视中显示讲话框的时间、准备在电视上显示讲话框的区域、区域内讲话框的形状和准备插入讲话框内的字幕文本。内容提供装置，可复用基于用作原始数据的电视内容数据在电视中显示讲话框的时间、准备在电视上显示讲话框的区域、区域内讲话框的形状和准备插入讲话框内的字幕文本数据生成设备生成的基于用作原始数据的电视内容数据在电视中显示讲话框的时间、准备在电视上显示讲话框的区域、区域内讲话框的形状和准备插入讲话框内的字幕文本数据和电视内容数据而生成复用数据，并把复用数据作为电视内容提拱；和内容回放设备，可根据内容提供装置提供的复用数据回放带讲话框字幕的电视内容。
32.如权利要求31所述的内容提供系统，其中内容提供装置通过无线广播向内容回放设备发送复用数据。
33.如权利要求31所述的内容提供系统，其中内容提供装置通过网络分布向内容回放设备发送复用数据。
34.如权利要求31所述的内容提供系统，其中内容提供装置通过封装媒体向内容回放设备发送复用数据。
全文摘要
一种内容生成设备，可为提供带讲话框字幕的电视内容生成所需的讲话框数据。讲话框数据包括以下至少一条信息讲话框显示时间、准备显示讲话框的区域、讲话框形状和准备插入讲话框的字幕文本。内容发送设备复用讲话框数据与内容数据，让广播设备播发复用数据。内容回放设备分析讲话框数据以生成讲话框图像信号和字幕文本信号，把这些信号与电视图像信号相组合，再让内容显示设备显示带讲话框字幕的电视。
文档编号H04N7/24GK1602051SQ200410012099
公开日2005年3月30日申请日期2004年9月27日优先权日2003年9月26日
发明者小林浩二申请人:松下电器产业株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：小林浩二
技术所有人：松下电器产业株式会社
我是此专利的发明人

上一篇：地下空间无源中继通信系统的制作方法
下一篇：用于交互式电视的系统的制作方法