视频信号中编码文本的翻译的制作方法

文档序号:6353203阅读:220来源:国知局
专利名称:视频信号中编码文本的翻译的制作方法
视频信号中编码文本的翻译
本发明专利申请是国际申请号为PCT/US2004/033167,国际申请日为2004年10 月7日,进入中国国家阶段的申请号为200480037755. 3,名称为“视频信号中编码文本的翻 译”的发明专利申请的分案申请。
背景
本发明涉及使用广播和多播媒体表示文本的领域,具体地说,涉及当在广播或多 播频道上接收到编码文本时,翻译所述编码文本。
现在许多广播和多播视频信号包括可以在电视或其他显示设备上显示的文本。 一种此类文本是隐藏式字幕(CC)文本。典型地,CC文本是视频中所说的文字的抄本 (transcription),此抄本有时还有对声道(soundtrack)中具有少量文字的部分的描述性 叙述。开始CC文本是为了方便有听力障碍的残障人士,后来CC文本也用在周围噪音级别 (或者很高或者很低)使得信号中音频部分很难听见的环境中,例如酒吧、餐馆、机场、医务主寸。
存在被包括在视频信号中的其他文本服务,所述服务包括可以包含文本的 TeleText, Ceefax和Oracle,所述文本涉及节目、电子节目指南、新闻、体育和紧急通告以 及许多其他类型的信息。现在,大多数文本服务被编码到视频信号的VBI (垂直消隐间隔) 内。但是,数字视频信号,包括MPEG-2(活动图像专家组)编码信号,也被构建(structure) 来将一些文本数据与信号的音频与视频部分一同携带(carry)。
在任何视频信号中可以携带的文本数量受编码系统的限制。使用VBI系统仅具有 有限量的用于携带文本的容量。由于CC文本必须全部被携带在VBI的21线上,所以存在 有限的可以被编码到每帧内的字符数。此外,可以被传输的字符和格式(formatting)的类 型受到限制,例如,既不支持Cyrillic、Arabic和Asian字符也不能修改这些字符的大小和 字体。TeleText具有更好的性能,但是仍然显著地受到限制。
嵌入式文本信号也受到信号创建者或提供者决定传送的内容的限制。例如在美 国,可以获得英语CC文本,并且通常可以获得西班牙语的文本。信号中的容量和市场需求 几乎无法考虑任何其他选择。由于缺乏容量和市场需求,不支持将文本翻译成葡萄牙语、亚 美尼亚语、匈牙利语和许多其他语言。不能提供到中文、保加利亚语、泰语和希伯来语的翻 译,是因为编码结构不支持在这些和许多其他语言中使用的字符。TeleText和其他编码文 本传输系统遭遇类似的约束。
附图简要说明
从下面给出的详细说明和本发明的各种实施方案的附图将能够更完整地理解本 发明。然而,这些附图并不把本发明限制于特定实施方案,而仅仅是用于解释和理解。


图1是根据本发明的一个实施方案,翻译隐藏式字幕文本的流程图2是根据本发明的一个实施方案,隐藏式字幕文本翻译系统的框图3是适合于实现本发明的实施方案的媒体中心的框图;以及
图4是适合于与本发明一起使用的娱乐系统的框图。
详细描述
参见图1,隐藏式字幕或其他类型的编码文本数据可以被翻译成用户选择的任何 语言。首先,在框13中接收具有编码文本数据的视频信号。可以从任意的各种不同来源, 例如录像带、盘或存储器播放器、网络连接或广播调谐器接收视频信号。这些视频信号的一 个普遍来源是通过无线和有线(cable)媒体的电视广播。这些信号可以是任意的支持编码 文本的类型。美国已经采用NTSC(全国电视标准委员会)和ATSC(先进电视系统委员会) 标准,而欧洲已经采用PAL(逐行倒相)和SECAM (顺序传送彩色与记忆)标准等等,而且日 本还使用不同的标准。
编码文本可以对应许多不同的格式,所述格式使用在用于传输编码文本的这些和 其他标准中。在模拟视频信号中,编码文本通常在对应于信号的VBI (垂直消隐间隔)的光 栅扫描线中传输。CC(隐藏式字幕)、Videotex、TeleText、Ceefax、Oracle和其他标准也使 用VBI中的线。
数字信号还分配每个分组(packet)的某个部分用于文本数据的传输。ATSC分派 (allocate)9600比特每秒的数据速率供隐藏式字幕使用。这是NTSC系统中的容量的10倍, 并且扩展了提供修饰(embellished)文本特性、多种颜色、更多语言频道以及许多其他特 征的能力。HD-SDI(高清晰串行数字接口)隐藏式字幕和相关数据携带在HD-SDI比特流、 图像用户数据、节目映射表(PMT)和事件信息表(EIT)的三个分别的部分中。字幕文本和 窗体命令被携带在HD-SDI运送频道中(所述频道依次地被携带在图像用户位中)。HD-SDI 字幕频道服务目录被携带在PMT中,并且用电缆可选地携带在EIT中。
存在许多其他使用中和开发中的文本编码系统。上面提及的文本编码系统被提供 来作为实施例。本发明可以被应用于任何编码或同时传输的文本,而不管是如何接收、编码 或调制所述文本的。所述文本可以包括嵌入式和边带(sideband)文本数据以及在不同频 道、频率或流上提供的补充(supplemental)文本数据。
接收完视频信号后,在框15中编码文本数据被解码。解码可以由常规的CC或 TeleText解码器执行,所述解码器在商业上可以从很多种类的不同来源获得。可替换 地,解码器可以是一般化的数字解码器或其他视频处理设备的部分。对于本发明的NTSC CC文本实施方案而言,解码器读取VBI的21线上的信号,并将这些信号解码成字母数字 (alphanumeric)字符。不同的模拟和视频标准应用不同的规范(convention)。
解码处理的结果通常是与视频同步的有序文本串。文本可以使用与视频节目相 同的语言(例如CC或Oracle文本),或者使用与视频节目不同的语言(例如对白字幕 (subtitle))。但是,使用一些文本系统时,文本不需要或不要求任何与视频的同步。例如, 如果文本涉及职业体育比赛的比分,那么比分可以与当前视频的时间安排(timing)没有 任何显著的关系。例如,Oracle被用来传送视频声道的抄本,而TeleText提供一般新闻信 息,所述一般新闻信息与携带它的视频没有特定的关系。
在框17中翻译已解码文本数据。翻译可以以不同的方式发生。在一个实施方案 中,向电子字典查询所述文本,所述电子字典将初始语言的文字替换为另一种语言的文字。 通过为语言提供合适的字典,可以支持任何语言。使用软件翻译系统,可以调整翻译的语 法、用法、术语和其他细微差别,以提供经改进的翻译。可以使用任何各种不同的翻译系统。 翻译导致另一种语言的新的文本流。
然后,已翻译文本可以在框19中与视频信号组合在一起。与视频的此组合可以通过用新文本替换初始的编码文本来完成,或者可以创建组合了文本和视频的全新视频信 号。如何显示已翻译文本的选择将取决于包括接收器和显示系统的功能的具体应用。
在另一个实施方案中,不翻译文本。文本被如上所述地解码,并且向字典查询所述 文本。然而,通过提供与已解码文本相同语言的字典,所述字典可以用来纠正编码文本中的 拼写、语法和句法错误。对于直播事件和一些低预算的作品(production),文本是被实时或 匆忙录入的并且之后没有被编辑。于是,字典可以用来纠正简单的错误。然后,已纠正文本 可以如上面关于参考图1的框19所描述的那样与视频信号组合在一起。
参见图2,示出了能够翻译编码文本的调谐器系统11。此系统可以被构建在单个 适配器卡或印刷电路板上、在单个模块上,或者可以从更大系统中的不同位置上连接在一 起,所述系统的一个实施例是在图3中示出的媒体中心。此系统可以是电视或视频显示器、 视频或音频记录器、用于连接到娱乐系统的分离的调谐器或任何各种其他设备。
图2的调谐器系统11具有一个或更多个模拟、数字或组合视频调谐器13。所述调 谐器可以具有相同类型,以允许画中画观看或同步观看和记录(recording),或者它们可以 具有不同类型,以允许接收不同种类的来源。调谐器可以用于各种不同的模拟和数字电视 或视频信号(不论是广播、多播还是点到点)中的任意一种。实施例包括NTSC、ATSC信号, PAL(逐行倒相)、各种可能的标准下的有线电视信号,或任何其他类型的音频或视频信号。
在本实施例中,调谐器被耦合到电视同轴电缆、陆地广播天线或DBS(直播卫星) 天线,并创建应用于其他组件的MPEG-2(活动图像专家组)编码信号。优选的(preferred) 输出信号的准确性质(nature)将取决于特定的设备。作为替换,调谐器可以包括解码器, 从而产生未压缩的数字或模拟视频输出信号。
在本实施例中,调谐器输出信号被应用于隐藏式字幕(CC)解码器27,以从已调 谐信号中提取数字字符串。被提取的字符串被传送到CC逻辑(logic) 29,所述CC逻辑四 决定CC文本是否应该被示出和是否应该被翻译。此逻辑可以驻留在调谐器系统中或者驻 留在系统中的某个其他处理器中。基于这些决定,文本可以被传送到翻译引擎31,所述翻 译引擎向字典15查询所述文本。所述字典提供使用其自身语言的单词、短语、表达或直 译(transliteration)来替换CC文本。对CC文本的实施例来讲,文本通常包括常用短语 (stockphrase),所述常用短语传递(relay)关于场景中接下来是什么的信息。这些短语可 能翻译得不好。因此,为CC文本的常用短语特别设计的自定义字典可以用来增强翻译的可 理解性。
已翻译CC文本被传送回CC逻辑以供使用。CC逻辑、翻译引擎和字典可以全部在 相同硬件中实现或在系统的不同部分中实现。字典可以存入可重写存储器,从而可以为不 同的用户支持不同的语言。可以在单个组件内或者在通信总线(例如I2C(Inter-IC,飞利 浦半导体设计的一种总线))或任何其他类型数据总线上执行这些通信。
同样类型的翻译处理也可以被应用于音频信号。已经提出各种标准用于补充具有 文本的广播音频,并且一些卫星无线电系统已经这样做了。AM(调幅)和FM(调频)广播无 线电可以携带包括PTY(节目类型)数据的RDS (无线电数据系统)文本。翻译可以被应用 于此文本或任何其他嵌入或旁带数据,从而在被显示前所述数据被提取和翻译。
替换上面描述的RF(射频)调谐器或除上面描述的RF(射频)调谐器之外,可以使 用复合视频调谐器。此设备可以允许系统接收来自录像机、摄像机、外部调谐器或任何其他6设备的视频和音频信号。然后,此信号可以通过解码器27和翻译引擎四以与任何其他视 频或音频信号相同的方式来处理。大量各种不同连接器可以被用于此调谐器,从同轴电缆 到RCA分量视频、S-Video, DIN连接线、DVI (数字视频接口)、HDMI (高清晰多媒体接口)、 VGA(视频图形适配器)等等。
如图2进一步示出,CC解码器将视频(包括任意音频)频道(channel)传送到图 形控制器或其他视频信号处理设备的视频平面(plane) 17。适当的设备可以是图3的图形 控制器41,但是也可以使用更强或更弱性能的组件。已翻译CC文本在图形平面19上被传 送到相同控制器。这些信号在阿尔法混合器(blender)中被组合,以产生可以被视频设备 显示和存储的信号。阿尔法混合器使用阿尔法值将视频和图形平面混合在一起,以提供菜 单、EPG(电子节目指南)数据和节目信息。视频平面、图形平面和阿尔法混合器的功能可 以由许多其他设备来执行。图2的体系结构对于本发明不是必需的。
已混合的输出可以或者是具有不同编码文本的相同视频信号,或者是包括作为视 频图像的部分的已翻译文本的视频信号。在一个实施方案中,观众被允许选择编码文本或 者作为图形嵌入在视频中的文本。通过编码已翻译文本和替换初始文本,图形控制器允许 所有的常规的文本编码、解码和显示技术来控制文本。例如,使用具有CC文本的NTSC信号 时,电视屏幕(monitor)可以使用电视的内建解码器显示已翻译文本。文本显示功能可以 由电视控制,而无须将任何命令传送到调谐器系统或CC逻辑。另一方面,将文本包括在视 频图像中,避免了在显示器中对解码器的需要并降低了对编码文本与特定视频帧同步的精 确性要求。
可替换地,通过生成已翻译字符的图形显示并且将这些字符与视频信号的图像组 合在一起,文本数据系统的性能可以得到加强。例如,可以扩展字符的数目。从英语到法语 的翻译可能通常需要比原始的英语多百分之五十的字符。如果编码文本已经接近它的最大 容量,那么法语翻译不能以与英语文本同样的方式被编码到视频信号中。可以生成可视文 本、文字电视广播、隐藏式字幕或其他文本系统不支持的其他字符。例如,具有编码英语CC 文本的ATSC信号可以被翻译成中文并使用传统或现代汉字来显示。在CC编码中完全不支 持中文。
除了将文本叠加在视频上,已翻译文本可以以不同大小、字体、具有不同背景效果 的颜色等来被示出。可以在显示器上提供任何可以被编程到视频处理器21中的性能,而不 需要在所述显示器中具有文本解码器。可以为观众提供菜单来选择文本的背景类型(例 如标准黑、其他颜色或透明)、文本的颜色、文本的位置以及字体和大小。例如,当观看的视 频使用的格式比显示器屏幕更宽时,观众可以选择将文本放在比水平黑条更高或更低的位 置。如果文本被编码回视频信号中,则这是不可能的。
图3示出适于使用上面描述的调谐器系统的媒体中心43的框图。图2的系统可 以是整个更大的系统。被示出并关于图2描述的硬件足够用来提供具有增强文本性能的集 成或机顶调谐器盒。它在调谐器13处接收输入并提供来自阿尔法混合器21的输出。通过 显示器以及用户输入的用户接口可以由逻辑引擎四来管理和处理。可以使用磁带、盘或存 储器记录器、使用附加的输入和输出或附加的调谐器来增加图2的硬件。字典15可以被提 供为厂家默认或者为可互换存储器芯片或模块。通过提供输入/输出接口,字典可以在相 同或不同的存储器中被更新、修改或替换,以提供任何期望的一种或多种语言。输入/输出接口可以直接地或通过逻辑引擎四指向字典。
在图3中,图2的更简单系统的性能被广泛地增强了。使用例如上面描述的I2C 接口,图2中的调谐器系统11被耦合到图形控制器41。在一个实施方案中,视频平面17、 图形平面19和阿尔法混合器21都驻留在图形控制器内。但是,其他体系结构也是可能的。 关于图2描述的多个视频、音频和文本输出被耦合到复用器51。如果需要的话,其他源也可 以被耦合到复用器,例如IEEE 1394装置53被示为也被耦合到复用器。一些这样的设备可 以包括磁带播放器、盘播放器和MP3播放器等等。在图形控制器控制下的复用器选择调谐 器或其他输入中的哪一个将被连接到媒体中心的其他部分。
被选出的调谐器输入被耦合到复用器输出。在本实施例中,这些复用器输出分别 被路由到各自的MPEG-2编码器53-1、53-2,并且随后被路由到图形控制器41。在数字电 视、无线电、数字电缆或卫星信号的情况下,复用器可以将信号路由在MPEG-2编码器周围, 或者当这些信号已经被编码时,禁止(disable)编码过程。
来自图形控制器的视频和音频信号可以是用于显示、储存或记录的输出。在一个 实施方案中,图形控制器包括MPEG-2和MPEG-3解码器以及视频信号处理器,以格式化被期 望的装置使用的视频和音频信号,并将命令、控制、菜单、消息和其他图像与来自调谐器的 视频和音频组合起来。如下面所描述,图形控制器可以驱动整个设备,或者仅操作用于在另 一个高级别处理器控制下的图形功能。
为了简单起见,图3仅示出一个视频输出和一个音频输出,但是输出的数目和种 类可以大大地依赖于具体应用而变化。如果媒体中心作为调谐器来运用,那么单个DVI或 分量视频输出连同单个数字音频输出(例如光学S/PDIF(索尼/飞利浦数字接口))就可 能够用。在示出的配置中,媒体中心可以被用作具有在屏幕上的画中画显示的调谐器,或者 它可以被用来在示出另一个频道的同时记录一个频道。如果媒体中心要提供更多功能,那 么可以期望一种或更多种不同类型的附加音频和视频连接。
用于视频和音频连接的实际连接器和格式可以具有许多不同类型和不同数目。一 些连接器格式包括同轴电缆、RCA复合视频、S-Video、分量视频、DIN(德国工业标准)连接 器、DVI (数字视频接口)、HDMI (高清晰多媒体接口)、VGA (视频图形适配器)以及甚至USB 和IEEE 1394。还存在对于具体应用来说可能是优选的几种不同的专有连接器。可以修改 连接器的类型以适合于具体应用,或者可以作为不同的连接器被采用。
媒体中心也可以包括大容量储存设备,例如硬盘驱动器、易失性存储器、磁带驱动 器(例如用于VTR)或光驱动器。此设备可以用来存储用于图形控制器的指令、维持EPG(电 子节目指南)或记录从调谐器系统接收到的音频或视频。
虽然对于许多消费类电子、家庭娱乐和家庭影院设备,例如调谐器(陆地、有线和 卫星机顶盒)、VTR、PVR和电视等等来说,上面描述的组件足够用。可以使用下面描述的附 加组件的一些来提供另外的功能。此外,前置放大器和功率放大器、控制面板或显示器(未 示出)可以按需要被耦合到图形控制器。
媒体中心还可以包括耦合到主控制器63或芯片组的CPU(中央处理单元)61。 可以使用任意数目的不同CPU和芯片组。在一个实施方案中,使用具有Intel 830芯片 组的移动Intel Celeron 处理器,但是本发明不受此限制。此处理器提供了足够用的处 理能力、连通性和节能模式。主处理器具有耦合到I/O控制器中心(ICH)65 (例如Intel FW82801DB(ICH4))的北桥,以及耦合到板载存储器67 (例如RAM (随机访问存储器))的南 桥。芯片组还具有与图形控制器41耦合的接口。注意,本发明不限于在此建议的处理器的 特定选择。在一个实施方案中,如下所述,翻译引擎31由CPU和芯片组提供,而字典15被 存储在硬盘驱动器87上。
ICH 65提供针对宽范围的不同设备的连通性。已经良好确立的规定和协议可以用 于这些连接。连接可以包括LAN(局域网)端口 69、USB集线器(USB hub) 71和本地BIOS(基 本输入/输出系统)闪存73。SIO(超级输入/输出)端口 75可以为具有按钮和显示器的 前端面板77、键盘79、鼠标81和红外设备85 (例如红外增强器(IR blaster)或遥控传感 器)提供连通性。I/O端口还可以支持软盘、并行端口以及串行端口连接。可替换地,这些 设备的任意一个或更多个可以从USB、PCI或任何其他类型的总线得到支持。
ICH还可以提供用于连接到盘驱动器87、89或其他大存储器设备的IDE(集成电子 设备)总线。大容量储存装置可以包括硬盘驱动器和光驱动器。所以,例如软件程序、用户 数据、EPG数据和已记录娱乐节目可以存储在硬盘驱动器或其他驱动器上。除了 CD (致密 盘)外,DVD(数字多用途盘)和其他储存媒体可以在耦合到IDE总线的驱动器上播放。
PCI (外设部件互连)总线91被耦合到ICH并且允许宽范围的设备和端口被耦合 到ICH。图3中的实施例包括WAN(广域网)端口 93、无线端口 95、数据卡连接器97和视频 适配器卡99。存在更多可用于连接PCI端口的设备和大量更多可能的功能。PCI设备可以 允许到本地设备,例如摄像机、存储器卡、电话、PDA(个人数字助理)或附近的计算机的连 接。它们还可以允许到各种外围设备,例如打印机、扫描仪、录制器(recorder)、显示器等等 的连接。它们还可以允许到更多远程器件或者任意大量不同的接口的有线或无线连接。远 程器件可以允许节目或EPG数据的通信、维护(maintenance)或遥控,或者游戏、因特网冲 浪或其他性能。
最后,ICH被示为具有AC-Link (音频编解码链路)101 Jy^iAC-Link 101是支持 具有针对音频和调制解调器的独立功能的编解码器的数字链路。在音频区中,支持麦克风 输入和左右音频信道。在图3的实施例中,AC-Link支持用于连接到PSTN的调制解调器 103,以及到图形控制器41的音频链路。AC-Link将CPU、主控制器或ICH生成的任何音频 传送到图形控制器,以与音频输出57集成(integration)。可替换地,ISA (工业标准结构) 总线、PCI总线或任何其他类型的连接可以用来达到此目的。如从图3中可以看到的,存在 许多不同方式来支持调谐器产生的信号和控制调谐器的操作。图3的体系结构允许宽范围 的不同功能和性能。特定的设计将取决于特定的应用。
图4示出适于与图3的媒体中心一起使用的娱乐系统111的框图。图4示出具有 宽范围的已安装器件的娱乐系统。此设备作为许多可能性的实施例被示出。本发明可以用 在简单得多或复杂得多的系统中。图3中所描述的媒体中心能够支持通过WAN和LAN连 接、蓝牙、IEEE 802. 11USB、1394、IDE、PCI和红外的通信。此外,调谐器系统接收来自天线、 组件、和复合视频与音频以及IEEE 1394设备的输入。这在设备类型方面提供了极高灵活 性和多样性,所述设备可以被连接到媒体中心并且和媒体中心一起操作。随着新接口被开 发出来并且根据媒体中心的具体应用,其他接口可以被增加或被用来替换那些被描述的接 口。许多连接可以被移除以降低成本。图4中示出的具体设备代表了可以适合于消费者家 庭娱乐系统的配置的一个实施例。
媒体中心43具有上述的几种不同的可能输入。在图4的实施例中,这些输入包括 电视电缆117、广播天线119、卫星接收器121、视频播放器123(例如磁带或盘播放器)、音 频播放器125(例如磁带、盘或存储器播放器)以及数字设备127(例如由IEEE 1394连接 来连接)。
处理、选择和控制后,这些输入可以用来为用户生成输出。这些输出可以在屏幕 129、或投影仪131或任何其他类型的可察觉的视频显示器上被呈现(render)。音频部分可 以通过放大器133 (例如A/V接收器或声音处理引擎)被路由到达耳机135、扬声器137或 任何其他类型的声音生成设备。输出也可以被传送到外部记录器139,例如VTR、PVR、⑶或 DVD记录器、存储器卡等等。
媒体中心还提供通过例如电话端口 141和网络端口 143连接到外部设备的连通 性。通过例如键盘145或遥控器147提供用户接口,并且媒体中心可以通过其自身的红外 端口 149与其他设备通信。可移除储存设备153可以允许在便携式设备上存储MP3压缩音 频并在以后播放所述音频,或者允许在屏幕1 上显示摄像机图像。
存在许多不同的用于使用图3的媒体中心的娱乐中心的设备配置以及要连接设 备的许多不同的可能选择。使用典型的当前可获得设备的典型家庭娱乐系统可以如下所 述。作为输入,所述典型家庭娱乐系统可以具有电视天线119以及到媒体中心的调谐器系 统的有线电视117输入或DBS 121输入中的一个。VTR或DVD记录器可以被连接为输入设 备123和输出设备139。可以增加用于音乐的⑶播放器125和MP3播放器127。此系统 还可以包括宽屏高清晰电视129,以及耦合到六个或八个扬声器137的环绕声接收器133。 此同样的用户系统会拥有供用户使用的小型遥控器147并且提供从媒体中心到电视、接收 器、VTR和⑶播放器的遥控操作149。网络连接141和键盘145将允许网上冲浪、升级和信 息下载,而计算机网络将允许文件交换以及在住宅内的来自个人计算机或到个人计算机的 远程控制。
应该意识到,比上面描述的实施例更少或更多装备的娱乐系统和媒体中心对于某 些实现来说可能是优选的。因此,娱乐系统和媒体中心的配置根据不同的实是变化的,这取 决于多个因素,例如价格约束、性能需求、技术改进或其他情形。本发明的实施方案也可以 被应用于其他类型的软件驱动的系统,所述系统使用与图2、3和4示出的硬件体系结构不 同的硬件体系结构。
在以上描述中,出于解释的目的,阐述了很多具体的细节,以提供对本发明的完整 理解。然而,本领域的技术人员将会清楚,无需使用这些具体的细节中的一些就可以实现本 发明。此外,公知结构和装置以框图形式被示出。
本发明可以包括各种步骤。本发明的步骤可以由硬件组件(例如图2、3和4中示 出的那些)执行,或者可以以机器可执行指令具体实施,所述指令可以用来导致使用所述 指令编程的通用或专用的处理器或者逻辑电路执行所述步骤。可替换地,所述步骤可以由 硬件和软件的组合来执行。
本发明可以被提供为可以包括其上存有指令的机器可读介质的计算机编程产品, 所述指令可以用来给媒体中心(或其他电子设备)编程,以根据本发明来执行处理。机器 可读介质可以包括,但不限于,软盘、光盘、CD-ROM和磁光盘、ROM、RAM、EPROM、EEPR0M、磁卡 或光卡、闪存存储器或是适于存储电子指令的其他类型的媒体/机器可读介质。此外,本发明还可以作为计算机编程产品被下载,其中,所述程序可以以载波或其他传播介质具体实 施的数据信号的方式,经由通信链路(例如调制解调器或网络连接)从远程计算机被传输 到请求的计算机。
许多方法和装置是以它们最基本的形式描述的,但是不背离本发明的基本范围, 可以向方法中增加步骤或从方法中删除步骤,并且可以向描述的装置中增加组件或从描述 的装置中去除组件。本领域技术人员将会清楚可以进行许多进一步修改和改动。具体实施 方案不是提供来限制本发明而是示出本发明的。本发明的范围不由上面提供的特定实施例 确定而仅由所附的权利要求书确定的。
权利要求
1.一种装置,包括视频接收器,所述视频接收器接收具有编码文本数据的视频信号;解码器,所述解码器解码所述编码文本数据;文本翻译器,所述文本翻译器将所述已解码文本数据从所述文本被接收时的语言翻译 成第二种语言;以及视频处理器,所述视频处理器生成已翻译文本数据的字符图像并将所述字符图像叠加 在所述视频信号的视频部分的图像之上以用于显示。
2.如权利要求1所述的装置,其中,所述编码文本数据包括隐藏式字幕文本。
3.如权利要求1所述的装置,其中,所述文本翻译器还包括字典和处理器,所述处理器 向所述字典查询所述已解码文本数据,以翻译所述文本数据。
4.一种方法,包括接收具有编码文本数据的视频信号;解码所述编码文本数据;处理所述已解码文本数据,以生成表示所述已解码文本数据的字符图像;以及将所述字符图像叠加在所述视频信号的视频部分的图像之上以用于显示。
5.如权利要求4所述的方法,其中,解码文本数据的操作包括解码来自所述视频信号 的垂直消隐间隔的文本信号。
6.如权利要求4所述的方法,其中,解码文本数据的操作包括从所述视频信号的视频 传输流中提取文本数据分组。
7.如权利要求4所述的方法,其中,处理文本数据的操作包括向短语字典查询所述已 解码文本中的短语。
8.如权利要求4所述的方法,其中,组合操作包括将所述已处理文本编码成文本数据, 并用所述编码的已翻译文本数据替换所述接收到的视频信号的所述编码文本数据。
9.一种无线视频接收器,包括视频接收器,所述视频接收器接收具有编码文本数据的无线视频信号;解码器,所述解码器解码所述编码文本数据;文本处理器,所述文本处理器处理所述已解码文本数据以生成表示所述已解码文本数 据的字符图像;以及视频处理器,所述视频处理器叠加所述视频信号的视频部分的字符图像以用于显示。
10.如权利要求9所述的调谐器,其中,所述解码器读取来自所述视频信号的垂直消隐 间隔的数据。
11.如权利要求9所述的调谐器,其中,所述解码器包括数字视频传输流解码器。
12.如权利要求9所述的调谐器,其中,所述文本处理器还包括字典和处理器,所述处 理器向所述字典查询所述已解码文本数据,以获得所述已处理文本数据。
13.如权利要求9所述的调谐器,其中,所述视频处理器将所述已处理文本编码成文本 数据,并用所述编码的已处理文本数据替换所述接收到的视频信号的所述编码文本数据。
14.一种系统,包括用于接收具有编码文本数据的视频信号的装置;用于解码所述编码文本数据的装置;用于处理所述已解码文本数据以生成表示所述已解码文本数据的字符图像的装置;以及用于将所述字符图像叠加在所述视频信号的视频部分的图像之上以用于显示的装置。
15.如权利要求14所述的系统,其中,所述用于解码文本数据的装置包括用于从所述 视频信号的视频传输流中提取文本数据分组的装置。
全文摘要
可以基于隐藏式字幕或其他类型的编码文本数据显示各种不同的语言和格式。在一个实施方案中,本发明包括接收具有编码文本数据的视频信号、解码该编码文本数据、翻译已解码文本数据以及将已翻译文本数据与视频信号的视频部分组合以用于显示。
文档编号G06F17/28GK102036045SQ201110008639
公开日2011年4月27日 申请日期2004年10月7日 优先权日2003年10月17日
发明者克里斯托弗·科奈克, 托尼·莫伊 申请人:英特尔公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1