通过隐藏字幕数据创建备选音频的方法和装置的制作方法

文档序号:7967317阅读:124来源:国知局
专利名称:通过隐藏字幕数据创建备选音频的方法和装置的制作方法
技术领域
本发明的实施例一般地涉及数字录像机。具体地说,本发明的实施例一般地涉及用于通过数字录像机呈现的节目的备选音频。
背景技术
电视显然是我们的时代里最有影响力的事物之一。通过被称为电视机或TV的设备,观众能够接收新闻、体育、娱乐、信息和商业节目。电视是最适合边看边听欣赏的媒体。但是,如果观众不理解所说语言或屏幕上显示的文字,他们就不能充分地欣赏电视剧或了解广告产品。当前处理理解备选语言的观众有以下三种方法提供一个或多个专用于备选语言的频道;通过第二套音频节目(SAP)提供备选音频;或者以备选语言提供隐藏字幕(CC)。
专用频道的缺点是将观众限于少数节目频道。同时要为备选语言分配广播频谱的一个频道,并且由于可能需要的语言数量较多,内容提供商(例如,有线或卫星电视公司)必须提供同样多的专用频道。此缺点也影响了SAP和CC,因为它们用于提供备选语言的带宽也是有限的。此外,SAP音频通常由内容的生产者提供,而提供备选音频对于内容生产者是难以承担的。
因此,需要一种用于提供与视频内容关联的备选语言音频和隐藏字幕文字的更好的技术。

发明内容
在一个实施例中,提供了创建具有备选音频段的备选音频文件并在所述备选音频文件中嵌入标记的方法、装置、系统和信号承载介质。每个所述标记都与相应的备选音频段关联,并且所述标记标识了节目中的原始隐藏字幕数据段。将所述备选音频文件发送给客户。所述客户从内容提供商处接收所述节目,将所述标记与所述原始隐藏字幕数据段相匹配,并在所述节目呈现期间通过所述匹配用所述备选音频段替换所述原始音频段。
在一个实施例中,创建包括备选隐藏字幕数据段的备选隐藏字幕数据。将标记嵌入所述备选隐藏字幕数据,每个所述标记都与一个相应的所述备选隐藏字幕数据段关联,并且所述标记标识了节目中的原始隐藏字幕数据段。将所述备选隐藏字幕数据发送给客户。所述客户将所述标记与所述原始隐藏字幕数据段相匹配,并在所述节目的呈现中通过所述匹配用所述备选隐藏字幕数据段替换所述原始隐藏字幕数据段。
在一个实施例中,创建包括备选音频和视频段的备选内容。将标记嵌入所述备选内容,每个所述标记都与一个相应的所述备选音频和视频段关联,并且所述标记标识了节目中的原始隐藏字幕数据段。将所述备选内容发送给客户。所述客户将所述标记与所述原始隐藏字幕数据段相匹配,并在所述节目呈现中通过所述匹配用所述备选音频和视频段替换所述原始隐藏字幕数据段。


图1示出了用于实现本发明的实施例的实例数字录像机的方块图;图2示出了用于实现本发明的实施例的实例计算机系统的方块图;图3示出了根据本发明的实施例的实例语言数据的方块图;图4示出了根据本发明的实施例的实例语言首选项的方块图;图5A示出了根据本发明的实施例的实例节目的方块图;图5B示出了根据本发明的实施例的实例节目、备选音频以及备选隐藏字幕数据的概念视图的方块图;图5C示出了根据本发明的实施例的实例节目和备选内容的概念视图的方块图;
图6示出了根据本发明的实施例的实例处理的流程图;图7示出了根据本发明的实施例的用于转换服务的实例处理的流程图。
具体实施例方式
参考附图,其中相同的数字表示各图中相同的部分。图1示出了根据本发明的实施例的用于记录/播放数字活动图像和/或音频信息的实例数字录像机(DVR)100的方块图。所述数字录像机100包括CPU(中央处理单元)130、存储设备132、临时存储装置134、数据处理器136、系统时间计数器138、音频/视频输入142、TV调谐器144、音频/视频输出146、显示设备148、键盘输入149、编码器150、解码器160以及存储器198。CPU130可通过控制数字录像机100操作的可编程通用中央处理单元来实现。
存储设备132可通过直接存取存储设备(DASD)、DVD-RAM、CD-RW,或者任何其他类型的能够编码、读取和写入数据的存储设备来实现。存储设备132存储节目174。节目174是能够被存储、检索和呈现的数据。在不同的实施例中,节目174可为电视节目、广播节目、电影、视频、音频、静止图像、图形,或者是它们的任意组合。在一个实施例中,节目174包括原始隐藏字幕数据。
编码器部分150包括模拟-数字转换器152、视频编码器153、音频编码器154、分视频编码器155以及格式器156。为模拟-数字转换器152提供了来自音频-视频输入142的外部模拟视频信号和外部模拟音频信号,或提供了来自TV调谐器144的模拟TV信号和模拟语音或音频信号。模拟-数字转换器152将输入的模拟视频信号转换成数字形式。即,模拟-数字转换器152将亮度分量Y、色差分量Cr(或Y-R)以及色差分量Cb(或Y-B)量化为数字形式。此外,模拟-数字转换器152将输入的模拟音频信号转换为数字形式。
当将模拟视频信号和数字音频信号输入模拟-数字转换器152时,模拟-数字转换器152将所述数字音频信号原样通过。此时,可实现用于减少附加到所述数字信号的抖动的处理或用于改变采样率或量化位数的处理而不改变所述数字音频信号的内容。此外,当将数字视频信号和数字音频信号输入模拟-数字转换器152时,模拟-数字转换器152将所述数字视频信号和数字音频信号原样通过。可以实现所述抖动减少处理或采样率改变处理而不改变所述数字信号的内容。
通过视频编码器153将来自模拟-数字转换器152的数字视频信号分量提供给格式器156。通过音频编码器154将来自模拟-数字转换器152的数字音频信号分量提供给格式器156。
视频编码器153将所述输入的数字视频信号转换成可变比特率的压缩数字信号。例如,视频编码器153可实现MPEG2或MPEG1规范,但在其他实施例中可使用任何适合的规范。
音频编码器154将所述输入的数字音频信号转换成以固定比特率压缩的数字信号(或线性PCM(脉冲编码调制)的数字信号),所述压缩例如基于MPEG音频或AC-3规范,但在其他实施例中可使用任何适合的规范。
当从音频-视频输入142输入视频信号,或当从TV调谐器144接收所述视频信号时,将所述视频信号中的分视频信号分量输入分视频编码器155。将输入到分视频编码器155的分视频数据转换为预置信号配置,然后将其提供给格式器156。格式器156为所述输入视频信号、音频信号、分视频信号执行预置信号处理,并将记录数据输出到数据处理器136。
临时存储部分134在写入存储设备132的数据(从编码器150输出的数据)间缓冲预置数量的数据,或在从存储设备132回放的数据(输入解码器部分160的数据)间缓冲预置数量的数据。数据处理器136将来自编码器部分150的记录数据提供给存储设备132,提取从存储设备132回放的回放信号,重写记录在存储设备132上的管理信息,或根据CPU130的控制来删除记录在存储设备132上的数据。
要通知数字录像机100的用户的内容显示在显示设备148上,或者显示在TV或连接到音频-视频输出146的监视器(未示出)上。
根据来自系统时间计数器138的时间数据来设置CPU130控制存储设备132、数据处理器136、编码器150和/或解码器160的计时。记录/回放操作通常与来自系统时间计数器138的时钟同步实现,而其他处理可以与系统时间计数器138无关的计时来实现。
解码器160包括用于分离和提取每个来自回放数据的包的分离器162、用于解码由分离器162分离的主视频数据的视频解码器164、用于解码由分离器162分离的分视频数据的分视频解码器165、用于解码由分离器162分离的音频数据的音频解码器168,以及用于将来自分视频解码器165的分视频数据与来自视频解码器164的视频数据相结合的视频处理器166。
视频数字-模拟转换器167将来自视频处理器166的数字视频输出转换为模拟视频信号。音频数字-模拟转换器169将来自音频解码器168的数字音频输出转换为模拟音频信号。通过音频-视频输出146,将来自视频数字-模拟转换器167的模拟视频信号和来自音频数字-模拟转换器169的模拟音频信号提供给通常为电视机、监视器或投影仪的外部组件(未示出)。
接下来,将说明根据本发明的实施例的数字录像机100的记录处理和回放处理。在用于记录的数据处理时,如果用户首先通过键盘输入149实现键入操作,则CPU130接收节目记录指令,并从存储设备132读出管理数据来确定其中记录视频数据的区域。在另一个实施例中,CPU130确定要记录的节目。
然后,CPU130在管理区域中设置所确定的区域,并在存储设备132上设置视频数据的记录起始地址。在这种情况下,所述管理区域指定了用于管理文件的文件管理部分,并顺序记录所述文件管理部分必需的控制信息和参数。
接下来,CPU130重置系统时间计数器138的时间。在此实例中,系统时间计数器138是所述系统的计时器,且使用它的时间作为基准来实现记录/回放操作。
视频数据的流向如下。由模拟-数字转换器152将从音频-视频输入142或TV调谐器144输入的音频-视频信号进行A/D转换,并分别将视频信号和音频信号提供给视频编码器153和音频编码器154,并将来自TV调谐器144的隐藏字幕信号或文字广播的文字信号提供给分视频编码器155。
编码器153、154、155压缩相应的输入信号以产生数据包,并将所述数据包输入格式器156。在这种情况下,编码器153、154、155根据系统时间计数器138的值来确定并记录每个数据包的PTS(呈现时间戳)、DTS(解码时间戳)。格式器156将每个输入数据包数据设置为包,混合所述包,并将混合结果提供给数据处理器136。数据处理器136将所述包数据发送到存储设备132,存储设备132将其存储为某一节目174。
在回放操作时,用户首先通过键盘输入149实现键入操作,且CPU130从其接收回放指令。接下来,CPU130将读取指令和要回放的节目174的地址提供给存储设备132。存储设备132根据所提供的指令读出扇区数据,并以包数据的形式将所述数据输出到解码器部分160。
在解码器部分160中,分离器162接收所述读出的包数据,将所述数据组成数据包形式,将视频数据包数据(例如,MPEG视频数据)传送到视频解码器164,将音频数据包数据传送到音频解码器168,并将分视频数据包数据传送到分视频解码器165。
此后,解码器164、165、168与相应数据包数据项的PTS的值同步实现回放处理(输出在所述PTS与系统时间计数器138的值彼此一致时解码的数据包数据),并通过音频-视频输出146将带有语音字幕的活动图片提供给TV、监视器或投影仪(未示出)。
存储器198连接到CPU130并包括语言首选项170和控制器172。语言首选项170描述了观看节目174的各部分的方式。在另一个实施例中,语言首选项170被嵌入节目174,或与节目174一起存储。以下参考图4进一步描述了语言首选项174。
控制器172包括能够在CPU130上执行的指令,或能够由在CPU130上执行的指令解释的语句,以便操纵语言首选项170和节目174,如以下参考图3、4、5A、5B和5C进一步描述的,并完成以下参考图6和7描述的功能。在另一个实施例中,控制器172可以以微码实现。在另一个实施例中,代替基于处理器的数字录像机,或除了基于处理器的数字录像机以外,控制器172可通过逻辑门和/或其他适合的硬件技术以硬件来实现。
在其他实施例中,数字录像机100可实现为个人计算机、大型计算机、便携式计算机、膝上型或笔记本计算机、PDA(个人数字助理)、平板电脑、袖珍电脑、电视机、机顶盒、有线电视解码盒、电话机、无线传呼机,汽车、远程会议系统、摄像放像机、收音机、录音机、放音机、立体声系统、MP3(MPEG音频层3)播放器、数字摄像机、家用电器或任何其他适合类型的电子设备。
图2示出了根据本发明的实施例的通过网络230连接到客户数字录像机100的服务器计算机系统200,以及通过网络230连接到客户100的内容提供商232的高级方块图表示。使用单词“客户”和“服务器”只是为了方便,在其他实施例中,在一个方案中用作客户的电子设备在另一个方案中可用作服务器,反之亦然。计算机系统200的主要组件包括一个或多个处理器201、主存储器202、终端接口211、存储接口212、I/O(输入/输出)设备接口213,以及通信/网络接口214,所有这些组件都通过存储器总线203、I/O总线204以及I/O总线接口单元205连接以便进行组件内通信。
计算机系统200包含一个或多个通用可编程中央处理单元(CPU)201A、201B、201C以及201D,在此总称为处理器201。在一个实施例中,通常为相对较大系统的计算机系统200包含多个处理器;但是,在另一个实施例中,计算机系统200可以替代地是单CPU系统。每个处理器201都执行存储在主存储器202中的指令,并可包括一级或多级板上高速缓存。
主存储器202是用于存储数据和计算机程序的随机存取半导体存储器。主存储器202在概念上是单个单片实体,但在其他实施例中,主存储器202是更复杂的布置,如分级的高速缓存和其他存储器设备。例如,存储器可以以多级高速缓存的形式存在,这些高速缓存还可按功能划分,以使一个高速缓存保存指令,而另一个高速缓存保存由一个或多个处理器使用的非指令数据。存储器还可为分布式的,并与不同的CPU或CPU组关联,如在各种所谓的非一致存储器存取(NUMA)计算机体系结构中的任一体系结构中公知的。
存储器202包括转换服务270、语言数据272、备选音频文件274、备选隐藏字幕数据276以及备选内容278。尽管转换服务270、语言数据272、备选音频文件274、备选隐藏字幕数据276以及备选内容278示为包含在计算机系统200的存储器202中,但是在其他实施例中,它们中的某些或全部可位于不同的计算机系统上,并可以例如通过网络230来远程访问。计算机系统200可以使用虚拟寻址机制,该机制允许计算机系统200的软件工作时似乎只访问单个大型存储实体,而不是访问多个较小的存储实体。因而,虽然转换服务270、语言数据272、备选音频文件274、备选隐藏字幕数据276以及备选内容278示为驻留在存储器202中,但是这些元素不一定同时全部包含在同一存储设备中。
在一个实施例中,转换服务270包括能够在处理器201上执行的指令,或能够由在处理器201上执行的指令解释的语句,以便操纵语言数据272、备选音频文件274、备选隐藏字幕数据276以及备选内容278,如以下参考图6和7进一步描述的。在其他实施例中,转换服务270可以以微码实现。在另一个实施例中,代替基于处理器的系统,或除了基于处理器的系统以外,转换服务270可通过逻辑门和/或其他适合的硬件技术以硬件来实现。备选音频文件274、备选隐藏字幕数据276以及备选内容278是可替代的,因为它们没有嵌入节目174或是节目174的一部分,并且与任何可能嵌入节目174或是节目174的一部分的原始音频或原始隐藏字幕数据不同(并且可使用不同的语言)。
存储器总线203提供了用于在处理器201、主存储器202以及I/O总线接口单元205之间传送数据的数据通信路径。I/O总线接口单元205还连接到系统I/O总线204以便从/向各个I/O单元传送数据。I/O总线接口单元205通过系统I/O总线204与多个又称为I/O处理器(IOP)或I/O适配器(IOA)的I/O接口单元211、212、213以及214通信。系统I/O总线204可以例如是工业标准PCI(外围组件互连)总线,或任何其他适合的总线技术。I/O接口单元支持与各种存储和I/O设备通信。例如,终端接口单元211支持连接一个或多个用户终端221、222、223以及224。
尽管存储器总线203在图2中示为相对简单的单总线结构,提供在处理器201、主存储器202以及I/O总线接口205之间的直接通信路径,但是在另一个实施例中,存储器总线203可包括多个不同的总线或通信路径,它们可以以任何不同的形式排列,如在分层、星形或网络配置中的点到点链路,多级总线,并行和冗余路径等。此外,虽然I/O总线接口205和I/O总线204示为单个相应单元,但是在其他实施例中,计算机系统200可包含多个I/O总线接口单元205和/或多个I/O总线204。虽然示出了多个I/O接口单元(它们将系统I/O总线204从连接到各种I/O设备的各种通信路径分离),但是在其他实施例中,某些或全部I/O设备直接连接到一个或多个系统I/O总线。
存储接口单元212支持连接一个或多个直接存取存储设备(DASD)225、226以及227,它们通常为旋转磁盘驱动存储设备,尽管它们可以替代地为其他设备,包括配置成对主机显示为单个大型存储设备的磁盘驱动器阵列。I/O和其他设备接口213为任意多种其他输入/输出设备或其他类型的设备提供了接口。在图2的示例性实施例中示出了两个此类设备(打印机228和传真机229),但是在其他实施例中,可以存在许多可为不同类型的其他此类设备。网络接口214提供了从计算机系统200到其他数字电子设备和计算机系统的一个或多个通信路径;此类路径可以包括例如一个或多个网络230。
网络230可为任何合适的网络或网络的组合,并可支持任何适于向/从计算机系统230、内容提供商232和/或客户100传送数据、节目和/或代码的适当协议。在一个实施例中,网络230可表示电视网络,无论是有线、卫星还是广播TV,也无论是模拟还是数字。在一个实施例中,网络230可表示直接或间接地连接到计算机系统200的存储设备或存储设备的组合。在一个实施例中,网络230可支持Infiniband。在另一个实施例中,网络230可支持无线通信。在另一个实施例中,网络230可支持硬连线通信,如电话线路或电缆。在另一个实施例中,网络230可支持以太网IEEE(电子电气工程师学会)802.3x规范。在另一个实施例中,网络230可为因特网并可支持IP(网际协议)。在另一个实施例中,网络230可为局域网(LAN)或广域网(WAN)。在另一个实施例中,网络230可为热点服务提供商网络。在另一个实施例中,网络230可为内联网。在另一个实施例中,网络230可为GPRS(通用分组无线业务)网络。在另一个实施例中,网络230可为FRS(家用无线设备)网络。在另一个实施例中,网络230可为任何适合的蜂窝数据网络或基于蜂窝的无线网络技术。在另一个实施例中,网络230可为IEEE 802.11B无线网络。在另一个实施例中,网络230可为任何适合的网络或网络的组合。尽管示出了一个网络230,但是在其他实施例中,可存在任何数量的(相同或不同类型)的网络。
图2中示出的计算机系统200具有多个附加终端221、222、223以及224,如多用户“大型机”计算机系统中所常见的。通常,在这种情况下,附加设备的实际数量大于图2中所示的数量,尽管本发明并不限于任何特定大小的系统。计算机系统200可以替代地为单用户系统,通常仅包含单个用户显示设备和键盘输入,或可为服务器或几乎没有直接用户界面,但接收来自其他计算机系统(客户)的请求的类似系统。在其他实施例中,计算机系统200可实现为个人计算机、便携式计算机、膝上型或笔记本计算机、PDA(个人数字助理)、平板电脑、袖珍电脑、电话、无线传呼机、汽车、远程会议系统、录像机、摄像放像机、录音机、放音机、立体声系统、MP3(MPEG音频层3)播放器、数码相机、家用电器或任何其他适合类型的电子设备。
内容提供商232包括客户100可下载的节目174。在不同实施例中,内容提供商232可为电视台、有线电视系统、卫星电视系统、因特网电视提供商或任何其他适合的内容提供商。尽管内容提供商232示为与计算机系统200分离,但是在另一个实施例中,它们可包装在一起。
应当理解,图1和2旨在在较高级别示出客户100、计算机系统200、内容提供商232以及网络230的代表性主要组件,个别组件的复杂度可以高于图1和2中所示,可以存在不同于、替代或除图1和2中示出的那些组件以外的组件,并且这些组件的数量、类型和配置可以不同。在此揭示了这些额外复杂度或额外变化的若个特定实例;应当理解,这些仅是作为实例,而不一定只有这些变化。
图1和2中示出的实现本发明的各种实施例的各种软件组件可用多种方式实现,包括使用各种计算机软件应用、例程、组件、程序、对象、模块、数据结构等(以下统称为“计算机程序”)。所述计算机程序通常包括一个或多个在不同时间驻留在客户100和计算机系统200的不同存储器和存储设备中的指令,并且当由客户100的一个或多个处理器130或136和/或计算机系统200的处理器201读取和执行时,导致客户100和/或计算机系统200完成执行包含本发明的实施例的各个方面的步骤或元素所必需的步骤。
此外,虽然已经或以下将在完整功能的计算机系统和数字录像机的上下文中描述本发明的实施例,但是本发明的各种实施例能够作为程序产品以多种形式分发,并且本发明均可同等地适用而与实际用于执行所述分发的信号承载介质的特定类型无关。定义此实施例的功能的程序可通过各种有形的信号承载计算机可记录介质被发送到客户数字录像机100和/或计算机系统200,所述程序包括但不限于(1)永久存储在不可重写的存储介质(例如,连接到或在计算机系统内的只读存储器设备,如CD-ROM,DVD-R或DVD+R)上的信息;(2)存储在可重写存储介质,例如,硬盘驱动器(例如,DASD 225,226或227,存储设备132或存储器198),CD-RW,DVD-RW,DVD+RW,DVD-RAM或软盘上的可改变的信息;(3)由通信介质(如通过计算机或电话网络,例如网络230,包括无线通信)传送到数字录像机100或计算机系统200的信息。
此类有形的信号承载计算机可记录介质,当携带引导本发明的功能的机器可读指令时,代表本发明的实施例。
本发明的实施例还可作为对客户组织、非盈利组织、政府实体、内部组织结构或类似组织的服务约定的一部分来提供。这些实施例的各方面可以包括配置计算机系统来完成在此描述的某些或全部方法,以及部署实现在此描述的某些或全部方法的软件系统和网络服务。这些实施例的各方面还可以包括分析客户公司、创建响应所述分析的建议、生成软件来实现所述建议的各部分、将所述软件集成到现有过程和基础结构中、计量在此描述的方法和系统的使用、为用户分配开销,并对用户使用这些方法和系统收费。
此外,可根据为其在本发明的特定实施例中实现各种节目的应用来标识在以下描述的所述各种节目。但是,以下任何特定的节目命名的使用只是为了方便,因而本发明的实施例不应限于仅在由这些命名标识和/或暗示的任何特定应用中使用。
图1和2中示出的示例性环境并非旨在限制本发明。实际上,可在不偏离本发明的范围的情况下,使用其他替代硬件和/或软件环境。
图3示出了根据本发明的实施例的实例语言数据272的方块图。语言数据272包括记录305和310,但在其他实施例中,可存在任意数量的具有任何适合数据的记录。每个记录305和310都包括节目标识域315,备选语言域320,备选音频可用性域325,以及备选隐藏字幕可用性域330,但在其他实施例中可存在更多或更少的域。
节目标识域315表示某一节目174。备选语言320标识了可用于关联的节目174的可能备选语言的列表。备选音频可用性域325指示每个备选语言320当前是否以备选音频形式可用,并且如果当前不可用,则以绝对或相对期限指示备选音频的预期可用性日期(如果存在预期可用性日期)。备选音频可用性325还可指示关联的语言不适用,因为节目的原始音频已使用该语言(例如,英语在记录305中被指示为不适用节目A,并且西班牙语在记录310中被指示为不适用节目B,因为这些节目在它们的原始音频中使用这些语言)。备选隐藏字幕可用性域330指示每个备选语言320当前是否以隐藏字幕形式可用,并且如果当前不可用,则以绝对或相对形式指示预期可用性日期。
图4示出了根据本发明的实施例的实例语言首选项170的方块图。语言首选项170包括记录405、410以及415,但在其他实施例中,可存在任意数量的具有任何适合数据的记录。每个记录405、410以及415包括优先级域420和语言域425,但在其他实施例中可存在更多或更少的域。优先级域420为关联的备选语言425标识了用户的优先级、等级或首选顺序。语言域425指示了某一备选语言320。
图5A示出了根据本发明的实施例的实例节目174的方块图。实例节目174包括行505。行505可用NTSC(国家电视系统委员会)标准或任何其他适合的标准或格式来实现。各种标准和格式的实例包括PAL(逐行倒相制式),SECAM(顺序彩色与存储),RS170,RS330,HDTV(高清晰度电视),MPEG(运动图像专家组),DVI(数字视频接口),SDI(串行数字接口),AIFF,AU,CD,MP3,QuickTime,RealAudio,WAV,以及PCM(脉冲编码调制)。行505可表示节目174中的任何内容,如视频515,原始音频520,原始隐藏字幕数据525,原始地址530,或它的任意部分。视频515可包括在呈现或显示时产生运动效果的一系列静止图像。音频520包括声音。
原始隐藏字幕数据525是可选的并可以包括音频520的文字表示,且通常呈现为可选的或通常不可见(除非被请求)的文本视频覆盖层,与开放字幕(其是视频的不变部分并始终显示)相反。隐藏字幕通常为对白音频和音效的文本表示。大多数电视机都设计为允许在屏幕底部附近可选地显示隐藏字幕数据。电视机也可使用解码器或机顶盒来显示隐藏字幕。隐藏字幕通常用于使节目174可被听力障碍的观众所理解,可被嘈杂环境(例如,机场)中的观众所理解,或可在必需保持安静的环境(例如,医院)中被理解。在一个实施例中,隐藏字幕数据被编码在视频信号内,例如,编码在垂直消隐区间(VBI)的行21中,但在其他实施例中,可使用任何适合的编码技术。
原始地址530包括节目174的外部内容的地址或位置,如通过网络230访问的包含与行505关联的内容的网站的地址。
图5B示出了根据本发明的实施例的作为节目174的实例的节目174-1的概念视图的方块图。实例节目174-1包括作为视频515的实例的视频515-1、515-2以及515-3。实例节目174-1还包括作为原始音频520的实例的原始音频段520-1、520-2以及520-3。实例节目174-1还包括作为原始隐藏字幕数据525的实例的原始隐藏字幕数据段525-1、525-2以及525-3。节目174-1还包括作为原始地址530的实例的原始地址530-1。视频515-1、原始音频段520-1、原始隐藏字幕数据段525-1以及原始地址530-1是关联的,意味着它们或它们的关联内容可被同时或以同步的方式呈现。视频515-2、原始音频段520-2以及原始隐藏字幕数据段525-2是关联的,意味着它们可被同时呈现。视频515-3、原始音频段520-3以及原始隐藏字幕数据段525-3是关联的,意味着它们可被同时或以同步的方式呈现。
图5B还示出了根据本发明的实施例的用于备选音频文件274的实例数据结构的方块图。备选音频文件274包括标记A550-1、备选音频段A555-1、标记B550-2、备选音频段B555-2、标记C550-3以及备选音频段C555-3。备选音频文件274中的标记A550-1与备选音频段A555-1关联。备选音频文件274中的标记B550-2与备选音频段B555-2关联。备选音频文件274中的标记C550-3与备选音频段C555-3关联。标记A550-1指向或标识了原始隐藏字幕数据,如原始隐藏字幕数据段525-1。标记B550-2指向或标识了原始隐藏字幕数据,如原始隐藏字幕数据段525-2。标记C550-3指向或标识了原始隐藏字幕数据,如原始隐藏字幕数据段525-3。
图5B还示出了根据本发明的实施例的用于备选隐藏字幕数据276的实例数据结构的方块图。隐藏字幕数据276包括标记A550-1、备选隐藏字幕段A565-1、标记B550-2、备选隐藏字幕段B565-2、标记C550-3以及备选隐藏字幕段C565-3。备选隐藏字幕数据276中的标记A550-1与备选隐藏字幕段A565-1关联。备选隐藏字幕数据276中的标记B550-2与备选隐藏字幕段B565-2关联。备选隐藏字幕数据276中的标记C550-3与备选隐藏字幕段C565-3关联。标记A550-1指向或标识了原始隐藏字幕数据,如原始隐藏字幕数据段525-1。标记B550-2指向或标识了原始隐藏字幕数据,如原始隐藏字幕数据段525-2。标记C550-3指向或标识了原始隐藏字幕数据,如原始隐藏字幕数据段525-3。
图5C示出了根据本发明的实施例的实例节目174-1以及备选内容278的概念视图的方块图。备选内容278可包括例如为特定观众定制的广告或任何其他适合的信息,为特定区域或语言定制广告的视频覆盖层(例如,呈现观众本地的电话号码)或任何其他适合的信息。尽管备选音频274和备选隐藏字幕数据276未在图5C中示出,但是在不同的实施例中,可存在它们中的一个或两个。
备选内容278包括标记A550-1、备选音频和/或视频段A575-1、标记B550-2、备选音频和/或视频段B575-2、标记C550-3以及备选音频和/或视频段C575-3。备选内容278中的标记A550-1与备选音频/视频段A575-1关联。备选内容278中的标记B550-2与备选音频/视频段B575-2关联。备选内容278中的标记C550-3与备选音频/视频段C575-3关联。标记A550-1指向或标识了原始隐藏字幕数据,如节目174-1中的原始隐藏字幕数据段525-1。标记B550-2指向或标识了原始隐藏字幕数据,如节目174-1中的原始隐藏字幕数据段525-2。标记C550-3指向或标识了原始隐藏字幕数据,如节目174-1中的原始隐藏字幕数据段525-3。
图6示出了根据本发明的实施例的实例处理的流程图。控制在方块600开始。然后控制继续到方块605,在此客户控制器172将带有首选语言和节目标识的请求发送到转换服务270。然后控制继续到方块610,在此转换服务270根据接收到的首选语言顺序(通过语言域425和优先级域420)以及接收到的节目标识(通过节目标识符域315)在语言数据272中找到记录,并将所述记录发送到客户100。然后控制继续到方块615,在此客户控制器172在所接收的一个或多个记录中选择具有最高优选或优先级的语言。在一个实施例中,用户可以选择忽略由客户控制器172完成的语言选择。
然后控制继续到方块620,在此客户控制器172将带有选定语言的请求发送到转换服务270。然后控制继续到方块625,在此转换服务270处理所述请求,如在以下参考图7进一步描述的。
然后控制继续到方块627,在此客户控制器172通过音频可用性域325和隐藏字幕可用性域330来判定所选定的语言是否可用。
如果在方块627的判定为假,则控制继续到方块628,在此客户控制器172等待在由音频可用性域325和/或隐藏字幕可用性域330指定的稍后日期下载用于所选定的语言的数据。然后控制返回此前描述的方块627。
在另一个实施例中,方块627和628的处理是可选的,并且客户控制器172在没有方块627和628的情况下进入方块630,以便允许用户在没有备选语言的帮助下观看节目174。
如果在方块627的判定为真,则控制继续到方块630,在此客户控制器172下载节目174,包括来自内容提供商232的原始隐藏字幕数据,并可选地在节目174中找到任何原始地址530并下载由原始地址530指向的任何内容。然后控制继续到方块635,在此客户控制器172通过计算机系统100处的转换服务270来下载备选音频文件274、备选隐藏字幕数据276和/或备选内容278(如果可用)。
然后控制继续到方块640,在此客户控制器172演示或显示节目174,将节目174中的原始隐藏字幕数据与备选音频274、备选隐藏字幕数据276和/或备选内容278中的标记相匹配,并根据所述标记用备选音频段、备选隐藏字幕数据段和/或备选内容段来替换原始音频段、原始视频段或原始隐藏字幕数据。在备选音频274、备选隐藏字幕数据276和/或备选内容278不可用的实施例中,客户控制器172在没有它们的情况下演示或显示节目174。然后控制继续到方块699,在此图6的逻辑返回。
图7示出了根据本发明的实施例的用于转换服务270的实例处理的流程图。控制在方块700开始。然后控制继续到方块705,在此转换服务270接收来自客户100的带有选定语言和节目的请求。然后控制继续到方块710,在此转换服务270为所述选定语言和节目的转换分配资源。在一个实施例中,在方块705处的请求是预请求,其允许转换服务270了解对资源的未来需求并从而在方块710处分配资源。
然后控制继续到方块715,在此转换服务270判定备选音频文件274、备选隐藏字幕数据276和/或备选内容278是否可用于所述选定的语言和节目。如果在方块715处的判定为真,则控制继续到方块720,在此转换服务270将备选音频文件274、备选隐藏字幕数据276和/或备选内容278发送给客户100。然后控制继续到方块799,在此图7的逻辑返回。
如果在方块715处的判定为假,则备选音频文件274和/或备选隐藏字幕数据276对所述选定的语言不可用,因此控制继续到方块725,在此转换服务270通过人工转换、文本到语音或文本到文本转换来为所述选定的语言创建备选音频文件274、备选隐藏字幕数据276和/或备选内容278。然后控制继续到方块735,在此转换服务270创建标记(例如,标记550-1,550-2,550-3)并将它们嵌入备选音频274、备选隐藏字幕数据276和/或备选内容278,所述标记指向或标识了节目174中的原始隐藏字幕数据525。所述标记中的每个标记都与一个相应的备选音频段关联,所述标记标识了节目中的原始隐藏字幕数据段,并且所述标记中的每个标记都与相应的备选隐藏字幕数据段关联。然后控制继续到此前以上描述的方块720。
在先前对本发明的示例性实施例的详细描述中,参考了附图(其中相同的数字代表相同的元素),所述附图形成了所述描述的一部分,并且其中通过示例的方式示出了其中可实现本发明的特定示例性实施例。这些实施例被充分详细地描述,以使得本领域的技术人员能够实现本发明,但是也可使用其他实施例,并且可在不偏离本发明的范围的情况下做出逻辑的、机械的、电气的以及其他更改。在本说明书中使用的单词“实施例”的不同实例不一定指相同的实施例,但是它们可能相同。因此,不应在限制的意义上理解此前的详细描述,并且本发明的范围仅由所附权利要求来限定。
为了提供对本发明的全面理解,此前的描述中说明了大量具体细节。但是,可在没有这些具体细节的情况下实现本发明。在其他实例中,为了不产生对本发明的混淆,并未详细示出公知的电路、结构和技术。
权利要求
1.一种方法,所述方法包括创建节目的备选音频文件,其中所述备选音频文件包括多个备选音频段;以及将第一多个标记嵌入所述备选音频文件,其中所述第一多个标记中的每个标记都与所述多个备选音频段中的一个相应备选音频段关联,其中所述第一多个标记标识了所述节目中的多个原始隐藏字幕数据段。
2.如权利要求1中所述的方法,还包括将所述备选音频文件发送给客户。
3.如权利要求2中所述的方法,其中所述客户从内容提供商处接收所述节目,将所述第一多个标记与所述原始隐藏字幕数据段匹配,并在呈现所述节目时通过所述匹配使用所述备选音频段来替换所述原始音频段。
4.如权利要求1中所述的方法,还包括根据从客户接收的语言首选项的顺序来选择所述备选音频文件的语言。
5.如权利要求4中所述的方法,还包括执行所述创建和所述嵌入以响应来自所述客户的请求。
6.如权利要求1中所述的方法,还包括创建包括多个备选隐藏字幕数据段的备选隐藏字幕数据;以及将第二多个标记嵌入所述备选隐藏字幕数据,其中所述第二多个标记中的每个标记都与所述多个备选隐藏字幕数据段中的一个相应备选隐藏字幕数据段关联,其中所述第二多个标记标识了所述节目中的所述多个原始隐藏字幕数据段。
7.如权利要求6中所述的方法,还包括将所述备选隐藏字幕数据发送给客户,其中所述客户通过所述第二多个标记将所述备选隐藏字幕数据与来自所述节目的视频同步以便进行呈现。
8.一种装置,所述装置包括用于创建节目的备选音频文件的装置,其中所述备选音频文件包括多个备选音频段;用于将第一多个标记嵌入所述备选音频文件的装置,其中所述第一多个标记中的每个标记都与所述多个备选音频段中的一个相应备选音频段关联,其中所述第一多个标记标识了所述节目中的多个原始隐藏字幕数据段;以及用于将所述备选音频文件发送给客户的装置,其中所述客户从内容提供商处接收所述节目,将所述第一多个标记与所述原始隐藏字幕数据段匹配,并在呈现所述节目时通过所述匹配使用所述备选音频段来替换所述原始音频段。
9.如权利要求8中所述的装置,还包括用于根据从客户接收的语言首选项的顺序来选择所述备选音频文件的语言的装置。
10.如权利要求8中所述的装置,还包括用于执行所述创建和所述嵌入以响应来自所述客户的请求的装置。
11.如权利要求8中所述的装置,还包括用于创建包括多个备选隐藏字幕数据段的备选隐藏字幕数据的装置;以及用于将第二多个标记嵌入所述备选隐藏字幕数据的装置,其中所述第二多个标记中的每个标记都与所述多个备选隐藏字幕数据段中的一个相应备选隐藏字幕数据段关联,其中所述第二多个标记标识了所述节目中的所述多个原始隐藏字幕数据段。
12.如权利要求11中所述的装置,还包括用于将所述备选隐藏字幕数据发送给所述客户的装置,其中所述客户将所述第二多个标记与所述原始隐藏字幕数据段匹配,并在呈现所述节目时通过所述匹配使用所述备选隐藏字幕数据段来替换所述原始隐藏字幕数据段。
13.如权利要求8中所述的装置,还包括用于创建包括多个备选音频和视频段的备选内容的装置;以及用于将第二多个标记嵌入所述备选内容的装置,其中所述第二多个标记中的每个标记都与所述多个备选音频和视频段中的一个相应备选音频和视频段关联,其中所述第二多个标记标识了所述节目中的所述多个原始隐藏字幕数据段。
14.如权利要求13中所述的装置,还包括用于将所述备选内容发送给所述客户的装置,其中所述客户将所述第二多个标记与所述原始隐藏字幕数据段匹配,并在呈现所述节目时通过所述匹配使用所述备选音频和视频段来替换所述原始隐藏字幕数据段。
15.一种用于配置计算机的方法,所述方法包括配置所述计算机来根据从客户接收的语言首选项的顺序来选择备选音频文件的语言;配置所述计算机来创建节目的所述备选音频文件,其中所述备选音频文件包括多个备选音频段;配置所述计算机来将第一多个标记嵌入所述备选音频文件,其中所述第一多个标记中的每个标记都与所述多个备选音频段中的一个相应备选音频段关联,其中所述第一多个标记标识了所述节目中的多个原始隐藏字幕数据段;以及配置所述计算机来将所述备选音频文件发送给客户,其中所述客户从内容提供商处接收所述节目,将所述第一多个标记与所述原始隐藏字幕数据段匹配,并在呈现所述节目时通过所述匹配使用所述备选音频段来替换所述原始音频段。
16.如权利要求15中所述的方法,还包括配置所述计算机来执行所述创建和所述嵌入以响应来自所述客户的请求。
17.如权利要求15中所述的方法,还包括配置所述计算机来创建包括多个备选隐藏字幕数据段的备选隐藏字幕数据;以及配置所述计算机来将第二多个标记嵌入所述备选隐藏字幕数据,其中所述第二多个标记中的每个标记都与所述多个备选隐藏字幕数据段中的一个相应备选隐藏字幕数据段关联,其中所述第二多个标记标识了所述节目中的所述多个原始隐藏字幕数据段。
18.如权利要求17中所述的方法,还包括配置所述计算机来将所述备选隐藏字幕数据发送给所述客户,其中所述客户将所述第二多个标记与所述原始隐藏字幕数据段匹配,并在呈现所述节目时通过所述匹配使用所述备选隐藏字幕数据段来替换所述原始隐藏字幕数据段。
19.如权利要求15中所述的方法,还包括配置所述计算机来创建包括多个备选音频和视频段的备选内容;以及配置所述计算机来将第二多个标记嵌入所述备选内容,其中所述第二多个标记中的每个标记都与所述多个备选音频和视频段中的一个相应备选音频和视频段关联,其中所述第二多个标记标识了所述节目中的所述多个原始隐藏字幕数据段。
20.如权利要求19中所述的方法,还包括配置所述计算机来将所述备选内容发送给所述客户,其中所述客户将所述第二多个标记与所述原始隐藏字幕数据段匹配,并在呈现所述节目时通过所述匹配使用所述备选音频和视频段来替换所述原始隐藏字幕数据段。
全文摘要
在一个实施例中,提供了创建具有备选音频段的备选音频文件并在所述备选音频文件中嵌入标记的方法、装置、系统和信号承载介质。所述标记中的每个标记都与相应的备选音频段关联,并且所述标记标识了节目中的原始隐藏字幕数据段。将所述备选音频文件发送给客户。所述客户从内容提供商处接收所述节目,将所述标记与所述原始隐藏字幕数据段相匹配,并在所述节目的呈现期间通过所述匹配用所述备选音频段来替换所述原始音频段。
文档编号H04N5/00GK1964428SQ20061011577
公开日2007年5月16日 申请日期2006年8月16日 优先权日2005年11月10日
发明者B·M·罗甘, D·A·拉尔森, T·T·尼克萨 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1