用于在流式媒体中由用户控制的选定叠加的方法和装置的制作方法

文档序号:7934308阅读:273来源:国知局
专利名称:用于在流式媒体中由用户控制的选定叠加的方法和装置的制作方法
技术领域
本发明与以下申请相关题为“在流式媒体中动态分发受控的额外选定叠加的方法和装置”,序列号为09/409,593;以及“在流式媒体中动态分发受控的额外选定叠加的方法和装置序列号为09/409,601,它们都与本申请同日提交,授予同一受让人,并纳入这里作为参考。
本发明涉及计算机软件领域,更具体而言,涉及在流式媒体中控制和提供额外的选定叠加的方法。
在通信中,因特网,也称“互联网”,是由“网关”联到一起的可能彼此不同的多个网络的集合。网关管理数据传输和把来自发送网络的消息转换成接收网络所用的协议(如果必要的话,则以打包方式进行)。当以大写字母打头时,Internet(因特网)”是指使用一套TCP/IP协议的网络和网关的集合。
因特网作为信息和娱乐二者之源已成为一种文化支撑。许多企业在创建因特网站点作为它们市场营销努力的组成部分,向消费者提供关于该企业提供的产品和服务的信息或提供其他信息以图造成对品牌的追随。许多联邦、州和地方政府机构也在把因特网站点用于信息服务,特别是那些必须与基本上是社会所有部分进行交互作用的机构,如国内税务服务局和州秘书处。通过提供信息指南和/或可查询的在线公共记录数据库。可以减少运作费用。
再有,因特网已经打破了分发多媒体内容的传统的地理和技术障碍。传统上,多媒体内容是经由广播电视(有时与无线电结合)、影片(电影)、以及更近来的有线电视来分发的。这些多媒体内容大多数曾是只能在有限的地理区域内可以得到,并且只以一种语言展现。
为了获得更广泛的观众和向消费者提供更多的选择,电视广播已利用了SAP广播,其中对于同一视频内容,电视广播包含若干音频信道用于若干不同的语言。然而,SAP是一种“有”或“无”的选择。就是说,一个用户必须选择一个音频信道。使用SAP不存在将若干音频信道混合到一起的可能性。
电视广播者已用于向用户提供对展现节目的更多选择的另一方法是“电视与无线电同时联播(simulcast)”。利用这种技术,通过无线电广播不同的音频信道以对应于同时广播的电视节目。然而,这涉及使用两种不同的媒体。再有,只有整个音频声音信道被广播,而不是它的各段能被有选择地过滤。再有,这种方法不包含任何其他视频分量,而且没有单一的控制点。“电视与无线电同时联播有两个控制点一个电视和一个单独的无线电”。
当前,可以得到一种潜力,即任何人在世界上的任何地方能观看被世界上任何地方广播的内容。这种潜力需要被实现,并要求一种新的技术以在向观看者提供中心内容的同时减小总体带宽,以此作为一个广播者不同于他在世界市场中的竞争者的一种手段。还有,为鼓励观看者观看一个事件或节目,希望能尽可能地吸引多种不同类型的观看者。在一些情况中,事件或节目可以以不同的语言广播。这种类型的定制通常需要对每种语言有一个单独的广播。这种类型的定制对每个版本需要用于音频和视频的带宽结果,由于对每个版本重广播一个事件而浪费了带宽。这样,如果有一种改进的方法和装置,以允许定制事件的展现以适合当今消费者的观看模式、希望和需要,同时减小定制事件所需带宽,这将是有好处的。
本发明提供一种方法和装置,用于定制一个事件在一计算机化多媒体系统上的多媒体展现。经由与该计算机化多媒体系统相耦合的网络为该事件提供了一组视频流、一组音频流和一组信息流。从该事件一组视频流中选择供展现的视频流。从该事件的一组音频流中选择供展现的音频流。从该事件的一组信息流中选择供展现的信息流。响应用户的输入,被选定的视频流和被选定的音频流被赋予视频和音频输出装置的各相应部分。根据选定的视频流和音频流赋予,该事件被展现出来。
在所附权利要求中提出了相信是本发明特征的新特性。然而,通过参考下文中对实施例的详细描述并结合附图阅读将会最好地理解发明本身和最佳使用方式,及其进一步的目的和优点,这里

图1是根据本发明的一个最佳实施例,可在其中实现本发明的一个分布式数据处理系统;图2是根据本发明可作为服务器系统实现的数据处理系统的方框图;图3是可在其中实现本发明的一个数据处理系统的方框图;图4是概括说明本发明过程的方框图;图5是根据本发明用于选择媒体流的功能部件的方框图;图6显示根据本发明的一个最佳实施例所描述的显示示例;图7A-7D显示根据本发明的一个最佳实施例所描述的发送给一客户机的数据流内包含的数据结构;图8是根据本发明的一个最佳实施例所描述的用于处理数据流的过程的流程图;图9是根据本发明的一个最佳实施例所描述的用于产生为同步数据流所用CRC值的过程的流程图;图10是根据本发明的一个最佳实施例所描述的用于使用CRC数据同步数据的过程的流程图。
现在参考附图,特别是图1,它给出根据本发明的一个最佳实施例所描述的能在其中实现本发明的一个分布式数据处理系统。分布式数据处理系统100包含网络102,网络102是用于在分布式数据处理系统100内所连接的各种装置和计算机之间提供通信链路的介质。网络102可以包括永久性连接,如连线或光纤电缆,或者通过电话连接的临时连接方式。
在所描述的例子中,服务器系统104与存储器单元106一起连于网络102。服务器系统104可以包含一个或多个服务器计算机以提供数据流。例如,一个服务器可以用于管理和控制数据流而在服务器系统104内的另一服务器可用于创建提供给客户机的源数据流。这些数据流中的信息可以存储在服务器系统104内或在远程存储器装置上,如存储器装置106。此外,客户机108、110及112也连于网络102。这些客户机108、110和112可以是例如(但不限于)个人计算机、机顶盒、万维网(Web)电视单元、或用于接收数据流的任何其他硬件单元。客户机108、110和112是服务器系统104的客户机。在所描述的实例中,服务器系统104向客户机108-112提供数据流。分布式数据处理系统100可以包括图中未画出的其他服务器、客户机或其他装置。
客户机108、110和112包括机制用于混合和过滤从服务器系统104或未画出的其他服务器系统接收的数据流。这些机制在所描述的实例中可以以硬件、软件、固件或它们的某种组合来实现。
例如,分布式数据处理系统100可以是因特网,以网络102代表使用一套TCP/IP协议彼此通信的网络和网关的世界范围的集合。在因特网的心脏是主要节点或主机之间的高速数据通信线骨干,包含以千计的商业、政府、教育以及其他计算机系统,它们为数据和消息提供路由。
网络102的另一实现是一种宽带网络,也称作宽带综合业务数据网(BISDN)。在这类网络中,通常由宽带业务提供的信道能支持大于1.5Mbps的数据传输速率,这个1.5Mbps是综合业务数字网(ISDN)的基本速率,记为T1或DS1。在宽带系统中,传输方式类型通常是使用同步光纤网(SONET)和智能网(IN)技术的同步传输方式(ATM),这是提供ISDN框架的技术。在这样的网络中,包括话音、数据、视频和音频的信息通过该网络传输到各个客户机。
再有,网络102也可以是依赖于具体实现的电缆通信系统。当然,分布式数据处理系统100也可以实现为若干个不同类型的网络,例如一个内联网或局域网。图1只是一个举例,而不是对本发明过程在体系结构上的限制。
参考图2,它是根据本发明可以实现为一个服务器系统(如图1中的服务器系统104)的一个数据处理系统的方框图。数据处理系统200可以用作为服务器系统内的视频服务器或其他应用服务器。
数据处理系统200可以是一个对称多处理器(SMP)系统,包括多个连到系统总线206上的处理器202和204。另一种作法是也可以利用单处理器系统。也连到系统总线206上的是存储器控制器/高速缓存208,它提供与局部存储器209的接口。I/O总线桥210连于系统总线206并提供与I/O总线212的接口。如图所示,存储器控制器/高速缓存208和I/O总线桥210可以被集成。
连到I/O总线212上的外部部件互连(PCI)总线桥214提供与PCI局部总线216的接口。若干调制解调器218-220可以连到PCI总线216。典型的PCI总线实现将支持4个PCI扩展槽或插入接插件。与图1中网络计算机108-112的通信链路可通过经由插入板连到PCI局部总线216的调制解调器218和网络适配器220来提供。
附加的PCI总线桥222和224提供附加PCI总线226和228的接口,由它们可支持附加的调制解调器或网络适配器。这样,服务器200允许连接到多个网络计算机。由存储器映射的图形适配器230和硬盘232也可连到I/O总线212,如图所示,或直接连接或间接连接。
本领域普通技术人员将会理解,图2所示硬件可以变化。例如,其他外围设备,如光盘驱动器等,也可用于增加或替代所示硬件。所示实例不意味着针对本发明的体系结构限制。
图2所示数据处理系统可以是例如IBM RS/6000,这是纽约Armonk国际商用机器公司的产品,运行高级交互执行(AIX)操作系统。
现在参考图3,图中显示在其中可实现本发明的一个数据处理系统的方框图。数据处理系统300是计算机的一个实例。数据处理系统300利用外围部件互连(PCI)局部总线结构。虽然所示实例利用PCI总线,但其他总线结构也可使用,如微通道和ISA。处理器302和主存储器304通过PCI桥308连于PCI局部总线306。PCI桥308也可包括集成的存储器控制器和高速缓存存储器供处理器302使用。通过直接部件互连或通过插入板可实现与PCI局部总线306的附加连接。在所示实例中,局域网(LAN)适配器310、SCSI主机总线适配器312以及扩展总线接口314由直接部件连接连到PCI局部总线306。与此相反,音频适配器316、图形适配器318以及音频/视频适配器(A/V)319是借助插入扩展槽的插入板来连到PCI局部总线306的。扩展总线接口314提供键盘和鼠标适配器320、调制解调器322以及附加存储器324的连接。在所示实例中,SCSI主机总线适配器312提供硬盘驱动器326、带驱动器328、CD-ROM驱动器330以及数字视频盘只读存储器驱动器(DVD-ROM)332的连接。典型的PCI局部总线实现将支持三个或四个PCI扩展槽或插入接插件。
在图3中的数据处理系统300内,一个操作系统在处理器302上运行并用于协调和控制系统300内的各种部件。操作系统可以是市场上可得到的操作系统,如OS/2,它可从国际商用机器公司得到。“OS/2”是国际商用机器公司的一个商标。一个面向对象的编程系统,如Java,可以与操作系统联合运行,以提供从Java程序或在数据处理系统300上执行的应用程序对操作系统的调用。操作系统、面向对象的操作系统以及应用或程序的指令都位于存储器装置上,如硬盘驱动器326,并可加载到主存储器304中供处理器302执行。
本领域普通技术人员将会理解,图3中的硬件可依其实现而变化。例如,其他外围设备,如光盘驱动器等,可以用于增加或替代图3中所示硬件。所示实例不意味着针对本发明的体系结构限制。例如,本发明的过程可以应用于多处理器数据处理系统。此外,数据处理系统300可以取笔记本计算机或个人数字助理(PDA)的形式。再有,数据处理系统可以是例如,但不限于,含有适当硬件和软件以实现本发明过程的电视机或机顶电缆盒。
本发明提供的方法、装置和计算机实现的指令用于减小所用带宽和增加客户机定制节目或事件。本发明的机制指向在多媒体数据处理系统上定制多媒体展现。这是针对不同的音频和视频组分把节目或事件分割成不同的数据流来实现的。可以增加额外的可选的数据流以允许定制节目或事件。一个数据处理系统可以接收与一节目或事件相关联的一组视频和音频流。可以根据用户的输入有选择地展现这些数据流。根据用户的输入,视频和音频数据流的某些部分可以展现而其他数据流则不展现。再有,用户的输入可以有选择地把一视频流放在显示器上的不同位置。再有,还可以接收含有文本和/或图形的信息并有选择地与节目或事件的展现一起显示。在用户所在地这些数据流的组合提供的定制无需向观看者广播一个事件的多个版本。
通过允许观看者定制一个节目或事件,所用带宽可以减小,因为节目制造者不必对不同的地理区域或不同的观看者基础广播一个节目或事件的多个版本。
现在转到图4,图中的方框图概括显示本发明的过程。一个客户机400,例如图3中所示数据处理系统300,向一个源服务器404发送一个节目内容请求402。源服务器404是一个数据处理系统,如图2中的数据处理系统200,是客户机400请求的节目内容的宿主。源服务器404把所请求的节目。作为一组数据流向客户机400发回。数据流406可用于在客户机402向用户展现节目或事件。再有,数据流406可以包含一个或多个视频组分、一个或多个信息流组分、以及一个或多个音频流组分。
图4中是按直接连接描述和显示客户机400和源服务器404的。然而,客户机402和源服务器404最好是一个分布式数据处理系统(如图1中的分布式数据处理系统100)的一部分并通过网络(如网络102)链接到一起。
接下来转向图5,图中显示根据本发明在选择媒体流时所用功能部件的方框图。在这一实例中,客户机500包括数据流处理系统502用于从网络504接收数据流510供向输出系统506输出。通过用户控制508控制从网络504收到的数据流的选择,该用户控制508控制数据流处理系统502。
多媒体数据流可通过连接508从网络504中接收。这些数据流可以是例如音频、视频、文本、图形、或其他可通过输出系统506显示给客户机500用户的其他信息。通过用户控制508来控制由数据流处理系统对来自网络504的数据流的选择过滤。通过输出系统506将选定的数据流或选定的数据流部分显示给用户,输出系统506可用于驱动显示器或音频输出装置,如高清晰度电视或扬声器。
现在参考图6,图中显示了根据本发明的一个最佳实施例的显示实例。在这一实例中,以显示单元602、音频源604、606和608构成展现系统600。展现系统600是客户机的一部分,用户通过它看见和听见节目。在这一实例中,音频源604是左扬声器而音频源608是右扬声器。在本例中音频源606是中央扬声器。视频610以文本框612、文本框614和视频616显示在显示器602上。在本例中视频610是主数据流,而文本框612和文本框614被重叠在视频610上。
在本例中由两个数据流产生文本框612和文本框614。文本框612是一个静态文本框,它可用于提供诸如关于节目的统计、即将到来的节目等信息,或用户可以选择的任何其他信息。在本例中文本框614是一个“弹出式(pop-up)”的,它可用于提供关于视频610中特定对象或人物的信息。
再有,在文本框614中的数据包可以包括对文本框614重定位的数据,以跟随特定的对象或人物。视频616是用另一数据流显示的,以给用户提供额外的观看内容。例如,视频616可以提供节目中的不同透视图或可以显示当前在视频610中未显示的场景。初始时,用户可以选择各种音频流供通过604、606和608馈送。例如,如果正在显示的节目是一个体育事件,用户可能选择一个特定运动员并让关于该运动员的音频信息通过608播放,或者让位于该运动员处的送话器输出直接通过604播放。
作为举例,考虑正在通过因特网或一宽带网络广播一场橄榄球赛。终端用户能从若干音频流中选择和混合这些音频流。例如,每个队的四分卫送话器、每个队的教练送话器、和/或广播员,而且可能有若干个(例如John Madden,Phil Simms,Howie Long,Bruce Beadle,Michael Paolini等)。这样,用户能解谐(tune-out)(不选)JohnMaddn,如果他们发现他令人讨厌的话。用户可能代之以选择收听49人队的四分卫送话器(或对立队的,或他们选择的另一广播员的,或完全收听另一种语言)而无需改变信道/复盖。
继续以橄榄球为例,利用本发明有可能为对此运动不熟悉的观看者提供单独的音频信道。这一单独音频信道会更详细地解释比赛规则和正在发生的情况。它还会解释橄榄球所特有的技术术语。用户可以选择让这一附加信息作为文本流来展现。
在应用本发明的另一例中,继续以橄榄球为主题,用户可以把A队运动员的声音放到右声道,把B队运动员的声音放在左声道,而把广播员的声音放在后声道。再有,用户可以选择得球的运动员,使这一运动员的声音永远在中央声道。
可以使用一个代表视频的主数据流(不论选择什么音频叠加流它也不改变)和许多代表音频或视频叠加的小的加入数据流来展现节目。这些流可被混合在一起或被赋予不同声道(右、左、后、中央等)以及/或使用来自杜比(Dolby)实验室的最新“杜比数字”或其他类似技术赋予3-D(三维)空间位置。此外,可基于每个叠加调节音量。关于诸如“杜比数字”等技术的更多信息可在美国专利5,912,976号中找到。
关于视频叠加,也可按类似于音频流的方式形成若干视频叠加流并加以选择,并混合起来“叠加”而成最终视频。例如,如果所希望的叠加是在含有某文本的某一视频显示位置处的气球形弹出,那么附加的叠加流本身不必是视频,而可以是用于建立这一视频的信息。所以,该数据流的大小会比主视频流小得多。此外,除了为该事件选择的数据流外,还可以向用户提供与此无关的信息,如股票市场数据或新闻摘要。例如,如果正观看的事件或节目是一场橄榄球赛,则有可能让一个视频叠加专门显示带有数据的弹出气球,如关于运动员的统计资料,其中这些弹出气球可以出现在运动员本身的上方。再有,可以以这种方式显示打睹赌陪率、关于运动员的其他趣事、或规则和关于事件的信息。另一类数据流可以包括嵌入的运动员照片以及附在上面的个人经历。
对于其他类型的节目,可以提供其他弹出窗口。例如,对于凶杀侦探节目,可以显示弹出窗口,给出关于未来事件的线索,或者还可以显示出与该节目相关的关于演员、脚本或导演的事实。
以这种方式,在橄榄球赛举例的内容中,有可能让视频叠加流专用于显示弹出气球,所带的数据如关于运动员的统计(它们可能很好的出现在运动员本身的上方)、打赌陪率、奇怪的或有趣的事实、解释所发生之事和规则的信息(供新观众)、不同的正在进行的体育事件数据的摘要(如来自正在进行的其他比赛的比分和统计)、股票市场数据和新闻摘要,所提供的只是少数举例。其他流类型可以包括嵌入的运动员照片以及附在上面的个人经历。
在另一实施例中,有可能使叠加成为可选择的。就是说,用户可以作等效于“点击”一个的事,以触发附加的叠加流或把它锁在原地。例如,选择一运动员的“名字叠加”可能例如带来一个具有该运动员个人经历的叠加。在一个单向系统中,这可通过让一个叠加信道连续循环所有运动员的个人经历并在广播的时候让客户机“选择”感兴趣的那个。
再有,用户能使用他们的客户机在不同的任选项中进行选择,从而在广播过程中能更多地控制他们想看和听的信息。
现在转到图7A-7D,图中显示根据本发明的一个实施例发送给客户机的数据流内包含的数据结构。在图7A中。显示一个数据包700,其中数据包包括头段702和净载荷704。头段702包含的信息用于为数据包700的净载荷704内包含的数据提供路由和进行管理。
图7B中显示在一数据包,例如数据包700内找到的头段信息的举例。在本例中,头段706包括标识(ID)字段708、信道字段710、位置字段712以及音量字段714。
在本例中,头段706是标识一音频包的头段。ID字段708用于标识数据包类型。在本例中,信道字段710可用于标识数据包要展现给用户时所在的信道。例如,信道字段710可用于标识例如环绕声系统中的那些声道。在本例中,这些信道可以是例如右、左、后或中央声道。再有,位置字段712也被包括在内,从而可以利用三维空间位置以使用如杜比数字之类音响技术。这一位置信息可以提供一个预设位置,它可由用户改变。所包括的音量字段714允许调整这一数据包中的数据相对于其他数据包中数据的音量,以允许叠加或强调不同的数据流。可使用其他字段添加或替代用于展现音频信息的头段706中所示字段。
在图7c中的头段716是在视频流中所用视频包中找到的头段信息的举例。在本例中,头段716包括ID字段718、时间标记字段720和CRC字段722。ID字段718用于标识在包内所含数据的类型,而在本例中的时间标记用于同步的目的。CRC字段722可用于错误检验或同步目的,取决于具体实现。如果CRC字段722用于同步目的,则CRC数据是对另一数据流计算的,并在被传送或向观看者广播之前放在该字段内。例如,该CRC数据可以是为其他数据流中的一帧或一帧的一部分计算的。当收到这一数据流和这另一数据流时,对这另一数据流中的一帧计算其CRC数据。将此计算出的CRC数据与存储在CRC字段722中的CRC数据比较。这些CRC值之间的匹配用于识别这两个数据流之间的同步点。
接下来,在图7D中,显示了视频流中数据包所用头段的另一举例。头段724包括ID字段726、类型字段728、位置字段730、持续时间字段732以及z深度字段734。ID字段726用于把数据包标识为包含视频数据。在本例中的类型字段728可用于标识视频类型,如文本或活动视频流中的一帧。位置字段730可用于标识要显示该数据的屏幕上的位置。持续时间字段732可用于标识该数据要显示的时间量。z深度字段734可用于标识相对于其他视频流所要显示的数据所在的深度或顺序。该深度用于确定在显示器上要显示的视频流或叠加的顺序。
在该例中,头段724是含有文本的视频流所用头段的举例,该文本要作为气球或弹出在屏幕上显示。在这种情况中,持续时间字段732标识该文本要显示多长时间而z深度字段734标识相对于其他视频流该本文要位于何处。位置字段730提供屏幕上的xy位置。在净载荷中会发现供弹出显示的文本。以这种方式,专用于显示文本的视频叠加流可与活动视频数据流一起使用。
本发明还提供了这些不同数据流的选择能力。例如,用户可以能按下一个选择钮以触发附加的叠加流或把一个流锁在原地。例如,选择一个运动员的“名字叠加”可能带来一个具有该运动员经历的叠加。在一个单向系统中,这可通过让一个叠加信道连续循环所有运动员的个人经历并在广播的时候让客户机选择感兴趣的那个。以这种方式,用户可在不同的任选项之间进行选择,并对用户希望在节目进行过程中看到和听到的信息有更多的控制。这些选择可经由单向或双向通信来实现,这取决于所用网络的带宽和类型。
叠加流可由服务器控制。在这种情况中,可在一个叠加中嵌入一个命令或一组命令,以使叠加在客户机上被选择或不被选择。这种机制将允许使选定的叠加中断以广播一重要事件,然后再恢复先前的节目。
现在转到图8,图中显示根据本发明的一个实施例用于处理数据流的过程的流程图。开始时,用户选定要从分布式数据库中提取的节目(步骤800)。用户接收与此选定节目对应的多重视频和音频流(步骤802)。用户或者直接地实时选择或通过使用用户定义的配置来选择音频流(步骤804),如果选定不只一个音频流(步骤806),则用户为这些选定的音频流配置展现档案(步骤808)。例如,如果选择了三个音频流,则用户将配置该系统在左声道播放一个音频流,在中央声道播放一个音频流和在右声道播放一个音频流。另一种作法是,用户可配置选定音频流的展现,使得一个音频流的音量比其他两个音频流的音量大。
接下来,用户从多个收到的视频流中选择一个或多个要显示的视频流(步骤811)。如果选择了不只一个视频流(步骤814),则用户配置这多个视频流的展现(步骤816)。例如,一个视频流将展现在视频显示器的左侧而第二个视频流展现在视频显示器的右侧。在另一例子中,一个视频流可能占据整个视频显示器屏幕,而第二个视频流被放在第一视频流内的一个较小窗口中。还有,还可对诸如不透明性和标度之类以及其他因素配置视频流。不透明性是指如叠加在事件上的菜单中看到的半透明,其中可通过该菜单看到该事件。标度可用于确定在显示装置上一视频流的显示尺寸。
一旦由用户选择和配置了媒体流,则音频和视频流被彼此同步(步骤818)并以用户配置的方式展现给用户(步骤820)。
再参考步骤806,如果没有选择多于一个的音频流,则用户从所收到的多个视频流中选择一个或多个要被显示的视频流(步骤811)。
再参考步骤814,如果没有选择多于一个的视频流,则音频和视频流被彼此同步(步骤818)并以用户配置的方式展现给用户(步骤820)。
可以利用若干种机制来同步数据流。例如,可在每个媒体流中与每个数据包一起发送时间标记,然后每个选定的数据流被同步展现给用户,使得具有相同时间标记的数据包在相同时刻展现。
每个数据流还可以在数据中包含以周期性出现的脉冲。数据流中的这个脉冲可以是例如不含视频或音频数据的数据包。再有,每个数据流含有以较长周期性出现的较大脉冲。例如,较短脉冲可以每30帧出现一次而较大脉冲每10秒出现一次。选定的数据流可以被同步使得各数据流中的脉冲同时出现。较长的脉冲使系统周期性地对其本身重新同步,如果数据流已被一个或两个较小数据脉冲构成的周期分离开了的话。
在第三种同步方法中,使用循环冗余校验(CRC)值。使用CRC数据同步数据流涉及对第一数据流计算CRC数据并把那些计算出的值放在第二数据流中数据包的头段中。把CRC值放在第二数据流中的数据包中,这第二数据流是应该与第一数据流中的数据包同步的。
转到图9,图中显示了根据本发明的一个实施例为产生同步数据流所用CRC值的过程的流程图。所示过程用于视频流,但可应用于其他类型数据流。
过程以选择一个未处理帧开始(步骤900)。这一步骤选择将作为数据流传送的内容的第一个未处理帧。然后对该帧计算CRC值(步骤902)。可对整个帧或该帧的不同部分计算CRC值。例如,可基于该帧的头5个字节、该帧中部的5个字节和该帧的最后5个字节来计算CRC值。
接下来,识别出第二数据流中要与这一帧同步的部分(步骤904)。然后把此CRC值放入用于该数据流那个部分的数据包头段中(步骤906)。然后确定是否存在其他未处理帧供处理(步骤908)。如果存在其他未处理帧,则过程返回步骤900。否则,过程终止。
当数据流被传送或广播时,可以使用图9中的过程。另一种作法是,在传送或广播一数据流之前启动这些过程。在这种情况中,这些CRC值可存储起来并当第二数据流被传送时添加到该数据流中。
现在转到图10,图中显示根据本发明的一个实施例使用CRC数据对数据流进行同步的过程流程图。图9中所示过程可在观看者一方实现以同步到来的数据流,供展现一个节目或事件。
过程以接收数据流开始(步骤1000)。在步骤1000中,数据流被接收供展现。这些数据流在展现之前被放在缓存器中(步骤1002)。对于存储在缓存器中的第一数据流中的一帧计算其CRC值(步骤1004)。然后,将计算出的CRC值与存储在缓存器中的第二数据流中的CRC值比较,以在第二数据流中识别出含有匹配的CRC值的一点(步骤1006)。在所描述的实例中,CRC值放在第二数据流中的头段内,其所在点的CRC值应与来自第一数据流一部分的计算CRC值匹配。然后,第一和第二数据流在匹配或者说同步点处展现(步骤1008),然后过程返回步骤1000。本发明可通过单向或双向通信来实现,取决于所用网络类型的带宽。
这样,本发明为用户提供了一种定制的经验。本发明提供若干不同类型数据流,音频的和视频的,它们被发送给一客户机,在客户机中可由客户机从这些数据流中进行选择,以定制出由用户观看的节目或事件,从而由本发明提供这种定制的经验。再有,本发明允许减小为提供定制节目所需的带宽量。当前,是为发送给观看者的节目的每个版本或定制创建一个数据流,其中的音频和视频不能被有选择地修改。通过发送一组流,不同的用户可以从中选择数据流的一个子集以定制一个节目或事件,而不是对一个节目或事件的每一所希望的定制创建一个新的数据流,在其中音频和视频以不可改变的形式传送,由此提供了这一优点。
指出这样一点是重要的,即尽管本发明是针对全功能数据处理系统描述的,但本领域的那些普通技术人员将会理解,本发明的过程能以指令的计算机可读介质形式以及多种形式分发,而且本发明同样可以应用而不论实际为实现这种分发所用的承载信号的介质的具体类型如何。计算机可读介质的实例包括可记录型介质,如软盘、硬件驱动器、RAM和CD-ROM,以及传输型介质,如数字和模型通信链路。本发明的描述是为说明和描述的目的而呈现的,并不想把本发明排它地局限于所披露的形式。对于本领域的技术人员,许多修改和变体将是显然的。所选择的描述的实施例是为了最好地解释本发明的原理和实践应用,并使本领域其他普通技术人员能理解本发明,以用于适合所期望的具体应用的经各种修正的各种实施例。
权利要求
1.在一个数据处理系统中用于用户选择一事件的多媒体数据流的方法,该方法包含接收一组视频流;接收一组音频流;展现该组视频流中的一些视频流;展现该组音频流中的一些音频流;以及响应用户对数据处理系统的输入,有选择地改变为该事件展现的该组视频流中的选定视频流和该组音频流中的选定音频流。
2.权利要求1的方法,这里的视频流展现在一显示器上,而这里的有选择的改变所展现的一组视频流中的选定视频流和一组音频流中的一部分的步骤包括改变显示器中展现该视频流的位置。
3.权利要求1的方法,这里的有选择地改变所展现的一组视频流中的选定视频流和一组音频流中的一部分的步骤包括选择该组视频流展现中的不同的选定视频流。
4.权利要求1的方法,这里有选择地改变所展现的一组视频流中的选定视频流和一组音频流中的选定音频流的步骤包括选择该组视频流中的附加选定视频流供展现。
5.权利要求1的方法,这里有选择地改变所展现的一组视频流中的选定视频流和一组音频流中的选定音频流的步骤包括选择该组音频流展现中的不同的选定音频流。
6.权利要求1的方法,这里有选择地改变所展现的一组视频流中的选定视频流和一组音频流中的选定音频流的步骤包括选择该组音频流中另外选定的音频流供展现。
7.权利要求1的方法,进一步包含接收一组包括文本的信息流;以及响应用户输入,有选择地在显示器上展现该组信息流中选定的信息流。
8.权利要求1的方法,这里该组视频流和该组音频流包括时间标记,该方法进一步包含利用时间标记使选定的视频流与选定的音频流同步。
9.权利要求1的方法,这里该组视频流和该组音频流包括周期性位于视频和音频数据流中的数据包,该方法进一步包含利用这些数据包使选定的视频流与选定的音频流同步。
10.权利要求1的方法,这里该组视频流和该组音频流中的某些选定的流包括参考循环冗余校验数据,这些数据是根据该组视频流和该组音频流中的其他流得到的,该方法进一步包含使选定流中的第一流的一部分与其他流中的第二流的一部分同步,作法是计算第二流的循环冗余校验数据计算值并将该计算出的循环冗余校验数据与第一流的参考循环冗余校验数据进行比较,以识别出同步点。
11.权利要求1的方法,这里的数据处理系统是计算机。
12.权利要求1的方法,这里的数据处理系统是个人数字助理。
13.权利要求1的方法,这里的数据处理系统是电视机。
14.在计算机化多媒体系统上定制一事件的多媒体展现的方法,包含下列步骤经由与该计算机化多媒体系统耦合的网络提供该事件的一组视频流、一组音频流和一组信息流;从该事件的该组视频流中选择供展现的视频流;从该事件的该组音频流中选择供展现的音频流;从该事件的该组信息流中选择供展现的信息流;响应用户输入,将选定的视频流和选定的音频流赋予视频和音频输出装置的相应部分;以及根据选定视频流和音频流的赋予,展现该事件。
15.权利要求14的方法,这里从该事件的一组视频流中选择供展现的视频流的步骤是在该计算机化多媒体系统中进行的。
16.权利要求14的方法,这里从该事件的一组音频流中选择供展现的音频流的步骤是在该计算机化多媒体系统中进行的。
17.如权利要求14中叙述的方法,这里该组视频流和该组音频流是由第一源提供的。
18.如权利要求17中叙述的方法,进一步包含响应用户选择,提供来自第二源的第二视频流。
19.如权利要求17中叙述的方法,进一步包含响应用户选择,提供来自第二源的第二音频流。
20.如权利要求14中叙述的方法,这里该组视频流、该组音频流和该组信息流由至少两个不同的源提供。
21.如权利要求14中叙述的方法,这里该组视频流、该组音频流和该组信息流是经由一宽带网络提供的。
22.供用户控制选择事件多媒体流的数据处理系统,该数据处理系统包含第一接收装置,用于接收一组视频流;第二接收装置,用于接收一组音频流;第一展现装置,用于展现该组视频流中的一些选定流;第二展现装置,用于展现该组音频流中的一些选定流;以及改变装置,用于响应用户向该数据处理系统的输入,有选择地改变为该事件展现的该组视频流中的一些选定流和该组音频流中的一些选定流。
23.权利要求22的数据处理系统,这里视频流展现在显示器上,而且这里的改变装置包括改变装置,用于改变在其中展现视频流的显示器中的一个位置。
24.权利要求22的数据处理系统,这里的改变装置包括第一选择装置,用于选择该组视频流展现的不同的选定流。
25.权利要求22的数据处理系统,这里的改变装置包括第二选择装置,用于选择该组视频流中的附加的选定流供展现。
26.权利要求22的数据处理系统,这里的改变装置包括第三选择装置,用于选择该组音频流展现中的不同的选定流。
27.权利要求22的数据处理系统,这里的改变装置包括第四选择装置,用于选择该组音频流展现中的其他选定流。
28.权利要求22的数据处理系统,进一步包含接收装置,用于接收一组包括文本的信息流;以及展现装置,用于响应用户输入,在显示器上有选择地展现该组信息流中的选定流。
29.权利要求22的数据处理系统,这里该组视频流和该组音频流包括时间标记,该数据处理系统进一步包含第一同步装置,用于利用时间标记使选定的视频流与选定的音频流同步。
30.权利要求22的数据处理系统,这里该组视频流和该组音频流包括周期性地位于该视频和音频流中的数据包,该数据处理系统进一步包含第二同步装置,用于利用数据包使选定的视频流与选定的音频流同步。
31.权利要求22的数据处理系统,这里该组视频流和该组音频流中的某些选定的流包括参考循环冗余校验数据,这些数据是根据该组视频流和该组音频流中的其他流得到的,该数据处理系统进一步包含第三同步装置,用于使选定流中的第一流的一部分与其他流中的第二流的一部分同步,作法是计算第二流的循环冗余校验数据计算值并将该计算出的循环冗余校验数据与第一流的参考循环冗余校验数据进行比较,以识别出同步点。
32.权利要求22的数据处理系统,这里该数据处理系统是计算机。
33.权利要求22的数据处理系统,这里该数据处理系统是个人数字助理。
34.权利要求22的数据处理系统,这里该数据处理系统是电视机。
35.在计算机化多媒体系统上定制一事件的多媒体展现的数据处理系统,该数据处理系统包含提供装置,用于经由与该计算机化多媒体系统耦合的网络提供该事件的一组视频流、一组音频流和一组信息流;第一选择装置,用于从该事件的一组视频流中选择供展现的视频流;第二选择装置,用于从该事件的一组音频流中选择供展现的音频流;第三选择装置,用于从该事件的一组信息流中选择供展现的信息流;赋予装置,用于响应用户输入,将选定的视频流和选定的音频流赋予视频和音频输出装置的相应部分;以及展现装置,用于根据选定视频流和音频流的赋予,展现该事件。
36.权利要求35的数据处理系统,这里用于从该事件的一组视频流中选择供展现的视频流的第一选择装置是在该计算机化多媒体系统中进行工作的。
37.权利要求35的数据处理系统,这里用于从该事件的一组音频流中选择供展现的音频流的第二选择装置是在该计算机化多媒体系统中进行工作的。
38.如权利要求35中叙述的数据处理系统,这里该组视频流和该组音频流是由第一源提供的。
39.如权利要求38中叙述的数据处理系统,进一步包含响应用户选择提供来自第二源的第二视频流。
40.如权利要求38中叙述的数据处理系统,进一步包含提供装置,用于响应用户选择,提供来自第二源的第二音频流。
41.如权利要求35中叙述的数据处理系统,这里该组视频流、该组音频流和该组信息流由至少两个不同的源提供。
42.如权利要求35中叙述的数据处理系统,这里该组视频流、该组音频流和该组信息流是经由一宽带网络提供的。
43.在计算机可读媒体中的供用户控制选择事件多媒体流的计算机程序产品,该计算机程序产品包含第一组指令,用于接收一组视频流;第二组指令,用于接收一组音频流;第三组指令,用于展现该组视频流中的一些选定流;第四组指令,用于展现该组音频流中的一些选定流;以及第五组指令,用于响应用户向该数据处理系统的输入,有选择地改变为该事件展现的该组视频流中的选定流和该组音频流中的选定流。
44.在计算机可读媒体中的计算机程序产品,用于在计算机化多媒体系统上定制一事件的多媒体展现,该计算机程序产品包含第一组指令,用于经由与该计算机化多媒体系统耦合的网络提供该事件的一组视频流、一组音频流和一组信息流;第二组指令,用于从该事件的可得到的该组视频流中选择供展现的视频流;第三组指令,用于从该事件的可得到的该组音频流中选择供展现的音频流;第四组指令,用于从该事件的可得到的该组信息流中选择供展现的信息流;第五组指令,用于响应用户输入,将选定的视频流和选定的音频流赋予视频和音频输出装置的相应部分;以及第六组指令,用于根据选定视频流和音频流的赋予,展现该事件。
全文摘要
用于在计算机化多媒体系统上定制一事件的多媒体展现以满足用户愿望的方法和系统。在一个最佳实施例中,该事件的一组视频流和一组音频流经由与该多媒体系统耦合的网络接供给用户。从该事件的该组可得到的视频流中选择一个或多个视频流供展现给用户。从该事件的该组可得到的音频流中选择一个或多个音频流供展现给用户。再有,不同音频流的相对音量可以调节。
文档编号H04N5/44GK1290895SQ0012867
公开日2001年4月11日 申请日期2000年9月20日 优先权日1999年9月30日
发明者罗纳德·W·.巴塞特, 布鲁斯·A.·比德尔, 米歇尔·维恩·布朗, 莱昂·P.·导德, 米歇尔·A.·抛利尼 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1