用于数字视频流的快速启动的制作方法

文档序号:7593283阅读:144来源:国知局
专利名称:用于数字视频流的快速启动的制作方法
技术领域
本发明一般涉及用于数字视频流技术。
背景技术
随着数字视频流技术(例如视频点播(VOD)系统)的出现,用户在从视频服务器接收数据时,或多或少能够看到和听到数字视频。
在视频流入时,随着数据下载到用户的接收设备(如计算机或机顶盒)上,输入视频流一般缓存于该接收设备。而在某些规定点(一般在缓冲器满时),将视频内容呈现给用户。随着视频内容的播放,接收设备清空存储在缓冲器中的数据。然而,在接收设备播放所存储视频的同时,会下载更多的数据,以重填缓冲器。只要数据能下载得至少如其播放一样快,文件就能流畅地播放。
MPEG主要的数字视频压缩与传输格式来自一个称为MPEG(运动图像专家组)的系列。这是用于以数字压缩格式编码音视频信息(如影片、视频、音乐之类)的标准的系列名。
为了解释视频流技术的方便,在此一般性地讨论与描述MPEG系列视频流。但是,那些本领域的技术人员会理解并意识到还存在并可以使用其它类似的数字视频压缩与传输格式。
当然,还有其它的数字视频压缩与传输格式,例如H.264编解码器。本领域的普通技术人员将会理解如何将这里所述的与MPEG有关的概念应用于其它格式。
GOP与帧MPEG视频流一般由一系列称为图像组(GOP)的分段来定义。一般而言,GOP由一组图像构成,当按其所需要的速度显示该组图像时,需要在短时段(如1/2秒)内顺序显示。
GOP一般包括三种帧·内帧(I帧);·预测帧(P帧);和·双向预测帧(B帧)。
对于GOP中可以使用的帧数没有特别的限制,在一个视频序列中也不要求所有的GOP中的图像数量相等。
I帧是编码的静止图像。其不依赖于解码器已经接收到的任何其它帧。每个GOP一般只有一个I帧。由于它是存取其所关联的GOP的入口,所以有时将其称为随机存取点(或“RAP”)。
从视频流解码器的观点看,P帧是从最近重构的I或P帧预测的。P帧(例如帧120p)需要来自先前解压的锚帧(如I帧或P帧)的数据以使其能够解压。
而以视频流编码器与发射机的观点来看,B帧是从最接近的两个I或P帧(过去一帧和将来一帧)预测的。B帧(例如帧132p)需要来自之前的和之后的锚帧(如I帧或P帧)的数据以解码其图像。它是双向依赖的。
当然,其它的数字视频压缩与传输格式(例如H.264编解码器)可以使用其它的标签、一些不同类型和不同的帧间关系。举例来说,在H.264中,帧类型、帧的依赖关系和帧的顺序比在MPEG中更加去耦。在H.264中,I帧可独立解码,并也是随机存取点。而且,帧定义了显示顺序(如MPEG一样)。但是,其它帧的关联与MPEG的P帧和B帧的关联不同。
如此,本领域的普通技术人员将会理解如何将这里所述与MPEG有关的概念应用于其它格式。
传输与显示时间线图1示出了同一MPEG视频流的两种表现。第一种是传输时间线100t,另一种是显示时间线100p。
传输时间线100t从由视频流编码器和发射机传输的角度示出了视频流。另外,也可从该视频流传输的接收机的角度来看。
如图1所示,I帧(如100t和150t)一般在时间上长于在传输时间线中的其它帧。由于它不利用来自任何其它帧的数据,所以它包含了产生一幅用于显示的完整图像所必需的所有数据。因此,I帧比任何其它帧包括了更多的数据。由于I帧比其它帧具有更多数据,因而它一般需要比其它帧类型更多的传输(当然还有接收)时间。
图1还示出了传输时间线100t的P帧(例如120t)和B帧(例如130t和132t)。相对于B帧,在传输时间线中P帧在时间上更长,因为它们一般比B帧包括了更多的数据。然而,P帧一般在时间上比I帧短,因为它们比I帧包括更少的数据。由于B帧依赖于来自至少两个其它帧的数据,所以它们一般不象(依赖于一个其它帧的)P帧那样,需要它们自身那么多的数据来解码其图像。
图1还从由视频解码器和显示器显示的角度示出了该视频流的显示时间线100p。与其传输时长相反,每个帧(无论其类型)的显示时长是严格相同的。换句话说,它按固定频率显示。
视频流的输入帧按固定频率(如每秒24帧(fps))来解码、缓冲,然后显示,以对用户产生相对流畅的运动图像显示。在用以传送NTSC视频的MPEG 2中,场速率是固定的,而每个MPEG 2图像可以产生1、2或3个场。需要场图像以产生1个场,而帧图像可能产生2或3个场。因此,帧图像显示速率可以是不固定的,但并不由这些帧图像的传输速率控制。
图1还示出了在其显示时间线中的典型的解码MPEG GOP 105。这一GOP的例子包括一个I帧110p、六个P帧(如120p)和14个B帧(如130p和132p)。一般而言,每个GOP包括以I帧(如帧110p)开头的一系列连续显示的解码帧。
传输与显示的顺序如图1所示,显示帧的顺序一般与传输这些帧被的顺序不直接匹配。在图1中传输时间线100t和显示时间线100p的帧间所示的箭头示出了帧在接收和显示之间重新排序的典型方式。每个箭头的尾部都有一个点(即圆圈),其锚定在某个传输帧的末端。每个箭头的头部都有一个箭头指向其相应的显示帧。
举例来说,传输I帧110t对应于显示I帧110p。实际上它们是同一帧,但它们的时间线表示指示出它们不同的表现。
回到这一示例的解释,传输P帧120t对应于显示P帧120p。传输B帧130t和132t对应于显示B帧130p和132p。如在图1中所示,在传输时间线100t中这些B帧130t和132t在它们的P帧120t后面被解码、发送、接收和解码,但在显示时间线100p中它们相应的显示B帧却在它们的P帧120p前面被显示。值得注意的是编码器一般按帧最终显示的相同顺序接收未压缩形式的帧,而编码器一般在压缩这些帧前进行帧的重新排序。
而且,下一个要传送的GOP开始于I帧150t,但在这一新的GOP开始后一般出现两个B帧134t和136t。如在图1中所示,在该新GOP的I帧150p的显示之前,顺序显示落后的B帧134p和136p。
GOP显示延迟图1示出了一个示例GOP的I帧110t时间上在点T1开始被首先接收,但它直到点T2才被首先显示。这两个点之间的时间差在此称为“GOP显示延迟”,在图1中标为170。它代表了从接收机第一次开始接收GOP的第一帧(一般是I帧)到设备第一次显示该GOP的第一帧的延迟。
这一延迟有很多原因。某些是视频流技术的自然结果,而另一些则是强加于该过程中以解决已知的技术问题。GOP显示延迟的某些原因包括·接收帧传输需要的时间与显示帧需要的时间之间的差异;·对帧进行解码需要的时间(特别是考虑到解码的帧间依赖);以及·为便于帧的流畅显示而无需等待帧的传输或解码的内建延迟。
这些原因的细节和对其它原因的认识对于本领域技术人员是已知的。
视频流显示启动延迟为了在某个视频流技术环境(例如数字线缆)中调谐频道,接收机接收视频流,并等待对该视频流存取点。直到接收存储点,频道才能发生改变。从用户的角度看,这可以导致较长的频道变换时间。
图2在280示出了视频流显示启动延迟的示例。启动延迟是用户所经历的实际延迟。它包括请求某特定视频流时和来自该特定视频流的GOP的第一帧的实际显示之间的延迟。如在图2中所示,启动延迟280包括(上面所讨论的)GOP显示延迟270。
这一示例参照图2来解释。以I帧210t开始的GOP正被传送。这在传输时间线200t中示出。接收机在请求点R调谐到这一视频流。这一选择示出为用户使用遥控器260选择视频流频道。
此外,这是一个用作解释性目的的示例。这一点R可以是GOP开始后(即在其I帧210t开始后)的任何时刻。
为了存取该视频流,接收机必须等待随机存取点(或RAP)。在本示例中,每个GOP都有一个RAP。I帧就是典型RAP的实例。所以,每个GOP都有一个I帧。这样,接收机在可以如传输时间线200t所示存取该视频流传输前必须等待下一个I帧(在下一个GOP的开头)。
一旦接收机在其缓冲器中具有了I帧,就可以往回参照它进行P和B帧的依赖解码。因此,传统的系统在其可以对(有用地)帧进行缓冲之前必须等待RAP。
在图2中,接收机在点M1从I帧250t开始对下一个GOP进行缓冲。这样,可以向用户最终显示的第一帧就是I帧250t,因为它是在接收器加入该视频流的点之后视频流中的第一个RAP。由于(上面所讨论的)GOP显示延迟,实际上在点M2(从显示时间线200p的I帧250p)开始显示该GOP,这也是启动延迟280的显示启动点S。
如屏幕262-266所演示,启动延迟是用户所经历的实际延迟。用户在请求点R(例如使用遥控器260)选择视频流频道,并看到空白屏幕,如屏幕262所示。当然,可能有信息显示在那里(例如电子节目信息),但由于它不是所期望的视频流内容,因此等效于空白的。
屏幕264示出即使在当前接收下一个GOP后该屏幕仍然是空白的。屏幕266示出帧250p的第一个图像最终向用户显示。
这一启动延迟的平均长度与平均GOP长度直接成比例。某些视频流提供器使用相对长的平均GOP长度。在这些情况下,这一延迟就更为剧烈,因为用户在她改变频道后等待下一个GOP到来的时间更长。
简短来说,这一启动延迟对于一般用户是非常烦恼的,并且会试验他们的耐心。

发明内容
在此所描述的是一种便于数字视频流显示的技术。在此所描述的一个实现减少了在系统调谐到视频流时发生的显示视频内容的第一帧的实际启动延迟。
本发明内容本身无意限制本专利的范围。而且,本专利的题目也无意限制本专利的范围。为了更好地理解本发明,请结合附图,参见以下的详细描述和所附权利要求书。本发明的范围在所附权利要求书中指出。


在整个附图中用相同的数字指代类似的部分和特性。
图1是示出典型的视频流传输时间线和其相应的显示时间线的图。
图2是用典型的视频流传输时间线和其相应的显示时间线示出显示启动延迟的图。
图3是按照在此所描述的利用单一可选视频流的实现,使出新的显示启动延迟的图。
图4是按照在此所描述的利用多个可选视频流的另一个实现,示出新的显示启动延迟的图。
图5是示出在此所描述的方法实现的流程图。
图6是示出在此所描述的方法实现的流程图。
图7示出了利用在此所描述的实现示例性环境。
图8示出了示例显示设备、电视和与该显示设备交互的多种输入设备。
图9是示出图7与8中所示的示例显示设备的各部件的框图。
具体实施例方式
在以下的描述中,为了解释目的,提出了特定的数字、材料和配置,以提供对本发明的透彻理解。然而,对本领域技术人员显而易见的是,本发明可以无需这些特定的示例性细节也可以实现。在其它情况下,省略或简化了众所周知的特性,以阐明本发明的示例性实现的描述,从而能更好地解释本发明。而且,为了理解容易,某些方法步骤被描绘成分开的步骤;但是,这些分开描述的步骤不应理解为必需依赖于它们出现的顺序。
以下的描述提出了用于数字视频流的快速启动的一个或多个示例性实现,其结合了在所附权利要求书中叙述的部分。这些实现以特征来描述,以便符合法定的书面描述、实现和最佳模式要求。但是,该描述本身无意限制本专利的范围。
发明者期望这些示例性实现成为示例。发明者不期望这些示例性实现限制所要求保护的本发明的范围;而是,发明者预期所要求保护的本发明还可以基和其它现有或未来的技术,以其它的方式来具体化和实现。
用于数字视频流的快速启动的实施例可以称为“示例性快速启动系统”。
为了解释的方便,数字视频流在此按照MPEG系列标准格式来讨论与描述。但是,本领域的技术人员会理解并意识到,还有其它这样的数字视频压缩与传输格式存在。
介绍在此所描述的要求保护的本发明一个或多个示例性实现可以由(图7-9的)显示设备708和/或如图7中所示出的计算环境的部分来(整体或部分地)实现。
为了在数字视频组播(如IP组播)环境下调谐频道,接收机接收组播视频数据流,并等待对该视频流的存取点。这有时候称为随机存取点(RAP)。直到接收RAP,频道改变才会发生。这样就会导致较长的频道变换时间。
组播环境是使用视频流技术的一类环境的一个实例。这样的环境可以利用互联网协议组播(即IP组播)。本领域的普通技术人员都很熟悉组播及其在组播环境中的应用。
在很多IP组播场合中,具有可用于客户端设备(即接收机)的限定比特率。用于客户端设备的比特率一般依赖于该客户端当前在所有可用的IP组播中收听哪个IP组播。
由于正在进行的IP组播的总数并不受对任何特定客户端的可用比特率的限制,因此本示例性快速启动系统尤其可应用于这一场合。一个系统可以始终组播多个加入的流(如可选的传输402-207)和一个主流。而且,个别的客户端设备可以为自己确定在任何给定的点要收听哪个流。而且,主流的比特率可以与该客户端设备可支持的连接一样高——这样,就可以获得相对高的呈稳定状态的视频质量。
如图3中所示,本示例性快速启动系统使用主组播视频流传输300t和一个或多个可选的组播导引视频流传输(例如传输302t),以获得较快的调谐时间。这些可选的流包括与主流同样的初始内容,但它们可能具有比主流更低的比特率。
这些可选的流可以是低比特率的,这样它们可以在比传输主流所需更少的时间传输。这被图形化地示为可选的视频流传输302t比主视频流传输300t中的相应帧更短。这里,“低比特率”的概念是以每幅图像(即帧)的比特数而言的。就每秒的比特数而言这可以是正常的比特率。
在本示例性快速启动系统中,响应于调谐指令,(比传统方法)更快速地显示视频流内容——即使起始图像是较低质量的。
尽管本示例性快速启动系统的讨论是限于MPEG系列数字视频压缩与传输格式的,但本领域的普通技术人员将会理解如何将如这里所述的与MPEG有关的概念应用于其它格式,例如H.264。
具有一个可选流的示例性快速启动系统图3示出了只有一个可选视频流的示例性快速启动系统的示例性操作。图3示出了主组播视频流传输300t和可选组播导引视频流传输302t。尽管这一讨论提到只有一个可选流的使用,但在这一示例中所述的这些概念也可应用于多个可选视频流的使用。
图3还示出了该操作如何减少明显的视频流显示启动延迟——这是用户所经历的实际延迟。这一启动延迟是请求特定视频流的时间和GOP第一帧实际显示之间的延迟。
这一示例参照图3来解释。以I帧310t开始的GOP在主流300t中传输。接收机在请求点R调谐到这一视频流。这一选择被示为用户使用遥控器360选择了视频流的频道。(但是,该视频流300t是在组播环境中请求的,但由于接收机还没有调谐到,该视频流实际上直到R后的某些点才可能传送到接收机。)这是还为了解释性目的的示例。这一点R可以是GOP内在其开头后(即在其I帧310t的开头后)的任何时刻。
接收机一般等待随机存取点(或RAP),以便对视频流进行存取。(在这一示例中,假定每个GOP都具有一个RAP。)I帧是典型RAP的一个实例。所以,接收机在对视频流传输进行存取并显示视频前必须等待下一个I帧(在下一个GOP传输的开头)。
在传统方法中,用户将在点M2第一个I帧350p的显示时看到视频显示(如在显示时间线300p中所示)。所以,传统的显示启动延迟(D)将是请求点(R)和点M2之间的差。写成公式就是D=M2-R[1]传统的显示启动延迟但是,代替等待主流传输300t中的下一个RAP的是,本示例性快速启动系统调谐到可选视频流传输302t。它在点A开始接收这一GOP传输。可选传输302t的RAP是I帧312t;所以,它可以在点S’以显示I帧312p开始显示可选显示时间线302p。
在显示可选视频流时(如在显示时间线302p中所示),示例性快速启动系统请求组播路由器在主流的下一个RAP(如I帧350t)将接收机切换到主流组播传输300t。
在显示可选视频流时(如在显示时间线302p中所示),示例性快速启动系统开始接收以主流的下一个GOP的第一帧(如I帧350t)开始的主视频流传输300t。在图3中,下一个GOP的第一帧(如I帧350t)在点M1开始。时间线上的点B代表接收可选流传输302t的最后一帧的结束。
从可选流传输302t切换回主流300t发生在图3中点B和M1之间的时隙中或附近。在图3中示出了这些点之间的放大并可见的时隙,以示出示例性快速启动系统有明显的机会来加入主视频流。现实中,点B和M1可能非常接近于同时发生,也可能就是同时发生的。在某些实施例中有可能具有小的交迭,使点B在点M1很短时间后发生。
在点M2,示例性快速启动系统开始显示以主流的下一个GOP的第一帧(如I帧350t)开始的主视频流显示300p。这在显示可选流显示302p的最后一帧(如帧322p)后(或非常接近这点)立即开始。在图3中的点M2指明了这一显示切换点。
为实现切换,可以希望主流为接合而作标记。另外,主流内RAP的位置可以经由某些其它机制来传递给组播路由器。而且,可以希望路由器具有对正常IP组播的扩展,使它可以在主流中下一个GOP到达时开始传递主流组播传输。
尽管并不是必需的,但还是希望对可选流302p的显示进行定时,使所显示的最后一帧(如帧322p)正好在显示主流显示300p的第一帧(如帧350p)之前显示。这样做就增强了视频内容的流畅显示——特别是它使得在点M2从可选流到主流显示的切换显示变得流畅。
如屏幕362-366所示,启动延迟是用户所经历的实际延迟。如屏幕362所示,用户在请求点R(如使用遥控器360)选择视频流的频道,并看到一个空白屏幕。当然,这里可能有信息显示(例如电子节目信息),但由于这不是所期望的视频流内容,所以等效于空白。
屏幕364示出了即使正在传送和接收可选流302t的RAP,屏幕仍为空白。然而,屏幕366示出帧312p的第一幅图像向用户显示。
在本示例性快速启动系统中(如在图3中所示),用户在点S’第一I帧312p的显示时首先经历视频内容的显示(如在可选显示时间线302p中所示)。所以,新的显示启动延迟(D’)将是请求点(R)和在点S’的可选流显示之间的差。表达成公式为D’=S’-R [2]新的显示启动延迟由本示例性快速启动系统所达到的时间节省就是D’与D之间的差。使用公式1和2,该节省的时间可以表达成公式D’-D=M2-S’ [1]节省的时间在本示例性快速启动系统中,用户体验由于新的启动延迟(D’)比传统启动延迟(D)少(即D’<D)而得以改善。本示例性快速启动系统通过与使用传统方法所经历的延迟相比减少了用户所经历的实际启动延迟而改善了用户体验。
具有多个可选流的示例性快速启动系统为了进一步使启动延迟最小,本示例性快速启动系统可以通过使用多个可选的、RAP阶段交错的视频流传输来考虑用户调谐到视频流频道的随机性。
图4示出了主组播视频流传输400t和阶段交错的多个可选导引视频流传输402t-407t。每个可选传输可以用所有可用的带宽来发送——从而使每个流的传输时间最小。而且,这些流的传输安排是阶段交错的,这样每个流的RAP的完整接收也就交错了。由于图4中所示的每个流的RAP都是在传输的开始,所以每个传输402t-407t的开始也就交错了。在图4中示出了可选传输的交错开始。
而且,可选流402t-407t的阶段交错的时间范围是在主流传输400t的RAP之间。如图4中I帧410t和450t之间的阶段交错所示。
通过发送多个不同的流,就改善了调谐时间,因为接收机可以选择这些导引流之一来播放。所选择的流一般是在用户调谐时刻后能最快准备显示的视频流。
在组播环境中,这些可选的传输不需要同时发送给某个特定接收机。更合适的是,每个流都准备好传输,但只有在特定接收机请求时才将特定的组播流发送给该接收机。图4示出了六个可选的请求点(R1至R6),其中每个点对应于一个特定的可选视频流传输(分别为流402t-407t)。
举例来说,当本示例性快速启动系统希望调谐到某个频道(实例由点R1至R6所示)时,它询问组播服务器(例如图7的内容服务器712),以便确定哪个导引可选流是尚未开始的第一个导引,而接收机就加入该可选组播传输。而后,本示例性快速启动系统请求路由器正好在主流的下一个RAP(如帧450t)之前将该接收机切换回主流组播传输400t。
由于可选流传输作为一座“桥”,直至接收机可以开始接收主流400t的下一个RAP,因此所有这些可选流(402t-408t)在图4中都示出为在点B结束。
在图4中,下一个GOP的第一帧(如I帧450t)在点M1开始。时间线上的点B代表接收每个可选流(402t-408t)的最后一帧的结束。
从每个可选流(402t-408t)切换回主流400t发生在图4中点B和M1之间的时隙中或附近。在图4中示出了这些点之间放大并可见的时隙,以示出示例性快速启动系统有明显的机会来加入主流。现实中,点B和M1可能非常接近于同时发生,也可能就是同时发生的。在某些实施例中有可能具有小的交迭,使点B在点M1很短时间后发生。
图4示出了分别对应于可选视频流传输402t-407t的可选视频流显示402p-407p。尽管并不是必需的,但还是希望对可选视频流显示402p-407p进行定时,使所显示的最后一帧正好在显示主流显示400p的第一帧之前显示。这样做就增强了视频内容的流畅显示——特别是它使在点M2从可选到主流显示的切换显示变得流畅。
示例性快速启动系统的操作图5示出了示例性快速启动系统的方法实现。这一方法实现可以以软件、硬件或它们的组合来执行。
在图5的510,用户调谐到特定的主视频流组播传输(如300t或400t)。这一示例点在图3的点R和图4的点R1至R6指出。
在512,示例性快速启动系统询问组播服务器(例如图7的内容服务器712),以便确定哪个可选的RAP阶段交错的导引可选视频流是尚未开始的第一个导引。当然,如果只有一个可选的传输,则这一询问可以简单地看成一个请求。
在514,示例性快速启动系统加入由该询问所标识的可选组播传输。它接收并缓存这一可选传输。这发生于(例如)图3的点A和图4的点A1至A6。
在516,它显示该已标识和缓存的可选传输的视频流。这发生于(例如)图3的点S。
在518,示例性快速启动系统正好在主流的下一个RAP(如帧350t和450t)切换回接收并缓存主流组播传输(如300t和400t)。这可以通过正好在主流的下一个RAP请求路由器将接收机切换回主流组播传输来做到。这发生于(例如)图3和4的指定点B和M1之间或周围。这也可以描述成发生在这些指定点“上或附近”。
示例性快速启动组播系统的操作图6示出了示例性快速启动系统的方法实现,该系统可以由一个内容提供器702和/或图7的内容分布系统706来实现。这一方法实现可以以软件、硬件或它们的组合来执行。
在图6的610,示例性快速启动系统同时对一个或多个可选视频流进行编码以用于传输。服务器系统对每个可选的流进行编码,使每个流的RAP相对于其它流都是阶段交错的。
而且,每个流都被编码成在同一点结束,而该点是在主视频流中下一个RAP可用时的点或其附近。这一指定点是(例如)图3和4的点M1。
在612,该组播系统接收到一个对哪个RAP阶段交错的导引可选视频流是尚未开始的第一个导引的查询。当然,如果只有一个可选的传输,则这一询问可以简单地看成一个请求。
在614,它将由该询问所标识的可选组播传输传送给请求它的接收机。
在616,该组播系统接收对路由器的正好在主流的下一个RAP之前将该接收机切换回主流组播传输的请求。在618,它响应于这样的请求进行该操作。这发生于(例如)图3和4的指定点B和M1之间或周围。这也可以描述成发生在这些指定点“上或附近”。
示例性环境图7示出了示例性环境700,其中可以(部分或全部)实现这里所描述的技术、系统及其它方面。示例性环境700是便于多媒体分布的电视娱乐系统。
环境700包括一个或多个多媒体内容提供器702、内容分布系统706和一个或多个经由可组播网络710耦合到内容分布系统706的显示设备708(1)、708(2)、…、708(N)。
多媒体内容提供器702包括内容服务器712和所存储的内容714,例如影片、电视节目、广告、音乐以及类似的音频和/或视频内容。内容服务器712控制将所存储的内容714从内容提供器702向内容分布系统706的发布。而且,内容服务器712还控制直播内容(如不是先前所存储的内容,例如实况转播)和/或存储在其它位置的内容向内容分布系统706的发布。
内容分布系统706可以耦合到网络720,例如某个企业内部互联网或互联网。内容分布系统706包括组播发射机728以及一个或多个内容处理器730。组播发射机728在可组播网络710上组播信号。
内容分布系统706表示向多个用户提供多媒体内容的头端服务。
可组播网络710可以包括有线电视网络、RF、微波、卫星和/或数据网络(例如互联网),也可以包括使用任何组播格式或组播协议的有线或无线媒介。而且,可组播网络710可以是任何种类的网络,使用任何种类的网络拓扑及任何网络通信协议,并可以显示成或实现成两个或多个网络的组合。
内容处理器730在将从内容提供器702接收到的内容在可组播网络708上发送以前处理这些内容。特定的内容处理器730可以将所接收的内容编码(或处理)为某种耦合到可组播网络710的多个显示设备708(1)、708(2)、…、708(N)所理解的格式。
显示设备708可以以许多方式实现。举例来说,显示设备708(1)接收从基于卫星的发射机经由卫星碟形天线734而组播的内容。显示设备708(1)也可称为机顶盒或卫星接收设备。显示设备708(1)耦合到用于显示由该显示设备所接收的内容(如音频数据与视频数据)以及图形用户接口的电视机736(1),。特定的显示设备708可以耦合到任何数量的电视机736和/或可以实现为显示或呈现内容的类似设备。同样,任何数量的显示设备708可以耦合到单台电视机736。
显示设备708(2)还耦合以从可组播网络710接收内容,并将所接收的内容提供给相关的电视机736(2)。显示设备708(N)是组合电视机738或集成机顶盒740的一个示例。在这一示例中,机顶盒的多种部件和功能被结合进电视机中,而不是使用两个分离的设备。结合入电视机的机顶盒可以经由卫星碟形天线或无线天线(例如碟形天线734)和/或经由可组播网络710接收组播信号。在可替换的实现中,显示设备706可以经由互联网或任何其它组播媒介接收内容。
示例性环境700还包括直播或存储的付费观看(PPV)内容742,例如PPV影片内容。这些存储的或直播的内容一般按照某一安排进行组播。当设备加入PPV组播频道时,就可以用显示设备708来观看PPV内容。
示例性显示设备图8示出了显示设备708的示例性实现800,其显示为耦合到电视机736的独立单元。显示设备708可以在任何数量的实施例中实现,包括作为机顶盒、卫星接收机、带硬盘的TV录像机、游戏控制台、信息设备、DVD播放机、个人视频录影机、个人计算机、家庭媒体中心、调制解调器等等。
显示设备708包括一个无线接收端口802(例如红外(IR)或蓝牙无线端口),用于从遥控设备804、手持输入设备806或任何其它无线设备(例如无线键盘)接收无线通信。手持输入设备806可以是个人数字助理(PDA)、手持计算机、无线电话等等。而且,耦合有线键盘以与该显示设备708通信。在可替换的实施例中,遥控设备804、手持设备806和/或键盘808可以使用RF通信链路或其它传输模式来与显示设备708通信。
显示设备708可以具有存储媒介阅读器809,用于读取内容存储媒介,例如DVD盘片。独立或非独立的显示设备708可以包括存储媒介阅读器809。
显示设备708可以从一个或多个组播源(例如从组播网络)接收一个或多个组播信号810。
显示设备708还包括用于向用户提供图形用户接口的硬件和/或软件,通过该接口用户可以(例如)访问多种网络服务、配置该显示设备708以及执行其它功能。
显示设备708能够经由一个或多个连接与其它设备通信,这些连接包括传统电话链路812、ISDN链路814、线缆链路816、以太网链路818、DSL链路820等等。显示设备708在特定时刻可以使用多种通信链路812-820中的一个或多个来与任何数量的其它设备通信。组播信号也可以经由这多种通信链路812-820来接收。
显示设备708产生视频信号820和音频信号822,这两种信号都被传送给电视机736。可替换的是,视频与音频信号也可以传送给其它音频/视频设备,例如扬声器、视频监视器、家庭影院系统、音响系统等等。
尽管没有在图8中示出,显示设备708可以包括一个或多个灯或其它指示器,标识该设备的当前状态。而且,显示设备可以包括一个或多个控制按钮、开关或其它可选择的控件,用于控制该设备的运行。
图9示出了图7和8中所示的显示设备708的选定部件。显示设备708包括第一调谐器900和可选的第二调谐器902。调谐器900和902表示一个或多个调谐到多种频率或频道以接收电视信号的频带内调谐器,以及调谐到或接收组播通信频道的频带外调谐器或接收机或网络接口卡,而其它内容可以在该组播通信频道上对显示设备708进行组播。
调谐器900和902可以是数字调谐器、模拟调谐器或任何用以将数字数据取入该客户端设备708的模拟与数字部件的组合。
显示设备708还包括一个或多个处理器304和一个或多个存储器部件。可能的存储器部件的实例包括随机存取存储器(RAM)906、硬盘驱动器908、大容量存储部件910以及非易失性存储器912(如ROM、闪存、EPROM、EEPROM等)。
显示设备708的可替换的实现可以包括一定范围的处理和存储能力,还可以包括比图9中所示的更多或更少类型的存储器部件。
处理器904处理多种指令,以控制显示设备708的运行并与其它电子与计算设备通信。存储器部件(如RAM 906、硬盘驱动器908、存储媒介910及非易失性存储器912)存储多种信息和/或数据,例如多媒体内容、电子节目数据、网络内容数据、用于显示设备708的配置数据,和/或图形用户接口信息。该设备可以将数据高速缓存入许多存储器部件任意一个。
操作系统914和一个或多个应用程序916可以存储在非易失性存储器912中,并在处理器904上执行,以提供运行时环境。运行时环境通过允许定义多种接口(这就允许应用程序916与显示设备708交互)而便于显示设备708的扩展性。
可以在显示设备708上实现的应用程序916包括电子节目指南(EPG)、利于电子邮件的电子邮件程序,等等。
显示设备708还可以包括在本示例中为简化目的而未示出的其它关于电视娱乐系统的部件。举例来说,显示设备708可以包括用户接口应用和便于观看者与该设备交互的用户接口灯、按钮、控件等。
网络接口924和串行和/或并行接口926使显示设备708能经由多种通信链路与其它电子与计算设备通信。尽管未示出,显示设备708还可以包括其它类型的数据通信接口,以与其它设备通信。
它可以包括调制解调器928或经由传统电话线或其它通信媒介利于与其它电子与计算设备通信的其它通信设备。
显示设备708具有接收组播数字数据的能力,它可以用调谐器900或902、网络接口924、调制解调器928或其它通信设备来接收。
显示设备708还包括音频/视频输出930,它向电视机或其它处理和/或显示或呈现这些音频和视频数据的其它设备提供信号。这一输出可以称为显示。
显示设备708还包括部分或全部地实现本示例性快速启动系统的快速启动模块940。它可以是应用程序或硬件部件。
尽管是分别地示出,但显示设备708的某些部件可以在特定用途集成电路(ASIC)中实现。而且,一般系统总线(未示出)在显示设备708内连接这多种部件。
系统总线可以实现成几种总线架构任意之一种或多种,包括存储器总线或存储器控制器、外部总线、加速图形接口,或使用多种总线架构中任一种的局部总线。举例来说,这样的架构可以包括卡总线、个人计算机存储器卡国际联合会(PCMCIA)、加速图形接口(AGP)、小型计算机系统接口(SCSI)、通用串行总线(USB)、IEEE 1394、视频电子标准协会(VESA)局部总线,以及也称为Mezzanine总线的外围部件互连(PCI)总线。
计算机可执行指令示例性快速启动系统的实现可以在计算机可执行指令的一般环境中来描述,例如由一台或多台计算机或其它设备执行的程序模块。总的来说,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等。一般来说,这些程序模块的功能可以如在多个实施例中所述进行组合或分布。
计算机可读取媒介示例性快速启动系统的实现可以存储在某些形式的计算机可读取媒介上,或通过它们传送。计算机可读取媒介可以是能由计算机所存取的任何可用的媒介。举例来说(但非限制),计算机可读取媒介可以由“计算机存储媒介”和“通信媒介”组成。
“计算机存储媒介”包括以任何存储信息(例如计算机可读取指令、数据结构、程序模块或其它数据)的方法或技术实现的易失性和非易失性、可移动和不可移动的媒介。计算机存储媒介包括(但不限于)RAM、ROM、EEPROM、按块擦除存储器或其它存储器技术、CD-ROM、数字万用盘(DVD)或其它光存储器、盒式磁带、磁带、磁盘存储器或其它磁存储设备,或可用以存储所希望的信息并能由计算机存取的任何其它媒介。
“通信媒介”一般将计算机可读取指令、数据结构、程序模块或其它数据实现在调制的数据信号中,如载波或其它传输机制。通信媒介还包括任何信息传递媒介。
术语“调制的数据信号”意指某种信号,其一个或多个特征可以以某种方式设置或改变,以便将信息编码到该信号中。举例而言(但非限制),通信媒介包括有线媒介(例如有线网络或直接线缆连接)和无线媒介(例如声学、RF、红外或其它无线媒介)。以上的任意组合也应当包括在计算机可读取媒介的范围内。
结论尽管本发明是以特定于结构特性和/或方法步骤的语言来描述的,但应当理解,在所附权利要求书中定义的本发明并不必需局限于所描述的明确特性或步骤。更合适地说,这些明确的特性或步骤是作为实现所要求权利的发明的较佳形式来揭示的。
权利要求
1.一种具有计算机可执行指令的计算机可读取媒介,这些指令在由计算机执行时实现一种方法,包含选择导引视频流,其中所述导引视频流对应于特定的主视频流传输;接收该选定的导引视频流的传输;显示所述选定的导引视频流传输的内容;将接收从所述导引视频流传输切换到所述主视频流传输;将显示从所述导引视频流传输的内容切换到所述主视频流传输的内容。
2.如权利要求1所述的媒介,其特征在于在选择中选定的导引视频流是从多个导引视频流之一所选择出来的。
3.如权利要求1所述的媒介,其特征在于所述切换在主视频流传输中所传送的随机存取点(RAP)发生时或附近发生。
4.如权利要求1所述的媒介,其特征在于所述切换正好在主视频流传输中所传送的随机存取点(RAP)发生之前发生。
5.如权利要求1所述的媒介,其特征在于进一步包含询问一视频流提供器,要求该提供器标识多个导引视频流传输中哪个是第一个具有可用RAP的传输,其中所标识的导引视频流传输就是所述选定的导引视频流传输。
6.如权利要求1所述的媒介,其特征在于将多个导引视频流传输安排为在传输主视频流传输的一个图像组(GOP)期间传输,其中一个GOP只具有一个RAP。
7.如权利要求1所述的媒介,其特征在于将多个导引视频流传输中每一个的RAP安排为相互阶段交错的传输。
8.如权利要求1所述的媒介,其特征在于多个导引视频流传输中的每一个都使用比所述主视频流传输所用的更低的比特率来进行编码。
9.如权利要求1所述的媒介,其特征在于所述视频流传输是组播。
10.一种计算设备,包含视频流显示设备;如权利要求1所述的媒介。
11.一种具有计算机可执行指令的计算机可读取媒介,这些指令在由计算机执行时实现一种方法,包含选择一特定的主视频流传输进行接收和显示;在传输所述主视频流传输中所传送的下一个随机存取点(RAP)之前,暂时接收对应于所述特定主视频流传输的导引视频流;将接收从所述导引视频流切换到所述主视频流传输。
12.如权利要求11所述的媒介,其特征在于进一步包含显示所述导引视频流的传输的内容;在将接收切换到主视频流后,显示所述主视频流传输的内容。
13.如权利要求11所述的媒介,其特征在于所述切换是在传输主视频流传输中的RAP时或附近进行的。
14.如权利要求11所述的媒介,其特征在于所述切换是在传输主视频流传输中要发生的下一个RAP时或附近进行的。
15.如权利要求11所述的媒介,其特征在于将所述导引视频流传输安排为在传输主视频流传输的一个图像组(GOP)期间传输,其中一个GOP只具有一个RAP。
16.如权利要求11所述的媒介,其特征在于多个导引视频流传输中的每一个都用比所述主视频流传输所用的更低的比特率来进行编码。
17.如权利要求11所述的媒介,其特征在于所述视频流传输是组播。
18.一种计算设备,其特征在于包含视频流显示设备;如权利要求11所述的媒介。
19.如权利要求11所述的媒介,其特征在于进一步包含选择多个导引视频流传输中的一个进行接收,其中每个导引视频流对应于特定的主视频流传输,其中选定的一个导引视频流传输是暂时接收的导引视频传输;显示该选定的导引视频流传输的内容;将接收从所述导引视频流传输切换到所述主视频流传输,并在所述主视频流传输中所传送的随机存取点(RAP)发生时或附近进行切换;将显示从所述导引视频流传输的内容切换到所述主视频流传输的内容。
20.如权利要求19所述的媒介,其特征在于进一步包含询问一视频流提供器,要求该提供器标识多个导引视频流传输中哪个是第一个具有可用RAP的传输,其中所标识的导引视频流传输就是所述选定的导引视频流传输。
21.如权利要求19所述的媒介,其特征在于将所述多个导引视频流传输安排为在传输主视频流传输的一个图像组(GOP)期间传输,其中一个GOP只具有一个RAP。
22.如权利要求19所述的媒介,其特征在于其中将多个导引视频流传输中每一个的RAP安排为相互阶段交错的传输。
23.如权利要求19所述的媒介,其特征在于其中多个导引视频流传输中的每一个都用比所述主视频流传输所用的更低的比特率来进行编码。
24.一种用于快速启动显示的方法,该方法包含选择多个导引视频流传输中的一个进行接收,其中每个导引视频流对应于特定的主视频流传输;接收选定的导引视频流传输;显示所述选定的导引视频流传输的内容;将接收从所述导引视频流传输切换到所述主视频流传输,并在所述主视频流传输中所传送的随机存取点(RAP)发生时进行切换;将显示从所述导引视频流传输的内容切换到所述主视频流传输的内容。
25.如权利要求24所述的方法,其特征在于进一步包含询问一视频流提供器,要求该提供器标识所述多个导引视频流传输中哪个是第一个具有可用RAP的传输,而所标识的导引视频传输就是所述选定的导引视频流传输。
26.如权利要求24所述的方法,其特征在于将所述多个导引视频流传输安排为在传输所述主视频流传输的一个图像组(GOP)期间传输,其中一个GOP只具有一个RAP。
27.如权利要求24所述的方法,其特征在于将所述多个导引视频流传输中每一个的RAP安排为相互阶段交错的传输。
28.如权利要求24所述的方法,其特征在于所述多个导引视频流传输中的每一个都用比所述主视频流传输所用的更低的比特率来进行编码。
29.如权利要求24所述的方法,其特征在于所述视频流传输是组播。
30.一种计算机,包含一个或多个具有计算机可执行指令的计算机可读取媒介,这些指令在由计算机执行时实现如权利要求24所述的方法。
31.一种具有计算机可执行指令的计算机可读取媒介,这些指令在由计算机执行时实现一种方法,包含根据同一原始视频内容制备多个视频流,以用于交迭传输安排,使得每一个视频流的随机存取点(RAP)都是阶段交错的;按照所述交迭传输安排,在通信网络上传送所述多个视频流中的一个或多个。
32.如权利要求31所述的媒介,其特征在于在所述传输安排中,所述多个视频流中每一个的图像组(GOP)传输于同一点或同一点附近结束。
33.如权利要求31所述的媒介,其特征在于所述多个视频流包括主视频流和导引视频流。
34.如权利要求31所述的媒介,其特征在于所述视频流中的一个或多个都用比其它视频流中一个或多个所用的更低的比特率来进行编码。
35.一种计算设备,包含传送设备,用于传送所述多个视频流中的一个或多个;如权利要求31所述的媒介。
全文摘要
在此描述的是一种便于数字视频流显示的技术。这里描述的实现减少了当系统调谐到视频流时显示该视频内容的第一个帧中发生的实际启动延迟。本摘要自身无意限制本专利的范围。本发明的范围在所附的权利要求书中指出。
文档编号H04N7/173GK1574972SQ200410048898
公开日2005年2月2日 申请日期2004年6月11日 优先权日2003年6月13日
发明者J·A·鲍德温, D·L·格林, J·H·格罗斯曼四世 申请人:微软公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1