用于使用控制消息管理可缩放视频和音频编码系统中的可缩放性信息的系统和方法

文档序号:7676160阅读:175来源:国知局

专利名称::用于使用控制消息管理可缩放视频和音频编码系统中的可缩放性信息的系统和方法
技术领域
:本发明涉及视频通信系统,尤其涉及用于在视频通信系统中以縮减比特率和计算复杂度两者的方式传达经可縮放视频编码的比特流的结构及对其的改变的技术。
背景技术
:针对编码效率中的一般改进的新型数字视频和音频"可縮放"编码技术具有多个新结构特性。具体地,重要的新特性是可缩放性。在可縮放编码中,原始或源信号是使用两个或多个分层结构化比特流来表示的。分层结构意味着给定比特流的解码依赖于分层结构中较低的部分或全部其它比特流的可用性。每个比特流连同其所依赖的比特流提供原始信号在特定时间、保真度(例如,在信噪比(SNR)方面)、或空间分辨率(对于视频)上的表示。应当理解,术语'可缩放'并非指数目方面的量级或等级,而是一般指编码技术提供与原始或源信号在分辨率或其它质量的不同'等级'上的有效表示相对应的一组不同比特流的能力。称为可缩放视频编码(SVC)的即将出现的ITU-TH.264附录F规范是提供了时间、空间和保真度所有维度中的视频编码可縮放性的视频编码标准的示例。SVC是H.264标准(也称为高级视频编码(AVC))的扩展。也提供所有三种类型可縮放性的较早标准的示例是ISOMPEG-2(也作为ITU-TH.262公布)。ITUG.729.1(也称为G.729EV)是提供可縮放音频编码的标准的示例。可縮放性被引入视频和音频编码中作为对流送和广播中分发问题的解决方案,以便允许给定通信系统与不同的接入网(例如,与不同带宽连接的客户端)、网络状况(例如,带宽波动)、以及客户端设备(例如,使用较大监视器的个人计算机对具有小得多的屏幕的手持式设备)一起操作。在共同转让的国际专利申请PCT/US06/028365中描述了专门为诸如视频会议等交互式视频通信设计的可缩放视频编码技术。此外,共同转让的国际专利申请PCT/US06/028365描述了称为可縮放视频通信服务器(SVCS)的新型服务器的设计。SVCS可有益地使用经可缩放编码的视频进行高质量和低延迟视频通信,并且与传统交换或译码多点控制单元(MCU)相比具有显著降低的复杂度。类似地,共同转让的国际专利申请PCT/US06/62569描述了合成可縮放视频编码服务器(CSVCS),该合成可縮放视频编码服务器具有与SVCS相同的益处,但是产生单个经编码的输出比特流。可縮放视频编码设计和SVCS/CSVCS架构可以其它有益方式来使用,例如在共同转让的国际专利申请PCT/US06/028367、PCT/US06/027368、PCT/US06/061815、PCT/US07/62357、和PCT/US07/63335中所述的这些其它有益方式。这些申请描述了可縮放编码技术的使用和用于服务器之间有效干线铺设(trunking)的SVCS/CVCS架构、减小的抖动缓冲器延迟、差错弹性和随机接入、可縮放视频比特流的"减薄"以便分别在减小的分组丢失和率控制的情况下提高编码效率。此外,共同转让的美国临时专利申请S/N.60/786,997描述了用于可縮放视频编码格式与其它格式之间的译码的技术,而共同转让的美国临时专利申请S/N.60/884,148描述了使用可縮放视频编码的视频通信系统中差错弹性的进一步改进。现在考虑使用可縮放视频或音频编码的改进视频和音频通信系统。具体地,为了改进此类系统,将注意力集中于管理或者直接或者通过一个或多个服务器从视频或音频比特流的源传达给接收者的可縮放性信息。源可以是编码现场视频并将其通过通信网络传送的传送端点、传送预编码视频的流送服务器、或者提供对存储在大容量存储或其它接入设备上中的文件的访问的软件模块。类似地,接收者可以是通过通信网络或者直接从大容量存储器或其它接入设备获得经编码的视频或音频比特流的接收端点。发明概要提供了用于使用可缩放编码的视频和音频通信系统中可縮放性信息的改进管理的系统和方法。系统和方法向系统组件传达经可縮放编码的比特流的结构以及可能随时间发生的改变。通信技术利用相关信息的差分编码并有益地实现缩减的比特率开销和縮减的计算复杂度。在优选实施例中,对于使用标准H.264SVC编码格式的视频通信系统,标准可縮放性信息SEI消息被更改并且还被补充成包括信令可縮放性信息改变的能力。可縮放性信息SEI消息的扩展集可通知接收者(例如,服务器、解码器/端点)所传送信号的可縮放性层结构及其改变。接收者可使用可缩放性层信息来适当地处理或解码接收到的信号。根据以下优选实施例的详细描述以及附图,本发明的其它特征、特性和各个优点将变得更显而易见,在附图中-图1是示出根据本发明的原理的SVC传输系统的示例性架构的框图;图2是根据本发明的原理的可縮放性信息状态管理过程的流程图3是根据本发明的原理的替换性实施例的可縮放性信息状态管理过程的流程贯穿附图中相同附图标记用于指代所例示的实施例的类似特征、元件、组件或部分,除非另外声明。此外,现在将参照附图对本发明的详细描述是结合示例性实施例进行的。发明详细描述提供了用于使用可缩放编码的视频和音频通信系统中可縮放性信息的改进管理的系统和方法。图1示出了使用可縮放编码的通信系统100的示例性架构。通信系统100包括在网络130上通过媒体网关140与客户端/接收器120传达视频和/或音频信号的媒体服务器或编码器110(例如,流送服务器或传送端点)。出于简便起见,本文的描述限于此类通信系统的视频部分。然而,应当理解,在此描述的用于视频部分的系统和方法可用于可縮放音频部分,并且应当理解,不能向音频信号提供空间可縮放性维度,但是多信道编码另外可被用于音频信号编码。此外,在此描述的系统和方法还可用于以可縮放方式编码的其它多媒体数据(例如,图形)。在通信系统100的优选实施例中,H.264SVC编码格式('SVC')被用于视频通信。(参见例如通过引用全部结合于此的SVCJD5规范中的2005年1月T.Wiegand、G.Sullivan、J.Reichel、H.Schwarz、M.Wien等人在泰国曼谷的联合视频组的Doc.JVT-R201的"JointDraft5:ScalableVideoCoding(联合草案5:可縮放视频编码)")。SVC是H.264AVC视频编码标准的可縮放视频编码扩展(附录F)。SVC在创建具有若干维度(例如,空间、时间、保真度或质量维度)中的可縮放性时提供了相当大的灵活性。SVC编码比特流可被结构化成若干分量或层。基层提供了源信号在某种基本保真度下的表示。附加层(增强层)提供了信号在高于基本保真度维度的附加可縮放性维度中的改进表示的信息。注意编码比特流上的层通常形成锥形结构,其中对层的解码要求存在一个或多个较低层。通常,对任何增强层进行解码要求基层的可用性。层的锥形结构无需总是这样的。例如,当通过多个描述编码或联播提供可縮放性时,对部分或全部层的独立解码会是可能的。本文所描述的系统和方法可应用于所有这些可縮放性格式。可縮放性可解决若干系统层难题,诸如异种网络和/或客户端、时变网络性能、尽力型网络递送等。然而,为了能够有效地使用这些这些特征,使它们可为视频编码器和解码器除外的系统组件所用是必不可少的。参照图1来理解有效地使用所有可縮放性特征的本发明的系统和方法。首先,注意在系统100中使用媒体网关140是任选的。当使用到客户端连接的直接媒体服务器时,或者当由大容量存储上的客户端可直接访问或者其它接入设备可直接或间接地(例如,通过通信网络的文件访问)地访问的文件来替代媒体服务器时,本发明的系统和方法是相同或类似的。考虑其中媒体服务器/编码器110(例如,流送服务器或者即为传送端点编码器的编码器)通过媒体网关140与客户端/接收器120传达可缩放媒体的简单计算环境。这种简单场景要求在媒体服务器与客户端之间建立用于传送所商定的一组层——这可能是例如RTP封装的SVCNAL单元——的连接。此外,媒体网关140必须获得指令(或基于其自身来推断)如何在操作上最好地利用传入分组(例如,所传送的RTP封装的SVCNAL单元)。在其中媒体网关MO具有SVCS/CSVCS架构的情形中,这种操作决定相当于决定哪些分组要丢弃以及哪些要转发。此外,对于适当的解码器操作,客户端/接收器120必须知晓或能够推导出哪些层集合被认为要被接收。为了实现这些功能,系统100必须向各个系统组件表示和传达所传送的比特流的可縮放性结构。作为示例性示例,考虑具有两个时间分辨率15和30fps以及两个空间分辨率QCIF和CIF的视频信号。这对应于四层可縮放性结构包含15fps的QCIF信号的层LO;包含30fps的QCIF信号增强的层L1;包含15fps的CIF信号增强的层S0;以及包含30fps的CIF信号增强的层的层S1。四层可縮放性结构中的编码依存关系可能是这样的LO是基层,L1依赖于L0,SO依赖于LO,而Sl依赖于L1和SO两者。系统100必须向系统组件描述这种四层结构以使得它们可适当地处理视频信号SVC提供了用于通过其可縮放性信息SEI消息(SSEI)描述经SVC编码的视频比特流的可缩放性结构的机制。补充增强信息(SEI)消息是包含在SVC比特流中的数据结构,这些消息提供了关于经编码的视频信号的、但并非解码过程的操作所必需的辅助性信息。在SVCJD5规范的章节F.10丄l中定义的SSEI包括关于每个层的描述性信息(例如,帧速率、概况信息),以及重要的编码依存性信息,即给定层依赖于哪些其它层来进行适当解码。在比特流的范围内,每个层由唯一"层id"来标识。特定层的编码依存性信息是通过编码直接依赖层的数目(num—directly—dependent—layers(数目—直接—依赖—层))以及一系歹U不同的值(directly—dependent—layer—id—delta(直接—依赖—层—id—△))来传达的,在它们被添加到特定层的层id时就标识该特定层进行解码所依赖的层的层id。设计如在SVCJD5规范的章节F.10丄l中定义的SSEI以实现能力协商(例如,在连接建立期间)、流适应(通过视频服务器或中间媒体网关)、以及低复杂度处理(例如,没有基于详细比特流解析的推断)。然而,SSEIJD5设计具有若干限制,这在近距离检查必用在通信系统中使用SSEI消息信息的方法时变得很明显。在通信系统(例如,系统100)的操作中,可以有其中所传送的流的结构被构建或更改(或者在服务器/源或者在媒体网关处)的若干实例。一在能力协商期间的初始定义。媒体服务器提供一组可縮放性层,而客户端或者直接或者经由协商过程(例如,使用会话描述协议(SDP))接受其全部或子集。—由媒体服务器或媒体网关对分层结构进行更改以适应改变的系统状况(例如,媒体网关与客户端之间增加的分组丢失或客户端处期望显示分辨率的改变)。一归因于编码器决定而对分层结构进行的更改。此类编码器决定的示例涉及细粒度可縮放性(FGS)、用于提供保真度可縮放性"~~其中FGS层比特流的一部分可用于产生縮减的质量下的信号的——的机制。作为在SVCJD5中设计FGS的方式的结果,使层依存性在从一个画面到下一个(或者实际上,从一个切片变成下一个)时改变是可能的。具体地,考虑在给定层处采用使用FGS的较低层作为参考来执行预测以及预测仅基于该较低层的一部分的情形。在此情形中,相同层的不同画面可依赖于不同较低层是可能的,因为某些层由于率控制而会被完全消去。一种不会改变层依存性结构的可能的解决方案是使用空NAL单元。然而,这在SVCJD5中是不允许的。这种情形被视为类似于紧邻的前一个层,而不同之处在于层依存性在时标上发生的改变是极大的(每个切片)。能力协商是SVC规范的范围之外的通信系统特征,而可縮放编码是通用的。诸如IP电话等相关通信应用领域已开发了用于能力协商的大量程序。例如,基于会话发起协议(SIP)的通信系统使用基于SDP的要约/回应。注意对这种能力协商功能单独使用SSEI是不必要的。根据本发明,SSEI不仅应当指示编码器能够产生什么,还应当较佳地指示在所传送的比特流中实际(或将)包含什么。根据本发明,在此方面,SSEI被更改成定义比特流的整体可縮放性信息结构,该结构被认为是有效的,除非另外通知。对分层结构的更改(即,流适应性调整)可在媒体服务器/编码器或者中间媒体网关(可能存在一个以上的此类媒体网关)处的通信系统的操作中发生。流适应性调整的示例是其中客户端/接收器120决定切换或改变分辨率(例如,从CIF到QCIF)的情形。分辨率的切换或改变是通过在媒体网关140或传送服务器110处丢弃相应分组来实现的。对分辨率的改变的触发是使用传统信令(如在图1中示为信令路径150)来完成的。对于适当的切换操作的一个重要考虑是何时可信令通知客户端/服务器120所请求的改变已发生。在缺乏任何此类信令通知的信息时,客户端/接收机120将在某个时间仅接收总分组或比特(对应于QCIF分辨率的)的子集。然而,无法得知高分辨率分组或比特的丢失是有意的(其请求的结果)还是归因于分组或比特丢失。与单环路解码有关的考虑会恶化这个问题,因为在不存在目标层数据的情况下,较低层画面可能在客户端/接收器120处不能被显示。如前所述的此类切换信息可通过以传统方式(例如,经由信令路径150)从媒体服务器或媒体网关到客户端/接收器120信令信息来提供。然而,本发明认识到,如果分层结构信息与编码数据一起在带内被运送,则有相当多的益处(例如,在同步或对差错状况的响应时间的方面)。分层结构信息(对消息的改变)可在经更改的SSEI消息中被带内携带。另一个归因于改变的系统状况的流适应性调整的示例涉及对网络引起的分组丢失的适应性调整。在此情形中,媒体网关可决定使用质量可縮放性特征改变或縮减例如所传送的流的带宽。再次为了适当操作,必须及时地通知或指令客户端/接收器120关于要接收的流中的改变。改变的分层结构信息可与编码信息一起及时地在经更改的SSEI消息中带内携带。类似于流适应性调整的情形是编码器驱动的层结构改变的情形。与以上讨论的流适应性调整的情形相比,编码器驱动的层结构改变并非响应于系统参数改变而由客户端或媒体服务器发起,而是代之以由视频编码器所用的编码过程的"伪像"引起。类似于信号适应性调整情形,关于分层结构的改变的信息可与编码数据一起经由经更改的SSEI消息在带内及时信令通知以便与媒体网关和解码器进行适当的同步。前述情形中系统100的操作的考虑表明在通信会话期间需要在不同时间以及在可能与切片级一样高的时标(或频率)上提供可縮放信息消息。注意仅当使使用可縮放性信息消息(例如经由经更改的SSEI消息)时的开销十分小时,提供该消息才是实用的。此外,由于由给定服务器或网关支持的客户端的数目在通信系统中出于经济目的常常被最大化,因此在解析以及生成有关消息时使通信系统中的计算负担最小化显然是可取的。注意SVCJD5规范规定仅在即时解码刷新(IDR)接入单元(章节F.10.2.1)处使用SSEI。IDR接入单元与帧内画面等效,它具有相当大的比特率开销,并且通常在交互式视频通信系统中仅被使用一次(仅用于第一画面的解码)。这种限制进一步阻止了对信号可縮放性信息改变使用标准SSEI。由于SSEI的主要用途之一是帮助服务器和媒体网关适当处理SVC流,因此如果此类消息的处理复杂度被最小化则是有益的。这通常使用固定长度字段以及尽可能少的选项来实现。为了最小化与SSEI消息相关联的比特率开销,这种简化与有效压缩的需要相抵触。如果SSEI消息传输的粒度十分高(如以上所述的,可能在切片级),则编码效率特别重要。鉴于压缩的观点,已对SSEI信息的更有效表示给出提议。(参见例如通过引用全部结合于此的2006年1月I.Amonou、N.Cammas、S.Kervadec和S.Pateux在尼斯(Nice)、曼谷的联合视频小组的Doc.JVT-R068的"ImprovedSignalingofScalabilityInformation(改进的可縮放性信息的信令)")。然而,所提议的表示基于相当可观的计算复杂度。例如,前述Doc.JVT-R068提出了在使用大量可縮放层时显示縮减约50%开销的表示。所提议的表示基于在编码不同层时的树结构方法,其中每个节点级对应于三个可縮放性维度(依次为空间、时间和质量)中的一个。呈现点对应于树的叶子。相反,SVCJD5语法基于对以任意次序编码的呈现点的连续解析。这类似于仅对Doc.JVT-R068中所提到的树结构的叶子进行解析,并注意其缺陷在于,某些信息被非必要地从一个层复制到下一层。在基于树的方法中,具有共同祖先的叶子无需复制由其共同父亲表示的信息。然而,这种不必要的复制可通过在创建SSEI时对选项标记采取明智使用的替换性编码方法来避免。例如,当仅temporalJevel(时间—级)从一个层到下一层改变时,实际上直接推断两个层中的帧大小是相同的并由此帧大小仅需被提供一次(例如,在最低层)。在使用前述两种方法(即,Doc.JVT-R068和具有任选标记的编码的替换解释SVCJD5语法)的情况下,注意"计算-压縮"权衡并非是理想的。与这些方法相比,本发明采用基于层依存性信息的差分编码的技术,以使得层可随意添加、替换或移除。与前述方法相比,本发明技术同时将比特率开销和计算复杂度縮减至最低水平。可参照将用于输送必要SSEI信息的本发明技术应用于其中假定在通信系统中的服务器、网关或客户端处获得初始SSEI并将其作为状态信息来维护的示例来理解本发明技术。从SSEI状态移除一个层或层的子集所需的比特是十分少的,因为仅需传送足够的"差分"信息来标识将截短SSEI信息结构的层。换言之,可基于对所指示的层的标识来从状态信息消去该层以及依赖于其的所有层。类似地,为了将新的层或新的层集添加到SSEI状态,仅传送与要添加的层有关的差分信息就足够了。通过设计,此方法消除了与将分层结构信息的编码从一个SSEI实例复制到下一实例有关的所有开销。与SSEI信息的编码相关联的总比特率中归因于这种差分编码的縮减允许对所需的消息使用简单的编码结构,以使得由媒体无意识(至少在视频编码级或H.264术语中的VLC)网关对它们进行的解析可被简化。注意本技术的确作出关于这些SSEI消息将如何被输送或——更重要的——它们是否以及如何被可靠输送的任何假设。如果相同消息被接收到一次以上,则仅确保状态一致性是足够的。SSEI消息可以任何合适的方式用层结构信息来补充。在此描述了两个实施例(实施例A和B)。在实施例A中,SSEI通过三个附加可縮放性信息控制SEI消息——对应于添加、替换或移除一个或多个层的操作——来补充。这些操作被累积地应用;换言之,基于应用所指示的操作假定的输入状态是就在该操作之前有效的状态。在替换实施例(实施例B)中,SSEI信息通过分别指示哪些层不存在以及哪些层已改变了解码依存性信息的两个附加可縮放性信息控制SEI消息来补充。与实施例A的累积操作相比,实施例B中的操作不以累积方式来应用,而是代之以假定应用所指示的操作的输入状态是由最近SSEI消息所构建的状态。在SEI消息可能经历丢失的环境中,实施例B可能是较佳的。在此情形中,在会话建立期间,初始SSEI可使用可靠输送机制来传达给接收器或媒体网关。如同在实施例A中那样,在实施例B中,任何介入可縮放性信息控制消息的丢失将不影响接收器或媒体网关的状态信息实施例B。本发明的实施例A引入SVCJD5的附录D(章节D.l)中的三个新的SEI有效载荷类型。scalability—info—add(可縮放性—信息—添加)(有效载荷类型26),它将一个或多个层添加到现有SSEI信息结构中;scalability—info—replace(可縮放性—信息—替代)(有效载荷类型27),它替代现有SSEI信息结构的一个或多个层;以及scalability—info—delete(可縮放性—信息—删除)(有效载荷类型28),它从现有SSEI信息结构中删除一个或多个层。用于'添加,和'替代'版本的语法与基本scalability—info(可缩放性—信息)结构的相同。仅所包含数据的语义被改变,且仅根据SSEI状态管理如何被执行来改变(换言之,各个字段解释保留相同)。'删除'版本的语法可以是简单的,因为它仅需要标识要移除层的层id。注意'替代'版本主要对处理层依存性信息中的改变有用。由于没有其它信息需要被编码,因此可使此类消息的大小十分小(例如,取决于层的数目,约为30-40比特的数量级)。在以下,使用术语"SSEI信息"指这四种可縮放性信息中的任一种,除非另外指出。由于当前SVCJD5规范规定仅在IDR接入单元处使用SSEI(章节F.10.2.1),因此在本发明中,允许SSEI信息在任何接入单元的起始处出现。当SPS(SVC中的序列参数集)参数nal_extension—flag(nal—扩展—标记)被设为0时,在该SPS中定义所有层的dependencyjd(依存性—id)、temporal—level(时间—级)、以及qualityjevel(质量_级)值(在此称为DTQ值)(章节F.7.3.2)。如果NAL语法元素extension—flag(扩展—标记)为0,则给定NAL单元与这些值的关联是使用simple_priority_id(简单—优先级一id)来执行的。如果extension—flag为1,则根据当前规范,simple_priority—id被忽略,并且DTQ参数的NAL报头值被使用。注意当profile—idc(概况—idc)不等于83时,则类型20和21的所有NAL单元必须置位其extension_flag(章节F.7.4.2)。如果假定在SPS级,nal—extension—flag被设为0,则所有SVCNAL报头将仅采用simple_priority—id而非整个DTQ集。为了允许服务器或网关处理NAL流,必须解析两个消息。SSEI提供了详细的分层信息,而SPS将特定层映射到优先级id值。看起来没有要在SPS包括此信息的强制性理由,并且实际上存在不如此进行的若干个理由。一旦检査到包含在SPS中的其余信息,就会注意到它们都不涉及输送问题。相应地,在本发明下,SPS的相关部分可被移除,并且代之以将其编码移到SSEI。naLextension一flag的使用较佳地应当是流范围的,换言之,不应当允许具有扩展NAL报头和不具有扩展NAL报头的NAL共存。尽管理论上,实现这种能力可能看起来会提供更大的灵活性,但是实际上这种能力使得服务器和网关的操作变得复杂且没有真正实质的益处。结果,在本发明下,对nal—extension_flag的编码并非是每个层地进行的,而是每个SSEI进行的。这与其中以每个SPS为基础进行编码的SVCJD5相一致。通过在SSEI级进行simple_priority_id编码,不再需要令DTQ值的编码为任选的,并且结果SSEI的相应标记(decoding—dependency—info_present—flag(解码—依存性j言息—存在—标记))可被移除。先前己注意到SVC是H.264AVC视频编码标准的可縮放视频编码扩展(附录F)。AVC兼容层意味着在没有simple_priority—id或DTQ字段扩展的情况下使用NAL单元报头。根据SVCJD5规范,值被假定为0。在本发明中,在SSEI级信令simple_priority—id或DTQ字段扩展的值。表1示出了根据本发明的原理对SVCJD5规范的章节F.7.3.2——序列参数集SVC扩展语法——作出的示例性语法改变。这些改变包括与优先级id和DTQ有关的语法元素的移除。表I<table>tableseeoriginaldocumentpage19</column></row><table>表II示出了根据本发明的原理在附录D,D.l,SEI有效载荷类型语法中作出的示例性语法改变(添加)。对应于添加、替代和删除操作添加了三个新的有效<table>tableseeoriginaldocumentpage20</column></row><table>表III示出了根据本发明的原理在章节F.10丄l——可縮放性信息SEI消息语法——中作出的示例性语法改变。注意到了nal—unit_extension_flag(nal—单元j广展—标记)的引入(从SPS移入),以及avc_compatible—flag(avc—兼容—标记)的引入。此外,注意到对于非AVC层,总是存在DTQ编码,并且如果nal—unit—extension—flag未被设置(即,当NAL单元不携带显式DTQ信息时),构建DTQ关联的priority—id。表III<table>tableseeoriginaldocumentpage21</column></row><table><table>tableseeoriginaldocumentpage22</column></row><table>也可对SSEI消息语法元素的语义解释作出相应改变(SVCJD5规范的章节F.10.2.1——可縮放性信息SEI消息语义)。具体地,IDR接入单元放置约束被移除。此外,当存在时,SSEI消息将对其之后的所有NAL单元起作用,并且替代对于当前流有效的任何以及所有先前的可缩放性信息。消息的语义是有效的,直至类型为scalabilityjnfo(可縮放性_信息)、scalability—info_add(可縮放性—信息_添力[])、scalability—info—replace(可縮放性—信息—替代)或scalabilityjnfo—del(可縮放性—信息—删除)的下一SEi消息。值为0的nal一unit一extension—flag[i]的语义指定dependency—id[i]、temporal—level[i]、禾口quality—id[i]至U层layer一id[i]的simple_priority_id[i]的映射被包括在此可縮放性信息SEI消息中。等于1的nal一unit—extension—flag指定simple_priority—id[i]参数不存在。当nal—unit—extension—flag不存在日寸,推断出其等于1。在此可縮放性信息SEI消息之后的具有等于20和21的nal—unit—type(nal—单元一类型)的所有NAL单元的NAL单元语法元素extension—flag应当等于nal—unit—extension—flag。当profile_idc不等于83(标识SVC)时,引用当前序列参数集的具有等于20和21的nal_unit—type的所有NAL单元的语法元素extension—flag应当等于1。此外,不允许在任何后续scalability_info_add或scalability—info_replace消息中的nal—unit—extension—flag的值不同,除非首先通过scalability—info消息进行更改。avc_compatible—flag[i]的语义是等于1的值指定层layerjd[i]遵从AVC规范。当avc—compatible一flag[i]等于0时,当前层遵从SVC规范。当avc—compatible—flag[i]等于1时,NAL单元报头不携带扩展报头信息。当avc—compatible—flag等于1日寸,贝U当前层i的dependency—id[i]、temporal—level[i]和quality—level[i]的值全部被假定为0。priority—id[i]的语义是它指定在语法元素dependency—id、temporal—level禾Oquality—level(如在SVCJD5规范的章节F.7.4.1中指定的)的推断过程中要使用的simple_priority—id值。对于priority—id[i]的所有值,其dependency—id[i]、temporal—level[i]禾卩quality—level[i]不存在,贝ij应当推断dependency—id[i]、temporal—level[i]禾口quality—level[i]等于0。最后,temporal—level[i]、dependency—id[i]和qualityJevd[i]分别等于具有等于i的层标识符的可缩放层中NAL单元白勺temporal—level、dependency—id禾卩quality—level。女口果temporal—level[i]、dependency—id[i]禾口quality—level[i]不存在,贝寸它们被假定为0。新的SEI'scalabilityjnfo—add'消息的语法与'scalability—info,SEI消息的相同。根据其语义,在存在时,此SEI消息将对之后的所有NAL单元起作用。它将多个层添加到当前有效的可縮放性信息。如果接收机处维护的可縮放性信息中已存在此消息中描述的层的layer—id,则该层的整体信息被删除,且在其位置使用此消息中包含的信息。在应用了此消息之后有效的可縮放性信息状态保持有效,直至类型为scalability—info、scalability—info_add、scalabilityjnfo—replace或scalability—info—del的下一SEI消息。所有字段的语义与scalabilityjnfo的相同。新的SEI'scalability—infojeplace,消息的语法与'scalability_info,SEI消息的相同。根据其语义,在存在时,此SEI消息将对其之后的所有NAL单元起作用。它替代了当前有效的可縮放信息中多个层——如其layerjd所指定的——的信息。仅包含在消息中的信息被替代;未被给定消息更改的任何先前设置实际上保持未更改。在应用了此消息之后有效的可缩放性信息状态保持有效,直至类型为scalability_info、scalability—info—add、scalability—info—replace或scalability—info_del的下一SEI消息。所有字段的语义与scalability_info的相同。表IV示出了根据本发明的原理的新的'scalability—info—del,SEI消息的示例性语法。如表中所示,消息包括要考虑从比特流中移除的层的层id的列表。在存在时,此SEI消息将对在其之后的所有NAL单元起作用。它删除了当前有效的可縮放信息中多个层——如其layer—id所指定的——的信息。在应用了此消息之后有效的可縮放性信息状态保持有效,直至类型为scalability—info、scalability—info—add、scalability—info_replace或scalability—info一del的下一SEI消息。所有字段的语义与scalability—info的相应语义相同。表IV<table>tableseeoriginaldocumentpage24</column></row><table>图2示出了实施例A中的示例性状态处理算法200的流程图。接收器的初始层结构状态(State(状态))为空。在步骤22,接收器从比特流或者通过诸如信令的替换手段获得可縮放信息SEI消息。所获得的scalability—infoSEI消息可充当初始化SSEI消息并用于初始化State。类似获得的'添加'、'删除'和'替代'可縮放性信息SEI消息可分别对当前状态添加、移除或更改一个或多个层。注意多个层可能受到这些消息的每一个的影响。然而,为了清晰起见,图2中的示图示出了对单个层(层(i))的影响。在某些通信或通信环境中,SSEI信息消息的传达可能从不与视频数据一起处于带内,但是总是在会话建立期间或通过其它可靠通信手段被传达。由于视频数据可能通过具有非零分组丢失率的信道输送,因此期望确保这种关键信息不会经历可能的丢失。对于这种通信系统或通信环境,在本发明的替换性实施例B中,可縮放性信息可由在SDP协商期间提供或者在IDR接入单元中存在(例如,以文件格式)的scalability_infoSEI消息来构建。在此类scalabilityjnfoSEI消息中的信息构建可縮放信息直至序列的末端、或者直至接收到另一scalabilityjnfoSEI消息、或在SDP的情形中重新协商。除层间的内部依存性之外,可縮放性信息不允许在那段时间内改变。实施例B相对于实施例A的另一不同之处是关于处理状态管理的方法。在实施例A中,以累积方式应用状态改变,这具有单个消息的丢失可能破坏状态信息的缺点。在替换性实施例B中,状态改变总是参照最近scalability—infoSEI消息来应用,并且丢失影响不会被混合。在实施例B中,'添加'SSEI消息未被使用,而'删除'SSEI消息被重新命名为'layers—notpresent(层_不存在),。'layers_notpresent,SSEI消息指示在始于包含SEI消息的接入单元的比特流中将不存在特定层以及所有依赖层。哪些层不存在的指示总是相关于当前活跃的scalability—infoSEI消息来执行。注意用于在特定层已被移除之后指示该特定层已被添加的方便机制是传送移除除被添加的特定层之外的所有当前不存在的层的'layers_notpresent'消息。作为示例性示例,假定具有3个层——编号为0、1、2——的比特流。进一步假定在初始传送所有3个层之后,媒体服务器传送指示层1和层2不存在的'layers—notpresent'消息。在此情形中,层1可在稍后时间通过传送指示仅层2不存在的'layers—notpresent'消息来添加。实际上,这指示层1已被添加。媒体服务器(或媒体网关)可在传送此'layers—notpresent,SEI消息之后立即开始传送层1信息。在实施例B中,第一实施例的'替代'SSEI消息被改成'dependency—change(依存性—改变)'消息。可縮放性信息依存性改变SEI消息指示特定layerjd的层依存性已被改变,并提供新的层依存性信息。依存性改变SSEI消息的语法不允许在与可縮放性信息相关联的信息中有其它改变。表V示出了取代SVCJD5规范的章节D.l中的语法的备选的新SEI有效载荷类型scalability—infoJayers—notpresent(可縮放性_信息—层—不存在)(编号26)禾口scalability—info—dependency—change(可縮放性_信息_依存性—改变)(编号27)的示例性语法。与实施例A相比,在实施例B中,允许仅在IDR画面存在可縮放性信息SEI消息。除层依存性信息之外,消息的语义是有效的直至下一相同类型的SEI消息。表V替换性SEI有效载荷类型seipayload(payloadType,payloadSize){C描述符if(payloadType==0)Bufferingperiod(payloadSize)5elseif(payloadType==l)5elseif(payloadType==22)scalability—info(payloadSize)/承在附录F中规定*/5elseif(payloadType==26)scalabiIity_info—layers—notpresent(payloadSize)/*在附录F中规定承/5elseif(payloadType==27)scalability—info—dependency—change(payloadSize)/*在附录F中规5elsereserved—sei—message(payloadSize)5if(!byte—aligned(》{bit—equal—to—one/*等于1*/5f(l)while(!byte—aligned(》bit—equal—to—zero/*等于0*/5f(l)特定层可用scalability_info—layers—notpresentSEI消息指示为非活跃(不再存在于比特流中)。在表VI中示出了此消息的示例性语法。表VI可縮放性信息层不存在SEI消息scalabilityinfolayersnotpresent(payloadSize){c描述符numlayers5ue(v)for(I==0;i<numlayers;i++){layer—id[i]5u(8)在存在时,此SEI消息将对在其之后的所有NAL单元起作用。该消息指示由其layerjd标识的指定层将不存在于比特流中。在应用了此消息之后有效的可縮放性信息状态保持有效,直至类型为scalability—info或scalability—info_layers_notpresent的下一SEI消息。num—layers(数目—层)指示在解码此SEI消息之后比特流中将不存在的可縮放层或呈现点的数目。num—layers的值在0到255(包括0和225)的范围内。当num—layers具有值0时,其指示所有层都存在。layer—id[i]指示被标识为比特流中不存在的可縮放层的标识符。该消息简单地包括被标识为不存在的层的列表。表VII示出了scalability—info—dependency—changeSEI消息的示例性语法。在存在时,此SEI消息将对在其之后的所有NAL单元起作用。特定层的层依存性信息包括由解码语法元素num—directly_dependent_layer(数目—直接—依赖_层)、directly—dependent—layer—id—delta—minul(直接—依赖—层—id—△—减1)、或替换性新语法元素layer—dependency—info—src_layer—id_delta_minul(直接—依存性_信息—源—层jd—A—减1)产生的信息。此新的元素允许系统标识具有与目前层相同的层依存性信息的另一层的层id(通过编码层id差分减1)。表VII<table>tableseeoriginaldocumentpage28</column></row><table>scalability—info—dependency—changeSEI消息指示由其layer—id标识的指定层的层依存性信息将按此消息的内容所指定地改变。在应用了此消息之后有效的可缩放性信息状态保持有效,直至类型为scalability—info或scalability—info—dependency—change的下一SEI消息。num—layers—minus1加1指示其层依存性信息在解码了此SEI消息之后将改变的可缩放层或呈现点的数目。num—layers一minusl的值在0到255(包括0和255)的范围内。layer—id[i]指示其层依存性信息将改变的可縮放层的标识符。等于1的layer—dependency—infojresent—flag[i](层—依存性—信息—存在—标记)指示在SEI消息中存在具有等于layer—id[i]的层标识符的可縮放层的层依存性信息。值0指示具有等于i的层标识符的可縮放层的层依存性信息在SEI消息中不存在,且与由layer—dependency—info—src—layer—id—delta—minus1[i]指示的另一层的一样。num—directly—dependent—layers[i]指示具有等于layer—id[i]的层标识符的可縮放层直接依赖的可縮放层的数目。例如,如果层M中有使用来自层Q的层间预测的至少一个经编码的画面,则层M直接依赖于层Q。num—directly—dependent—layers的值在0到255(包括0和255)的范围内。directly—dependent—layer—id_delta—minusl[i][j]指示layer一id[i]与具有等于layer—id[i]的层标识符的可縮放层直接依赖的第j个可縮放层的层标识符和i之间的差。直接依赖可縮放层的层标识符等于(layer—id[i]-directly—dependent」ayer_id—delta_minus1[i]-1)。layer—dependency—info—src—layer—id_delta—minus1[i]指定层标识符等于layer—id[i]的层具有与层标识符等于(layer—id[i]-layer—dependency—info—src—layer—id—delta—minus1[i]-1)的层相同的层依存性信息。图3示出了实施例B中的示例性状态处理算法300的流程图。接收器的初始层结构状态(State)为空。在步骤33,接收器从比特流或者通过诸如信令的替换手段获得可縮放性信息.SEI消息。scalabilityjnfoSEI消息充当初始化SSEI消息并用于初始化该状态。'layers—notpresent'和'dependency一change'消息分别将一个或多个层标记为不存在或更改其解码依存性信息。注意在此替换性实施例B中,通过非初始化消息既未添加也未移除层。这确保状态一致性(解码依存性可能例外),只要初始化消息被可靠地接收到即可。注意多个层受到这些消息的每一个的影响。然而,出于清晰起见,类似图2中示图的图3中的示图示出了对单个层(层(i))的影响。尽管本文所描述的优选实施例使用H.264SVC标准,但是对于本领域技术人员而言,在此描述的技术可直接应用或扩展到用于视频或者用于音频或任何其它多媒体数据的、允许多个空间/质量和时间级的任何编码结构是显而易见的。虽然已描述了被认为是本发明的优选实施例的那些实施例,但是本领域技术人员应当认识到,可作出其它或进一步的改变和更改而不背离本发明的精神,并且其旨在要求保护落在本发明的真实范围内的所有这些改变和更改。应当理解,本发明的系统和方法可用任何硬件和软件的组合来实现。用于实现和操作前述系统和方法的软件(即,指令)可被设置在计算机可读介质上,这些计算机可读介质可包括但不限于固件、存储器、存储设备、微控制器、微处理器、集成电路、ASIC、可在线下载的媒体以及其它可用的介质。权利要求1.一种数字媒体通信系统,包括媒体服务器,它传送以可缩放媒体编码格式编码的媒体;至少一个接收器;以及电子通信网络,它链接所述传送媒体服务器和所述至少一个接收器,其中所述媒体服务器被配置成向所述至少一个接收器传送与所传送的媒体有关的可缩放性信息,所述可缩放性信息包括初始化可缩放性信息和随着时间对所述缩放性信息的改变,并且其中所传送的对所述可缩放性信息的改变是以差分形式来编码的。2.如权利要求1所述的系统,其特征在于,所述可縮放媒体编码格式是H.264SVC,所述初始化可縮放性信息是所述SVCscalabilityjnfo(可縮放性_信息)SEI消息,并且其中所传送的对所述可縮放性信息的改变在所述接收器处被累积地应用。3.如权利要求2所述的系统,其特征在于,所述对可縮放性信息的改变还包括指示至少一个可缩放性层从此刻起被添加到所述比特流的scalab他y—info_add(可縮放性—信息—添加)SEI消息。4.如权利要求2所述的系统,其特征在于,所述对可縮放性信息的改变还包括scalabilityjnfo—replace(可縮放性—信息—替代)SEI消息,所述消息指示从此刻起用所述scalabilityjnfo一replaceSEI消息中包含的所述可縮放性信息来替代所述比特流中存在的至少一个层的所述可縮放性信息,以及其中未被显式编码在所述scalabilityjnfo—replaceSEI消息中的层的任何可縮放性信息被假定为保留其先前值。5.如权利要求2所述的系统,其特征在于,所述对可縮放性信息的改变还包括指示从此刻起从所述比特流移除至少一个层的scalability—info一del(可縮放性一信息_删除)SEI消息。6.如权利要求2所述的系统,其特征在于,所述对可缩放性信息的改变出现在所述经编码的视频信号的任何接入单元中。7.如权利要求2所述的系统,其特征在于,所述接收器是媒体网关。8.如权利要求1所述的系统,其特征在于,所述可縮放媒体编码格式是H.264SVC,所述初始化可縮放性信息是所述SVCscalability—infoSEI消息,并且其中在所述接收器处使用最近scalabilityjnfoSEI消息作为参考来单独地应用所述对可縮放性信息的改变。9.如权利要求8所述的系统,其特征在于,所述对可縮放性信息的改变还包括指示在所述初始化可縮放性信息中所指示的至少一个可縮放性层从此刻起在所述比特流中不存在的scalabilityjnfo—layers一notpresent(可縮放性一信息—层_不存在)SEI消息。10.如权利要求8所述的系统,其特征在于,所述对可縮放性信息的改变还包括scalability—info—dependency—change(可缩放性—信息—依存性—改变)SEI消息,所述消息指示从此刻起用所述scalability—info—dependency—changeSEI消息中所包含的所述层依存性信息来替代最近初始化可縮放性信息中指示的至少一个层的所述层依存性信息。11.如权利要求8所述的系统,其特征在于,所述对可縮放性信息的改变出现在所述经编码的视频信号的任何接入单元中。12.如权利要求8所述的系统,其特征在于,所述接收器是媒体网关。13.—种配置成处理经编码的媒体数据的数字媒体解码器,所述经编码的媒体数据包括经可缩放编码的媒体数据;初始化可缩放性信息数据;以及随着时间对初始化可縮放性信息数据的改变;其中所述可縮放性信息数据用于通知所述解码器关于在所述经编码媒体数据中包含的所述层的存在性和依存性结构,并且其中所述对初始化可縮放性数据的改变是以差分形式编码的。14.如权利要求13所述的解码器,其特征在于,所述可缩放媒体数据是根据H.264SVC来编码的,所述初始化可縮放性信息是所述SVCscalability—infoSEI消息,并且其中所述对可縮放性信息的改变在所述解码器处被累积地应用。15.如权利要求14所述的解码器,其特征在于,所述对可縮放性信息的改变还包括指示至少一个可缩放性层从此刻起被添加到所述比特流的scalability—info—addSEI消息。16.如权利要求14所述的解码器,其特征在于,所述对可縮放性信息的改变还包括scalabilityjnfo—replaceSEI消息,所述消息指示从此刻起用所述scalability—info—replaceSEI中包含的所述可縮放性信息来替代所述比特流中存在的至少一个层的所述可缩放性信息,以及其中未被显式编码在所述scalability—info—replaceSEI消息中的层的任何可縮放性信息被假定为保留其先前值。17.如权利要求14所述的解码器,其特征在于,所述对可縮放性信息的改变还包括指示从此刻起从所述比特流移除至少一个层的scalability—info—delSEI消息。18.如权利要求14所述的解码器,其特征在于,所述对可缩放性信息的改变可出现在所述经编码的视频信号的任何接入单元中。19.如权利要求13所述的解码器,其特征在于,所述可縮放媒体数据是根据H.264SVC来编码的,所述初始化可縮放性信息是所述SVCscalability—infoSEI消息,并且其中在所述解码器处使用最近scalability—infoSEI消息作为参考来单独地应用所述对可縮放性信息的改变。20.如权利要求19所述的解码器,其特征在于,所述对可縮放性信息的改变还包括指示在所述初始化可縮放性信息中所指示的所述可縮放性层的一个或多个从此刻起在所述比特流中不存在的scalabilityjnfojayers—notpresentSEI消息。21.如权利要求19所述的解码器,其特征在于,所述对可縮放性信息的改变还包括scalability—info—dependency—changeSEI消息,所述消息指示从此刻起用所述scalabilityjnfo—dependency—changeSEI消息中包含的所述层依存性信息来替代最近初始化可縮放性信息中指示的至少一个层的所述层依存性信息。22.如权利要求19所述的解码器,其特征在于,所述对可縮放性信息的改变可出现在所述经编码的视频信号的任何接入单元中。23.—种用于将至少一个接收器链接到传送以可縮放媒体编码格式编码的媒体的传送媒体服务器的电子通信网络上的数字媒体通信的方法,所述方法包括从所述媒体服务器向所述至少一个接收器传送与所传送媒体有关的可縮放性信息,所述可縮放性信息包括初始化可縮放性信息和随着时间对所述縮放性信息的改变,其中所传送的对所述可縮放性信息的改变是以差分编码形式来编码的。24.如权利要求23所述的方法,其特征在于,所述可縮放媒体编码格式是H.264SVC,所述初始化可縮放性信息是所述SVCscalability—infoSEI消息,所述方法还包括在所述接收器处累积地应用所传送的对所述可縮放性信息的改变。25.如权利要求24所述的方法,其特征在于,还包括在所述对可縮放性信息的改变中包括指示至少一个可縮放性层从此刻起被添加到所述比特流的scalability—info—addSEI消息。26.如权利要求24所述的方法,其特征在于,还包括在所述对可縮放性信息的改变中包括scalability_info_replaceSEI消息,所述消息指示从此刻起用所述scalability—info—replaceSEI消息中包含的所述可縮放性信息来替代所述比特流中存在的至少一个层的所述可縮放性信息,其中未被显式编码在所述scalabilityjnfo—replaceSEI消息中的层的任何可縮放性信息被假定为保留其先前值。27.如权利要求24所述的方法,其特征在于,还包括在所述对可縮放性信息的改变中包括指示从此刻起从所述比特流移除至少一个层的scalability—info—delSEI消息。28.如权利要求24所述的方法,其特征在于,所述对可縮放性信息的改变出现在所述经编码的视频信号的任何接入单元中。29.如权利要求24所述的方法,其特征在于,所述接收器是媒体网关。30.如权利要求23所述的方法,其特征在于,所述可縮放媒体编码格式是H.264SVC,所述初始化可縮放性信息是所述SVCscalability—infoSEI消息,所述方法还包括在所述接收器处使用最近scalability—infoSEI消息作为参考来单独地应用所述对可縮放性信息的改变。31.如权利要求30所述的方法,其特征在于,还包括在所述对可縮放性信息的改变中包括指示在所述初始化可縮放性信息中所指示的至少一个可縮放性层从此刻起在所述比特流中不存在的scalability_info_layers_notpresentSEI消息。.32.如权利要求30所述的方法,其特征在于,还包括在所述对可縮放性信息的改变中包括scalability—info—dependency—changeSEI消息,所述消息指示从此刻起用所述scalability—info—dependency—changeSEI消息中包含的所述层依存性信息来替代最近初始化可縮放性信息中指示的至少一个层的所述层依存性信息。33.如权利要求30所述的方法,其特征在于,所述对可縮放性信息的改变出现在所述经编码的视频信号的任何接入单元中。34.如权利要求30所述的方法,其特征在于,所述接收器是媒体网关。35.—种用于在解码器处解码数字媒体的方法,其中所述数字媒体包括经可縮放编码的媒体数据、初始化可縮放性信息数据、以及以差分形式编码的随着时间对初始化可缩放性信息数据的改变,所述方法包括使用可縮放性信息数据来通知所述解码器关于在所述经编码媒体数据中包含的所述层的存在性和依存性结构。36.如权利要求35所述的方法,其特征在于,所述可縮放媒体数据是根据H.264SVC来编码的,所述初始化可縮放性信息是所述SVCscalability—infoSEI消息,所述方法还包括在所述解码器处累积地应用所述对可縮放性信息的改变。37.如权利要求36所述的方法,其特征在于,所述对可縮放性信息的改变还包括指示至少一个可縮放性层从此刻起被添加到所述比特流的scalability—info—addSEI消息。38.如权利要求36所述的方法,其特征在于,所述对可縮放性信息的改变还包括scalability—info—replaceSEI消息,所述消息指示从此刻起用所述scalability_info_replaceSEI中包含的所述可縮放性信息来替代所述比特流中存在的至少一个层的所述可縮放性信息,所述方法还包括假定未被显式编码在所述scalability—info—replaceSEI消息中的层的任何可縮放性信息保留其先前值。39.如权利要求36所述的方法,其特征在于,所述对可縮放性信息的改变还包括scalability—info—delSEI消息指示从此刻起从所述比特流移除至少一个层。40.如权利要求36所述的方法,其特征在于,所述对可縮放性信息的改变可出现在所述经编码的视频信号的任何接入单元中。41.如权利要求35所述的方法,其特征在于,所述可縮放媒体数据是根据H.264SVC来编码的,并且所述初始化可縮放性信息是所述SVCscalabilityjnfoSEI消息,所述方法还包括在所述解码器处单独地应用所述对可縮放性信息的改变,并使用最近scalabilityjnfoSEI消息作为参考。42.如权利要求41所述的方法,其特征在于,所述对可縮放性信息的改变还包括指示在所述初始化可縮放性信息中所指示的所述可縮放性层的一个或多个从此刻起在所述比特流中不存在的scalability_info_layers—notpresentSEI消息。43.如权利要求41所述的方法,其特征在于,所述对可縮放性信息的改变还包括scalability—info—dependency—changeSEI消息,所述消息指示从此刻起用所述scalability—info—dependency—changeSEI消息中包含的所述层依存性信息来替代最近初始化可縮放性信息中指示的至少一个层的所述层依存性信息。44.如权利要求41所述的方法,其特征在于,所述对可縮放性信息的变化可出现在所述经编码的视频信号的任何接入单元中。45.—种包括用于执行权利要求23-44的至少一项中所述的步骤的指令集的计算机可读介质。全文摘要提供了用于及时地传达与由视频和/或音频通信系统中的解码器(图1的120)和其它组件接收到的信号的可缩放性层结构有关的信息的系统和方法(图1)。对于使用标准H.264SVC编码格式的通信系统(图1的140),标准SSEI消息被更改或补充成包括信令可缩放性层结构信息及其变化的能力。接收者可使用信号可缩放性层信息来适当地处理或解码接收到的信号。文档编号H04B1/66GK101411080SQ200780011497公开日2009年4月15日申请日期2007年3月27日优先权日2006年3月27日发明者A·埃尔夫瑟里阿迪斯申请人:维德约股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1