视频会议系统和操作方法

文档序号：7756312阅读：337来源：国知局

专利名称：视频会议系统和操作方法
技术领域：
本发明涉及视频会议。本发明可以应用于基于H.323和/或基于SIP的集中视频会议中、使用分层视频编码的视频交换机制，但并不限于此。
背景技术：
由于商业步伐加快，商业关系扩展到全世界，因此对快速并且经济地跨越通信距离的需要变成了主要的难题。为了在竞争越来越激烈的市场上取得成功，把顾客和工作人员有效地集合起来是关键。商家正在寻找灵活的解决方案，以使用各种通信方法，例如语音、视频、图像数据和它们的任何组合来支持跨国以及跨大洲的实时信息共享。
尤其是，跨国组织越来越希望取消昂贵的旅行并连接多个位置，以便让组织内的群组能够更有效地通信。在互联网协议(IP)网络上操作的多点会议系统试图解决该需要。在本发明的领域中，已知在多点视频会议中终端可以实时交换音频和视频流。现有的在IP网络上建立多点会议的方法是使用多点控制单元(MCU)。MCU是网络上的端点，为三个或更多终端和/或通信网关提供参与多点会议的能力。在点对点会议中MCU还可以连接两个终端，以便他们能够具有发展成多点会议的能力。
首先参照图1，示出了已知的集中会议模型100。集中会议利用基于MCU的会议网桥。所有终端(端点)120、122、125发送并接收去往/来自MCU110的以音频、视频和/或数据信号形式的媒体信息以及控制信息流140。这些传输可以以点对点方式进行。这在图1中示出了。
MCU100由多点控制器(MC)和零或多个多点处理器(MP)组成。MC处理所有终端之间的呼叫建立和呼叫信令协商，以确定用于音频和视频处理的共同能力。MC110不直接处理任何一个媒体流。这留给MP处理，MP混合、交换并处理音频、视频和/或数据比特。
以这种方式，MCU提供举行多位置会议、销售会议、群组会议和其他‘面对面’通信的性能。已知多点会议可以用于各种应用，例如(i)在多个位置的执行者和管理者能够‘面对面’开会，共享实时信息，并且更快地做出决定，而没有时间、开支的任何损失和旅行的需要。
(ii)项目组和知识工作者可以以实时方式协调各自的任务，并且观看和修正共享的文档、文稿、设计和文件；并且(iii)在远程位置的学生、受训人员和雇员可以跨越任何距离或时区访问共享的教育/培训资源。
因此，可以想象得到，在未来基于IP的网络上的多媒体通信中，基于MCU的系统将起到重要作用。
这样的多媒体通信通常采用视频传输。在这种传输中，在发送和接收单元之间传送图像序列，这些图像序列通常被称为帧。可以使用各种方法建立多点多媒体会议系统，例如H.232和SIP会话层协议标准所规定的方法。有关SIP的参考文献可以在以下网址找到http//www.ietf.org/rfc/rfc2534.txt，以及http//www.cs.columbia.edu/～hgs/sip.
此外，例如在使用ITU H.263视频压缩[ITU-T Recommendation，H.263，‘Video Coding for Low Bit Rate Communication’]系统中，视频序列的第一帧包括相当数量的综合图像数据，通常被称为帧内编码信息。由于帧内编码帧是第一帧，因此它可以提供要显示的图像的实质部分。帧内编码帧随后是帧间编码(预测)信息，其通常包括与正发送的图像中的变化有关的数据。因此预测的帧间编码信息包含的信息比帧内编码信息少得多。
在传统的多媒体会议系统中，当用户讲话时他们需要识别自己本身，以便接收终端知道是谁在讲话。很明显，如果发送终端不能识别它本身，收听的用户将不得不猜测是谁在讲话。
一种已知的技术通过分析音频流并转发活跃发言人的姓名和视频流给所有参与方来解决该问题。在集中会议系统中，MCU通常执行该功能。之后MCU可以通过把合适的输入多媒体流交换到输入端口/路径来把发言人的姓名和相应的视频和音频流发送给所有参与方。
视频交换是一种公知的技术，其旨在给每个端点传送一个单独的视频流，相当于安排多个点对点会话。视频交换可以是(i)语音激活交换，其中MCU发送活跃发言人的视频。
(ii)定时激活交换，其中在预定时间隔相继发送每个参与方的视频。
(iii)个人视频选择交换，其中每一端点可以请求他/她希望接收的参与方视频流。
现在参照图2，示出了传统的视频交换机制200的功能框图。在传统的集中会议系统中，视频交换的执行如下。MCU220，例如位于基于互联网协议(IP)的网络210内的MCU200，包含交换机230。MCU220接收所有参与方(用户设备)250、260、270、280的视频流255、265、275、285。MCU还可以从正在讲话的参与方单独接收组合(多路复用)的音频流290。之后，MCU220选择一个视频流并且把该视频流240发送给所有参与方250、260、270、280。
这种传统系统有一个缺点，就是他们只发送活跃发言人的视频流。用户还可能有一个问题，就是如果几个发言人同时讲话或活跃发言人不断改变，识别视频流发言人会有问题。这尤其是大型视频会议中存在的问题。
作为替换，可以将每个参与方的视频发送给所有参与方。但是，在基于无线的会议中该方法会由于带宽限制而受影响。
在视频技术领域，已知视频作为一系列静态图像/画面发送。因为视频信号的质量在视频信号编码和压缩期间会受到影响，因此已知会包括附加的信息‘层’，这些层基于视频信号和编码视频比特流之间的差异。包含附加层能够使接收信号质量随着解码和/或解压缩而得到增强。因此，使用图像和被分为一个或多个层的增强图像这样的分级结构来产生分层视频比特流。
在分层(可量测)视频比特流中，可以在基本层之外通过以下之一对视频信号进行增强(i)提高画面的分辨率(空间量测性)；(ii)包括错误信息，以改善画面的信噪比(SNR量测性)；或(iii)包括额外的画面，以提高帧速率(时间量测性)。
这样的增强可以应用于整个画面，或应用到画面中任意形状的目标，这被称为基于目标的量测性。为了保留时间增强层的可任意处理特性，H.263+标准规定，包含在时间量测性模式中的画面应该是如图3的视频流所示的双向预测(B)画面。
图3示出了可量测视频配置300的示意性图示，说明了视频编码技术领域公知的B画面预测相关性。最初的帧内编码帧(I1)310后是双向预测帧(B2)320。随后是(单向)预测帧(P3)330，再然后是第二双向预测帧(B4)330。再后面是(单向)预测帧(P5)350，等等。
图4是视频编码技术领域中已知的分层视频配置的示意性图示。分层视频比特流包括基本层405和一个或多个增强层435。
基本层(层1)包括从原始视频信号画面抽样、编码和/或压缩得到的一个或多个帧内编码画面(I画面)410。另外，基本层包括从帧内编码帧410预测的多个预测帧间编码画面(P画面)420、430。
在增强层(层2或3或更多)435中，可以使用三种类型的画面(i)双向预测(B)画面(未示出)；(ii)基于基本层405的帧内编码画面410的增强内插(EI)画面440；和(iii)基于基本层的帧间编码画面420、430的增强预测(EP)画面450、460。
从较低层向上的垂直箭头说明，增强层中的画面是从参考(较低)层中的画面的重构近似中预测的。
总之，可以在多点通信多媒体会议中使用可量测视频编码，并且仅仅在点对点或多点通信视频通信的情况中使用。但是，当前无线网络不支持多点通信。另外，通过多点通信，每一层在分开的多点通信会话中发送，接收方确定它自己是否登录到一个或多个会话中。
因此，需要一种改进的视频会议配置和操作方法，可以减轻上面提到的缺点。

发明内容
根据本发明，提供一种如权利要求1所述的在多媒体视频会议中中继视频图像的方法，一种如权利要求7所述的用于中继视频图像的视频会议设备，一种如权利要求11所述的用于参与视频会议的无线装置，一种如权利要求12所述的多点处理器，一种如权利要求16所述的视频通信系统，一种如权利要求18所述的媒体资源功能元件，一种如权利要求19或权利要求20所述的视频通信单元，一种如权利要求23所述的存储介质。本发明的其他方面如从属权利要求所述。
总之，本发明的发明原理是通过提供一种视频交换方法来解决现有技术配置的缺点，以在视频会议中改善参与方和发言人的识别。本发明利用分层视频编码，以更好地利用可用于每一用户的带宽。

图1示出了一种已知的集中会议模型。
图2示出了传统的视频交换机制的功能框图。
图3是一个视频配置的示意性图示，表示在视频编码技术领域中已知的画面预测相关性。
图4是在视频编码技术领域中已知的分层视频配置的示意性图示。
现在将参照附图描述本发明的示例性实施例，其中图5示出了根据本发明的优选实施例的视频交换机制的功能框图。
图6示出了根据本发明的优选实施例的多点处理单元的功能框图/流程图。
图7示出了使用本发明的优选实施例参与视频会议的无线装置的视频显示。
图8示出了根据本发明的优选实施例采用的UMTS(3GPP)通信系统。
具体实施例方式
总体来说，本发明的优选实施例提出一种用于多媒体会议的新的视频交换机制，该机制使用分层视频编码。以前，分层视频编码只用于把一个视频比特流分成多于一个的层如上面对照图4所描述的基本层和一个或几个增强层。这些用于可量测视频通信的已知技术在诸如H.263和MPEG-4的标准中进行了详细描述。
但是，本发明的发明人已经认识到通过采用分层视频编码的原理并把采用的原理应用到多媒体视频会议应用中可以得到这些好处。以这种方式，本发明定义了一种与点对点或多点通信视频通信不同类型的可量测视频编码来用于多媒体会议。
现在参照图5，示出了根据本发明的优选实施例的视频交换机制的功能框图500。与传统的集中会议系统形成相比，这种视频交换的执行如下。MCU520，例如位于基于互联网协议(IP)的网络510内的MCU520，包含交换机530。
值得注意的是，MCU520接收‘分层’视频流，该视频流包括所有参与方(用户设备)550、560、570、580的基本层552、562、572、582和一个或多个增强层流555、565、575、585。为了清楚的目的，每个参与方只示出了一个增强层视频流。
MCU520还可以单独从参与方接收组合(多路复用)的音频流590。之后MCU520使用交换机530选择多个活跃发言人535的基本层视频流和最活跃发言人的增强层540。之后MCU520发送这些视频流535、540给所有的参与方550、560、570、580。
优选地，确定最活跃发言人的选择过程通过MCU520分析音频流590来执行，以便首先确定所有这些活跃发言人都是谁。然后如图6所述，优选地，在多点处理器单元中确定最活跃发言人。优选地，根据基于每一参与方的活跃性的优先级把一个或多个基本层和一个增强层发送到参与方。
为了实现图5的改进的但是更复杂的视频交换机制，多点处理单元(MP)600适于促进根据本发明的优选实施例和如图6所示的新的视频交换机制。
MP600还通过分组过滤模块610从参与方的视频/多媒体通信单元接收音频流590并且把该音频流路由到分组路由模块630。但是，音频流现在还被路由到一个发言人识别模块620，该模块分析该音频流590以便确定谁是活跃的发言人。发言人识别模块620基于每一参与方的活跃性分配优先级并且确定(i)最活跃发言人620，(ii)任何其他的活跃发言人625以及缺席的人(iii)任何剩余的不活跃发言人。
根据本发明的优选实施例，之后发言人识别模块620把优先级信息转发到交换模块640，该交换模块适于处理发言人的优先级。另外，交换模块640适于通过分组过滤模块610从参与方的视频通信单元接收分层视频流，该分层视频流包括视频基本层流552、562、572和582以及视频增强层流555、565、575和585。交换模块640使用该发言人信息通过分组路由模块630把第二(次)活跃发言人和最活跃发言人的视频基本层和最活跃发言人的视频增强层发送给所有参与方。
因此，多点处理器的一个或多个接收端口适于从一组用户设备550、560、570和580接收分层视频流，给分层视频流包括基本层视频流552、562、572和582以及增强层视频流555、565、575和585。在本发明的考虑中，如果确定只有一个活跃发言人，交换模块640可以只选择一个基本层视频图像和相应的一个或多个增强层。之后将该发言人自动指定为最活跃发言人，以发送到一个或一组用户设备550、560、570和580。
如在视频会议中发生的，当最活跃发言人经常改变时，将不断交换增强层。本发明的发明人已经认识到这样经常并快速交换所具有的潜在问题。在这种情况下，如果第一帧实际上是来自之前只是第二活跃发言人的预测帧(EP)，那么该帧需要被转换为内插帧(EI)。
为了解决该潜在问题，优选地将来自分组过滤模块610的视频基本层流552、562、572和582以及视频增强层流555、565、575、585输入到解包功能元件680。解包功能元件680对视频流去多路复用并且把经过去多路复用的视频流提供给视频解码器和缓冲器功能元件670。
为了同步并配合视频解码，视频解码器和缓冲器功能元件670接收最活跃发言人622的指示。在提取最活跃发言人的视频流信息后，视频解码器和缓冲器功能元件670提供最活跃发言人622的双向预测(BP)675和/或预测(EP)视频流数据给‘EP帧到EI帧译码模块’660。该‘EP帧到EI帧译码模块’660处理输入视频流，以提供最初的发言人增强层视频流，如帧内编码(EI)帧。
之后将最初的发言人增强层视频流输入到打包功能元件650，在那里打包并且输入到交换模块640。之后交换模块640组合最初的发言人增强层视频流和第二活跃发言人的视频基本层流552、562、572和582并且把组合的多媒体流路由到分组路由模块630。之后分组路由模块根据图5的方法把该信息路由到参与方。
在本发明的优选实施例中，当确定最初发言人改变时，视频交换模块640使用‘EP帧到EI帧译码模块’660的输出。
在本发明的考虑中，还可以在MP600中包括类似于模块660的一个或多个模块，以便当认为第二发言人已经改变时对他们执行相同的功能。否则，在使用单个‘EP帧到EI帧译码模块’660来译码最初发言人的视频流的实施例中，当假定一个不活跃的发言人变成第二活跃发言人时，发言人识别模块620(或交换模块640)可以请求新的内插帧。作为选择的，交换模块640可以在发送相应的视频基本层流给所有参与方之前等待新的第二活跃发言人的新内插帧。
在本发明的优选实施例之外，在多于一个的增强层可以使用的情况中使用多类发言人也在本发明的考虑之内。通过使用多类发言人，由于改善了发言人识别，可以得到多媒体消息的更精确的可量测性，尤其是对大的视频会议来说。
对一个或多个基本层流增加预测帧到内插帧的转换，也在本发明的考虑内。以这种方式，交换模块640可以快速的在基本层之间交换而不需等待新的内插帧。
图7示出了使用本发明的优选实施例参加视频会议的无线装置700的视频显示器710。通过实现此前描述的本发明原理，可以得到改善的视频通信。具体地说，对于给定的带宽，通过降低次(第二)活跃发言人730的视频质量并且不为不活跃的发言人提供视频，参与方现在能够接收最活跃发言人720的更好的视频质量。为了提供这种改善的视频会议，视频通信装置接收最活跃发言人720的增强层和基本层、第二活跃发言人730的基本层并且不从不活跃发言人接收视频。
以这种方式，视频通信单元可以在更大、更高分辨率的显示器提供不断更新的最活跃发言人的视频图像，同时较小的显示器可以显示第二(次)活跃发言人。
优选地，无线装置700具有用于显示最活跃发言人的较高质量视频图像的主要视频显示器710，以及一个或多个第二不同的显示器，用于显示各个次活跃发言人。优选地，由可操作地耦合到视频显示器的处理器(未示出)执行各个视频图像进入相应显示器的处理。处理器接收最活跃发言人720和次活跃发言人的指示，并且确定所接收的哪一个视频图像应该在第一显示器上显示，从次活跃发言人730接收的哪一个图像应该在第二显示器上显示。有益地，可以设置第二显示器，以提供较低质量的次活跃发言人视频图像，从而节省费用。
可以预料到，在未来，基于MCU的系统将会有助于在基于IP的网络上的多媒体通信。因此，本发明的发明人想到，在此描述的技术可以包含在利用MCU的任何基于H.323/SIP的多点多媒体会议或系统中。
前述的优选应用是在用于宽带码分多址(WCDMA)标准的第三代合作计划(3GPP)规范中。具体地说，本发明可以应用于IP多媒体域(在规范的3G TS25.xxx系列中描述)，其计划把H.323/SIP MCU结合到3GPP网络中。见图8，MCU将由媒体资源功能元件(MRF)890A支持。
图8示出了一种以分级结构形式的3GPP(UMTS)通信系统/网络800，其能够在根据本发明的的优选实施例中采用。通信系统800适于并且包含能够在UMTS和/或GPRS空中接口上操作的网络元件。
通常认为该网络包括(i)用户设备域810，由以下构成(a)用户SIM(USIM)域820，以及(b)移动设备域830；和(ii)基础设施域840，由以下构成(c)接入网域850，和(d)核心网域860，其由以下(至少)构成(di)服务网域870，和(dii)转接网域880，和(diii)IP多媒体域890，具有由SIP提供的多媒体(ETFRFC2543)。
在移动设备域830中，UE830A经有线Cu接口从USIM域820中的用户SIM820A接收数据。UE830A经无线Uu接口与网络接入域850中的节点B850A传送数据。在网络接入域850内，节点B850A包含一个或多个收发信机单元并且经UMTS规范定义的Iub接口与基于蜂窝的系统基础设施的其余部分，例如，RNC850B通信。
RNC850B经Iu接口与其它RNC(未示出)通信。RNC850B经Iu接口与服务网域870中的SGSN870A通信。在服务网域870内，SGSN870A经Gn接口与GGSN870B通信，并且SGSN870A经Gs接口与VLR服务器870C通信。根据本发明的优选实施例，SGSN870A与MCU(未示出)通信，该MCU位于IP多媒体域890的媒体资源功能元件(890A)内。经Gi接口执行通信。
GGSN870B(和/或SSGN)负责UMTS(或GPRS)与诸如因特网或公共交换电话网(PSTN)这样的公共交换数据网(PDSN)880A接口。SGSN870A执行UMTS核心网内业务的路由和隧道功能，同时GGSN870B连接到外部分组网络，在这种情况中是任何一个访问系统的UMTS模式的网络。
RNC850B是负责许多节点B的资源控制和分配的UTRAN元件；通常，一个RNC850B可以控制50到100个节点B。RNC850B还通过空中接口提供可靠的用户业务传送。多个RNC彼此通信(经接口Iur)以支持切换和宏分集。
SGSN870A是UMTS核心网元件，负责会话控制以及到位置寄存器(HLR和VLR)的接口。SGSN是用于许多RNC的大型集中控制器。
GGSN870B是UMTS核心网元件，负责把核心分组网的用户数据集中并隧道到最终的目的地(例如，因特网服务提供商(ISP))。这样的用户数据包括去往/来自IP多媒体域890的多媒体和相关的信令数据。在IP多媒体域890中，MRF被分为多媒体资源功能控制器(MRFC)892A和多媒体资源功能处理器(MPFP)891A。如上所述，MRFC892A提供多点控制器(MC)功能性，而MPFP891A提供多点处理器(MP)功能性。
跨越Mr参考点/接口893A使用的协议是SIP(如RFC2543定义的)。呼叫状态控制功能元件(CSCF)895A充当呼叫服务器并处理多媒体呼叫信令。
因此，根据本发明的优选实施例，如在此之前描述的，元件SGSN870A、GGSN870B和所有MRF890A中的部分都适于促进多媒体消息。此外，如在此之前描述的，UE830A、节点B850A和RNC850B还适于促进改进的多媒体消息。
总的来说，这种适配可以以任何合适的方式在各个通信单元中实现。例如，可以在现有的通信单元添加新的装置，或作为选择的采用现有的通信单元的现有部分，例如通过对其中的一个或多个处理器重新编程。这样，所要求的适配可以以存储在存储介质上的处理器可实现指令的形式来实现，这里的存储介质例如软盘、硬盘、PROM、RAM或任何这些或其他存储多媒体的组合。
作为选择的，多媒体消息的这种适配还可以通过采用通信系统800的任何其他部分来控制、全部实现或部分实现，这也在本发明的考虑中。
尽管通常提供上面的元件作为分立单元(在它们自己各自的软件/硬件平台上)，分为移动设备域830、接入网域850和服务网域870，但是可以想到也可以采用其他的配置。
另外，在其他网络基础设施的情况中，例如GSM网中，处理操作的实现可以由任何合适的节点来执行，例如任何其他合适类型的基站、基站控制器、移动交换中心或可操作和管理控制器等等。作为选择的，可以通过分布在任何合适网络网络内的不同位置或实体的各种部件来执行上面提到的步骤。
如上所述，优选的，当应用在集中视频会议中时，使用分层视频编码的视频会议方法可以提供以下的优点(i)与传统系统相比，发言人的识别有了很大改善，因为共享带宽允许发送一个或多个增强层和几个基本层而不是只发送一个完全质量视频流。
(ii)当活跃发言人改变时，使用在此描述的本发明原理的视频交换更加平滑，这是因为它定义了几个状态，活跃发言人、第二最活跃发言人、不活跃发言人。
(iii)最活跃发言人的视频质量得到了改善。
(iv)改进的视频通信单元可以显示各种发言人，每一被显示的图像依赖于与相应视频通信单元的传输有关的优先级。
已经描述了一种在多个多媒体用户设备之间的多媒体视频会议中中继视频图像的方法。该方法包括以下步骤通过许多用户设备中的多个发送分层视频图像，其中分层视频图像包括基本层和一个或多个增强层，并且在多点控制单元接收发送的分层视频图像。选择许多活跃发言人的许多基本层图像和最活跃发言人的一个或多个增强层。该多点控制单元把许多活跃发言人的许多基本层视频图像和最活跃发言人的一个或多个增强层发送给多个多媒体用户设备的一个或多个。
此外，描述了一种用于在多个用户设备之间中继视频图像的视频会议装置。另外，还描述了一种用于参与视频会议的无线装置，其中许多参与方发送视频图像。
权利要求
1.一种用于在多个多媒体用户设备(550、560、570、580)之间的多媒体会议中中继视频图像的方法，该方法包括以下步骤由多个所述用户设备组发送分层视频图像，其中所述分层视频图像包括基本层(552、562、572、582)和一个或多个增强层(555、565、575、585)；在多点控制单元(520)接收所述的发送的分层视频图像；选择许多活跃发言人(535)的许多基本层视频图像和最活跃发言人的一个或多个增强层(540)；并且由所述多点控制单元(520)发送所述许多活跃发言人(535)的许多基本层视频图像以及最活跃发言人的一个或多个增强层(540)给该多个多媒体用户设备(550、560、570、580)的一个或多个。
2.根据权利要求1的在多媒体会议中中继视频图像的方法，其中，选择步骤进一步包括以下步骤分析所述多个多媒体用户设备(550、560、570、580)发送的许多音频数据流(590)，以便确定所述许多活跃发言人和/或最活跃发言人。
3.根据权利要求1或2的在多媒体会议中中继视频图像的方法，其中该方法进一步包括以下步骤为由各个用户设备发送的每一分层视频图像和/或所述音频数据流指定优先级；并且基于所述指定的优先级，选择许多基本层视频图像(535)和一个或多个增强层(540)，用于发送给所述多个多媒体用户设备(550、560、570、580)的所述一个或多个。
4.根据前述任一权利要求的在多媒体会议中中继视频图像的方法，其中该方法进一步包括以下步骤把最活跃发言人的视频图像的第一预测帧译码(660)为帧内编码帧，用于增强最活跃发言人的视频质量。
5.根据前述任一权利要求的在多媒体会议中中继视频图像的方法，其中该方法进一步包括以下步骤当多于一个的增强层可用时，通过所述多媒体控制单元(520)随着每一分层视频图像的传输，接收所述一个或多个发言人的分类指示，以便提供所述视频图像的更精确的量测性。
6.根据前述任一权利要求的在多媒体会议中中继视频图像的方法，其中，该方法进一步包括以下步骤对于一个或多个基本层视频流，把预测帧转换为帧内编码帧。
7.一种用于在多个用户设备(550、560、570、580)之间中继视频图像的视频会议装置，该视频会议装置包括多点控制单元(520)，适于接收所述许多用户设备的多个发送的许多分层视频图像，其中所述分层视频图像包括基本层(552、562、572、582)和一个或多个增强层(555、565、575、585)；以及视频交换模块(530)，以可操作的方式耦合到所述多点控制单元(520)并且适于选择许多活跃发言人(535)的许多基本层视频图像和最活跃发言人的一个或多个增强层(540)；其中所述多点控制单元(520)进一步适于发送所述许多活跃发言人(535)的许多基本层视频图像以及最活跃发言人的一个或多个增强层(540)给该多个多媒体用户设备(550、560、570、580)的一个或多个。
8.根据权利要求7的视频会议装置，进一步包括预测帧到帧内编码帧译码模块(660)，可操作地耦合到所述视频交换模块(530)，以便如果所述多点控制单元(520)接收初始作为预测帧的所述帧，就提供最活跃发言人增强层视频流为帧内编码帧。
9.根据权利要求7或8的视频会议装置，进一步包括发言人识别模块(620)，分析许多音频流(590)，以便确定许多活跃发言人和/或所述最活跃发言人。
10.根据权利要求9的视频会议装置，其中所述发言人识别模块(620)基于确定的每一参与方的活跃性分配优先级，以确定以下的一个或多个最活跃发言人(622)、任何其他活跃发言人(625)和任何不活跃发言人。
11.一种用于参与视频会议的无线装置(700)，在视频会议中多个参与方发送视频图像，该无线装置(700)包括视频显示器(710)，具有第一显示器和一个或多个第二不同显示器，用于显示来自该多个参与方的各个参与方(720、730)；以及处理器，可操作地耦合到到所述视频显示器，用于接收最活跃发言人(720)和多个次活跃发言人(730)的指示，并且确定从所述最活跃发言人(720)接收的所述视频图像显示在提供较高质量视频图像的所述第一显示器上，并且从所述多个次活跃发言人(730)接收的所述视频图像显示在提供较低质量视频图像的所述第二显示器上。
12.一种多点处理器器，包括一个或多个接收端口，适于从多个用户设备(550、560、570、580)接收分层视频图像，分层视频图像包括基本层视频流(552、562、572、582)和增强层视频流(555、565、575、585)；以及交换模块(640)，可操作地耦合到所述一个或多个接收端口，选择许多活跃发言人(535)的许多基本层视频图像和最活跃发言人的一个或多个增强层(540)，用于发送给一个或多个用户设备(550、560、570、580)。
13.根据权利要求12的多点处理器，进一步包括发言人识别模块(620)，可操作地耦合到所述一个或多个接收端口，用于分析从所述许多用户设备的多个中接收的许多音频流(590)，以便确定许多活跃发言人和/或所述最活跃发言人。
14.根据权利要求12或13的多点处理器，其中所述发言人识别模块(620)基于确定的许多参与方的活动性分配优先级，以确定以下的一个或多个最活跃发言人(622)、任何其他活跃发言人(625)和任何不活跃发言人。
15.根据权利要求12到14任一个的多点处理器，进一步包括预测帧到帧内编码帧译码模块(660)，可操作地耦合到所述交换模块(640)，以便如果在相应的端口接收的所述最活跃发言人的增强层视频流为预测帧，就把它转换为帧内编码帧。
16.一种适于执行权利要求1到6中任何一个的方法步骤，或适于包括权利要求7到10中任何一个的视频会议装置、或适于包括权利要求12到15中任何一个的多点处理器的视频通信系统。
17.根据权利要求16的视频通信系统，其中，该视频通信系统可与具有互联网协议多媒体域(890)的UMTS通信标准(800)兼容，以便于视频会议通信。
18.一种适于执行权利要求1到6中任何一个的方法步骤、或适于包括权利要求7到10中任何一个的视频会议装置、或适于包括权利要求12到15中任何一个的多点处理器的媒体资源功能元件(890A)。
19.一种适于接收根据权利要求1到6的方法产生的分层视频会议图像的视频通信单元(700)。
20.一种适于产生用在权利要求1到6的方法中的分层视频会议图像、或适于发送根据权利要求1到6的方法产生的分层视频会议图像的视频通信单元。
21.根据权利要求19的视频通信单元，其中该视频通信单元是以下之一节点B(850A)，RNC(850B)，SGSN(870A)，GGSN(870B)，MRF(890A)。
22.根据权利要求1到6的在多媒体视频会议中中继视频图像的方法或根据权利要求7到10中任何一个的视频会议装置，或根据权利要求12到15中任何一个的多点处理器或根据权利要求16到17的视频通信系统，或根据权利要求18的媒体资源功能元件(890A)或根据权利要求19、20或21的视频通信单元，都适于促进基于H.323标准或SIP标准的视频会议图像。
23.一种存储处理器可实现指令的存储介质，该指令用于控制处理器执行权利要求1到6中任何一个的方法。
全文摘要
一种在多个多媒体用户设备(550、560、570、580)之间的多媒体视频会议中重放视频图像的方法，包括通过许多所述用户设备发送分层视频图像的步骤，其中所述分层视频图像包括基本层(552、562、572、582)和一个或多个增强层(555、565、575、585)。在多点控制单元(520)接收所发送的分层视频图像，在该单元选择许多活跃发言人(535)的许多基本层视频图像和最活跃发言人的一个或多个增强层(540)。该多点控制单元(520)把这些基本层视频图像和该最活跃发言人的一个或多个增强层发送给所述多个多媒体用户设备(550、560、570、580)中的一个或多个。相对于现有的视频会议系统，发言人的识别得到了极大改善，因为可用带宽的共享允许发送一个增强层和几个基本层，而不是只发送一个完全质量视频流。
文档编号H04N5/00GK1618233SQ02827743
公开日2005年5月18日申请日期2002年12月16日优先权日2002年1月30日
发明者阿瑟·拉莱申请人:摩托罗拉公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：阿瑟.拉莱
技术所有人：摩托罗拉公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。