管理分组交换电话会议的制作方法

文档序号:7758869阅读:114来源:国知局
专利名称:管理分组交换电话会议的制作方法
技术领域
本发明涉及一种管理在多个终端间的分组交换集中式电话会议的方法。本发明同样涉及到一个电话会议服务器和一个终端,该电话会议服务器包括有用于管理集中式电话会议的装置,该终端包括有用于参与集中式电话会议的装置。
背景技术
在电话会议中,一组终端用户通过一种方法相互连接,即当一个参与用户讲话时,所有其它的参与用户都能够听到该正在讲话的参与者的声音。在这种通信中,通常每次仅有一个参与用户讲话,而其它的用户收听。在集中式电话会议中,参与用户的终端不是相互直接连接的,而是通过一个电话会议服务器。通过在因特网中的基于因特网的语音协议(VoIP)电话会议应用或者作为在通用移动通信业务(UMTS)网络的分组交换域中的语音会议,集中式电话会议能被实现。
在VoIP会话中,话音数据典型的通过使用网际协议(IP)之上的实时传输协议(RTP)和用户数据报协议(UDP)运载。RTP在RFC 1889″RTPA TransportProtocol for Real-Time Applications″,1996年1月,作者为H.Schulzrinne等中有详细描述。
端对端的VoIP连接经常称为VoIP隧道。在典型的集中式电话会议的建立中,VoIP隧道在每一个参与终端和电话会议服务器间形成。
为了说明,在集中式的基于电话会议的RTP中,编码过的语音隧道如图1所示。
图1示意性的表示一个在UMTS网络11的分组交换域中的集中式电话会议系统,该系统具有一个连接到网络11上的电话会议服务器12和多个移动终端13。该移动终端13使用RTP隧道14通过UMTS网络11连接到该电话会议服务器。
在终端13上,由各个终端13的用户产生的话音数据首先被编码,然后插入到RTP包的有效载荷中。有许多可选的话音编码器能用来执行实际的话音编码。例如,自适应多速率(AMR)话音编码器,其被指定为用于第三代系统的强制性编码器,可用来压缩在RTP有效载荷内承载的话音数据。该编码器将话音采样编码成帧,该帧然后经过UMTS网络11通过RTP/UDP/IP协议运载至该电话会议服务器12。
该电话会议服务器12包括一个RTP混合器15,该混合器从与之连接的终端13接收输入的RTP数据包流,去除其RTP封装,将该数据流组合成一个单一的RTP数据包流,然后将该流发送到每一个终端13。
对每一个在终端13和电话会议服务器12间传送的RTP数据包,附加一个报头。该报头的结构在前面引述过的RFC1889中有规定,如图2所示。该报头包括一个标识使用的RTP版本的V域和一个用于填充比特的P域。如果设置了填充比特,该数据包在末端包括一个或多个附加的八比特组,该末端不属于有效载荷的部分。该报头进一步包括一个用于扩展比特的X域。如果设置了扩展比特,该固定报头后面正好跟着一个报头扩展。此外该头还包括一个用于发生源(CSRC)记数的CC域,该域包括跟随该固定报头的CSRC标识符的数量,该报头还包括一个用于标记比特的M域,该标记的说明通过一个简表定义。另外,该报头包括一个用于标识有效载荷格式的PT域和一个用于序列号的域,该域在每一个RTP数据包发送时由增加一。该序列号可由接收端使用来检测丢失的包和恢复该包序列。该报头还包括一个用于时间戳的域,该域反映该RTP数据包中第一个八比特组的采样时间。
此外,该RTP包报头携带一个同步源(SSRC)标识符和一列如上面提到的与CC域相关的发生源(CSRC)标识符。
该SSRC标识符用来标识所述的发送RTP包的同步源。对于各个RTP会话唯一的SSRC标识符随机的与每一个可能的源相关,即与每一个终端13和该电话会议服务器12相关。每一个终端13将与之相关的SSRC标识符添加到它聚集的每一个RTP包的RTP报头中的SSRC标识符域中。同样的,该电话会议服务器12的RTP混合器15将该与电话会议服务器12相关的SSRC标识符添加到离开该服务器12的每一个RTP包的RTP报头中的SSRC标识符域中。
该CSRC列表用来鉴别不同的产生RTP包的源的,因而其仅仅与在该电话会议服务器13中聚集的RTP包相关。该RTP混合器15将那些产生该组合输出VoIP流的终端13的SSRC标识符添加到将输出的RTP包的CSRC域中。
此外,为了能够控制使用RTP的VoIP连接,在前面引述过的RFC 1889中定义实时控制协议(RTCP)。RTCP例如用来保持有关它们提供和接收的业务质量的连接通知的两端。这个信息以RTCP发送者报告(SR)和RTCP接收者报告(RR)包的形式发送。此外,该RTP规范定义了RTCP源说明(SDES)包类型。该源能使用RTCP SDES包以提供关于它自身的更多信息。SDES CNAME或NAME包例如能用来提供在该随机的SSRC标识符和该源身份间的映射。SDESCNAME包计划提供规范的端点标识符,而SDES NAME包计划提供用来描述各个源的真实名称。该RTP混合器15预期在将它们转发之前组合来自所有终端13的SR和RR类型的RTCP包。相反,该SDES类型的RTCP包由该RTP混合器15没有修改的发送到所有的会议参加者13。
在电话会议中,参与用户立即识别出谁在讲话有时是困难的。这是一个特别的问题,一旦在电话会议中有许多的参与用户,而这些参与用户就不能很好的彼此认识。
以上引述过的RFC1889描述了音频会议的典型情形,其中混合器指示所有的讲话者,这些讲话者的声音被组合产生输出包,允许接收者指示出当前的讲话者,即使所有的音频包包含相同的SSRC标识符,即混频器的标识符。
然而,在任何敏感的话音编解码器的VoIP使用中,该编解码器将发送静音描述符(SID)帧以使只要在各个会议参与者不活动时,即在收听时,在接收端产生的噪音是舒服的。从而,所有的源将总是产生发送到电话会议服务器12的信号。电话会议服务器12在编码将发送到终端13的输出话音和SID帧之前,将从每个参加者接收到的VoIP流解码返回话音或SID帧以求和。这意味着由该混合器15将所有终端13的SSRC标识符包含到输出混合RTP包的CSRC列表内,因此接收终端13区分活动的和不活动的参与者是不可能的。必须指出,在CSRC目录中包括该所有参加终端13的SSRC标识符也是有好处的,例如,可以保持每个参与用户得到参加会议的所有其它用户的最新的数量和身份。

发明内容
本发明的一个目的是提高参与IP承载语音电话会议中的用户的舒适性。
本发明通过一种管理在多个终端间的分组交换集中式电话会议的方法来达到该目的,该方法包括的第一步,电话会议服务器从参与该电话会议的所有终端接收数据包。这些数据包包括话音数据或者背景噪音信息和一个与产生该话音数据或背景噪音信息的相应终端相关的标识符。第二步,基于接收数据包,在参与该电话会议的终端中确定至少一个当前正在产生话音数据的终端,如果这样的终端存在。明显的,如果参与该电话会议的用户中暂时没有人讲话,暂时没有一个终端产生话音数据,也就确定没有产生话音数据的终端。第三步,接收到的话音数据和背景音信息被混合并连同与已被确定为当前正在产生话音数据的一个终端相关的至少一个标识符一起插入到新的数据包中,如果这样的终端存在。该标识符通过一种方式包括在数据包中,该方式使其与其它包括的信息相区分。这就特别意味着至少一个标识符能够与其它可能包括在其中的标识符相区分,这些其它的标识符不一定与产生话音数据的终端相关。最终,新的数据包由电话会议服务器传送到参与该电话会议的终端。
本发明的目的通过一个电话会议服务器同样能够达到,该服务器包括实现该提到的方法的装置。
此外,本发明的目的通过一个终端实现,该终端包括用来加入集中式电话会议的装置,依照本发明该装置适合利用通过电话会议服务器发送的信息。该终端包括末端装置以接收由电话会议服务器发送的数据包。该数据包包括由参加该电话会议的终端产生的混合的话音数据和/或背景音信息,和至少一个与在该电话会议服务器中已被确定为当前正在产生话音数据的终端相关的标识符,如果该终端存在。此外,该终端包括用来在接收到的数据包中识别标识符的装置,该标识符与在电话会议服务器中确定为当前正在产生话音数据的终端相关。进一步,该终端包括基于识别的标识符,向用户指出提供语音数据的终端身份标识的装置,该标识符与在电话会议服务器中已被确定为当前正在产生话音数据的那个终端相关。
本发明根据该想法继续提出电话会议服务器,该服务器能被设计以区分那些当前活动的电话会议参与者,即产生话音数据的参与者,和那些当前不活动的参加者,即仅产生背景音信息的参与者。本发明还根据该想法继续提出一种终端该终端设计为一旦接收到了相应的信息,其能够为用户指出当前有效的电话会议参与者。因此,本发明建议电话会议服务器执行确定电话会议中当前有效的参与者,并且该服务器将一个相应的、可区分的指示转发给参加该电话会议的终端。
本发明的一个优点在于其能够改良终端的用户接口,由于该活动的会议参与者发送的信息能够传送到该用户。该电话会议的参与者因而总是能在所有的参加者中识别出当前的讲话者。
通过从属权利要求,本发明的优选实施例将变得显而易见。
有效终端的标识符能够通过电话会议服务器以多种方式发送。
在第一种可选方案中,该电话会议服务器在每一个组合的数据包中发送一个与那些终端相关的专用标识符,那些终端是当前的有效终端。该方案的优点在于接收终端能够向它们的用户指出所有的当前讲话者,即使同时有多个讲话者。然而,通过该方案,接收终端也不能保证它们的用户能够得知最新的所有参与者。
在第二种可选方案中,该电话会议服务器在每一个组合的数据包中向所有参加该会议的终端发送标识符,但在该方式中,与有效终端相关的标识符总是列于标识符目录的预定位置,例如该列表的第一部分。该方案经常更新所有会议参与者的信息,但它不允许同时指出多于一个的有效终端。然而,在敏感的讨论中,特别是通过电话连接时,每次仅有一个参与者讲话,这个问题可作为一个小问题考虑。
通过改进第二个方案提出了第三个可选方案。在第三个方案中,电话会议服务器总是在每一个组合的数据包中向参加该会议的终端再一次发送标识符。与当前有效终端相关的标识符列于标识符列表的开始位置。此外,在与当前有效的终端相关的标识符和与当前无效的终端的标识符间插入一些标记。第三个方案结合了第一个方案和第二个方案的优点,通过引入一个必须发送的附加值使方案简单化。
与相应终端相关的标识符自身可能并不适合在接收终端识别发送终端,例如随机分布的SSRC标识符。在这种情况下,优选的将该标识符到清楚的身份标识的标识符的映射首先从所有可能的发送终端发送到该电话会议服务器,并进一步发送到所有可能的接收终端。然后每一个接收终端都能够将随后接收到的与发送终端相关的标识符映射为这个终端的相应标识。特别的,该身份标识可以是一个SIP地址或者电话号码。该接收终端也可以进一步将该确定的标识映射为另一种标识。例如,如果该标识是一个SIP地址或者电话号码,该终端可以将这个地址或号码映射为存储在接收终端的目录中的一个名称或者一个映象。
一旦所有的电话会议参与者都呈现给一个终端的用户,那么以任何适当的方式向该用户指出有效的参与者。
本发明能被特别的使用在一个系统中,虽然不是专用的,在该系统中,集中式电话会议是基于上面引述过的RFC1889中定义的RTP的。在这种情况下,从该终端传送到该电话会议服务器的数据包和从该电话会议服务器传送到该终端的数据包是RTP包。在该组合的RTP包中,由该电话会议服务器发送的终端标识符可有利的是S添加到该RTP报头的CSRC目录中的SRC标识符。在第三种可选方案中,由该电话会议服务器完成标识符的发送,使用的标记例如可以是与该电话会议服务器相关的SSRC标识符。由于该与电话会议服务器相关的SSRC标识符无论如何都是在每一个组合的RTP包的RTP报头头的SSRC域中被发送,该接收终端知道这个值并且使用它来在CSRC列表中区分有效终端和无效终端。相反,在通常的应用中,该与电话会议服务器相关的SSRC标识符仅仅包括在输出的组合RTP包的SSRC域中,而不是在CSRC列表中,有用该电话会议服务器自身不能产生该组合RTP流。
三个可选方案的每一个都呈现为通过该电话会议服务器发送标识符遵从现有的RTP规范,并且不损害实施,该实施不能使用特殊的SSRC/CSRC处理方法。
依照本发明的方法的一个综合的实施例执行在一个基于RTP的系统中,该实施例有利的包括三个部分。第一个部分包含在一个机构中,该机构用于电话会议的参与终端,通过RTCP SDES包来交换RTP源标识符和将那些标识符映射为每个终端或者终端用户的各自的身份标识。第二部分由执行在该电话会议服务器中依照预定义的规则设置该RTP报头的CSRC域的机构组成。第三部分由执行在该参与接收终端中以将该RTP包头的CSRC域中的标识符映射为终端或用户的身份标识的装置组成,以能够向接收终端的用户呈现当前有效的讲话者的身份标识。
应当注意,通过该电话会议服务器发送到该参与终端标识符的数量和/或能够由该接收终端呈现的参与者的数量可被限定为一个预定值。例如,依照前面引述过的RFC1889,该CSRC列表限制为最大15个项目。
本发明可特别使用于因特网或者在UMTS包交换语音会议中。在UMTS的情况下,该活动的参与者的信息例如可在移动终端的屏幕上显示。


通过以下的详细说明并结合附图考虑,本发明的其它目的和特征将会变得更加明显,其中图1图解了基于RTP的,集中式电话会议系统的原理;图2图解了RTP报头的结构;图3表示一个终端的用户接口,该接口使用依照本发明的方法的一个实施例。
具体实施例方式
现在将根据图1到图3描述依照本发明的方法的一个实施例。
该实施例支持VoIP电话会议的管理,并在基于RTP的系统中执行,其包括UMTS网络11,电话会议服务器12,该电话会议服务器12包括连接到网络11的RTP混合器15,和多个终端13。该终端13能够使用RTP隧道14通过UMTS网络11连接到该电话会议服务器12。该系统通常与图1所示的系统相应,该系统已经在前面描述过了。
为了在这个系统中建立VoIP电话会议,会话启动协议(SIP)用作信令协议。SIP与会话描述协议(SDP)一起用来向被叫方发送邀请并对话音编解码器等达成一致。终端13的用户也通过向该电话会议服务器12发送SIP请求消息来自己启动会话从而加入该会议,或者回复通过该电话会议服务器12接收到的邀请消息来加入该会议。
在启动会议会话的开始,每个终端13的会议软件向该电话会议服务器12发送RTCP SDES包。这些SDES包携带与用于这个会话的相应终端13相关的SSRC标识符,此外在该SDES内容域中还有各个终端13的SIP地址或者电话号码。该电话会议服务器12将接收到的SDES包转发给参加该电话会议的每个终端13中。基于在这些SDES包中的信息,该终端13准备将会议会话中接收到的SSRC标识符映射成相应的SIP地址或者电话号码。
当会议会话有效时,所有参加该会议的终端13向电话会议服务器12发送RTP包。该终端13以一种方式对末端使用语音编码,例如,AMR语音编解码器,该方式是当在输入端有话音时,即当终端13的用户正在讲话时,它们以普通速率发送,当该源不发声时,即当该终端13的用户正在收听其它参与者时,减小速率。在第一种情况下,语音编解码器编码话音数据并在该RTP包的有效载荷内将其发送。在后一种情况下,语音编码器产生并发送SID帧,该帧携带有背景噪音估计,该估计对于在接收端产生舒适的噪音是需要的。在这种情况下,这个接收端是电话会议服务器12。
该电话会议服务器12的RTP混合器15解码所有输入的数据流,以便对解码后的话音求和并对组合的话音编码。基于各个使用的数据速率,该电话会议服务器12获得一个解码过程的辅助信息,该信息指示该解码后的信号是语音还是背景噪音估计。
此后,该电话会议服务器12的RTP混合器15将该解码后的话音和来自所有源13的背景噪音估计混合在一起,并且通过编码的组合数据流汇编RTP包。每一个汇编过的RTP包包括一个RTP报头,该报头头的结构与图2所示的结构相应,该结构已经在以上描述过了。从而,每个RTP报头包括一个用于SSRC标识符的域和一个用于CSRC列表的域。
该RTP混合器15将与该用于当前电话会议的电话会议服务器12相关的SSRC标识符插入到该输出RTP包的RTP报头头的SSRC标识符域中,因为该电话会议服务器12是用于这些RTP包的源。
此外,该RTP混合器15包括与那些终端13相关的SSRC标识符,该终端在该RTP头的CSRC列表中产生组合RTP包。由于所有参与该电话会议的终端13总是向该电话会议服务器12发送RTP包,该包具有话音数据或者背景噪音估计,该CSRC列表因而总是包括有用于所有参与终端13的SSRC标识符。然而,该RTP混合器15注意到,该与有效的参与终端13相关的SSRC标识符作为第一元素包括在CSRC列表中。
另外,该RTP混合器15也将与该电话会议服务器12相关的SSRC标识符插入到该CSRC列表中。更特别的,包含的与该电话会议服务器12相关的SSRC标识符作为与位于该CSRC列表的开始的有效终端13相关的SSRC标识符和与位于该CSRC列表的结尾的该无效终端13的SSRC标识符中间一个标记包。
然后,该电话会议服务器12将该合成流转发给每一个参与终端13。
该终端13通过该UMTS网络14接收由该电话会议服务器12发送的RTP包,并检索该包括在各个RTP包的报头的CSRC列表中的SSRC标识符。基于该先前接收到的映射信息,该终端13接着确定与从CSRC列表中检索到的SSRC标识符相应的SIP地址或者电话号码。该终端13不对该SSRC标识符执行这一映射,该SSRC标识符与该电话会议服务器12相关。该终端13基于包括在该RTP头的SSRC标识符域中同一SSRC标识符来识别该SSRC标识符。该终端13进一步确定在它们的内部地址目录中与已经确定的SIP地址或电话号码相关的名称,直到可用为止。该确定出的名称然后以列表的形式在终端13的显示装置上呈现给各个用户。
图3表示这种显示装置31的一个实施例,其在呈现其它信息之外,呈现一个列表选项32,该列表选项具有参与正在进行的电话会议的用户的名称。
此外,该终端13确定在该CSRC列表中列出的所有那些SSRC标识符,该标识符列在与该电话会议服务器12相关的SSRC标识符的前面。该确定的用于那些SSRC标识符的名称属于当前活动的参与者,并且在该显示装置31上呈现的列表32中被指出。在图3的例子中,一个专用讲话者指示器图标33被使用来指示当前正在讲话的参与者。在出现情况中,当前仅一个参与者正在讲话,讲话者指示器图标33位于该列表32中的相应名称″Saimi″的后面。
从而,该终端13的用户总是能够看见所有参与该电话会议的用户的身份标识,并能够区分当前讲话的参与者和不活动的参与者。
应当理解所描述的实施例只构成本发明可能的实施例的一种变化。
权利要求
1.一种管理在多个终端(13)间的集中式电话会议中交换的信息包的方法,所述方法包括在电话会议服务器(12)上-从参与所述电话会议的所有终端(13)上接收数据包,该数据包包括话音数据或背景噪音信息,以及与各个终端(13)相关的标识符,该各个终端(13)提供所述的话音数据或者所述的背景噪音信息;-基于所述接收到的数据包在参与所述电话会议的所述终端(13)中确定至少一个当前正在提供话音数据的终端(13),如果这样的终端存在;-混合所述接收到的话音数据和所述接收到的背景噪音信息,并将所述混合后的数据与至少一个标识符一起插入到新数据包中,该标识符与所述已被确定为当前产生话音数据的一个终端(13)相关,如果这样的终端存在,以便能够从包括在所述数据包中的任何其它信息中区分所述至少一个标识符;以及-发送所述新数据包给参与所述电话会议的终端(13)。
2.根据权利要求1的方法,其中与所述终端(13)相关的所述标识符是随机与用于所述电话会议的所述终端(13)相关的标识符,所述方法包括在所述电话会议服务器(12)上从参与所述电话会议的所述终端(13)接收控制包的在前步骤,所述控制包包括将与对应终端(13)相关的标识符映射到所述终端(13)的身份标识,将控制包中的所述映射从所述电话会议服务器(12)转发给参与所述电话会议的所述终端(13)中。
3.根据上述权利要求之一的方法,其中所述电话会议服务器(12)在所述新数据包中排他地发送与已确定为提供话音数据的终端(13)相关的标识符。
4.根据权利要求1或2的方法,其中所述电话会议服务器(12)在所述新数据包中包括与当前正在提供会议数据的终端(13)相关的标识符,也包括与当前正在提供背景噪音信息的终端相关的标识符,至少一个与已确定为提供话音数据的终端(13)相关的标识符包括在所述数据包中所有包括的标识符中的预定位置处。
5.根据权利要求1或2的方法,其中所述电话会议服务器(12)在所述新数据包中包括与当前正在提供话音数据的终端(13)相关的标识符,也包括与当前正在提供背景噪音信息的终端(13)相关的标识符,其中至少一个与已确定为产生话音数据的终端(13)相关的标识符包括在所述数据包中所有包括的标识符中的预定位置处,如果这样的终端存在,并且其中通过一个标记将与已确定为提供话音数据的终端(13)相关的标识符与所包括的与其它终端(13)相关的标识符分开。
6.根据权利要求5的方法,其中所述的标记对应于和所述电话会议服务器(12)相关的标识符。
7.根据以上权利要求之一的方法,其中所述电话会议是基于实时传输协议RTP的,其中所述的数据包是RTP包,其中与所述终端(13)相关的所述标识符是同步源SSRC标识符,并且其中对于用于发生源CSRC列表的数据包报头中提供的字段,所述标识符通过所述电话会议服务器(12)包括在所述新数据包中。
8.根据以上权利要之一的方法,进一步包括在参与所述电话会议的终端(13)上接收由所述电话会议服务器(12)发送的所述新数据包,并基于包括在所述接收到的新数据包中的标识符指出至少一个终端(13)的身份标识(32、33),该终端(13)已被确定为是向用户产生话音数据的终端。
9.一种电话会议服务器(12),包括用于管理在多个终端(13)间的集中式电话会议的装置,所述装置包括用于实现根据权利要求1到7之一的方法步骤的装置(15)。
10.一种包括用于参与集中式电话会议的装置的终端(13),所述装置包括-用于接收由电话会议服务器(12)发送的数据包的装置,该数据包包括混合的话音数据和/或由参与所述电话会议的终端(13)提供的背景噪音信息,还包括至少一个与在所述电话会议服务器(12)中已确定为当前正在提供话音数据的终端(13)相关的标识符,如果这样的终端存在;-用于在接收到的数据包中识别标识符的装置,该标识符与在所述电话会议服务器(12)中已确定为当前正在提供话音数据的终端(13)相关;和-用于基于识别的与在电话会议服务器(12)中已被确定为当前正在提供话音数据的终端(13)相关的标识符,向用户指出正提供话音数据的终端(13)的标识的装置。
全文摘要
本发明涉及一种用于管理在多个终端(13)间的分组交换集中式电话会议的方法。为了提高用户的舒适度,建议该方法包括在电话会议服务器(12)上接收来自所有终端(13)的数据包。然后,基于这些数据包,确定至少一个当前提供话音数据的终端(13)。在下一个步骤,在数据包中接收到的数据被混合,并且将混合数据连同至少一个与一个终端(13)相关的标识符一起插入到新数据包中,该终端为已确定来提供话音数据的终端,以便将至少一个标识符从数据包中的其它信息中区分。最终,将新数据包发送到参加该电话会议的终端(13)。本发明同样涉及一种相应的服务器和一种相应的终端。
文档编号H04L12/18GK1871825SQ02829259
公开日2006年11月29日 申请日期2002年7月4日 优先权日2002年7月4日
发明者J·库西宁, A·拉卡尼米 申请人:诺基亚有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1