Ip网络中资源高效的声回波消除的制作方法

文档序号:7990041阅读:193来源:国知局
Ip网络中资源高效的声回波消除的制作方法
【专利摘要】系统和方法为IP网络中互联网协议(IP)媒体服务器中的实时媒体处理提供声回波监测和消除。回波监测器被配置成选择性地比较通过选定端口进出IP媒体服务器的音频流。比较确定回波的发生。与回波监测器通信的回波消除器被配置成对于回波监测器的确定做出响应,以便从音频流的至少一个中移除回波。通话突发检测器可用于检测通过选定端口的音频流的至少一个中的话音。回波监测器响应于来自通话突发检测器的指示检测到话音的信号来比较音频流。
【专利说明】IP网络中资源高效的声回波消除
【技术领域】
[0001]本文所描述的实施例涉及在互联网协议(IP)网络上承载的音频信号和流中的声回波监测和消除的领域。
【背景技术】
[0002]回波通常由以扬声器电话模式操作的电话终端或者由将2线模拟电路转换为公共电话交换网(PSTN)网络中的4线传输线路的混合变换器(hybrid)引入。在IP网络中,回波(声和/或混合)被从终端承载通过并且经受可变的延迟和抖动。在IP会议系统中,由参与者中的任一个引入的回波由除了引入回波的一个或多个终端之外的所有参与者听到,导致音频会议较差的质量。从媒体处理资源利用的角度而言,监测回波和从IP音频流中移除回波是特别昂贵的操作。
[0003]基于IP的会议服务器通常被称作IP媒体服务器,IP媒体服务器用于电话网络中并且执行多种基本和增强的服务,其包括会议、音频和视频交互语音响应(IVR)、转码、音频和视频通知和其它先进的话音服务。IP媒体服务器也可用于网络中,该网络提供视频会议服务以及在互联网、在虚拟专用网络上,在广域网或在局域网内发生的类型的典型数据交换服务。由媒体服务器执行的数据交换和处理是基于具有固定最大处理时间要求的分组处理。
[0004]IP多媒体会议服务器允许多个参与者参加会议。会议服务通过混合器资源提供参与者媒体的混合,允许所有参与者听到或者看到其它参与者,当他们在会议期间变得活跃时。会议混合器资源可使用来自所有参与者的媒体以确定在会议操作期间哪些参与者将作为活跃的参与者而被听到或看到。当在其他参与者开始发言的同时特定参与者停止发言时,活跃的参与者的集合能够实时地动态改变。
[0005]会议服务的单个实例可在N个处理器上分布,其中N>=1。媒体处理服务器的集合可以在同一物理服务器内并置或者可以在近或远位置经由IP通信接口互连的多个物理服务器上分布。
[0006]无论会议混合器资源是并置的还是分布的,在会议中服务以及参与者交互的用户体验优选地不应改变。例如,在音频会议中,所有参与者,无论会议混合器资源在地理上是分布的或并置的,应听到相同的会议输出混合。
[0007]IP多媒体端对端服务器允许两个参与者参与双向会议。

【发明内容】

[0008]在一个实施例中,一种用于对互联网协议(IP)网络中的实时媒体处理提供声回波监测和消除的系统。该系统包括IP媒体服务器,IP媒体服务器包括用于向音频会议的多个参与者提供实时端对端服务或音频混合的多个端口。IP媒体服务器包括回波监测器,回波监测器被配置成选择性地比较通过多个端口中的选定端口进入IP媒体服务器的音频流和流出IP媒体服务器的音频流。比较确定回波的发生。IP媒体服务器还包括与回波监测器通信的回波消除器。回波消除器被配置成响应于由回波监测器的确定从音频流中的至少一个移除回波。在某些这样的实施例中,IP媒体服务器进一步包括通话突发检测器,其被配置成检测通过选定端口的音频流的至少一个中的话音。回波监测器响应于来自通话突发检测器的指示检测到话音的信号,选择性地比较音频流。
[0009]在另一实施例中,一种用于声回波监测和消除的方法包括选择性地比较进入IP媒体服务器的选定端口的音频流和流出IP媒体服务器的选定端口的音频流。比较确定回波的发生。响应于对回波发生的确定,该方法进一步包括从音频流中的至少一个移除回波。在某些这样的实施例中,该方法还包括:检测通过选定端口的音频流的至少一个中的话音,其中响应于话音的检测来发生选择性地比较音频流。
[0010]从下文参考附图进行的对优选实施例的详细描述,另外的方面和优点将是显而易见的。
【专利附图】

【附图说明】
[0011]现将参考附图,仅通过举例来更详细地描述各种实施例,在附图中:
[0012]图1是示出了典型基于终端的声回波消除方案的框图;
[0013]图2包括在基于终端或基于网络的声回波消除方案中体延迟与回波尾部长度之间差异的曲线图;
[0014]图3是示出在VoIP网络内在典型会议场景中的回波路径的框图;
[0015]图4是示出根据一个实施例的VoIP媒体服务器的框图,VoIP媒体服务器被配置成为会议服务执行声回波消除;
[0016]图5是示出根据一个实施例的VoIP媒体服务器的框图,VoIP媒体服务器被配置成为端对端服务执行声回波消除;
[0017]图6是示出根据一个实施例在媒体服务器中使用的AEC的框图;
[0018]图7是示出了根据一个实施例,从AEC处理对象的视角,具有声回波消除的示例三端口窄频带音频会议的方法的流程图;以及
[0019]图8是示出了根据一个实施例,从AEC处理对象的视角,具有声回波消除的示例二端口端对端服务的方法800的流程图。
【具体实施方式】
[0020]1.介绍
[0021]声回波消除(AEC)是在进入端口上移除回波的技术。通常在终端以扬声器电话模式操作并且不具有内置回波消除器或者具有较差的内置回波消除器时引入声回波。当发送给用户终端的扬声器的会议音频的一部分由麦克风拾取并且反馈给会议混合器以由所有会议用户(除了生成回波的用户之外)听到时,在会议中出现声回波。回波也可能在将2线模拟电路转换为4线传输线路的混合变换器中在公共交换电话交换网(PSTN)终端上引入。回波消除通常不能区分声回波和混合回波并且试图消除它们二者。当回波延迟变得远大于约50ms时,回波是很分散注意力的。
[0022]回波的尾部长度是在回波初始开始直到回波基本上消失(例如,以30dB或更多)之间的时间长度。标准会议室为大约64ms的回波尾部。[0023]回波的体延迟是在媒体服务器输出发声到在媒体服务器输入上相对应的回波开始之间的时间长度。体延迟包括往返网络延迟、在回波路径中的声延迟和在终端和媒体服务器中的任何延迟(例如,抖动、分组、编解码器延迟等)。在VoIP中的回波通常具有更大的延迟(直至512ms)并且可能在感觉上更让人讨厌。如由终端使用的常规声回波消除技术在这种场景中并不现实,而是替代地,网络回波消除器利用体延迟信息来估计和消除回波。具有64ms回波尾部的回波消除器能有效地消除具有64ms尾部的回波,只要已知正确的体延迟。在媒体服务器上,测量体延迟,因为其在呼叫与呼叫之间可能差异很大并且是未知的。由回波监测资源测量在IP音频流上的回波和体延迟的存在与否,这从媒体处理资源利用角度而言是昂贵的操作。由回波消除资源来处置回波消除,这从媒体处理资源利用角度而言也可能增加了昂贵了操作。
[0024]本文所公开的实施例提供在保留稀有的媒体处理资源的同时监测和消除在大量音频流上的声回波的能力。根据某些实施例,VoIP网络添加了增加的延迟、时钟偏移和额外的减损,这使得准确估计体延迟和声回波消除的任务较难。
[0025]图1是示出了典型的基于终端的声回波消除器(AEC) 110的框图。在此示例中,AEC 110包括自适应滤波器112、减法器113、双向通话(DT)检测器114、控制器和/或非线性处理器(NLP) 116、开关118和衰减器120。AEC 110包括相对于用户在“近端”用于连接到终端的扬声器124和麦克风126的终端侧122。AEC 110还包括相对于用户在“远端”用于通过网络132 (例如,互联网)连接到媒体服务器130的媒体服务器侧128。
[0026]从媒体服务器130 (远端)到达的音频被馈送到AEC 110中的自适应滤波器112以及终端的扬声器124 (近端),在那里,其被麦克风126部分地拾取。自适应滤波器被配置成模拟终端中的回波路径,使得通过AEC 110中的减法器113来移除由终端的麦克风126拾取的任何回波。不完全的回波移除导致使用最小均方算法更新自适应滤波器112直到自适应滤波器112收敛为回波路径。近端话音(双向通话)的存在干扰收敛。因此,由DT检测器114来检测双向通话,DT检测器114然后防止自适应滤波器112更新。
[0027]在回波路径中的任何非线性可能导致不能由线性自适应滤波器112移除的某些残余回波。每当回波控制器和/或NLP 116确定在无双向通话(S卩,无近端话音)的情况下存在回波时,控制器和/或NLP 116通过接入和断开(例如,由开关118图形表示的)衰减器120来移除此残余回波。在双向通话期间,控制器和/或NLP 116并不激活,并且仅自适应滤波器112用于减少回波。在此情况下,任何残余回波不受影响地通过,但是可能被近端话音掩盖。
[0028]应当指出的是,对于给定终端,在发送到扬声器124的音频与回响的音频之间存在固定的最小延迟。这个延迟被称作体延迟。为了使声回波消除的效果最大化,AEC 110通常并不试图消除在体延迟之前发生的回波。
[0029]图2包括在基于终端或基于网络的声回波消除方案中体延迟与回波尾部长度之间差异的曲线图。现参看图1,在图2的顶部的曲线图(媒体服务器输出(MSout))示出了被馈送到近端的扬声器124的音频,并且在图2的底部的曲线图(媒体服务器输入(MSin))示出了由近端的麦克风126拾取的回波信号。体延迟是在发送给扬声器的信号与其回波之间的时间差,而尾部长度为回波弹回的时间长度。
[0030]图3是示出在VoIP网络310内在典型会议场景中回波路径300的框图。在此示例中,第一用户312和第二用户314通过PSTN 316和VoIP网关318与VoIP网络310通信,第三用户320和第四用户322通过蜂窝电话网络(在本文中被称作“小区网络”)324、通过蜂窝(小区)网关326与VoIP网络310通信,并且第五用户328和第六用户330与VoIP网络310直接通信(例如,使用具有有线或无线连通性的计算机,其可包括网络设备,例如路由器和网关)。图示的回波路径300在第四用户322与第六用户330之间。
[0031]第一用户312、第二用户314、第三用户320、第四用户322、第五用户328和第六用户330 (“会议参与者”)中的两个或更多个可以在会议呼叫中通过媒体服务器332彼此通信,媒体服务器332与VoIP网关318通信。如在图3中示意性地表示,媒体服务器332包括会议混合器338。在某些实施例中,会议混合器334被配置成在会议呼叫中混合来自当前N个最响亮的会议参与者的语音或者其它数据。从会议参与者接收的数据在输入到会议混合器334之前由多个解码器336 (“dec”)解码。从会议混合器334输出到相应的会议参与者的数据由多个编码器338编码。
[0032]会议参与者中的每一个取决于其特定设置而产生不同的声回波量。声回波的最差的冒犯者(offender)通常为扬声器电话(例如,第六个用户330利用包括扬声器340和麦克风342的系统)和免提蜂窝电话(例如,第三用户320和第四用户322),尽管这些设备可被设计成减小在扬声器与麦克风之间的耦合。即使具有最小化直接回波路径的良好设计,来自办公室墙壁和家具的音频反射也造成不想要的回波。与反射组合的直接回波扩展了回波的持续时间并且形成所谓的回波尾部(参看图2所示的尾部长度),其可以在小会议室中持续多达50ms或更长时间。
[0033]高端会议电话可包括回波消除(例如,第一用户312、第二用户314,和第三用户320均包括内置AEC 344),但典型的办公室扬声器电话并不包括。特别糟的是软客户端(例如,第六用户330),其使用廉价的个人计算机(PC)扬声器340和麦克风342,并不特别地考虑减小声耦合。软客户端常常提供回波消除的选择但其通常并不使能或者未适当配置。电话头戴送受话器(例如,由第五用户328使用的头戴送受话器346)通常并不具有回波的问题,除非它们放置在桌子上,在此情况下,从桌子反射的回波能造成回波问题。
[0034]在PSTN电话的混合变换器(例如,关于第一用户312和第二用户314示出的混合变换器347)中在2线至4线转换中可能出现另一形式的回波。这种回波被称作混合回波并且具有很短的尾部长度。混合回波通常在PSTN电话网络316或者在VoIP网关318 (例如,图示为线回波消除器(EC) 348)中消除但也能由声回波消除器消除。
[0035]如上文所提到的那样,图示的回波路径300在第四用户322与第六用户330之间。在此情况下,来自第四用户322的蜂窝电话的音频通过小区网络324到媒体服务器322,在此其被增加到会议混合并且发送给第六用户330。第六用户330的麦克风342拾取会议音频中被发送回到媒体服务器332以添加到会议中的一些。然后会议混合由所有会议参与者听到,除了第六用户330之外。应当指出的是,第四用户322听到以往返网络延迟(从第四用户322至媒体服务器332至第六用户330并且然后再返回的延迟)的基本上两倍,其可能很容易是IOOms或更多,回到他/她的他/她自己的语音。
[0036]图4是示出了根据一个实施例,被配置成为会议服务执行声回波消除的VoIP媒体服务器400的框图。VoIP媒体服务器400也可在本文中被称作“IP媒体服务器”或者“媒体服务器”。在此情况下,VoIP媒体服务器400执行基于网络的AEC,而不是基于终端的AEC。应当指出的是,对于基于网络的AEC,体延迟不再是固定的并且大得多,因为其包括在网络中的传输延迟,其中的几个可能在呼叫期间改变(诸如自适应抖动缓冲等)。
[0037]VoIP媒体服务器400包括多个AEC 410、412、414、416,每个用于一个端口。在此示例实施例中,VoIP媒体服务器400包括通过网络418与第一用户420、第二用户422、第三用户424和第四用户426通信的四个端口。但是,本领域技术人员从本文的公开认识到在其它实施例中,VoIP媒体服务器400可具有与任意多个用户通信并且向任意多个用户提供会议服务的任意多个端口。VoIP媒体服务器400还包括会议混合器428、多个解码器(DEC)430和多个编码器(ENC) 432。
[0038]来自每端口的进入的实时传送协议(RTP)流由相应的解码器430解码并且然后输入到移除回波的相应AEC410、412、414、416的近侧。移除了回波的信号从相应的AEC410、412、414、416的远侧传出到会议混合器428,在会议混合器428中,其被混合并且发送到其它用户420、422、424、426。用于每个用户的混合音频传入到相应的AEC410、412、414、416的远侧,在那里,其由自适应滤波器(参看图1中的自适应滤波器12)用于预测进入的回波信号。
[0039]在某些实施例中,在VoIP媒体服务器400中的AEC410、412、414、416并不实际上改变会议混合器428的输出信号。因此,在这样的实施例中的会议输出并不需要通过AEC410、412、414、416,如图4所示,而是能够直接传递到编码器432。
[0040]图5是示出根据一个实施例,被配置成为端对端服务执行声回波消除的VoIP媒体服务器500的框图。VoIP媒体服务器500也可被称作“ IP媒体服务器”或者“媒体服务器”。非常类似于图4,VoIP媒体服务器500执行基于网络的AEC,而不是基于终端的AEC。VoIP媒体服务器500包括用于每端口的AEC 510、512,它们分别通过网络517与第一用户514和第二用户516通信。AEC 510,512均通过解码器518和编码器520耦合到相应端口
[0041]来自每端口的进入的RTP流由相应的解码器518解码并且然后被输入到移除回波的相应的AEC 510、512的近侧。移除了回波的信号从相应的AEC 510、512的远侧传出并且发送到其它用户。然后音频传入到相应的AEC 510、512的远侧,在那里,其由自适应滤波器(参看图1中的自适应滤波器112)用于预测进入的回波信号。在某些实施例中,在VoIP媒体服务器500中的AEC 510,512并不实际上改变输出信号(即,在AEC的输入中在远处接收)。在这样的实施例中,输出信号无需通过AEC,如图5所示,但能够直接传递到相应的编码器520。
[0042]图6是示出根据一个实施例,在媒体服务器(例如,图4所示的媒体服务器400或者图5所示的媒体服务器500)中所用的AEC 600的框图。类似于图1所示的基于终端的AEC 110,AEC 600包括回波消除器610,回波消除器610包括自适应滤波器112、减法器113、双向通话(DT)检测器114、控制器和/或非线性处理器(NLP) 116、开关118和衰减器120。但是,图6所示的AEC 600还包括回波监测器612和通话突发检测器(TBD)614、616。在某些实施例中,如在下文中详细地讨论,回波消除器610和/或回波监测器612可选自多个处理资源。
[0043]在图6所示的示例实施例中,AEC的功能被分成远AEC处理对象618和近AEC处理对象620。如在本文所用的,“处理对象”是广义的术语,具有其正常和通常的意义,并且可使用软件、硬件或者软件与硬件的组合来实施。远AEC处理对象618采样到端口的输出信号。近AEC处理对象618执行大量的回波消除功能工作,并且包括TBD614、616和回波监测器612。将AEC功能分成远AEC处理对象618和近AEC处理对象620的原因是实施上的考虑,这并不偏离本文所公开的实施例的精神或范围,如鉴于本文所包含的公开而对本领域技术人员将是显而易见的。
[0044]回波监测器612比较到编码器(远端,例如,从混合器428 (图4)或者从远侧AEC(图5)在AEC的“Farin”终端处接收)的输入与来自解码器(近端,例如,在AEC的“Nearin”终端处接收,如图4和图5所示)的输入,寻找从零至最大支持的体延迟的变化延迟的相关性。如对于本领域技术人员显然的,许多可能的措施能够用于使远侧信号的表示与近侧信号的类似表示相关,来找到用于确定回波估计和回波的体延迟的匹配。在实际回波监测过程中许多更改和修改是可能的,而不偏离本发明的精神或范围并且并非是实践本文所公开的实施例的中心。在某些实施例中,仅当TBD614检测到远侧中通话突发时发生回波监测,因为这个远端话音可能是回波的必要条件。应当指出的是,直到做出了体延迟估计才能开始回波消除,这可能需要存在实际的回波。此外,或者在其它实施例中,回波监测器612被配置成估计音频流中回波的回波返回损失(ERL)。
[0045]应当指出的是,根据某些实施例,为了提高性能,媒体服务器在多个端口之间共享有限的回波监测器资源并且仅将有限的回波消除资源应用于最需要它的端口(即,具有最小ERL的端口)。这在随后部分中更详细地涵盖。
[0046]图7是示出根据一个实施例,从AEC处理对象的视角,具有声回波消除的示例三端口窄带音频会议的方法700的流程图。在此示例实施例中,图6所示的AEC600被配置成提供回波消除,其中近AEC处理对象620在输入信号路径中插入到就在解码器后方的智能混合器702,并且其中远AEC处理对象618对就在解码器前方的会议输出米样。关于在用于第一端口、第二端口和第三端口的相应时隙中执行的多个步骤示出了方法700。
[0047]在输入步骤710中,端口中的一个或多个接收RTP输入。在解码器步骤712中,对RTP输入进行解码。在第一预处理步骤714,近AEC620执行回波消除功能,如本文所描述的那样。第一预处理步骤714还可包括对于双音多频(DTMF)信号传递的处理。第二预处理步骤716可包括一个或多个功能,诸如增益、自动增益控制(AGC)、噪声选通(NG)、降噪(NR)和/或噪声线检测(NLD)。在服务步骤718,智能混合器702混合来自第一端口、第二端口和第二端口的信号。
[0048]第一后处理步骤720提供对于智能混合器702输出的增益。在第二后处理步骤722中,简单的混合器可用于混合智能混合器702的输出与端口通知和/或DTMF生成的信号。在编码器步骤724中,对混合的输出信号进行编码。远AEC处理对象618接收与编码器相同的信号,以便不仅对于会议音频而且也对于端口通知或者DTMF生成进行回波消除,如由虚线所示。在输出步骤726中,将RTP输出提供给相应端口。
[0049]近AEC处理对象620和远AEC处理对象618链结,如由虚线所示。在某些实施例中,近AEC处理对象620并不执行大量工作,仅依靠远AEC处理对象618对远端信号采样。
[0050]图8是根据一个实施例,从AEC处理对象的视角,具有声回波消除的示例两端口端对端服务的方法800的流程图。在此示例实施例中,图6所示的AEC600被配置成用于回波消除,其中近AEC处理对象620在输入信号路径中插入在就在解码器的后方,并且其中远AEC处理对象618对就在解码器前方的解码输出进行采样。关于在用于第一端口和第二端口的相应时隙中执行的多个步骤示出了方法800。
[0051 ] 在输入步骤810,端口中的一个或两个接收RTP输入。在解码器步骤812中,对RTP输入解码。在第一预处理步骤814,近AEC620执行回波消除功能,如本文所描述的那样。第一预处理步骤814还可包括用于DTMF信号传递的处理。第二预处理步骤816可包括一个或多个功能,诸如增益、AGC、NG、NR和/或NLD。在服务步骤818,第一端口的处理的RTP输入被提供给第二端口用于输出,并且第二端口的处理的RTP被提供给第一端口用于输出。
[0052]第一后处理步骤820为从另一个端口接收的信号提供增益。在第二后处理步骤822,简单混合器可用于混合来自另一端口的信号与端口通知和/或DTMF生成的信号。在编码器步骤824中,对混合的输出信号进行编码。远AEC处理对象618接收与编码器相同的信号以便进行回波消除,非常类似会议的情况。在输出步骤826中,RTP输出被提供给相应端口。
[0053]I1.回波监测
[0054]关于图6,现针对包括可在多个近AEC处理对象620之间共享的多个回波监测器612 (或处理资源)(或回波监测器612的池)的实施例描述回波监测。当激活时,在媒体服务器(参看,例如在图4中的VoIP媒体服务器400或者在图5中的VoIP媒体服务器500)内的近AEC处理对象620开始寻找通话突发(例如,使用TBD 616)。一旦发现通话突发,近AEC处理对象620首先寻找在其池内的空闲回波监测器612以检查回波的存在,并且若存在,则测量其回波返回损失(ERL)和其体延迟。应当指出的是,在某些实施例中,如果不存在可测量的回波,则不能估计体延迟。
[0055]如果存在空闲回波监测器612,则近AEC处理对象620使用它,并且随后当完成其测量时将其返回到池。如果不存在空闲回波监测器612,则近AEC处理对象620再次每IOms尝试更新直到回波监测器612空闲或者直到通话突发消失。如果在发现空闲回波监测器612之前,通话突发消失,那么,近AEC处理对象620等待直到在其再次开始寻找回波监测器612之前检测到新通话突发。在某些实施例中,也可能发现回波监测器612但是通话突发太短以至于不能用于检测回波,在此情况下,回波监测器612在没有检测到回波的情况下返回到池。
[0056]如果回波监测器612的数量太低,对于它们可能存在相当多的争用。如果近AEC处理对象620需要回波监测器612并且回波监测器612是空闲的,则近AEC处理对象620获得空闲回波监测器612。如果近AEC处理对象620不能得到回波监测器612,则近AEC处理对象620只是保持尝试。在一个实施例中,用于将回波监测器请求排出优先次序的方法考虑近AEC处理对象620已经等待的时间长度和可能的任何先前回波测量的强度。该方法根据不同的优先级将回波监测器请求置于队列中,其中在队列顶部的项目具有更高的优先级并且更快地利用回波监测器612。队列的大小是可配置的参数。队列长度可为零(即,无队列),在此情况下,并不尝试将回波监测器请求排队使得它们以任何特定次序被服务。
[0057]回波监测可能占用最大支持的体延迟加上合适远端通话突发的额外可配置的持续时间。最大支持的体延迟是可被配置的并且指示通过网络固有的最大可能延迟。
[0058]在一个实施例中,近AEC处理对象620的回波监测部分包括两个状态机,这两个状态机控制TBD614、616和回波监测器12的行为。
[0059]TBD (远端TBD614和近端TBD616)包括两个状态,它们是“不在通话突发中”;和在“通话突发中”。每个处理循环,TBD614、616返回是否检测到通话突发。
[0060]回波监测器612包括2种状态,其为“等待回波监测器”和“回波监测器开始”。
[0061]在“等待回波监测器”状态,端口等待满足适当的定时器,然后远端处于通话突发,并且回波监测器资源是可用的。当由于在近端信号(例如,来自解码器冲存在回波,回波监测器612获得体延迟的可靠估计时,使用“ech0_f0und_timer (回波发现定时器)”。在此时间点,如果有足够的回波消除资源可用,则回波监测器612接通回波消除器610。[0062]一旦发现了体延迟估计,可能体延迟估计可能由于改变的网络条件而随着时间改变。可以预期变化很小的时间能够被认为是时间间隔TBDE—intOTval(TBDE3t$_s)。因此,在每个TBDE—ehange—inteval,可获得体延迟的更新的估计,以便防止回波消除器610在回波消除期间发散。这个持续时间是可配置的参数并且可为大约30秒的量级。一旦经过这段时间,并且发现下一远端通话突发开始,如果回波监测资源可用,则重新开始回波监测器612并且计算体延迟的更新的估计。如果资源不可用,则等待下一可用的资源。
[0063]当回波监测器612并未发现回波,因为回波在近端信号中不存在时,使用“ech0_not_found_timer(回波未发现定时器)”。在此时间点,如果回波消除器610当前接通,则回波监测器612可关断回波消除器610,指示回波已经消失并且不再需要回波消除资源。可能在随后的时间,由于变化的声条件,可能引入或再引入回波。之后近AEC处理对象620再测试回波存在的时间能够被认为是时间间隔TBDE—。?—intOTval (TBDE__)。这个持续时间是可配置的参数并且可为大约5秒的量级。一旦经过了这个时间,并且发现了下一远端通话突发开始,如果资源是可用的,则回波监测器612重新开始并且计算是否出现了回波,并且若出现,则计算体延迟的估计。如果资源并不可用,则近AEC处理对象620等待下一可用资源。
[0064]期望等待发现远端信号中的通话突发,以通过寻找更早远端信号中的近端信号的相关版本,来获得体延迟的估计。如果接收了通话突发检测事件并且资源是可用的,那么资源可立即用于进行回波监测。但是,如果接收了通话突发检测事件并且资源目前不可用,那么将这个请求排队并且取决于其落入队列中的位置来考虑,而这继而又取决于ERL的先前估计。队列的大小是可配置的参数。队列长度可为零(即,无队列)。
[0065]在此示例实施例中所用的策略是资源完全基于先到先得的来分配的策略(无队列)和与仅基于优先级来分配资源的策略之间的折衷。这个策略利用这两种可替代策略。可能所有资源已经完全用于监测其它端口的回波。在这样的情况下,资源不可用于监测这个端口的回波并且必须在下一处理循环窗口中再次尝试。如果某些资源已经被释放,倘若这个端口在等待资源的端口队列顶部,则这个端口得到回波监测器资源。如果这个端口并不在队列顶部,其仍保持在等待回波监测器资源的这个状态。如果TBD状态变成“不在通话突发中”的状态,那么特定端口在其能做出对回波监测器资源的另一请求之前将必须等待直到下一通话突发开始,因为其还未完全准备好进行体延迟估计,因为其不再具有与近端信号相关的远端通话突发。
[0066]队列包括以最高的先前计算的ERL在队列底部,而最低的先前计算的ERL在队列顶部的次序排序的端口。因此在资源被释放时,如果当前端口具有高的先前ERL值,则其可能具有太低的优先级而不能得到回波监测器资源并且将必须等待直到更多的资源释放。另一方面,如果当前端口具有低的先前ERL,其将具有更高的优先级。如果端口并不具有先前ERL估计,即,其从未测量体延迟的估计,那么其将具有最高的优先级,使得回波监测器资源能分配给它并且关于其是否具有回波做出确定。为了确保具有高ERL值的端口最终得到回波监测器资源,定时器可用于测量端口已经等待回波监测器资源多长时间。如果定时器超过了可配置的时间,则端口向上移动到队列顶部,如果它当前在队列中的话,并且然后找到具有为零的估计的ERL的下一可用资源,S卩,指示其并不具有有效的体延迟估计,因为当前的测量现在可能太旧,并且在对决定其能否获得回波监测器资源时不应当具有不适当的影响。
[0067]当完成了体延迟的实际估计时是“回波监测器开始”状态。在“回波监测器开始”状态,回波监测器612返回是否发现回波和体延迟的估计。回波监测器612在其试图找到体延迟的估计之前对于近端话音和远端语话音等待特定时间缓冲。这段时间缓冲在最小体延迟与最大体延迟之间的某处。在经过了可配置的时间后,如果发现回波是可靠的,则状态机转变为“回波监测器等待”状态并且启动回波发现定时器。如果并未可靠地发现回波,则状态机转变为“回波监测器等待”状态并且启动回波未发现定时器。如果回波的存在或不存在是不可靠的,或者当检测到回波特征显著变化,诸如在体延迟变化的情况下,则回波监测器状态机转变为“回波监测器等待”状态并且并不启动任何额外的定时器,并且仅等待下一远端通话突发。如果在“回波监测器开始”状态中缓冲数据的同时完成远端通话突发,则关于是否存在充分的远端通话突发数据做出确定,以确定体延迟的有意义的值。如果远端通话突发的持续时间小于规定阈值,那么较早停止回波监测器计算并且状态机恢复到“回波监测器等待”状态。在此情况下,在试图重新获得对回波监测器资源的控制之前无需等待特定时间。
[0068]由于在基于网络的回波消除器中可能的抖动缓冲调整和时钟偏移校正,在某些实施例中,在媒体服务器中的AEC功能所提供的回波监测和消除能力中需要调整体延迟的估计。这是因为由于时钟偏移的抖动缓冲调整,近信号能相对于远信号移位。这继而导致需要调整体延迟估计,否则体延迟估计可能会略微偏离并且可能导致从调整点较差的消除。
[0069]II1.回波消除
[0070]一旦完成了回波监测,然后具有检测的回波的近AEC处理对象620寻找空闲的回波消除器610。如果发现了空闲的回波消除器610,则近AEC处理对象620得到它并且开始回波消除。如果并未发现空闲的回波消除器610,则近AEC处理对象620比较回波监测阶段期间其测量的ERL与在使用中的其它回波消除器610的ERL,并且如果其回波更强(B卩,更小的ERL),那么其可以从具有最小回波的端口窃取回波消除器610 (最大ERL经受下文所讨论的滞后)。
[0071]滞后用于防止回波消除器610在端口与端口之间弹跳太多。滞后具有一定时间和ERL分量。为了窃取回波消除器610,新端口的ERL被确定为比旧端口的ERL差了特定ERL裕量,并且旧端口的回波消除器610被确定为被分派超过特定时间阈值。
[0072]先前描述假定近AEC处理对象620处于自动模式。如果AEC超驰(override)模式被设置为“强制开启”,那么近AEC处理对象620从具有最小回波的端口窃取回波消除器610(如果并无可用的空闲回波消除器),无论其自身的端口的回波测量如何或者AEC已经被分派给其它端口多长时间。应当指出的是,为了进行回波消除,首先在端口上检测回波并且测量有效的体延迟。因此,将AEC超驰模式转为“强制开启”对于无回波的端口并无效果。只要在过去做出了成功的体延迟测量并且存在空闲的回波消除器610,则“强制开启”将生效。若非如此,只要两种条件都为真,其将生效。
[0073]如果AEC超驰模式被设置为“强制关闭”,那么近AEC处理对象620如果其具有回波消除器610则释放其回波消除器610并且并不试图得到回波消除器,即使在检测到回波的情况下。在从“强制开启”至“强制关闭”至“自动”的呼叫期间的任何时间,AEC超驰模式能够改变。
[0074]在某些实施例中,近AEC处理对象620的回波消除器610包括状态机,状态机控制回波消除器610的行为。声回波消除器610可包括两种状态:“关闭”状态和“开启”状态。AEC “关闭”状态表示在近端信号中不存在回波使得无需分配资源来执行回波消除。只要从回波监测器612接收到表示已经获得体延迟的估计并且因此发现回波的事件,如果资源可用或者这个通道排挤当前正在进行回波消除的另一通道,则期望开启回波消除。
[0075]检查资源以通过管理正在执行回波消除的所有AEC通道的列表来查看它们是否可用。列表包括特定通道的以下信息=ERL ;“超驰开启”或“自动”模式标志;以及回波消除开启的时间。为了排挤进行回波消除的现有端口,新端口应满足滞后阈值要求和滞后时间要求,滞后阈值要求是指ERL超出当前利用回波消除器610的具有最小回波的端口的ERL了滞后水平阈值,滞后时间要求是指具有最大ERL的端口已经执行回波消除持续了至少滞后排挤时间段阈值。滞后排挤时间段和水平阈值为可配置的参数。如仍无可用资源,特定端口将在未来的处理循环中争用有限的资源。
[0076]在“超驰关闭”模式,回波消除器610的状态机保持在“关闭”状态。在“超驰开启”模式的情况下,此特定端口排挤掉并不处于“超驰开启”模式的具有最高ERL值(S卩,最小回波)的端口。被排挤的端口无需满足已经对其执行回波消除持续了如自动模式所需的特定时间量的时间要求。“超驰关闭”模式意指特定通道不具有正在对该端口执行的回波消除(即,是超驰自动模式并且禁用回波消除)。“超驰开启”模式意指特定通道具有正在对该端口执行的回波消除,倘若其能获得体延迟估计(即,回波存在或者在某较早的时间点存在)。
[0077]AEC “开启”状态是其中回波消除器610实际上被激活并且正在执行回波消除的状态。如果当前正在执行AEC的通道被另一通道排挤,则被排挤的通道转变为AEC “关闭”状态以竞争资源。如果端口处于此状态并且设置“超驰开启”模式,则其保留在此状态,无论是否仍存在回波。如果在此状态时设置“超驰关闭”模式,则回波消除器610的状态机转变为AEC “关闭”状态。如果当在此状态时接收到AEC关闭事件,则回波消除器610的状态机转变为AEC “关闭”状态。
[0078]回波消除器610和回波监测器620 —起工作以确保有效地消除回波。期望能使用运行时间反馈控制来对体延迟估计提供动态调整,运行时间反馈控制确定是否正在经历声回波消除的任何给定音频流不再能有效地消除回波。然后作为回波监测器612的一部分,该信息由体延迟估计来使用,以在必要时对体延迟的当前估计做出调整,这随后应当导致更好的回波消除。
[0079]IV.基于AEC端口的统计
[0080]在某些实施例中,媒体服务器(例如,图4所示的VoIP媒体服务器400或者图5所示的VoIP媒体服务器500)在其接收了每端口统计命令时报告AEC统计。如下表I中所示,一个示例实施例包括十一个AEC统计,这十一个AEC统计被包括在每端口统计消息中。
[0081]
【权利要求】
1.一种用于对互联网协议(IP)网络中的实时媒体处理提供声回波监测和消除的系统,所述系统包括: IP媒体服务器,所述IP媒体服务器包括用于向音频会议的多个参与者提供实时端对端服务或音频混合的多个端口,所述IP媒体服务器包括: 回波监测器,所述回波监测器被配置成选择性地比较通过所述多个端口中的选定端口进入所述IP媒体服务器的音频流和流出所述IP媒体服务器的音频流,所述比较确定回波的发生;以及 与所述回波监测器通信的回波消除器,所述回波消除器被配置成响应于由所述回波监测器的确定,从所述音频流的至少一个中移除所述回波。
2.根据权利要求1所述的系统,其中,所述IP媒体服务器进一步包括: 通话突发检测器,所述通话突发检测器被配置成检测通过所述选定端口的所述音频流的至少一个中的话音,其中,所述回波监测器响应于来自所述通话突发检测器的指示检测到话音的信号来选择性地比较所述音频流。
3.根据权利要求1所述的系统,其中,所述IP媒体服务器包括多个媒体处理资源,所述媒体处理资源每一个可选择性地配置成被应用于声回波监测,并且其中,所述IP媒体服务器允许用户保留所述媒体处理资源的一部分以分配到选定端口。
4.根据权利要求3所述的系统,其中,所述IP媒体服务器允许所述用户基于在所述IP媒体服务器上的可用媒体处理资源的可配置的百分比和总的实时音频流的可配置的百分比中的至少一个,来保留所述媒体处理资源的所述部分。
5.根据权利要求1所述的系统,其中,所述IP媒体服务器被配置成由所述IP媒体服务器外部的网络元件控制,以保留 特定数量的资源用于同时进行声回波监测。
6.根据权利要求1所述的系统,其中,所述IP媒体服务器包括多个媒体处理资源,所述多个媒体处理资源每一个可选择性地配置成应用于声回波监测,并且其中,所述IP媒体服务器基于在减少所述媒体处理资源对于其它功能的可用性与快速地并且准确地检测回波的能力之间的权衡,来选择所述媒体处理资源的数量以专用于声回波监测。
7.根据权利要求6所述的系统,其中,所述IP媒体服务器被配置成通过禁用对于音频流的回波监测持续由回波变化间隔限定的持续时间,来优化所述媒体处理资源对于声回波监测的专用, 其中,在所述回波变化间隔之后继续监测所述选定端口指示所述回波是否仍存在以及体延迟测量是否仍有效,并且 其中,对于与所述IP媒体服务器所提供的音频会议或端对端服务相关联的任何声回波消除(AEC)使能的音频流,在监测是否已经发生回波特征变化或者回波消失的过程中,在所述回波监测器的下一请求之前,发生基于所述回波变化间隔的配置的最小等待时间间隔。
8.根据权利要求6所述的系统,其中,所述IP媒体服务器基于在所述IP媒体服务器外部的网络元件延迟的调整,来提供周期性体延迟估计。
9.根据权利要求6所述的系统,其中,所述IP媒体服务器被配置成通过禁用对于音频流的回波监测持续由回波关闭间隔限定的持续时间,来优化所述媒体处理资源对于声回波监测的专用,其中,当在音频流中不存在回波时,对于与所述IP媒体服务器所提供的音频会议或端对端服务相关联的任何声回波消除(AEC)使能的音频流,在监测回波出现的过程中,在所述回波监测器的下一请求之前,发生基于所述回波关闭间隔的配置的最小等待时间间隔。
10.根据权利要求6所述的系统,其中,所述IP媒体服务器被配置成对于与所述IP媒体服务器所提供的音频会议或端对端服务相关联的任何声回波消除(AEC)使能的音频流,当不确定回波存在与否或者当检测到回波特征显著变化时,对于所述媒体处理资源专用于声回波监测来找到下一合适通话突发的请求立即做出响应,而无需等待任何额外的间隔。
11.根据权利要求6所述的系统,其中,所述IP媒体服务器被配置成当确定IP会议或端对端服务的任何给定参与者的音频流中存在的回波的存在性和严重性时,仅在检测到远端音频流中合适的通话突发之后,基于开始监测回波的请求,优化所述媒体处理资源对于声回波监测的专用。
12.根据权利要求11所述的系统,其中,所述IP媒体服务器被配置成如果存在足够的资源用于回波监测则提供媒体处理回波监测资源请求, 其中,如果不存在足够的资源,则所述请求被排列到可配置长度的队列中,所述队列保持取决于下列中的至少一个而具有不同优先级的不同流: 如果存在回波,最后测量的回波返回损失(ERL); 基于先前的回波监测测量,是否发现不存在回波;以及 是否未做出先前的回波监测请求,并且 其中,将最高优先级的流置于所述队列的顶部以便可以获得最先可用的回波监测器资源。·
13.根据权利要求12所述的系统,其中,所述IP媒体服务器被配置成在IP会议或端对端服务的任何给定参与者的音频流中,基于限制所述回波监测能力保持开启的持续时间来提供媒体处理回波监测资源优化,所述回波监测能力保持开启的持续时间的上限由合适的远端通话突发的可配置的持续时间与可能的最大可配置的体延迟之和来界定。
14.根据权利要求12所述的系统,其中,所述IP媒体服务器被配置成在IP会议或端对端服务的任何给定参与者的所述音频流中,如果所述远端通话突发并不足够长以提供有意义的数据来试图检测到回波并且计算体延迟,则基于关断回波监测资源使用,来提供媒体处理回波监测资源优化。
15.根据权利要求1所述的系统,其中,所述IP媒体服务器被配置成: 基于抖动缓冲和时钟偏移校正来动态调整在所述回波消除功能中的体延迟估计,其中,基于所述IP媒体服务器的处理间隔来确定所述估计;以及 如果认为存在回波,则作为所述回波监测的一部分,在算法中考虑动态抖动缓冲调整以确定所述体延迟。
16.根据权利要求1所述的系统,其中,所述IP媒体服务器被配置成由在所述IP媒体服务器外部的至少一个网络元件控制,以执行从包括下述的组中选择的至少一个功能: 对于与由所述IP媒体服务器所提供的音频会议或端对端服务相关联的任何声回波消除(AEC)使能的音频流,设置最大体延迟,所述最大体延迟指示在存在回波时在所述回波监测器内所支持的最大可能的体延迟; 对于与由所述IP媒体服务器所提供的音频会议或端对端服务相关联的任何AEC使能的音频流,设置回波变化间隔,所述回波变化间隔指示回波存在的时间,其中在监测回波特征变化或者回波消失是否发生的过程中,在所述回波监测器的下一请求之前,发生配置的最小等待时间间隔;以及 对于与由所述IP媒体服务器所提供的音频会议或端对端服务相关联的任何AEC使能的音频流,设置回波关闭间隔,所述回波关闭间隔指示音频流中不存在回波的时间,其中在监测回波出现的过程中,在所述回波监测器的下一请求之前,发生基于所述回波关闭间隔的配置的最小等待时间间隔。
17.根据权利要求1所述的系统,其中,所述IP媒体服务器包括多个媒体处理资源,所述多个媒体处理资源每一个可选择性地配置成应用于声回波消除,并且其中,所述IP媒体服务器允许用户保留所述媒体处理资源的一部分以分配到选定端口。
18.根据权利要求17所述的系统,其中,所述IP媒体服务器允许用户基于可用媒体处理资源的可配置的百分比和在所述IP媒体服务器上总的实时音频流的可配置的百分比中的至少一个,来保留所述媒体处理资源的所述部分。
19.根据权利要求1所述的系统,其中,所述IP媒体服务器被配置成由所述IP媒体服务器外部的网络元件控制,以保留特定数量的资源用于同时进行声回波消除。
20.根据权利要求1所述的系统,其中,所述IP媒体服务器基于在确定IP会议或者端对端服务的任何给定参与者的音频流中存在的回波的存在性和严重性过程中的声回波监测,来提供媒体处理回波消除资源优化。
21.根据权利要求20所述的系统,其中,所述IP媒体服务器基于确定IP会议或者端对端服务的任何给定参与者的音频流中的回波返回损失(ERL)来提供媒体处理回波消除资源优化,并且其中,所述IP媒体服务器基于关于任何给定音频流的测量的ERL来确定声回波的严重性,同时向经历最差回波特征的流施加声回波消除。
22.根据权利要求21所述的系统,其中,所述IP媒体服务器仅对呈现低于所配置的阈值设置的ERL的音频流,基于使能声回波消除的ERL阈值设置,提供可配置的控制。
23.根据权利要求22所述的系统,其中,所述IP媒体服务器提供优化,其中通过对呈现最多回波失真的实时音频流的可配置的百分比施加回波消除功能,来节约所述IP媒体服务器的媒体处理回波消除资源。
24.根据权利要求22所述的系统,其中,所述IP媒体服务器实时动态调整应用于声回波消除的媒体处理资源量。
25.根据权利要求24所述的系统,其中,所述IP媒体服务器使用运行时间控制来提供媒体处理资源的动态调整,所述运行时间控制确定任何给定音频流是否需要声回波消除,动态激活声回波消除并且当认为回波的存在性低于给定阈值并且保持低于阈值持续预定时间段时动态移除声回波消除。
26.根据权利要求24所述的系统,其中,所述IP媒体服务器使用运行时间控制来动态地调整媒体处理资源分配,对于给定音频流,无论在该流上是否检测到回波,所述运行时间控制强制关闭回波消除。
27.根据权利要求24所述的系统,其中,所述IP媒体服务器使用运行时间控制来动态地调整媒体处理资源分配,所述运行时间控制对于给定音频流,一旦检测到回波,就强制开启回波消除,并且保持执行回波消除,即使在给定音频流上随后不存在回波的情况下。
28.根据权利要求25所述的系统,其中,所述IP媒体服务器使用运行时间控制动态地调整媒体处理资源分配,所述运行时间控制确定需要声回波消除但未能找到空闲资源的新音频流是否能排挤当前正利用回波消除器资源的具有最小回波的音频流,因为所述新流的ERL超出所述最小回波ERL可配置的排挤水平阈值。
29.根据权利要求25所述的系统,其中,所述IP媒体服务器使用运行时间控制动态地调整媒体处理资源分配,所述运行时间控制确定需要声回波消除但未能找到空闲资源的任何给定音频流是否能排挤当前正利用回波消除器资源的具有最小回波的音频流,倘若被排挤的端口的激活时间超过了可配置的排挤时间段阈值。
30.根据权利要求27所述的系统,其中,所述IP媒体服务器使用运行时间控制动态地调整媒体处理资源分配,所述运行时间控制确定需要声回波消除但未能找到空闲资源的任何给定音频流是否能排挤当前正利用回波消除器资源的具有最小回波的音频流,倘若被排挤的流当前并不处于强制开启模式。
31.根据权利要求1所述的系统,其中,所述IP媒体服务器使用运行时间反馈控制来提供体延迟估计的动态调整,所述运行时间反馈控制确定正在经历声回波消除的任何给定音频流是否不再能如所希望的那样有效地消除回波,其中,作为所述回波监测器的一部分,所述确定由所述体延迟估计来使用,以在必要时对所述体延迟的当前估计做出调整,这随后导致更好的回波消除。
32.根据权利要求1所述的系统,其中,所述IP媒体服务器被配置成由在所述IP媒体服务器外部的至少一个网络元件控制,以: 对于与所述IP媒体服务器提供的音频会议或端对端服务相关联的任何音频流,使能或禁用声回波消除能力;以及 对于声回波消除(AEC)使能的音频流,执行从包括下述的组中选择的至少一个功能: 强制施加声回波消除; 强制不施加声回波消除; 取决于具体流回波特征来施加声回波消除; 设置回波返回损失(ERL)排挤水平阈值,所述回波返回损失(ERL)排挤水平阈值在下述时间使用,即,需要回波消除器资源但未能找到空闲资源的新音频流排挤当前正利用回波消除器资源的具有最小回波的音频流,因为所述新音频流的ERL超过所述最小回波ERL所述排挤水平阈值; 设置ERL排挤时间段阈值,所述ERL排挤时间段阈值在下述时间使用,即,需要回波消除器资源但未能找到空闲资源的新音频流排挤当前正利用回波消除器资源的具有最小回波的音频流,倘若被排挤的端口的激活时间超过了可配置的排挤时间段阈值; 设置无回波阈值,所述无回波阈值指示一个水平,低于该水平则认为回波不再存在并且能关断所述回波消除器;以及 设置无回波滞后时间段,所述无回波滞后时间段指示一时间段,在该时间段中回波降低到低于所述无回波阈值并且保持低于所述无回波阈值并且所述回波消除器被关断以防止不必要的切断和接通回波消除器。
33.根据权利要求1所述的系统,其中,所述IP媒体服务器被配置成针对于AEC使能的音频媒体流,报告声回波消除(AEC)事件,其中,由所述IP媒体服务器所生成的所述AEC事件包括下列中的一个或多个: 检测到回波(真/假); 回波消除器激活(真/假); 对于检测到回波且回波消除器未激活的理由代码,包括: 无理由; 无足够的AEC媒体处理资源;以及 AEC强制关闭; 最近的ERL测量;以及 最近的体延迟测量;并且 其中,所述事件由所述IP媒体服务器通过通信协议报告给外部网络元件。
34.根据权利要求33所述的系统,其中,所述IP媒体服务器进一步被配置成基于所述AEC事件,受到应用服务器或者作为所述事件的接收者的其它网络元件控制,以超驰由所述IP媒体服务器所提供的AEC的功能的行为和应用,并且其中,通过通信协议来提供所述IP媒体服务器的控制。
35.根据权利要求1所述的系统,其中,所述IP媒体服务器被配置成对于AEC使能的音频媒体流,在呼叫期间或呼叫结束时报告声回波消除(AEC)每端口统计(PPS),其中,由所述IP媒体服务器所生成的所述AEC PPC包括下列中的一个或多个:AEC使能时间;回波消除器激活时间;回波消除器缺乏资源标志;当前体延迟测量;最小体延迟测量;最大体延迟测量;当前ERL测量;最小ERL测量;最大ERL测量;当前ERLE测量;最大ERLE测量;以及最小ERLE测量,并且其中,所述统计由所述IP媒体服务器通过通信协议报告给外部网络元件。
36.根据权利要求35所述的系统,其中,所述IP媒体服务器进一步被配置成基于所述PPS,由应用服务器或者作为PPS的接收者的其它网络元件控制,以超驰由所述IP媒体服务器提供的AEC功能的行为和应用,并且其中,所述IP媒体服务器的控制通过承载XML编码的控制消息的SIP传送来提供。
37.根据权利要求1所述的系统,其中,所述IP媒体服务器被配置成通过运行、管理和预置(OAMP)接口报告所述IP媒体服务器上所有音频媒体流的声回波消除(AEC)状态报告,用于系统日志目的,其中,由所述IP媒体服务器生成的所述AEC状态报告包括下列中的一个或多个:激活的回波消除器的最大数量;被拒绝的回波消除器激活请求的最大数量;回波监测请求的数量;被拒绝的回波监测请求的数量;以及,同时使用的回波监测资源的数量。
38.根据权利要求37所述的系统,其中,所述IP媒体服务器进一步被配置成基于所述状态报告通过接口重新配置以修改由所述IP媒体服务器所提供的AEC功能的行为和应用。
39.根据权利要求1所述的系统,其中,所述IP媒体服务器提供音频会议中媒体处理资源的优化使用,使得所有参与者媒体的子集混合为N个最响亮的混合,其中,从总共M个会议参与者混合来自N个最响亮的参与者的音频,并且其中N〈M,从而,将所需的回波监测和消除资源的数量的上限界定为N。
40.一种用于对互联网协议(IP)网络中的实时媒体处理提供声回波监测和消除的方法,所述方法包括 :选择性地比较进入IP媒体服务器的选定端口的音频流和流出IP媒体服务器的选定端口的音频流,所述比较确定回波的发生;以及 响应于所述回波发生的确定,从所述音频流的至少一个中移除回波。
41.根据权利要求40所述的方法,进一步包括: 检测通过所述选定端口的所述音频流中至少一个中的话音,其中,响应于所述话音的检测来选择性地比较所述音频流。
42.一种用于为互联网协议(IP)网络中的实时媒体处理提供声回波监测和消除的系统,所述系统包括: 用于选择性地比较进入IP媒体服务器的选定端口的音频流和流出IP媒体服务器的选定端口的音频流的装置,所述比较确定回波的发生;以及, 用于响应于所述回波发生的确定而从所述音频流的至少一个中移除所述回波的装置。
43.根据权利要求42所述的系统,进一步包括: 用于检测在通过所述选定端口的所述音频流的至少一个中的话音的装置,其中响应于所述话音的检测来选择 性地比较所述音频流。
【文档编号】H04M1/60GK103583032SQ201280022743
【公开日】2014年2月12日 申请日期:2012年5月11日 优先权日:2011年5月11日
【发明者】阿德南·萨利姆, 穆罕默德·艾米尔·侯赛因, 蒂莫西·S·沃伊诺斯基, 尼尔·M·冈 申请人:锐德世加拿大公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1