一种会议系统中播放提示语音的方法及设备的制作方法

文档序号:2833429阅读:496来源:国知局
专利名称:一种会议系统中播放提示语音的方法及设备的制作方法
技术领域
本发明涉及通信技术领域,尤其涉及会议系统中播放提示语音的方法和设备。
背景技术
错误!未找到引用源。给出了一个典型的多个终端通过MCU (MultiControl Unit,多点控制单元)ioid的会议的组网图,其中,未包含视频部分。由于音频语音会议系统的组网图与此类似,不再单独列举。在图I所示系统中,一个会场IOla通过麦克风102a()拾取与会场语音信号传输到终端设备104a对会场语音信号进行压缩编码,然后将压缩编码后的会场语音信号经由网络传输到MCUlOld中,其他会场101b、IOlc通过同样的工作模式将会场语音信号传输到MCUlOld中。MCUlOld对各个会场101a、101b、IOlc的会场语音信号进行解码、混音、编码,然后将编码后的会场语音信号分别发送给各个会场101a、101b、101c,这样就实现了多个会场可以互相听到其他多个会场的声音。在召集多点会议时,某些场景MCU需要对与会终端发送要播放的提示语音,以更清晰、明显地提示与会者进行某些操作或者提醒与会者当前会议正处于什么样的进程。例如在会议过程中有新会场加入时播放提示语音“欢迎加入会议”、当会议即将结束时播放提示语音“离会议结束还有5分钟”等等。图2给出了现有技术中,MCU实现对所有终端会场播放提示语音的情况。结合图I,在会议过程中,MCU需要向所有与会终端会场播放提示语音,那么现有技术会直接将解码器DEC(Decoder) I、DEC2、DEC3解码产生的纯音频码流按照混音规则混音完成后再与提示语音信号混音,以使得编码器ENC(Encoder) I、ENC2、ENC3收到的即将编码的音频数据为本身混音的数据叠加上将要播放音频提示语音信号,然后编码器ENC1、ENC2、ENC3将此音频数据进行压缩编码,再通过网络发送给终端会场进行播放。以上工作过程就实现了 MCU设备对所有与会终端会场发送音频互动语音应当IVR(Interactive Voice Response)提示音。但现有技术存在如下问题I、按照现有技术,MCU需要向所有与会终端会场发送音频提示语音时,是直接将音频提示语音信号与会场语音信号进行混合叠加,再发送给ENCl、3(302b、304b)进行编码后发送到终端会场进行播放。这样做就使得提示语音的音量很难调节,如果提示语音过高将会使得听音者无法听清主席声音,而如果提示语音的过低可能会导致听音者无法听清提示语音而产生其他不良影响。2、另一方面,由于MCU需要向所有会场发送提示语音,所以作为主席会场的ENC2(303b)也同样会收到此IVR提示语音。那么当主席正在连续发言的时候,按照当前的技术,会直接将提示语音发送给主席会场,这样会使得当前发言的主席会场有一种发言被打断的感觉,体验不好。

发明内容
鉴于此,有必要提供一种会议系统中播放提示语音的方法和设备,用以解决现有技术存在的问题。一方面,本发明实施例提供一种会议系统中播放提示语音的方法对解码后的会场语音信号进行VAD (Voice Activation Dectection,语音活动侦测)检测,判断所述会场语音信号是否处于语音激活状态;如果经过VAD检测的所述解码后的会场语音信号为非语音激活状态,则对所述解码后的会场语音信号与提示语音信号进行混音处理,形成混合语音信号。另一方面,本发明实施例提供一种会议系统中播放提示语音的MCU设备,包括
VAD检测模块,对解码后的会场语音信号进行VAD检测,判断所述解码后的会场语音信号是否处于语音激活状态;混音模块,如果经过VAD检测的所述解码后的会场语音信号为非语音激活状态,对所述解码后的会场语音信号与提示语音信号进行混音处理,形成混合语音信号。本发明实施例通过会场语音信号进行VAD检测,在会场语音信号处于非语音激活状态下叠加提示语音,使得当前发言不会被突然打断;在会场语音信号处于语音激活状态下对提示语音进行AGC(Automatic Gain Control,自动增益控制)处理,可以优先保证与会终端可以听清会议正常声音,在此前提下,尽可能保证与会终端可以听清提示语音。通过以上有益效果,有效提升了发言和收听的用户体验,解决了现有技术存在的问题。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图I是现有技术的系统构架图;图2是现有技术的混首方法不意图;图3是本发明实施例一的方法流程图;图4是本发明实施例二的MCU设备结构图;图5是本发明实施例三的MCU设备结构图;图6是本发明实施例二的方法流程图;图7是本发明实施例四的MCU设备结构图;图8是本发明实施例二的方法流程具体实施例方式为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。以下结合附图及实施例,对本发明所阐述的会议系统中播放提示语音的方法以及MCU设备做进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例I本发明实施例提供一种会议系统中播放提示语音的方法,请参考图3,该方法包括SlOl :对解码后的会场语音信号进行VAD检测,判断所述会场语音信号是否处于语音激活状态;其中,在对会场语音信号进行VAD检测之前,接收会场语音信号并将其解码。S103:如果经过所述解码后的会场语音信号为非语音激活状态,则对所述解码后的会场语音信号与提示语音信号进行混音处理,形成混合语音信号。之后,接收上述混合语音信号并将其编码。本发明实施例通过会场语音信号进行VAD检测,在会场语音信号处于非语音激活·状态下叠加提示语音,使得当前发言不会被突然打断,有效提升了的用户体验,解决了现有技术存在的问题。实施例2本发明实施例提供一种会议系统中播放提示语音的MCU设备10,请参看图4,包括VAD检测模块101,对解码后的会场语音信号进行VAD检测,判断所述解码后的会场语音信号是否处于语音激活状态;混音模块102,如果经过VAD检测的所述解码后的会场语音信号为非语音激活状态,对所述解码后的会场语音信号与提示语音信号进行混音处理,形成混合语音信号。其中,上述MCU设备10,还包括解码模块103,接收上述会场语音信号并将其解码,并将解码后的会场语音信号发送给VAD监测模块101。编码模块104,接收上述混合语音信号并将其编码。上述MCU设备10,进一步包括提示语音模块105,如果经过VAD检测的所述解码后的会场语音信号为语音激活状态,则推迟向所述混音模块102发送所述提示语音信号;如果经过VAD检测的所述解码后的会场语音信号为非语音激活状态,则向所述混音模块102发送所述提示语音信号;AGC模块106,对上述提示语音信号进行AGC处理。上述提示语音模块105,还用于如果经过VAD检测的所述解码后的会场语音信号为语音激活状态,则向所述混音模块发送经过AGC处理的提示语音信号。本发明实施例通过会场语音信号进行VAD检测,在会场语音信号处于非语音激活状态下叠加提示语音,使得当前发言不会被突然打断;在会场语音信号处于语音激活状态下对提示语音进行AGC处理,可以优先保证与会终端可以听清会议正常声音,在此前提下,尽可能保证与会终端可以听清提示语音。通过以上有益效果,有效提升了发言和收听时插播提示语音的用户体验,解决了现有技术存在的问题。实施例3本发明实施例提供一种会议系统中播放提示语音的方法,本发明实施例的总体构架图如图5所示,方法流程图如图6所示。下面结合图示对本发明实施例的方法进行阐述。
S201 :接收会场语音信号并将其解码。解码模块103接收会场终端发送的会场RTP (Real-time TransportProtocol,实时传送协议)语音信号并将其解码,将解码后的会场PCM(Pulse-code modulation,脉冲编码调制)语音信号发送给混音模块102。 本例中,解码模块103 (2)接收与其对应的会场终端发送的会场RTP语音信号并将其解码发送到混音模块102。S202:对解码后的会场语音信号进行VAD检测,判断所述会场语音信号是否处于语音激活状态;当需要向各会场发送提示语音信号时,例如,在会议过程中新会场加入时播放提示语音“欢迎加入会议”等,提示语音控制模块107控制提示语音模块106向混音模块102 发送提示语音信号。在提示语音模块105向混音模块102发送提示语音信号之前,提示语音模块105控制VAD检测模块对会场PCM语音信号进行VAD检测。本例中,VAD检测模块对解码模块103⑵发送的会场PCM语音信号进行VAD检测。S203 :如果经过VAD检测的所述解码后的会场语音信号为非语音激活状态,则。如果经过VAD检测的所述解码后的会场语音信号为语音激活状态,则延迟对所述解码后的会场语音信号与提示语音的混音处理。上述对所述解码后的会场语音信号与提示语音信号进行混音处理,形成混合语音信号的步骤,具体包括S2031 :提不语音模块105向混音模块102发送提不语音信号。S2032 :混音模块102将会场PCM语音信号和提示语音信号进行混音处理,形成混
合语音信号。上述延迟对所述解码后的会场语音信号与提示语音的混音处理的步骤,具体包括提不语音信号模块105延迟向混音模块102发送提不语音信号。需要说明的是,VAD检测,用以检测人在会议讲话过程中发言之间的停顿,本例正是利用这个停顿时间来叠加提示语音。本领域的普通技术人员知道如何使用VAD检测来进行监测。S204 :接收混合语音信号并将其编码。混音模块102将混合语音信号发送到编码模块104 ;编码模块104将混合语音信号进行编码。本发明实施例通过会场语音信号进行VAD检测,在会场语音信号处于非语音激活状态下叠加提示语音,使得当前发言不会被突然打断,有效提升了发言时插播语音提示的用户体验,解决了现有技术存在的问题。实施例4本发明实施例提供一种会议系统中播放提示语音的方法,本发明实施例的总体构架图如图7所示,方法流程图如图8所示。下面结合图示对本发明实施例的方法进行阐述。S301与S201相同,在此不赘述。S302:对解码后的会场语音信号进行VAD检测,判断所述会场语音信号是否处于语音激活状态;当需要向各会场发送提示语音信号时(例如,在会议过程中新会场加入时播放提示语音“欢迎加入会议”等),提示语音控制模块107控制提示语音模块106向混音模块102发送提示语音信号。在提示语音模块105向混音模块102发送提示语音信号之前,提示语音模块105控制VAD检测模块对会场PCM语音信号进行VAD检测。在本例中,VAD检测模块对混音模块102发送的会场PCM语音信号进行VAD检测。S303’ 如果经过VAD检测的所述解码后的会场语音信号为语音激活状态,则对提示语音信号进行AGC处理,将处理后的提示语音信号与所述解码后的会场语音信号进行混音处理,形成混合语音信号。S3031’:如果经过VAD检测的所述解码后的会场语音信号为语音激活状态,则提示 语音模块105将提示语音信号发送到AGC模块106进行AGC处理适当下调提示语音信号的音量,在保证提示语音信号可以被听清的情况下,优先保证会场语音信号的正常音量。如果经过VAD检测的所述解码后的会场语音信号为非语音激活状态,则保持提示语音信号的默认音量,不进行AGC处理。需要说明的是,AGC处理是一种现有技术。S3032’ =AGC模块106将经过AGC处理后的解码后的会场语音信号发送到混音模块 102。S3033’ 混音模块102将解码后的会场语音信号和经过AGC处理的提示语音信号进行混音处理,形成混合语音信号。S304与S204相同,在此不赘述。本发明实施例通过会场语音信号进行VAD检测,在会场语音信号处于语音激活状态下对提示语音进行AGC处理,可以优先保证与会终端可以听清会议正常声音,在此前提下,尽可能保证与会终端可以听清提示语音,有效提升了收听时插播提示语音的用户体验,解决了现有技术存在的问题。通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可以用硬件实现,或软件实现,或固件实现,或它们的组合方式来实现。当使用软件实现时,可以将上述功能存储在计算机可读介质中或作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是计算机能够存取的任何可用介质。以此为例但不限于计算机可读介质可以包括RAM、ROM、EEPROM、CD-ROM或其他光盘存储、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质。此外。任何连接可以适当的成为计算机可读介质。例如,如果软件是使用同轴电缆、光纤光缆、双绞线、数字用户线(DSL)或者诸如红外线、无线电和微波之类的无线技术从网站、服务器或者其他远程源传输的,那么同轴电缆、光纤光缆、双绞线、DSL或者诸如红外线、无线和微波之类的无线技术包括在所属介质的定影中。如本发明所使用的,盘(Disk)和碟(disc)包括压缩光碟(CD)、激光碟、光碟、数字通用光碟(DVD)、软盘和蓝光光碟,其中盘通常磁性的复制数据,而碟则用激光来光学的复制数据。上面的组合也应当包括在计算机可读介质的保护范围之内。
总之,以上所述仅为本发明技术方案的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范 围之内。
权利要求
1.一种会议系统中播放提示语音的方法,其特征在于,所述方法包括 对解码后的会场语音信号进行VAD检测,判断所述解码后的会场语音信号是否处于语音激活状态; 如果所述解码后的会场语音信号为非语音激活状态,则对所述解码后的会场语音信号与提示语音信号进行混音处理,形成混合语音信号。
2.根据权利要求I所述的方法,其特征在于,所述,如果经过VAD检测的所述解码后的会场语音信号为非语音激活状态,则对所述解码后的会场语音信号与提示语音信号进行混音处理,形成混合语音信号,之后,所述方法还包括 接收所述混合语音信号并将其编码。
3.根据权利要求I所述的方法,其特征在于,所述方法进一步包括 如果经过VAD检测的所述解码后的会场语音信号为语音激活状态时,则延迟对所述解码后的会场语音信号与提示语音进行混音处理,形成混合语音信号。
4.一种会议系统中播放提示语音的的方法,其特征在于,所述方法包括 对解码后的会场语音信号进行VAD检测,判断所述解码后的会场语音信号是否处于语音激活状态; 如果经过VAD检测的所述解码后的会场语音信号为语音激活状态时,则对所述提示语音信号进行AGC处理; 将处理后的提示语音信号与所述解码后的会场语音信号进行混音处理,形成混合语音信号。
5.根据权利要求4所述的方法,其特征在于,所述对所述提示语音信号进行AGC处理,具体包括 将所述提示语音信号进行AGC处理,使得所述提示语音信号的音量保持在不干扰所述会场语音信号的范围内。
6.一种多点控制单元,其特征在于,所述MCU包括 VAD检测模块,用于对解码后的会场语音信号进行VAD检测,判断所述解码后的会场语音信号是否处于语音激活状态; 混音模块,如果经过VAD检测的所述解码后的会场语音信号为非语音激活状态,对所述解码后的会场语音信号与提示语音信号进行混音处理,形成混合语音信号。
7.根据权利要求6所述的多点控制单元,其特征在于,所述多点控制单元还包括 编码模块,接收所述混合语音信号并将其编码。
8.根据权利要求6所述的多点控制单元,其特征在于,所述混音模块还用于 如果经过VAD检测的所述解码后的会场语音信号为语音激活状态时,则延迟对所述解码后的会场语音信号与提示语音进行混音处理,形成混合语音信号。
9.根据权利要求6所述的多点控制单元,其特征在于,所述多点控制单元还包括 提示语音模块,如果经过VAD检测的所述解码后的会场语音信号为语音激活状态,则推迟向所述混音模块发送所述提示语音信号;如果经过VAD检测的所述解码后的会场语音信号为非语音激活状态,则向所述混音模块发送所述提示语音信号。
10.一种多点控制单元,其特征在于,所述多点控制单元包括 VAD检测模块,用于对解码后的会场语音信号进行VAD检测,判断所述解码后的会场语音信号是否处于语音激活状态; AGC模块,用于对提示语音信号进行AGC处理; 混音模块,用于将处理后的提示语音信号与所述解码后的会场语音信号进行混音处理,形成混合语音信号。
11.根据权利要求10所述的多点控制单元,其特征在于,所述AGC模块,进一步用于 将所述提示语音信号进行AGC处理,使得所述提示语音信号的音量保持在不干扰所述会场语音信号的范围内。
12.根据权利要求10所述的多点控制单元,其特征在于,所述多点控制单元还包括 提示语音模块,用于,如果经过VAD检测的所述解码后的会场语音信号为语音激活状态,则向所述混音模块发送经过AGC处理的提示语音信号。
全文摘要
本发明实施例提供一种会议系统中播放提示语音的方法以及MCU设备。其中方法包括对解码后的会场语音信号进行VAD检测,判断所述会场语音信号是否处于语音激活状态;如果经过VAD检测的解码后的会场语音信号为非语音激活状态,则对解码后的会场语音信号与提示语音信号进行混音处理,形成混合语音信号。采用此方法,在会议进行过程中播放提示语音时,不会打断用户的正常发言或由于音量不合适干扰到用户的正常发言,有效提升了用户体验。另外,本发明实施例还提供一种MCU设备。
文档编号G10L19/012GK102915743SQ201210387520
公开日2013年2月6日 申请日期2012年10月12日 优先权日2012年10月12日
发明者张冉冉 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1