一种混音方法、混音设备及系统的制作方法_4

文档序号：9924000阅读：来源：国知局

该参与voip语音会议的源节点可以均使用相同的音频编码器；
[0132]混音设备接收到各源节点发送的音频码流后，每隔各源节点均发送一帧音频时，检测一次当前的发言方，并判断当前是单人发言还是多人发言；
[0133]如果当前是单人发言，上一次也是单人发言(即上一次各源节点均发送一帧音频时，所检测的结果也是单人发言)，则混音设备判断发言人是否改变;如果改变，则混音设备先向所有目标节点发送三帧空数据包，再将当前发言人的音频码流中的语音发送给除当前发言人外的其他目标节点；如果没改变，则混音设备转发当前发言人的音频码流中的语音给除当前发言人外的其他目标节点；
[0134]如果当前是单人发言，上一次是多人发言，则混音设备先向所有目标节点发送三帧空数据包，再将当前发言人的音频码流中的语音发送给除当前发言人外的其他目标节占.V ，
[0135]如果当前是多人发言，上一次是单人发言，则混音设备先向所有目标节点发送三帧空数据包，再将除目标节点外的当前各发言人的音频码流中的语音，解码后的pcm进行混音，再对混音后的pcm进行编码后发送给目标节点；
[0136]如果当前是多人发言，上一次也是多人发言，则混音设备将除目标节点外的当前各发言人的音频码流中的语音，解码后的pcm进行混音，再对混音后的pcm进行编码后发送给目标节点；
[0137]在当前是多人发言的情况下，如果混音设备正好为目标节点，则混音设备可直接对混音后的pcm进行播放即可，无需再对混音后的pcm进行编码。
[0138]本发明实施例提供的混音方法能够大幅减小了数据处理量，且大幅降低了cpu开销负载。
[0139]下面对本发明实施例提供的混音设备进行介绍，下文描述的混音设备可以与上文描述的以混音设备角度描述的混音方法相互对应参照。
[0140]图5为本发明实施例提供的混音设备的结构框图，该混音设备可以为服务器，也可以是从参与多人通话的多个源节点中选取的一源节点；参照图5，该混音设备可以包括:
[0141]音频信号接收模块100，用于接收至少两个源节点发送的音频信号；
[0142]检测模块200，用于分别对各源节点发送的音频信号进行检测，确定音频信号中携带语音数据的源节点数量；
[0143]第一处理模块300，用于当确定音频信号中携带语音数据的源节点数量为多个时，对相应多个源节点的至少语音数据部分进行混音处理；
[0144]第二处理模块400，用于当确定音频信号中携带语音数据的源节点数量为一个时，直接传输相应源节点的至少语音数据部分。
[0145]可选的，图6示出了本发明实施例提供的检测模块200的可选结构，参照图6，检测模块200可以包括:
[0146]语音检测单元210，用于分别对各源节点发送的音频信号进行语音检测，确定音频信号中携带语音数据的源节点数量。
[0147]可选的，语音检测单元210可采用语音活动检测vad算法进行语音检测；
[0148]具体的，语音检测单元210具体可用于，分别对各源节点发送的音频信号进行语音检测，确定携带语音数据的音频信号数量，以所确定的携带语音数据的音频信号数量，确定音频信号中携带语音数据的源节点数量；
[0149]或，分别对各源节点发送的音频信号进行语音检测，并对检测到的所有语音数据进行语音特征识别处理，当识别到所有语音数据的语音特征不同，则确定音频信号中携带语音数据的源节点数量为多个，当识别到所有语音数据的语音特征相同，则确定音频信号中携带语音数据的源节点数量为一个。
[0150]可选的，图7示出了本发明实施例提供的检测模块200的另一可选结构，参照图7，检测模块200可以包括:
[0151 ]标识检测单元220，用于分别对各源节点发送的音频信号进行语音标识检测，确定音频信号中携带语音数据的源节点数量，所述语音标识表示对应源节点发送的音频信号中携带有语音数据。
[0152]可选的，图8示出了本发明实施例提供的混音设备的另一结构框图，结合图5和图8所示，该混音设备还可以包括:
[0153]判断模块500，用于在接收至少两个源节点发送的音频信号后，以各源节点发送的音频信号均达到设定帧对应一检测周期，判断上一检测周期结束后，各源节点发送的音频信号是否均达到设定帧。
[0154]相应的，图9示出了本发明实施例提供的检测模块200的再一可选结构，参照图9，检测模块200可以包括:
[0155]时机执行单元230，用于在判断结果为是时，分别对各源节点发送的音频信号进行检测，确定音频信号中携带语音数据的源节点数量。
[0156]可选的，图10示出了本发明实施例提供的第一处理模块300的可选结构，参照图10，第一处理模块300可以包括:
[0157]第一处理执行单元310，用于在当前检测周期携带语音数据的源节点数量为多个，上一检测周期携带语音数据的源节点数量为一个时，则先向各目标节点发送预设数量帧的空数据包，再对于各目标节点，根据当前检测周期相应多个源节点的至少语音数据部分中，除目标节点的语音数据部分进行混音处理；目标节点为接收语音数据的节点；
[0158]第二处理执行单元320，用于在当前检测周期携带语音数据的源节点数量为多个，上一检测周期携带语音数据的源节点数量也为多个时，则对于各目标节点，根据当前检测周期相应多个源节点的至少语音数据部分中，除目标节点的语音数据部分进行混音处理。
[0159]可选的，图11示出了本发明实施例提供的第二处理模块400的可选结构，参照图11，第二处理模块400可以包括:
[0160]第三处理执行单元410，用于在当前检测周期携带语音数据的源节点数量为一个，上一检测周期携带语音数据的源节点数量也为一个，且当前检测周期携带语音数据的源节点，与上一检测周期携带语音数据的源节点不同时，或，在当前检测周期携带语音数据的源节点数量为一个，上一检测周期携带语音数据的源节点数量为多个时，则先向各目标节点发送预设数量帧的空数据包，再将当前检测周期相应源节点的至少语音数据部分传输给各目标节点；目标节点为接收语音数据的节点；
[0161]第四处理执行单元420，用于在当前检测周期携带语音数据的源节点数量为一个，上一检测周期携带语音数据的源节点数量也为一个，且当前检测周期携带语音数据的源节点，与上一检测周期携带语音数据的源节点相同时，则直接将当前检测周期相应源节点的至少语音数据部分传输给各目标节点。
[0162]本发明实施例提供的混音设备能够大幅减小了数据处理量，且大幅降低了cpu开销负载。
[0163]图12为本发明实施例提供的混音设备的硬件结构框图，参照图12，该混音设备可以包括:处理器I，通信接口 2，存储器3和通信总线4;
[0164]其中处理器1、通信接口 2、存储器3通过通信总线4完成相互间的通信；
[0165]可选的，通信接口2可以为通信模块的接口，如GSM模块的接口；
[0166]处理器I，用于执行程序；
[0167]存储器3，用于存放程序；
[0168]程序可以包括程序代码，所述程序代码包括计算机操作指令。
[0169]处理器I可能是一个中央处理器CPU，或者是特定集成电路ASIC(Applicati0nSpecific Integrated Circuit)，或者是被配置成实施本发明实施例的一个或多个集成电路。
[0170]存储器3可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatilememory)，例如至少一个磁盘存储器。
[0171]其中，程序可具体用于:
[0172]接收至少两个源节点发送的音频信号；
[0173]分别对各源节点发送的音频信号进行检测，确定音频信号中携带语音数据的源节点数量；
[0174]当确定音频信号中携带语音数据的源节点数量为多个时，对相应多个源节点的至少语音数据部分进行混音处理；
[0175]当确定音频信号中携带语音数据的源节点数量为一个时，直接传输相应源节点的至少语音数据部分。
[0176]下面对本发明实施例提供的混音系统进行介绍，本发明实施例提供的混音系统的结构可以如图1所示，包括:混音设备和源节点；
[0177]其中，混音设备，用于接收至少两个源节点发送的音频信号;分别对各源节点发送的音频信号进行检测，确定音频信号中携带语音数据的源节点数量；当确定音频信号中携带语音数据的源节点数量为多个时，对相应多个源节点的至少语音数据部分进行混音处理；当确定音频信号中携带语音数据的源节点数量为一个时，直接传输相应源节点的至少语音数据部分；
[0178]源节点，用于向所述混音设备发送音频信号。
[0179]本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。
[0180]专业人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤

完整全部详细技术资料下载

当前第4页1 2 3 4 5