一种全交互会议的dsp混音方法和装置的制作方法

文档序号：7894679阅读：302来源：国知局

专利名称：一种全交互会议的dsp混音方法和装置的制作方法
技术领域：
本发明涉及音频技术，具体涉及ー种全交互会议的DSP (Digital SignalProcessing,数字信号处理)混音方法和装置。
背景技术：
在多通道音频会议中，所有參与者都有自由发言的权利，每个通道能够同时接收多个与会者(自己的声音除外)的声音，这种会议通常也称为全交互会议。、
现有技术中通常采用混音的办法实现通道能够同时接收多个与会者的声音。混音一般就是指用一个输出设备播放多个音频流，提供一个单输出多输入的信道。随着信号处理方法，硬件处理能力方面的不断改进，多媒体通讯也越来越普及。音频会议是多媒体通信系统的基本模块，作为有多个通道參与的音频会议，在全交互模式下，为了能够在每个通道同时接受多个与会者的声音，必须采用多路音频流混合方案。多个音频源同时播放时，人耳听到的声波是各个声源声波的线性叠加，同理声音在数字化后，其混音结果也应是线性相加的。然后，在全交互会议通话中，若将所有通道都參与混音，很可能会导致音频数据溢出而造成混音后失真。另外，若当前与会者A在持续发言，突然与会者B发言打断，那么在这ー时间段的语言样本中，按照时域能量大小去选取，有可能会把A抛弃掉，而将B加入到混音之中。因此在实际的会议中必须要确定ー个合适的混音路数，同时还需要合理确定要參与混音的通道，以保证声音的清晰度和准确度。

发明内容
为了解决现有技术的技术问题，本发明提供ー种具有较好清晰度的全交互会议的DSP混音方法和装置。本发明解决技术问题的技术方案包括音频数据采集；对与会者通道接收的多路模拟音频信号进行采集，得到多路语音样本；帧处理；对输入的语音样本按照预先设定的时间长度进行分帧，得到X个语音样本数据。能量计算；对每一路语音样本数据进行能量计算。确定參与混音的与会通道；根据计算得到的每一路音频样本能量，选择最大的前4个作为混音通道。混音；对确定參与混音的与会通道的语音数据进行混音。混音发送；对混音信号进行处理，向每个与会通道发送只占ー个信号通道的混音音频流。其中，每个參与混音的与会通道只接收的另外3个參与混音的与会通道的混音数据，其他未參与混音的与会通道接收所有4个參与混音的与会通道的混音数据。本发明还提供ー种全交互会议的DSP混音装置，包括依次连接的采集单元、处理単元和混音发送单元。所述处理単元包括帧处理単元、能量计算单元、混音选择单元和混音単元。其中，所述采集単元用于采集各个与会通道的语音数据，所述帧处理单元用于采集的语音数据进行帧处理。所述能量计算单元用于对帧处理后的语音数据进行能量计算，采用能量累计计算方法。所述混音选择单元用于根据各路语音数据计算后能量选择确定能量最大的前4路对于的与会通道參与混音。所述混音単元用于将參与混音的与会通道的语音数据进行混音。所述混音发送单元用于将混音后的语音数据通过ー个信号通道发送给所有与会通道。相较于现有技术，本发明ー种全交互会议的DSP混音方法和装置采用能量累计方法计算语音数据能量，通过增加对过去时刻的能量的考虑，选择并确定能量最大的4个与会通道參与混音，本发明的有益效果是能够防止因某路信号突然增大而造成对混音通道选择的误差，保证与会者的持续发言不会被突然中断。

图I是本发明ー种全交互会议的DSP混音方法的一个实施方式的流程示意图。图2是的混音过程中出现噪声示意图。图3是本发明ー种全交互会议的DSP混音装置的一个实施方式的方框示意图。
具体实施例方式下面结合附图和具体实施方式
对本发明做进ー步详细说明。请參阅图1，本发明ー种全交互会议的DSP混音方法包括步骤SI，音频数据采集；对与会者通道接收的多路模拟音频信号进行采集，得到多路语音样本；步骤S2,巾贞处通；其中，在时域上语首样本是短时平稳イ目号，例如I秒内具有8000帧，对输入的语音样本按照预先设定的长度进行分帧，得到X个语音样本数据。步骤S3，能量计算；对每一路语音样本数据进行能量计算。步骤S4，确定參与混音的与会通道；根据计算得到的每一路音频样本能量，选择最大的前4个作为混音通道。步骤S5，混音；对确定參与混音的与会通道的语音数据进行混音。步骤S6，混音发送；对混音信号进行处理，向每个与会通道发送只占ー个信号通道的混音音频流。其中，每个參与混音的与会通道只接收的另外3个參与混音的与会通道的混音数据，其他未參与混音的与会通道接收所有4个參与混音的与会通道的混音数据。本实施方式中，混音路数设定为4路，即每次參与混音的通道个数为4个，为了避免出现发言的与会者没有被选择參与混音，在能量计算时采用能量累积计算方法，且在计算每路能量的时候，将过去时刻的能量也考虑进去。公式如下Ε=Σ E(η)/2η其中，η代表时间，O代表当前时间，O彡η彡X，对应于帧处理的时间节点数。本发明的混音路数的选择原则是保证与会者的发言不被打断，保持其声音的连续性，过滤掉混有噪声的通道，保证声音的清晰度，在其他实施方式中，也可以根据需要和与会人数选择其他的通道个数进行混音。
请同时參阅图2，混音路数为4路，tl时间段之前有4个与会者在持续发言。在tl时间段时，突然有一路通道声音发生突变，在这小段的时间内其能量值接近或超过了其他正在发言的与会者，若对tl时间段的语音帧按照最大能量来选取參与混音的通道，这可能将导致有一个持续发言的与会通道被抛弃，其发言会被中断。而所述实施方式的能量计算将过去时刻能量也进行计算的方法能够很好避免上述情形的发生。请參阅图3，是本发明ー种全交互会议的DSP混音装置的一个实施方式的方框示意图。所述全交互会议的DSP混音装置包括依次连接的采集单元10、处理单元20和混音发送单元30。所述处理単元20包括帧处理単元21、能量计算单元22、混音选择单元23和混音単元24。其中，所述采集単元10用于采集各个与会通道的语音数据，所述帧处理单元21用于采集的语音数据进行帧处理。所述能量计算单元22用于对帧处理后的语音数据进行能量计算，采用能量累计计算方法。所述混音选择单元23用于根据各路语音数据计算后能量选择确定能量最大的前4路对于的与会通道參与混音。所述混音単元24用于将參与混音的与会通道的语音数据进行混音。所述混音发送单元30用于将混音后的语音数据通过ー个信号通道发送给所有与会通道。其中，每个參与混音的与会通道只接收的另外3个參与混音的与会通道的混音数据，其他未參与混音的与会通道接收所有4个參与混音的与会通道的混音数据。相较于现有技术，本发明ー种全交互会议的DSP混音方法和装置采用能量累计方法计算语音数据能量，通过增加对过去时刻的能量的考虑，选择并确定能量最大的4个与会通道參与混音，本发明的有益效果是能够防止因某路信号突然增大而造成对混音通道选择的误差，保证与会者的持续发言不会被突然中断。以上实施方式仅用以说明本发明的技术方案，而非对其限制；尽管參照前述实施方式对本发明进行了详细的说明，本领域的普通技术人员应当理解其依然可以对前述实施方式所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施方式技术方案的精神和范围。
权利要求
1.ー种全交互会议的DSP混音方法，包括如下步骤音频数据采集，对与会者通道接收的多路模拟音频信号进行采集，得到多路语音样本；帧处理，对输入的语音样本按照预先设定的时间长度进行分帧，得到X个语音样本数据；能量计算，对每一路语音样本数据进行能量计算；确定參与混音的与会通道，根据计算得到的每一路音频样本能量，选择最大的前4个作为混音通道；混音，对确定參与混音的与会通道的语音数据进行混音；混音发送，对混音信号进行处理，向每个与会通道发送只占ー个信号通道的混音音频流。
2.根据权利要求I所述的全交互会议的DSP混音方法，其特征在于，所述混音发送具体包括每个參与混音的与会通道只接收的另外3个參与混音的与会通道的混音数据，其他未參与混音的与会通道接收所有4个參与混音的与会通道的混音数据。
3.根据权利要求2所述的全交互会议的DSP混音方法，其特征在于，所述能量计算具体包括采用能量累积计算方法，按照E =Σ E (η)/2η计算能量，其中，η代表时间，O代表当前时间，O≤η≤X，X对应于帧处理的时间节点数。
4.ー种全交互会议的DSP混音装置，其特征在于，包括依次连接的采集单元、处理单元和混音发送单元。所述处理単元包括帧处理単元、能量计算单元、混音选择单元和混音单元。其中，所述采集単元用于采集各个与会通道的语音数据，所述帧处理单元用于采集的语音数据进行帧处理。所述能量计算单元用于对帧处理后的语音数据进行能量计算，采用能量累计计算方法。所述混音选择单元用于根据各路语音数据计算后能量选择确定能量最大的前4路对于的与会通道參与混音。所述混音単元用于将參与混音的与会通道的语音数据进行混音。所述混音发送单元用于将混音后的语音数据通过ー个信号通道发送给所有与会通道。
5.根据权利要求4所述的全交互会议的DSP混音装置，其特征在干，每个參与混音的与会通道只接收的另外3个參与混音的与会通道的混音数据，其他未參与混音的与会通道接收所有4个參与混音的与会通道的混音数据。
全文摘要
本发明公开了一种全交互会议的DSP混音方法，包括音频数据采集，得到多路语音样本；帧处理，对输入的语音样本按照预先设定的时间长度进行分帧，得到多个语音样本数据；能量计算，对每一路语音样本数据进行能量计算；确定参与混音的与会通道，根据计算得到的每一路音频样本能量，选择最大的前4个作为混音通道；混音，对确定参与混音的与会通道的语音数据进行混音；混音发送，对混音信号进行处理，向每个与会通道发送只占一个信号通道的混音音频流。本发明还公开了一种使用上述全交互会议的DSP混音方法的装置。本发明能够防止因某路信号突然增大而造成对混音通道选择的误差，保证与会者的持续发言不会被突然中断。
文档编号H04L29/06GK102664019SQ20121012957
公开日2012年9月12日申请日期2012年4月27日优先权日2012年4月27日
发明者代同杰, 王有海, 王灏申请人:深圳市邦彦信息技术有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王灏;代同杰;王有海
技术所有人：深圳市邦彦信息技术有限公司
我是此专利的发明人

上一篇：电子邮件缓发送的方法及客户端的制作方法
上一篇：一种基于lte的子带跳频外部干扰避免系统及方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。