一种混合音频的处理方法及装置的制作方法

文档序号：2833738阅读：221来源：国知局

专利名称：一种混合音频的处理方法及装置的制作方法
技术领域：
本发明涉及音频处理领域，尤其涉及一种混合音频的处理方法及装置。
背景技术：
声音是由于物体振动对周围的空气产生压力而传播的一种压力波，转换成电信号后，再经过抽样、量化，仍然是一种连续平滑的波形信号。音调、响度和音色是声音的三个主要特征，量化后的语音信号的频率与声音的频率对应，振幅与声音的音量对应。在自然界中，人耳听见的语音则是来自四面八方声音的叠加，量化的语音信号的叠加等价于空气中声波的叠加。所以当各信号的抽样率一致时，混合音频可以实现为将各信号的采样数据线性叠加。对于会议系统来说，由于网络带宽的限制和网络环境的多变性，人们采用降低编码比特率和改善网络条件等办法获取高质量的语音和视频。同时人们希望会议系统能够模拟真实的会议环境，在有多人同时说话时，终端能同时听到每个人说话的声音，这就需要增加混音功能。将来自与会者的语音数据在时域混合成一个音频流，这样在播放时就达到模拟真实会议场景的目的。语音信号的抽样及量化都在声卡芯片上进行，常用的声卡为16位，量化精度多为16bit。在众多操作系统中，声卡缓冲区的数据类型通常为signed short，其值范围在-32768 32767。多路混音后，幅值有可能超出声卡可接受的范围(在-32768 32767范围之外)，从而造成声音的失真，由此产生混音溢出问题。目前对混音后采样值溢出的处理方法较多，但基本思想基本上都是先对语音信号的振幅做一定的平滑处理，即可以在不破坏(或基本不破坏)语音信号原有频率的基础上避免溢出。现有技术中对混音信号的处理方案主要有如下几种一、直接箝位法；这种方法的思想是指定声音幅值的最大和最小临界值，这个由量化精度及其取值范围确定。当混合后语音样本值超出缓冲区数据类型范围时，溢出的样本值用最大或最小临界值代替，不产生溢出的混音样本结果保持不变，见下式描述。可以看出，用临界值代替线性叠加值，会造成语音波形的人为削峰，在破坏语音信号特性的同时会促使噪音的产生。二、归一化定标法；归一化定标算法的主要思想是使用一个衰减因子对音频数据进行衰减。衰减因子会随着混音后的样本值的变化而变化。当产生溢出时，衰减因子比较小，以保证溢出的样本值经过衰减处理后在临界值范围内。没有溢出时，衰减因子会慢慢增加，以保持数据的平滑变化。该算法在对混音数据溢出处理时，仍然采用的是直接箝位法。若混音过程中，溢出比较频繁，就会影响混音的质量。另一方面，该算法中每一次衰减因子的更新，都要进行一次浮点数除法操作。由此可见，现有技术中对混音的溢出处理不合理，会导致较差的混音质量
发明内容
本发明实施例提供了一种混合音频的处理方法及装置，用以对混合音频的溢出进行处理，提升混合音频的质量。本发明实施例提供的一种混合音频的处理方法包括对于当前接收的混合音频样本，根据当前的混合音频样本和根据上一混合音频样本确定的衰减因子，确定当前的混合音频样本的第一输出值；当确定所述第一输出值不在预设的范围内时，根据预设的数值集合与所述第一输出值重新确定衰减因子，并根据所述第一输出值和重新确定的衰减因子重新确定当前的混合音频样本的第二输出值。本发明实施例提供的一种多路音频的混合处理装置包括第一输出单元，用于对于当前接收的混合音频样本，根据当前的混合音频样本和根据上一混合音频样本确定的衰减因子，确定当前的混合音频样本的第一输出值；第二输出单元，用于当确定所述第一输出值不在预设的范围内时，根据预设的数值集合与所述第一输出值重新确定衰减因子，并根据所述第一输出值和重新确定的衰减因子重新确定当前的混合音频样本的第二输出值。通过以上技术方案可知，本发明中对于当前接收的混合音频样本，根据当前的混合音频样本和根据上一混合音频样本确定的衰减因子，确定当前的混合音频样本的第一输出值；当确定所述第一输出值不在预设的范围内时，根据预设的数值集合与所述第一输出值重新确定衰减因子，并根据所述第一输出值和重新确定的衰减因子重新确定当前的混合音频样本的第二输出值。通过可变的衰减因子使得混合音频不会产生溢出的同时尽量保持较小的失真度；其中，当确定的第一输出值溢出时，并未采用现有的箝位方法，而是重新确定衰减因子，以及重新确定混合音频样本的输出值；保持了混音波形的平滑，提升了混音的质量。

图1为本发明实施例提供的一种混合音频的处理方法的流程示意图；图2为本发明具体实施例提供的一种混合音频的处理方法的流程示意图；图3为本发明实施例提供的一种混合音频的处理装置的结构示意图；图4为本发明实施例提供的一种混合音频的处理装置的另一结构示意图。
具体实施例方式本发明实施例提供了一种混合音频的处理方法及装置，用以对混合音频的溢出进行处理，提升混合音频的质量。参见图1，本发明实施例提供的一种混合音频的处理方法包括S101、对于当前接收的混合音频样本，根据当前的混合音频样本和根据上一混合音频样本确定的衰减因子，确定当前的混合音频样本的第一输出值；S102、当确定所述第一输出值不在预设的范围内时，根据预设的数值集合与所述第一输出值重新确定衰减因子，并根据所述第一输出值和重新确定的衰减因子重新确定当前的混合音频样本的第二输出值。较佳的，衰减因子的初始值为I ;即对第一个混合音频样本进行处理时，衰减因子为I。较佳的，所述预设的数值集合中的各数值不大于I ;S102中，所述根据预设的数值集合与所述第一输出值重新确定衰减因子，具体为将预设的数值集合中与所述第一输出值的乘积在所述预设的范围内的最大值对应的数值，确定为衰减因子。较佳的，所述预设的数值集合，为{i/n}，i为整数，0〈i〈n，η是根据将所述混合音频存储为数字信号时所采用的比特位数确定的。较佳的，S102重新确定当前的混合音频样本的第二输出值之后，该方法还包括判断衰减因子是否小于预设的门限值，如果是，将衰减因子f增加一个变化步长；否则，将衰减因子确定为I ;其中，一个变化步长为(l-f)/n，η是根据将所述混合音频存储为数字信号时所采用的比特位数确定的。当衰减因子非常接近于I时，将衰减因子重新置为1，以减少浮点数除法操作，提高运算效率。较佳的，该方法还包括当确定所述第一输出值在预设的范围内时，判断衰减因子是否小于预设的门限值，如果是，将衰减因子f增加一个变化步长；否则，将衰减因子确定为I ;其中，一个变化步长为(l-f)/n，η是根据将所述混合音频存储为数字信号时所采用的比特位数确定的。较佳的，所述预设的范围，是根据将所述混合音频存储为数字信号时所采用的比特位数确定的。下面是本发明的具体实施例假设共有M个输入音频流，每个音频流有N个样本，mixing [i]为将音频流混合后当前帧的第i个样本的线性叠加值，output[i]为当前混音帧的第i个样本的输出，input [i，j]为当前帧的第j个音频流的第i个样本的输入(其中O彡j彡M-1, O彡i彡N)，则线性叠加式如下
权利要求
1.一种混合音频的处理方法，其特征在于，该方法包括对于当前接收的混合音频样本，根据当前的混合音频样本和根据上一混合音频样本确定的衰减因子，确定当前的混合音频样本的第一输出值；当确定所述第一输出值不在预设的范围内时，根据预设的数值集合与所述第一输出值重新确定衰减因子，并根据所述第一输出值和重新确定的衰减因子重新确定当前的混合音频样本的第二输出值。
2.权利要求1所述的方法，其特征在于，所述预设的数值集合中的各数值不大于I;所述根据预设的数值集合与所述第一输出值重新确定衰减因子，具体为将预设的数值集合中与所述第一输出值的乘积在所述预设的范围内的最大值对应的数值，确定为衰减因子。
3.如权利要求2所述的方法，其特征在于，所述预设的数值集合，为{i/n}，i为整数，0〈i〈n，η是根据将所述混合音频存储为数字信号时所采用的比特位数确定的。
4.如权利要求1所述的方法，其特征在于，所述重新确定当前的混合音频样本的第二输出值之后，该方法还包括判断衰减因子是否小于预设的门限值，如果是，将衰减因子f增加一个变化步长；否贝U，将衰减因子确定为I ; 其中，一个变化步长为(1-f) /n, η是根据将所述混合音频存储为数字信号时所采用的比特位数确定的。
5.如权利要求1所述的方法，其特征在于，该方法还包括当确定所述第一输出值在预设的范围内时，判断衰减因子是否小于预设的门限值，如果是，将衰减因子f增加一个变化步长；否则，将衰减因子确定为I ; 其中，一个变化步长为(1-f) /n, η是根据将所述混合音频存储为数字信号时所采用的比特位数确定的。
6.权利要求1所述的方法，其特征在于，所述预设的范围，是根据将所述混合音频存储为数字信号时所采用的比特位数确定的。
7.权利要求1所述的方法，其特征在于，衰减因子的初始值为I。
8.一种混合音频的处理装置，其特征在于，该装置包括第一输出单元，用于对于当前接收的混合音频样本，根据当前的混合音频样本和根据上一混合音频样本确定的衰减因子，确定当前的混合音频样本的第一输出值；第二输出单元，用于当确定所述第一输出值不在预设的范围内时，根据预设的数值集合与所述第一输出值重新确定衰减因子，并根据所述第一输出值和重新确定的衰减因子重新确定当前的混合音频样本的第二输出值。
9.如权利要求8所述的装置，其特征在于，所述预设的数值集合中的各数值不大于I;所述第二输出单元根据预设的数值集合与所述第一输出值重新确定衰减因子，具体用于将预设的数值集合中与所述第一输出值的乘积在所述预设的范围内的最大值对应的数值，确定为衰减因子。
10.如权利要求9所述的装置，其特征在于，所述预设的数值集合，为{i/n}，i为整数，0〈i〈n，η是根据将所述混合音频存储为数字信号时所采用的比特位数确定的。
11.如权利要求8所述装置，其特征在于，该装置还包括衰减因子调整单元，用于在重新确定当前的混合音频样本的第二输出值之后，判断衰减因子是否小于预设的门限值，如果是，将衰减因子f增加一个变化步长；否则，将衰减因子确定为I ; 其中，一个变化步长为(1-f) /n, η是根据将所述混合音频存储为数字信号时所采用的比特位数确定的。
12.如权利要求8所述的装置，其特征在于，所述衰减因子调整单元还用于当确定所述第一输出值在预设的范围内时，判断衰减因子是否小于预设的门限值，如果是，将衰减因子f增加一个变化步长；否则，将衰减因子确定为I ; 其中，一个变化步长为(1-f) /n, η是根据将所述混合音频存储为数字信号时所采用的比特位数确定的。
13.如权利要求8所述的装置，其特征在于，所述预设的范围，是根据将所述混合音频存储为数字信号时所采用的比特位数确定的。
14.如权利要求8所述的装置，其特征在于，衰减因子的初始值为I。
全文摘要
本发明实施例提供了一种混合音频的处理方法及装置，用以对混合音频的溢出进行处理，提升混合音频的质量。该方法包括对于当前接收的混合音频样本，根据当前的混合音频样本和根据上一混合音频样本确定的衰减因子，确定当前的混合音频样本的第一输出值；当确定所述第一输出值不在预设的范围内时，根据预设的数值集合与所述第一输出值重新确定衰减因子，并根据所述第一输出值和重新确定的衰减因子重新确定当前的混合音频样本的第二输出值。
文档编号G10L21/003GK103021419SQ20121057553
公开日2013年4月3日申请日期2012年12月26日优先权日2012年12月26日
发明者高陆军, 樊国栋申请人:大唐移动通信设备有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：高陆军;樊国栋
技术所有人：大唐移动通信设备有限公司
我是此专利的发明人