一种混音处理方法和装置的制造方法

文档序号：9930280阅读：413来源：国知局

一种混音处理方法和装置的制造方法
【技术领域】
[0001]本发明涉及一种互联网技术领域，尤其涉及一种混音处理方法和装置。
【背景技术】
[0002]目前，随着多媒体通信发展，多媒体会议已经成为发展热点之一，其中一弄的交互处理处于最基本最核心的位置，对音频是实时性要求更为苛刻，由此，对于实际使用中的不同地点的多个终端，若要进行多个点的实时音频的交互，需要将多路音频信号进行混合输出，即混音处理。
[0003]现有的常用混音算法主要有以下几种。
[0004]I)直接叠加
[0005]直接叠加就是将多路数据线性求和，这是一种最简单最直接的方法。该方法的缺点就是溢出导致的声音截顶失真，通常语音PCM(Pulse Code Modulat1n----脉码调制录音)数据表示范围在-32768和32767之间，因此多路数据相加后的结果会超出这个有效范围，这样就带了声音的失真。
[0006]2)线性叠加求平均
[0007]为了避免线性叠加后失真，对线性求和后的结果求平均，也就是如果有N路混音，求和的结果除以N，相当于每路数据乘以一个权重系数1/N。这种处理有效的避免了失真问题，带来的新问题是，如果语音过程中混音的人数发生变化，那么N就变化，这样导致多人语音过程中每个人的声音大小不一致;同时如果N值比较大的话，对于采集声音比较小的某路数据乘以权重系数后，声音会变的更小。

【发明内容】

[0008]有鉴于此，本发明实施例提供一种混音处理方法和装置，可以有效避免溢出失真以及声音忽大忽4、的问题。
[0009]为了解决上述技术问题，本发明实施例提供了一种混音处理方法，所述方法包括:
[0010]获取至少两路音频输入信号；
[0011 ]对所述至少两路音频输入信号进行线性叠加；
[0012]将线性叠加后的混音信号按照音频强度大小划分为至少两个混音信号强度区间；
[0013]分别对所述各个混音信号强度区间采用对应的收缩比例进行音频强度收缩，其中音频强度较高的混音信号强度区间所采用的收缩比例要小于音频强度较低的混音信号强度区间所采用的收缩比例；
[0014]将经过音频强度收缩的所述至少两个混音信号强度区间进行叠加后输出。
[0015]相应地，本发明实施例还提供了一种混音处理装置，其特征在于，包括:
[0016]音频输入模块，用于获取至少两路音频输入信号；
[0017]混音叠加模块，用于对所述至少两路音频输入信号进行线性叠加；
[0018]强度区间划分模块，用于将线性叠加后的混音信号按照音频强度大小划分为至少两个混音信号强度区间；
[0019]音频收缩模块，用于分别对所述各个混音信号强度区间采用对应的收缩比例进行音频强度收缩，其中音频强度较高的混音信号强度区间所采用的收缩比例要小于音频强度较低的混音信号强度区间所采用的收缩比例；
[0020]混音输出模块，用于将经过音频强度收缩的所述至少两个混音信号强度区间进行叠加后输出。
[0021]本发明实施例通过通过对线性叠加的混音信号进行强度分区，进而对不同混音信号强度区间采用不同的收缩比例进行收缩处理，以实现避免溢出失真，同时区间收缩的处理，收缩比例跟混音路数的规模，时间等都是无关的，所以不会出现忽大忽小，不清晰等问题。
【附图说明】
[0022]为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0023]图1是本发明实施例中的一种混音处理方法的流程示意图；
[0024]图2是本发明另一实施例中的混音处理方法的流程示意图；
[0025]图3是本发明实施例中的一种混音处理装置的结构示意图；
[0026]图4是本发明另一实施例中的混音处理装置的结构示意图。
【具体实施方式】
[0027]下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0028]图1是本发明实施例中的一种混音处理方法的流程示意图，如图所示本实施例中的混音处理流程可以包括:
[0029]SlOl，获取至少两路音频输入信号。
[0030]例如在一个多媒体会议中，共有M位与会者参加发言，则共有M位音频输入信号参与混音，这时需要向每位与会者发送其他M-1路音频输入信号进行混音后的输出信号，同时还可以向外部输出全部M路音频输入信号进行混音后的输出信号。需要指出的是，本发明实施例中提及的音频输入信号可以是已经经过采样、量化、滤波等处理后的数字信号，也可以是模拟波形信号。
[0031]S102，对所述至少两路音频输入信号进行线性叠加。
[0032]S103，将线性叠加后的混音信号按照音频强度大小划分为至少两个混音信号强度区间。
[0033]即将线性叠加后的混音信号划分成多个强度区间信号，以便后续针对不同强度区间的混音信号采用不同的收缩比例进行处理。例如按照设定的分界阈值，将不大于该分界阈值的强度区间内的混音信号划分为第一级强度区间信号，将大于该分界阈值的强度区间内的混音信号划分为第二级强度区间信号，以此类推可以将线性叠加后的混音信号划分得至IJ3个或更多的强度区间信号。
[0034]在可选实施例中，可以根据预先划分的多个等长度的音频强度分布区间，将所述混音信号处于不同音频强度分布区间的信号确定为所述至少两个混音信号强度区间。示例性的，在预先划分的多个等长度的音频强度分布区间中，第η个音频强度分布区间为:
[0035]((n-1) X2Q—1，nX2^1]，其中η 2 I，Q为预设常数，通常取2的倍数，例如8或16。
[0036]那么可以将所述混音信号处于不同音频强度分布区间的信号划分为对应的混音强度区间，例如线性叠加后的混音信号的强度分布在上述划分得到的第1-3个音频强度分布区间，那么可以将落入第I音频强度分布区间的称为第一混音信号强度区间，落入第2音频强度分布区间的称为第二混音信号强度区间，落入第3音频强度分布区间的称为第三混音信号强度区间，其他实施例中以此类推。
[0037]S104，分别对所述各个混音信号强度区间采用对应的收缩比例进行音频强度收缩，其中音频强度较高的混音信号强度区间所采用的收缩比例要小于音频强度较低的混音信号强度区间所采用的收缩比例。
[0038]由于语音信号中的中低强度的信号出现的几率比高强度的信号更高，本发明实施例采用对高强度信号和中低强度信号采用不同的收缩处理方案，即对经过混音后线性叠加的音频信号进行分区间压缩，较低强度的信号采用较大的收缩比例，确保较低强度信号的可识别性同时有一定的收缩，高强度的信号采用较小收缩比例，以确保不会出现音频信号溢出，同时也保留一定的可识别性。所述收缩

完整全部详细技术资料下载

当前第1页1 2 3 4

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王新亮;李斌;
技术所有人：腾讯科技（深圳）有限公司;
我是此专利的发明人

上一篇：用于高频带宽扩展的对信号进行编码和解码的设备和方法
上一篇：一种声纹采集和处理系统及其采集和处理方法