一种混音处理方法和装置的制造方法_2

文档序号:9930280阅读:来源:国知局
比例为收缩后的信号强度与原信号强度之间的比值,例如原信号强度为100,收缩后为50,那么收缩比例为50%。
[0039]示例性的,以上述划分第η个音频强度分布区间为:((n-1)X2Q—UXSq-1]将线性叠加后的混音信号划分成多个强度区间信号为例,处于第η个音频强度分布区间的混音信号强度区间对应的收缩比例为[(k-l)/k]*(l/k)n,其中k为预设的收缩因子,通常取2的倍数,例如8或16。在一较佳实施例中,10X8,Q取值16。
[0040]S105,将经过音频强度收缩的所述至少两个混音信号强度区间进行叠加后输出。
[0041]本实施例通过采用上述混音处理方法,通过对线性叠加的混音信号进行强度分区,进而对不同混音信号强度区间采用不同的收缩比例进行收缩处理,以实现避免溢出失真,同时区间收缩的处理,收缩比例跟混音路数的规模,时间等都是无关的,所以不会出现忽大忽小,不清晰等问题。
[0042]图2是本发明另一实施例中的混音处理方法的流程示意图,如图所示,本实施例中的混音处理方法可以包括:
[0043]S201,获取至少两路音频输入信号。
[0044]S202,检测所述至少两路音频输入信号的音频强度,确定所述至少两路音频信号中存在至少一路过小音频输入信号。
[0045]具体的,可以通过对所述至少两路音频输入信号的音频强度进行采样,根据采样结果确定各路音频输入信号的音频强度,例如进行预设时间的音频强度采样,将最高值或均值,或有效声音信号的最高值或均值视为该路音频输入信号的音频强度。若某一路音频输入信号的音频强度小于预设的过小信号门限值,则可以确定该路音频输入信号是过小音频输入信号;或者若出现所述至少两路音频输入信号中的某一路音频输入信号的音频强度与另一路音频输入信号的音频强度的比值小于预设阈值,则可以将音频强度较小的这一路音频输入信号确定为过小音频输入信号。所述预设时间可以例如10秒或5秒,在该采样期间,可以先将各路音频输入信号直接线性叠加。需要指出的是,该过小音频输入信号的检测可以发生在新获取到一路音频输入信号时,也可以是周期性的进行检测,例如每隔I分钟或30秒进行一次检测,以确保某一路音频输入信号由于故障或信道问题导致音量较低时,能够及时作出针对性的增益。
[0046]具体实现中,可以首先确定所述至少两路音频输入信号中音频强度最高的一路音频输入信号;然后判断是否存在某一路音频输入信号的音频强度与所述音频强度最高的一路音频输入信号的音频强度的比值小于预设阈值,则确定该路音频输入信号为过小音频输入信号。
[0047]在另一可选实现方式中,可以通过对所述至少两路音频输入信号进行预设时长的音频强度采样,若存在满足以下情况的第一音频输入信号和第二音频输入信号,则可以确认第一音频输入信号为过小音频输入信号:在同一采样周期内,所述第一音频输入信号的最高采样值与所述第二音频输入信号的有效音频信号的最低采样值的比值不大于预设阈值。示例性的,若某路音频输入信号的所有采样值均分布在区间(0,p*2Q—1L其中p〈0.03,同时存在某一路音频输入信号的有效音频信号的所有采样值均分布在区间,⑴],则可以确定该较小采样值的音频输入信号为过小音频输入信号。
[0048]S203,对所述至少一路过小输入音频信号进行音频强度增益。
[0049]具体的,由于过小音频输入信号较大概率由于时域掩蔽效应存在听不清的情况,因此本实施例中首先对检测到的过小输入音频信号进行音频强度增益,再将其与其他路的音频信号进行线性叠加。增益系数可以根据需要设定,例如根据过小音频输入信号的音频强度与其他正常音频强度的音频输入信号的音频强度之间的比例确定,还可以根据过小音频输入信号的采样值自身确定,示例性的,增益系数可以为:
[0050]2Q—Vmsq(s),其中msq(s)为预设时长内所述过小输入音频信号的音频强度采样值的均方根。
[0051]S204,将所述至少一路过小输入音频信号经过音频强度增益后与其他路音频信号进行线性叠加。
[0052]S205,将线性叠加后的混音信号按照音频强度大小划分为至少两个混音信号强度区间。
[0053]本实施例中,可以根据预先划分的多个等长度的音频强度分布区间,将所述混音信号处于不同音频强度分布区间的信号确定为所述至少两个混音信号强度区间。具体的,在预先划分的多个等长度的音频强度分布区间中,第η个音频强度分布区间为:
[0054]((n_l)X2Q—Vxsq-1L其中n21,Q为预设常数,通常取2的倍数,例如8或16。进而可以将所述混音信号处于不同音频强度分布区间的信号划分为对应的混音强度区间。
[0055]S206,分别对所述各个混音信号强度区间采用对应的收缩比例进行音频强度收缩,其中音频强度较高的混音信号强度区间所采用的收缩比例要小于音频强度较低的混音信号强度区间所采用的收缩比例。
[0056]由于语音信号中的中低强度的信号出现的几率比高强度的信号更高,本发明实施例采用对高强度信号和中低强度信号采用不同的收缩处理方案,即对经过混音后线性叠加的音频信号进行分区间压缩,较低强度的信号采用较大的收缩比例,较高强度的信号采用较小收缩比例。具体的,处于第η个音频强度分布区间的混音信号强度区间对应的收缩比例为[(k-l)/k]*(l/k)n,其中k为预设的收缩因子,通常取2的倍数,例如8或16。在一较佳实施例中,k取8,Q取值16。
[0057]S207,将经过音频强度收缩的所述至少两个混音信号强度区间进行叠加后输出。
[0058]本实施例通过采用上述混音处理方法,通过对线性叠加的混音信号进行强度分区,进而对不同混音信号强度区间采用不同的收缩比例进行收缩处理,以实现避免溢出失真,同时区间收缩的处理,收缩比例跟混音路数的规模,时间等都是无关的,所以不会出现忽大忽小,不清晰等问题,同时结合过小音量信号的检测和增益处理,有效解决了小音量语音被掩蔽听不清的问题。
[0059]图3是本发明实施例中的一种混音处理装置的结构示意图,如图所示本实施例中的混音处理装置可以包括:
[0060]音频输入模块310,用于获取至少两路音频输入信号。
[0061 ]例如在一个多媒体会议中,共有M位与会者参加发言,则共有M位音频输入信号参与混音,这时需要向每位与会者发送其他M-1路音频输入信号进行混音后的输出信号,同时还可以向外部输出全部M路音频输入信号进行混音后的输出信号。需要指出的是,本发明实施例中音频输入模块310获取到的音频输入信号可以是已经经过采样、量化、滤波等处理后的数字信号,也可以是模拟波形信号。
[0062]混音叠加模块320,用于对所述至少两路音频输入信号进行线性叠加;
[0063]强度区间划分模块330,用于将线性叠加后的混音信号按照音频强度大小划分为至少两个混音信号强度区间。
[0064]即将线性叠加后的混音信号划分成多个强度区间信号,以便后续针对不同强度区间的混音信号采用不同的收缩比例进行处理。例如按照设定的分界阈值,将不大于该分界阈值的强度区间内的混音信号划分为第一级强度区间信号,将大于该分界阈值的强度区间内的混音信号划分为第二级强度区间信号,以此类推可以将线性叠加后的混音信号划分得至IJ
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1