一种混音处理方法和装置的制造方法_3

文档序号:9930280阅读:来源:国知局
3个或更多的强度区间信号。
[0065]在可选实施例中,强度区间划分模块330可以根据预先划分的多个等长度的音频强度分布区间,将所述混音信号处于不同音频强度分布区间的信号确定为所述至少两个混音信号强度区间。示例性的,在预先划分的多个等长度的音频强度分布区间中,第η个音频强度分布区间为:
[0066]((n-1) X2Q—1,nX2^1],其中η 2 I,Q为预设常数,通常取2的倍数,例如8或16。
[0067]从而强度区间划分模块330可以将所述混音信号处于不同音频强度分布区间的信号划分为对应的混音强度区间,例如线性叠加后的混音信号的强度分布在上述划分得到的第1-3个音频强度分布区间,那么可以将落入第I音频强度分布区间的称为第一混音信号强度区间,落入第2音频强度分布区间的称为第二混音信号强度区间,落入第3音频强度分布区间的称为第三混音信号强度区间,其他实施例中以此类推。
[0068]音频收缩模块340,用于分别对所述各个混音信号强度区间采用对应的收缩比例进行音频强度收缩,其中音频强度较高的混音信号强度区间所采用的收缩比例要小于音频强度较低的混音信号强度区间所采用的收缩比例。
[0069]由于语音信号中的中低强度的信号出现的几率比高强度的信号更高,音频收缩模块340采用对高强度信号和中低强度信号采用不同的收缩处理方案,即对经过混音后线性叠加的音频信号进行分区间压缩,较低强度的信号采用较大的收缩比例,确保较低强度信号的可识别性同时有一定的收缩,高强度的信号采用较小收缩比例,以确保不会出现音频信号溢出,同时也保留一定的可识别性。所述收缩比例为收缩后的信号强度与原信号强度之间的比值,例如原信号强度为100,收缩后为50,那么收缩比例为50%。
[0070]示例性的,以上述划分第η个音频强度分布区间为:((n-1)X 2Q—1,n X 2s—1]将线性叠加后的混音信号划分成多个强度区间信号为例,处于第n个音频强度分布区间的混音信号强度区间对应的收缩比例为[(k-l)/k]*(l/k)n,其中k为预设的收缩因子,通常取2的倍数,例如8或16。在一较佳实施例中,10X8,Q取值16。
[0071]混音输出模块350,用于将经过音频强度收缩的所述至少两个混音信号强度区间进行置加后输出。
[0072]在可选实施例中,混音处理装置进一步还可以包括:
[0073]过小音频检测模块360,用于检测所述至少两路音频输入信号的音频强度,确定所述至少两路音频信号中存在至少一路过小音频输入信号。
[0074]具体的,过小音频检测模块360可以通过对所述至少两路音频输入信号的音频强度进行采样,根据采样结果确定各路音频输入信号的音频强度,例如进行预设时间的音频强度采样,将最高值或均值,或有效声音信号的最高值或均值视为该路音频输入信号的音频强度。若某一路音频输入信号的音频强度小于预设的过小信号门限值,则可以确定该路音频输入信号是过小音频输入信号;或者若出现所述至少两路音频输入信号中的某一路音频输入信号的音频强度与另一路音频输入信号的音频强度的比值小于预设阈值,则可以将音频强度较小的这一路音频输入信号确定为过小音频输入信号。所述预设时间可以例如10秒或5秒,在该采样期间,可以先将各路音频输入信号直接线性叠加。需要指出的是,该过小音频输入信号的检测可以发生在新获取到一路音频输入信号时,也可以是周期性的进行检测,例如每隔I分钟或30秒进行一次检测,以确保某一路音频输入信号由于故障或信道问题导致音量较低时,能够及时作出针对性的增益。
[0075]具体实现中,过小音频检测模块360可以首先确定所述至少两路音频输入信号中音频强度最高的一路音频输入信号;然后判断是否存在某一路音频输入信号的音频强度与所述音频强度最高的一路音频输入信号的音频强度的比值小于预设阈值,则确定该路音频输入信号为过小音频输入信号。
[0076]在另一可选实现方式中,过小音频检测模块360可以通过对所述至少两路音频输入信号进行预设时长的音频强度采样,若存在满足以下情况的第一音频输入信号和第二音频输入信号,则可以确认第一音频输入信号为过小音频输入信号:在同一采样周期内,所述第一音频输入信号的最高采样值与所述第二音频输入信号的有效音频信号的最低采样值的比值不大于预设阈值。示例性的,若某路音频输入信号的所有采样值均分布在区间(0,p*2Q—1L其中p〈0.03,同时存在某一路音频输入信号的有效音频信号的所有采样值均分布在区间(2°-1,⑴],则可以确定该较小采样值的音频输入信号为过小音频输入信号。
[0077]音频增益模块370,用于对所述至少一路过小输入音频信号进行音频强度增益。
[0078]具体的,由于过小音频输入信号较大概率由于时域掩蔽效应存在听不清的情况,因此音频增益模块370首先对检测到的过小输入音频信号进行音频强度增益,再由混音叠加模块320将其与其他路的音频信号进行线性叠加。增益系数可以根据需要设定,例如根据过小音频输入信号的音频强度与其他正常音频强度的音频输入信号的音频强度之间的比例确定,还可以根据过小音频输入信号的采样值自身确定,示例性的,增益系数可以为:
[0079]2Q—Vmsq(s),其中msq(s)为预设时长内所述过小输入音频信号的音频强度采样值的均方根。
[0080]本实施例中的混音处理装置,通过对线性叠加的混音信号进行强度分区,进而对不同混音信号强度区间采用不同的收缩比例进行收缩处理,以实现避免溢出失真,同时区间收缩的处理,收缩比例跟混音路数的规模,时间等都是无关的,所以不会出现忽大忽小,不清晰等问题,进而通过结合过小音量信号的检测和增益处理,还可以有效解决小音量语音被掩蔽听不清的问题。
[0081]图4展示了一种运行上述混音处理方法的基于冯诺依曼体系的计算机系统。该计算机系统可以是智能手机、平板电脑、掌上电脑,笔记本电脑或个人电脑等终端设备。具体的,可包括通过系统总线连接的输入输出接口 410、处理器420、存储器430。其中,输入输出接口 410可包括用于获取多路音频输入信号的输入接口 411,用于输出混音处理结果的输出接口 412,可选的还可以包括网络接口 413。存储器430可包括外存储器431(例如硬盘、光盘或软盘等)和内存储器432。
[0082]在本实施例中,本方法的运行可以基于计算机程序,该计算机程序的程序文件存储于前述基于冯诺依曼体系的计算机系统的外存储器431中,在运行时被加载到内存储器432中,然后被编译为机器码之后传递至处理器420中执行,从而使得基于冯诺依曼体系的计算机系统中形成逻辑上的音频输入模块310、混音叠加模块320、强度区间划分模块330、音频收缩模块340、混音输出模块350、过小音频检测模块360以及音频增益模块370。且在上述实施例中混音处理方法的执行过程中,输入的参数均通过输入接口 411接收,并传递至内存储器432中缓存,然后输入到处理器420中进行处理,处理的结果数据或缓存于内存储器432中进行后续地处理,或被传递至输出接口 412或网络接口 413进行输出。
[0083]本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1