一种音频信号的混音方法及装置的制作方法

文档序号:2833614阅读:269来源:国知局
专利名称:一种音频信号的混音方法及装置的制作方法
技术领域
本发明实施例涉及音频技术领域,特别是涉及一种音频信号的混音方法,以及一种音频信号的混音装置。
背景技术
混音(Audio Mixing)是音乐制作中的一个重要步骤,就是将多种来源的音频信号,整合至一个立体音轨或单音音轨中,经过混合后一起播放。目前,在对多个音频信号进行混合时,通常是直接将音频信 号中各个采样点的音量强度进行简单叠加,以两个音频信号的混音为例,假设Al和A2分别为两个单声道素材,现有技术中,具体有以下两种混音方式I、Mix (Al, A2) = (A1+A2),其中Al,A2分别代表两路原始音频信号的采样值,Mix(Al,A2)表示将Al和A2混音后得到的输出信号,该方法是将两路原始信号直接叠加作为混音结果,Soundtrack(音频制作软件)采用这种方法来进行混音。2, Mix (Al, A2) = (A1+A2)/sqrt (2),该方法可以将两路原始信号分别降低音量3dB,然后相加得到混音信号,Adobe Audition(音频制作软件)采用这种方法来进行混音。以上现有技术中存在的问题是,音频信号的最大音量强度与采样位数有关,将音频信号中各个采样点的音量强度进行简单叠加后,音量强度很可能会超过采样位数所能承载的最大音量强度,超出部分的音量会被削平,从而产生声音削波失真的问题。

发明内容
本发明实施例提供了一种音频信号的混音方法,以避免音频信号混音时产生的削波问题。本发明实施例还提供了一种音频信号的混音装置,用以保证上述方法在实际中的应用及实现。为了解决上述问题,本发明实施例公开了一种音频信号的混音方法,包括在待混音的两路音频信号中,提取对应同一米样时间的两个米样点;将所述两个采样点的样点数据与预置的混音条件进行匹配,并依据匹配到的混音条件确定对应的混音方式;由所述采样点的采样位数,确定所述混音方式中对应的混音平衡参数m ;按照所匹配的混音方式,以及对应的混音平衡参数,对两个采样点进行混音。优选地,所述混音条件包括多个数值范围,所述样点数据为所述采样点的音量强度;所述将两个采样点的样点数据与预置的混音条件进行匹配的步骤为判断两个采样点的音量强度所匹配的数值范围。优选地,所述采样点的采样位数记为n,所述混音方式中对应的混音平衡参数m满足 m = 2n。优选地,所述混音条件对应的混音方式包括
当所匹配的数值范围为Al和A2均大于O时,对应的混音方式为Mix(Al,A2)=Al+A2-AlXA2/m ;当所匹配的数值范围为Al和A2均小于O时,对应的混音方式为Mix(Al,A2)=Al+A2+AlXA2/m ;当所匹配的数值范围为Al和A2均不同时大于0,且不同时小于O时,对应的混音方式为 Mix (Al,A2) = A1+A2 ;其中,Al和A2为两个采样点对应的音量强度,Mix (Al, A2)为混音结果。优选地,若待混音的音频信号多于两个,则在将所述两路音频信号进行混音后,所述方法还包括
将所述两路音频信号的混音结果,与其余待混音的音频信号中的其中一个音频信号进行混音。本发明实施例还提供了一种音频信号的混音装置,包括米样模块,用于在待混音的两路音频信号中,提取对应同一米样时间的两个米样占.匹配模块,用于将所述两个采样点的样点数据与预置的混音条件进行匹配,并依据匹配到的混音条件确定对应的混音方式;平衡参数确定模块,用于由所述采样点的采样位数,确定所述混音方式中对应的混音平衡参数m ;混音模块,用于按照所匹配的混音方式,以及对应的混音平衡参数,对两个采样点进打混首。优选地,所述混音条件包括多个数值范围,所述样点数据为所述采样点的音量强度;所述匹配模块包括判断子模块,用于判断两个采样点的音量强度所匹配的数值范围。优选地,所述采样点的采样位数记为n,所述混音方式中对应的混音平衡参数m满足 m = 2n。 优选地,所述混音条件对应的混音方式包括当所匹配的数值范围为Al和A2均大于O时,对应的混音方式为Mix (Al,A2)=Al+A2-AlXA2/m ;当所匹配的数值范围为Al和A2均小于O时,对应的混音方式为Mix (Al,A2)=Al+A2+AlXA2/m ;当所匹配的数值范围为Al和A2均不同时大于0,且不同时小于O时,对应的混音方式为 Mix (Al,A2) = A1+A2 ;其中,Al和A2为两个采样点对应的音量强度,Mix (Al, A2)为混音结果。优选地,若待混音的音频信号多于两个,则所述混音模块还包括多路信号混音子模块,用于将所述两路音频信号的混音结果,与其余待混音的音频信号中的其中一个音频信号进行混音。与现有技术相比,本发明实施例具有以下优点本发明实施例在对两路音频信号进行混音时,针对不同的采样点数据,预置了多个混音条件和对应的多种混音方式,按照样点数据匹配的混音条件所对应的混音方式,对音频信号进行混音,其中,针对音频信号的采样位数,设定了不同的混音平衡参数,从而保证了混音结果不会超过采样位数所能承载的最大音量强度,避免了现有技术中对音频信号简单的叠加混音时产生的削波问题。本发明实施例用于将多于两个的音频信号进行混音时,先将其中两路音频信号进行混音,然后将混音结果与剩余的一个信号进行混音,如此重复执行,直至所有的音频信号均参与混音,由于本发明在对两个音频信号混音可以避免削波的问题,因此在多于两个音频信号进行混音时,同样不会出现削波的问题。当然,实施本发明的任一产品不一定需要同时达到以上所述的所有优点。


图I是本发明实施例的一种音频信号的混音方法实施例的流程图;
图2是本发明实施例的一种音频信号的混音装置实施例的结构框图。
具体实施例方式为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式
对本申请作进一步详细的说明。现有技术中,无论是Soundtrack采用的直接叠加法,或是Adobe Audition采用的先降低3dB再直接相加法,在对两个音频信号进行混音时,混音后音频信号的音量强度很可能会超过采样位数所能承载的最大音量强度。假设两路原始信号的采样位数都是16bit,能承载的最大音量强度为32768,在某一时刻t对应的采样值分别为Al = 22000,A2 =28000,采用上述两种方案得到的混音信号在时刻t的采样值分别为35355和50000,两种结果都已经超过16bit表示的最大值,超出部分的音量会被削平,产生了削波的问题。鉴于现有技术中的问题,本发明实施例提出一种音频信号的混音机制,核心构思之一在于,预置不同的混音条件,各混音条件对应了混音方式,对于待混合的采样数据,匹配到不同的混音条件,其中,针对音频信号的采样位数,设定了不同的混音平衡参数,从而保证了混音结果不会超过采样位数所能承载的最大音量强度,避免了削波的问题。参考图1,示出了本发明实施例的一种音频信号的混音方法实施例的流程图,具体可以包括以下步骤步骤101、在待混音的两路音频信号中,提取对应同一采样时间的两个采样点。本发明实施例在对两路音频信号进行混音时,是针对音频信号中对应统一采样时间的两个采样点进行混音,多个时间点的混音结果构成了两路音频信号的混音结果。步骤102、将所述两个采样点的样点数据与预置的混音条件进行匹配,并依据匹配到的混音条件确定对应的混音方式。本发明实施例中,所述混音条件包括多个数值范围,所述样点数据为所述采样点的音量强度,所述步骤101可以包括子步骤S11、判断两个采样点的音量强度所匹配的数值范围。将采样点的样点数据与预置的混音条件进行匹配,也即是判断采样点的音量强度所属的数值范围。本发明实施例中,首先判断待混合的两个音频信号所对应的采样点数据是正数还是负数,混音条件可以是采样点数据的正负值情况,包括两个采样点数据都为正数、两个采样点数据都为负数、以及除此之外的第三种情况。混音条件与混音方式一一对应,确定了混音条件,即可进一步确定对应的混音方式。本发明实施例中,所述混音条件对应的混音方式可以包括当所匹配的数值范围为Al和A2均大于O时,对应的混音方式为Mix (Al,A2)=Al+A2-AlXA2/m ;当所匹配的数值范围为Al和A2均小于O时,对应的混音方式为Mix (Al,A2)=Al+A2+AlXA2/m ;当所匹配的数值范围为Al和A2均不同时大于0,且不同时小于O时,对应的混音方式为 Mix (Al,A2) = A1+A2 ;
其中,Al和A2为两个采样点对应的音量强度,Mix (Al, A2)为混音结果。现有技术中或Al+A2(Al+A2)/sqrt(2)均是二元线性函数,在Al和A2较大时很容易越界,混合结果是线性增长的,本发明实施例中,输入的待混音的采样点数据与输出的混音结果的关系是一个二元函数,这里自变量是Al和A2,所采用的二元函数是二元二次函数,其增长幅度不是随着Al和A2线性增长的,相比于要比线性增长慢的多。当Al和A2均大于O时,直接叠加的结果很可能会超出采样位数所能承载的最大音量强度,因此,本发明实施例在混音时,在直接叠加结果中去除一部分音量强度,通过设定混音平衡参数,使混音结果控制在采样位数所能承载的最大音量强度的范围内;当Al和A2均小于O时,类似的,直接叠加结果很可能会低于采样位数所能承载的范围,因此,本发明实施例在混音时,在直接叠加结果中加上一部分音量强度,使混音结果不会低于采样位数所能承载的范围;对于Al、A2不同时为正数或不同时为负数的情况,直接叠加的结果必然控制在采样位数所能承载的范围内,因此,可以直接叠加。步骤103、由所述采样点的采样位数,确定所述混音方式中对应的混音平衡参数m0混音平衡参数可以依据具体的使用环境或实际需要设定,本发明实施例中,若采样点的采样位数记为n,则混音方式中对应的混音平衡参数m可以是m = 2n,也即是采样位数所能承载的最大音量强度值减去I。对于采样位数为16bit的采样数据,混音平衡参数为216,即 32768。以下论述本发明实施例中采用2n作为混音平衡参数,为何能避免削波问题(I)Al和A2都为非负数的情况令Mix (Al, A2) = A1+A2-A1 X A2/32768,这里 Al 和 A2 都属于区间[-32768,32767]。那么一方面,Mix(Al, A2) = AlX (1-A2/32768)+A2 < 32768 X (1-A2/32768)+A2=32768 ;另一方面,由于(1-A2/32768)> 0,所以 Mix (Al,A2) = Al X (1-A2/32768)+A2 >A2 > O ;由此推出,Mix(Al,A2)属于区间
。(2)A1和A2都为负数的情况令Mix (Al, A2) = A1+A2+A1 X A2/32768,这里 Al 和 A2 都属于区间[-32768,32767]。那么一方面,Mix(Al,A2)= AlX (1+A2/32768)+A2 > -32768X (1+A2/32768)+A2=-32768 ;另一方面,由于(1+A2/32768)>0,所以 Mix (Al,A2) = Al X (1+A2/32768)+A2< O ;由此推出,Mix(Al,A2)属于区间[-32768,O]。(3) Al和A2 —正一负的情况很明显,不妨假设Al > O且A2 < 0,那么Mix (Al,A2)=A1+A2 < Al < 32767 ;并且 Mix (Al,A2) > A2 > -32768,所以此时 Mix (Al,A2)属于区间[-32768,32767]。通过以上三种情况的论证可以看出,本发明实施例的混音方法得到的结果始终在区间[-32768,32767],因此不会产生削波的问题。声音采样值是在一定范围内,比如对于16bit的采样数据,其数值范围是[-32768,32767],假设Al和A2标准化(采样值除以其范围端点值)后都在
内,那么避免削波问题的根本即是Mix(Al,A2)仍然在
内,否则产生削波。本发明实施例的方法相当于采样结果进行了标准化,即将原始采样值除以其最大值,16bit的最大值为32768。正数的采样数据标准化后在区间(0,I],负数的采样数据在[_1,0)。以Al = 22000, A2 = 28000为例,匹配到的混音条件为Al和A2都为非负数的情况,相对应的混音方式为A1+A2-A1XA2/32768,得到混音结果为31201,在16bit的表示范围[-32768,32767]内,避免了削波的问题。值得一提的是,在开始的例子中,混音结果(31201)既大于22000,也大于28000,这不是偶然的,因为在样本值都为正数的情况下,Mix (Al, A2) > Al且Mix (Al,A2) > A2,这也说明了混音方法的合理性。步骤104、按照所匹配的混音方式,以及对应的混音平衡参数,对两个采样点进行 混音。将采样点的样点数据匹配对应的混音方式,依据采样位数确定了混音方式中的平衡参数后,便可以按照混音方式进行混音,即按照混音方式,将两个带混音的采样点的音量强度混合,得到采样位数所能承载范围内的音量强度。本发明实施例中,若待混音的音频信号多于两个,则在将所述两路音频信号进行混音后,所述方法还可以进一步包括将所述两路音频信号的混音结果,与其余待混音的音频信号中的其中一个音频信号进行混音。在上面的步骤中论述了本发明实施例的方法将两路音频信号混合时,可以避免削波的问题,进一步,本发明实施例还可以用于对多路音频进行混合,具体的,混合过程中,先提取两个音频进行混合,然后将混音结果与剩余的一个信号进行混音,如此重复执行,直至所有的音频信号均参与混音。相比于现有技术,直接将多路音频信号的音量强度直接叠加,比两路音频信号的叠加更容易超出采样位数所能承载的范围,例如有5轨音频,最后得到的结果将会是MIX =al+a2+a3+a4+a5,当各个采样点的样点数据均为正数或是均为负数时,简单叠加的结果将很有可能超过16bits音频的所能承载最大值32768,这样就会出现削波现象。由于本发明在对两个音频信号混音可以避免削波的问题,因此在多于两个音频信号进行混音时,同样不会出现削波的问题。
综上所述,依据本发明实施例,在对两路音频信号进行混音时,针对不同的采样点数据,预置了多个混音条件和对应的多种混音方式,按照样点数据匹配的混音条件所对应的混音方式,对音频信号进行混音,其中,针对音频信号的采样位数,设定了不同的混音平衡参数,从而保证了混音结果不会超过采样位数所能承载的最大音量强度,避免了现有技术中对音频信号简单的叠加混音时产生的削波问题。本发明实施例用于将多于两个的音频信号进行混音时,先将其中两路音频信号进行混音,然后将混音结果与剩余的一个信号进行混音,如此重复执行,直至所有的音频信号均参与混音,由于本发明在对两个音频信号混音可以避免削波的问题,因此在多于两个音频信号进行混音时,同样不会出现削波的问题。对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。 参考图2,示出了本申请的一种音频信号的混音装置实施例的结构框图,具体可以包括以下模块米样模块201,用于在待混音的两路音频信号中,提取对应同一米样时间的两个米样点;匹配模块202,用于将所述两个采样点的样点数据与预置的混音条件进行匹配,并依据匹配到的混音条件确定对应的混音方式;平衡参数确定模块203,用于由所述采样点的采样位数,确定所述混音方式中对应的混音平衡参数m ;混音模块204,用于按照所匹配的混音方式,以及对应的混音平衡参数,对两个采样点进行混音。在本发明的一种优选实施例中,所述混音条件可以包括多个数值范围,所述样点数据可以为所述采样点的音量强度;所述匹配模块可以包括判断子模块,用于判断两个采样点的音量强度所匹配的数值范围。在本发明的一种优选实施例中,所述采样点的采样位数可以记为n,所述混音方式中对应的混音平衡参数m可以满足m = 2n。在本发明的一种优选实施例中,所述混音条件对应的混音方式可以包括当所匹配的数值范围为Al和A2均大于O时,对应的混音方式为Mix(Al,A2)=Al+A2-AlXA2/m ;当所匹配的数值范围为Al和A2均小于O时,对应的混音方式为Mix (Al,A2)=Al+A2+AlXA2/m ;当所匹配的数值范围为Al和A2均不同时大于0,且不同时小于O时,对应的混音方式为 Mix (Al,A2) = A1+A2 ;其中,Al和A2为两个采样点对应的音量强度,Mix (Al, A2)为混音结果。在本发明的一种优选实施例中,若待混音的音频信号多于两个,则所述混音模块还可以包括多路信号混音子模块,用于将所述两路音频信号的混音结果,与其余待混音的音频信号中的其中一个音频信号进行混音。由于所述装置实施例基本相应于前述图I所示的方法实施例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此就不赘述了。本申请可用于众多通用或专用的计算系统环境或配置中。例如个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类 型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有
更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括所述要素的过
程、方法、物品或者设备中还存在另外的相同要素。以上对本申请所提供的一种音频信号的混音方法和一种音频信号的混音装置进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式
及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
权利要求
1.一种音频信号的混音方法,其特征在于,包括 在待混音的两路音频信号中,提取对应同一采样时间的两个采样点; 将所述两个采样点的样点数据与预置的混音条件进行匹配,并依据匹配到的混音条件确定对应的混音方式; 由所述采样点的采样位数,确定所述混音方式中对应的混音平衡参数m ; 按照所匹配的混音方式,以及对应的混音平衡参数,对两个采样点进行混音。
2.根据权利要求I所述的方法,其特征在于,所述混音条件包括多个数值范围,所述样点数据为所述采样点的音量强度;所述将两个采样点的样点数据与预置的混音条件进行匹配的步骤为 判断两个采样点的音量强度所匹配的数值范围。
3.根据权利要求I所述的方法,其特征在于,所述采样点的采样位数记为n,所述混音方式中对应的混音平衡参数m满足m = 2n。
4.根据权利要求2所述的方法,其特征在于,所述混音条件对应的混音方式包括 当所匹配的数值范围为Al和A2均大于O时,对应的混音方式为Mix(Al,A2)=Al+A2-AlXA2/m ; 当所匹配的数值范围为Al和A2均小于O时,对应的混音方式为Mix(Al,A2)=Al+A2+AlXA2/m ; 当所匹配的数值范围为Al和A2均不同时大于O,且不同时小于O时,对应的混音方式为 Mix (Al, A2) = A1+A2 ; 其中,Al和A2为两个采样点对应的音量强度,Mix (Al, A2)为混音结果。
5.根据权利要求I所述的方法,其特征在于,若待混音的音频信号多于两个,则在将所述两路音频信号进行混音后,所述方法还包括 将所述两路音频信号的混音结果,与其余待混音的音频信号中的其中一个音频信号进行混音。
6.一种音频信号的混音装置,其特征在于,包括 米样模块,用于在待混音的两路音频信号中,提取对应同一米样时间的两个米样点; 匹配模块,用于将所述两个采样点的样点数据与预置的混音条件进行匹配,并依据匹配到的混音条件确定对应的混音方式; 平衡参数确定模块,用于由所述采样点的采样位数,确定所述混音方式中对应的混音平衡参数m ; 混音模块,用于按照所匹配的混音方式,以及对应的混音平衡参数,对两个采样点进行混音。
7.根据权利要求6所述的装置,其特征在于,所述混音条件包括多个数值范围,所述样点数据为所述采样点的音量强度;所述匹配模块包括判断子模块,用于判断两个采样点的音量强度所匹配的数值范围。
8.根据权利要求6所述的装置,其特征在于,所述采样点的采样位数记为n,所述混音方式中对应的混音平衡参数m满足m = 2n。
9.根据权利要求7所述的装置,其特征在于,所述混音条件对应的混音方式包括 当所匹配的数值范围为Al和A2均大于O时,对应的混音方式为Mix(Al,A2)=Al+A2-AlXA2/m ; 当所匹配的数值范围为Al和A2均小于O时,对应的混音方式为Mix(Al,A2)=Al+A2+AlXA2/m ; 当所匹配的数值范围为Al和A2均不同时大于O,且不同时小于O时,对应的混音方式为 Mix(Al, A2) = A1+A2 ; 其中,Al和A2为两个采样点对应的音量强度,Mix (Al, A2)为混音结果。
10.根据权利要求6所述的装置,其特征在于,若待混音的音频信号多于两个,则所述混音模块还包括 多路信号混音子模块,用于将所述两路音频信号的混音结果,与其余待混音的音频信号中的其中一个音频信号进行混音。
全文摘要
本发明实施例提供了一种音频信号的混音方法和装置。所述方法包括在待混音的两路音频信号中,提取对应同一采样时间的两个采样点;将所述两个采样点的样点数据与预置的混音条件进行匹配,并依据匹配到的混音条件确定对应的混音方式;由所述采样点的采样位数,确定所述混音方式中对应的混音平衡参数m;按照所匹配的混音方式,以及对应的混音平衡参数,对两个采样点进行混音。本发明可以避免音频信号混音时产生的削波问题。
文档编号G10L19/008GK102968995SQ201210466260
公开日2013年3月13日 申请日期2012年11月16日 优先权日2012年11月16日
发明者徐岱, 苏文涛 申请人:新奥特(北京)视频技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1