一种多声道音频信号缩混方法及系统的制作方法

文档序号:7924435阅读:272来源:国知局
专利名称:一种多声道音频信号缩混方法及系统的制作方法
技术领域
本发明涉及音频信号的处理,尤其涉及一种多声道音频信号缩混方法及系统。
背景技术
在音频编辑播放软件,以及各种多媒体应用软件中,都会遇到将多声道音频信号 (如5. 1声道)变为单声道信号的情况,即DownMix (向下缩混,简称缩混)算法。DownMix是音视频播放及编辑软件,以及各种音视频聊天等各种应用中基本的算法,能够取得计算效率和听觉效果上的双重收获,具有很重要的意义。如下情况需要将多声道信号变为单声道信号
1、编解码中,比如AAC(Advanced Audio Coding,高级音频编码)编解码中,为了减少编码数据量,通常将多声道信号变为单声道信号,之后再重新根据频率的对应关系还原为多声道(这个过程还是可逆的);
2、在播放设备比较单一的情况下,例如只有一个音响的情况下;
3、在网络传输过程中,为了节省传输的数据量,尤其对于像网上音频信号这样对声道要求不敏感,但是对数据量大小限制很强的情况下;
4、在多人语音中,多个人说话汇合一下,统一到一个声卡中,播放时感觉是一个声道过来的,而不是很多个声道一个个过来。在AAC编解码中有一个比较典型的DownMix,但是此算法需要比较复杂的计算公式,而且效果并不突出。而另外的一些算法多是将多路信号相加求均值,算法很武断,效果很差。

发明内容
本发明要解决的技术问题在于,针对现有技术的上述DownMix算法复杂、效果差的缺陷,提供一种算法简单又效果好的多声道音频信号缩混方法。本发明解决其技术问题所采用的技术方案是构造一种多声道音频信号缩混方法,包括
预先接收的来自两个不同声道的音频信号; 按照下面公式计算缩混后的单声道音频信号 y(t)= w*sl (t)+w*s2(t)
其中,y(t)为缩混后的单声道音频信号,si (t)为第一声道的音频信号,s2(t)为第二声道的音频信号,w为权值,且满足0. 58 < w < 0. 7。在本发明所述的多声道音频信号缩混方法中,在所接收的音频信号来自超过两个声道时,将超过两个声道的音频信号转化为两个声道的音频信号,且该步骤具体为
逐个声道地判断所接收的音频信号为有声音频信号或为无声信号,筛选出有声音频信号并忽略掉无声信号;
对有声音频信号进行主次路分析,将主路音频信号作为第一声道的音频信号,并将所有次路音频信号相加后再求均值,以形成第二声道的音频信号。在本发明所述的多声道音频信号缩混方法中,所述w=0. 618。在本发明所述的多声道音频信号缩混方法中,所述第一声道的音频信号和第二声道的音频信号的幅度均不超过所能存储的最大幅度信号的幅度的0. 81倍。本发明还构造一种多声道音频信号缩混系统,包括 接收模块,用于预先接收的来自两个不同声道的音频信号; 计算模块,用于按照下面公式计算缩混后的单声道音频信号 y(t)= w*sl (t)+w*s2(t)
其中,y(t)为缩混后的单声道音频信号,si (t)为第一声道的音频信号,s2(t)为第二声道的音频信号,w为权值,且满足0. 58 < w < 0. 7。在本发明所述的多声道音频信号缩混系统中,所述混合系统还包括
两声道音频信号获得模块,用于在所接收的音频信号来自超过两个声道时,将超过两个声道的音频信号转化为两个声道的音频信号; 其中,所述两声道音频信号获得模块包括
判断及筛选单元,用于逐个声道地判断所述超过两个声道的音频信号为有声音频信号或为无声信号,筛选出有声音频信号并忽略掉无声信号;
主次路分析单元,用于对有声音频信号进行主次路分析,将主路音频信号作为第一声道的音频信号,并将所有次路音频信号相加后再求均值,以形成第二声道的音频信号。在本发明所述的多声道音频信号缩混系统中,所述w=0. 618。在本发明所述的多声道音频信号缩混系统中,所述第一声道的音频信号和第二声道的音频信号的幅度均不超过所能存储的最大幅度信号的幅度的0. 81倍。实施本发明的技术方案,通过将来自两个不同声道的音频信号分别乘以权值后再相加便可得到缩混后的单声道音频信号,因此算法复杂度低,易于实现,而且由于权值在 0. 58和0. 7之间,使混合后的声音听起来更有美感。


下面将结合附图及实施例对本发明作进一步说明,附图中 图1是本发明一种多声道音频信号缩混方法实施例一的流程图; 图2是本发明一种多声道音频信号缩混方法实施例二的流程图; 图3是本发明一种多声道音频信号缩混系统实施例一的流程图; 图4是本发明一种多声道音频信号缩混系统实施例二的流程图。
具体实施例方式如图1所示,在本发明一种多声道音频信号缩混方法实施例一的流程图中,该混合方法包括以下步骤
S100.预先接收的来自两个不同声道的音频信号; S200.按照下面公式计算缩混后的单声道音频信号 y(t)= w*sl (t)+w*s2(t)
其中,y(t)为缩混后的单声道音频信号,si (t)为第一声道的音频信号,s2(t)为第二声道的音频信号,w为权值,且满足0. 58 < w < 0. 7。假设sl(t)和s2(t)为来自双声道的两路音频信号,由于si (t)和s2(t)是属于一个信号的两个声道,因此,si (t)和s2(t)具有很强的相关性,比如伴奏与说唱,因此,关键是找出一个合适的权值来平衡该两路音频信号si (t)和s2(t)在最终缩混的信号中贡献。考虑到人耳的特性,以及双声道信号的相关性,为两路音频信号si (t)和s2(t)分别分配一个权值w,且0. 58 < w < 0. 7,该两路音频信号si (t)和s2 (t)分别与权值相乘后,再相加,便得到缩混后的单声道音频信号。因此,该多声道音频信号缩混方法算法复杂度低, 易于实现,而且由于权值在0. 58和0. 7之间,使混合后的声音听起来更有美感。上述实施例的混合方法主要针对了双声道音频信号转化为单声道音频信号的情况,对于5.1声道音频信号转为单声道音频信号的情况,例如,在实际VOIP (Voice over Internet Protocol,网络电话)中100路混音的时候,经常有声音的部分只是其中一路,其它路处于聆听阶段,或是交替说话阶段,此时,可结合图2所示的本发明一种多声道音频信号缩混方法实施例二的流程图进行音频信号的缩混,即,在所接收的音频信号来自超过两个声道时,首先将该超过两个声道的音频信号转化为两个声道的音频信号,然后再按照图1 所示的实施例一的方法进行缩混。该实施例的缩混方法具体包括以下步骤
5001.逐个声道地判断所接收的音频信号为有声音频信号或为无声信号,筛选出有声音频信号并忽略掉无声信号;
5002.对有声音频信号进行主次路分析,将主路音频信号作为第一声道的音频信号,并将所有次路音频信号相加后再求均值,以形成第二声道的音频信号;
S100.预先接收的来自两个不同声道的音频信号; S200.按照下面公式计算缩混后的单声道音频信号 y(t)= w*sl (t)+w*s2(t)
其中,y(t)为缩混后的单声道音频信号,si (t)为第一声道的音频信号,s2(t)为第二声道的音频信号,w为权值,且满足0. 58 < w < 0. 7。在上述两个实施例中的多声道音频信号缩混方法中,权值优选黄金分割点,即 w=0. 618。在上述两个实施例中的多声道音频信号缩混方法中,所述第一声道的音频信号和第二声道的音频信号的幅度均不超过所能存储的最大幅度信号的幅度的0. 81倍。应当说明的是,根据对音频信号的分析可以认为,此权值造成信号的溢出是小概率事件。假设所能存储的最大幅度信号为16bit量化信号,幅度位于[-32768,32767],假设实际幅度最大值 x/32768 = ρ,则在两路音频信号的情况下为了保证不溢出,则有2*ρ*0. 618 = 1 (此时,权值取0.618),解方程得ρ约为0.81。即两路音频信号的最大幅度只需要是32768的0.81 倍即可保证不溢出。而对于音乐信号一般有主次之分,同时达到最大的可能性也更小,因此溢出是小概率事件。并且当溢出发生时,只用饱和运算下即可解决。在图3所示的多声道音频信号缩混系统中,该缩混系统包括依次相连的接收模块 100和计算模块200。其中,接收模块100用于预先接收的来自两个不同声道的音频信号; 计算模块200用于按照下面公式计算缩混后的单声道音频信号
y(t)= w*sl (t)+w*s2(t)
其中,y(t)为缩混后的单声道音频信号,si (t)为第一声道的音频信号,s2(t)为第二声道的音频信号,w为权值,且满足0. 58 < w < 0. 7。在图4所示的多声道音频信号缩混系统中,该缩混系统包括依次相连的两声道音频信号获得模块000、接收模块100和计算模块200。其中,接收模块100和计算模块200与图3所示的实施例中的相应模块的逻辑结构相同,在此不做赘述,以下仅说明两声道音频信号获得模块000,该两声道音频信号获得模块000用于在所接收的音频信号来自超过两个声道时,将超过两个声道的音频信号转化为两个声道的音频信号。其中,所述两声道音频信号获得模块000进一步包括依次相连的判断及筛选单元001和主次路分析单元002。而且,判断及筛选单元001用于逐个声道地判断所述超过两个声道的音频信号为有声音频信号或为无声信号,筛选出有声音频信号并忽略掉无声信号;主次路分析单元002用于对有声音频信号进行主次路分析,将主路音频信号作为第一声道的音频信号,并将所有次路音频信号相加后再求均值,以形成第二声道的音频信号。在上述实施例的多声道音频信号的缩混系统中,优选地,权值w=0. 618。在上述实施例的多声道音频信号的缩混系统中,优选地,所述第一声道的音频信号和第二声道的音频信号的幅度均不超过所能存储的最大幅度信号的幅度的0. 81倍。以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。
权利要求
1.一种多声道音频信号缩混方法,其特征在于,包括 预先接收的来自两个不同声道的音频信号;按照下面公式计算缩混后的单声道音频信号 y(t)= w*sl (t)+w*s2(t)其中,y(t)为缩混后的单声道音频信号,si (t)为第一声道的音频信号,s2(t)为第二声道的音频信号,w为权值,且满足0. 58 < w < 0. 7。
2.根据权利要求1所述的多声道音频信号缩混方法,其特征在于,在所接收的音频信号来自超过两个声道时,首先将超过两个声道的音频信号转化为两个声道的音频信号,且该步骤具体为逐个声道地判断所接收的音频信号为有声音频信号或为无声信号,筛选出有声音频信号并忽略掉无声信号;对有声音频信号进行主次路分析,将主路音频信号作为第一声道的音频信号,并将所有次路音频信号相加后再求均值,以形成第二声道的音频信号。
3.根据权利要求1或2所述的多声道音频信号缩混方法,其特征在于,所述w=0.618。
4.根据权利要求3所述的多声道音频信号缩混方法,其特征在于,所述第一声道的音频信号和第二声道的音频信号的幅度均不超过所能存储的最大幅度信号的幅度的0. 81 倍。
5.一种多声道音频信号缩混系统,其特征在于,包括接收模块,用于预先接收的来自两个不同声道的音频信号; 计算模块,用于按照下面公式计算缩混后的单声道音频信号 y(t)= w*sl (t)+w*s2(t)其中,y(t)为缩混后的单声道音频信号,si (t)为第一声道的音频信号,s2(t)为第二声道的音频信号,w为权值,且满足0. 58 < w < 0. 7。
6.根据权利要求5所述的多声道音频信号缩混系统,其特征在于,所述混合系统还包括两声道音频信号获得模块,用于在所接收的音频信号来自超过两个声道时,将超过两个声道的音频信号转化为两个声道的音频信号; 其中,所述两声道音频信号获得模块包括判断及筛选单元,用于逐个声道地判断所述超过两个声道的音频信号为有声音频信号或为无声信号,筛选出有声音频信号并忽略掉无声信号;主次路分析单元,用于对有声音频信号进行主次路分析,将主路音频信号作为第一声道的音频信号,并将所有次路音频信号相加后再求均值,以形成第二声道的音频信号。
7.根据权利要求5或6所述的多声道音频信号缩混系统,其特征在于,所述w=0.618。
8.根据权利要求7所述的多声道音频信号缩混系统,其特征在于,所述第一声道的音频信号和第二声道的音频信号的幅度均不超过所能存储的最大幅度信号的幅度的0. 81 倍。
全文摘要
本发明公开了一种多声道音频信号缩混方法及系统,多声道音频信号缩混方法包括预先接收的来自两个不同声道的音频信号;按照下面公式计算缩混后的单声道音频信号y(t)=w*s1(t)+w*s2(t),其中,y(t)为缩混后的单声道音频信号,s1(t)为第一声道的音频信号,s2(t)为第二声道的音频信号,w为权值,且满足0.58≤w≤0.7。本发明还构造一种多声道音频信号缩混系统。实施本发明的技术方案,算法复杂度低,易于实现,而且使缩混后的声音听起来更有美感。
文档编号H04S5/00GK102395097SQ20111029333
公开日2012年3月28日 申请日期2011年9月29日 优先权日2011年9月29日
发明者赵伟峰 申请人:深圳市万兴软件有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1