音频信号产生装置的制作方法

文档序号：7680202阅读：269来源：国知局

专利名称：音频信号产生装置的制作方法
技术领域：
本发明涉及通过通信网络进行的移动通信。
背景技术：
为了编码多通道音频信号，可以应用下列参考资料中所介绍的参数立体声音频编码或多通道音频编码C. Faller和F. Baumgarte合著的《Eff icientrepresentationof spatial audio using perceptual parametrization)),于 2001 年 10 月发表在((Proc. IEEE Workshop on AppI. of Sig. Proc. to Audioand Acoust.》中，第 199-202页；C. Faller 和 F. Baumgarte 合著的〈〈BinauralCue Coding A novel and efficientrepresentation of spatial audio》，于 2002 年 5 月发表在《Proc. ICASSP》中，第 2 卷第1841-1844 页;E. Schui jers、ff. Oomen> B. den Brinker 和 J. Breebaart 合著的((Advancesin parametriccoding for high-quality audio〉〉，于 2003 年 3 月发表在〈〈Preprint 114th Conv. Aud. Eng. Soc.》中；F. Baumgarte 和 C. Faller 合著的《Binaural Cue Coding-PartI Psychoacoustic fundamentals and design principles)),于 2003 年 11 月发表在《IEEE Trans, on Speech and Audio Proc.》中，第 11 卷第 6 期第 509-519 页；C. Faller和 F. Baumgarte 合著的〈〈Binaural Cue Coding-Part II Schemes and applications)),于2003年11月发表在《IEEE Trans, on Speech and Audio Proc.》中，第11卷第6期第520-531页。传统的参数立体声音频编码方法或多通道音频编码方法采用下混来生成混音音频信号，这种音频信号的通道要少于原始多通道音频信号的通道。混音音频信号包含的通道信号可以是波形编码形式的，而涉及原始信号通道关系的边信息可以添加到已编码通道音频。解码器可以使用这些边信息根据已解码的波形编码音频通道信号重新生成原始数量的音频通道信号。如果音频通道信号是独立的，可以通过对输入的多个音频通道信号求和来生成混音音频信号。但是，如果音频通道信号不是独立的(这种情况对于立体声和多通道音频信号很常见)，则上述求和操作可能会导致声音的音调发生变化，因为通道信号间的统计数据会随时间而变化。要缓解这个问题，其中一个解决方法是采用幅度均衡法，如A. Baumgarte,C. Faller 和 P. Kroon 合著的论文〈〈Audio coder enhancement using scalable binauralcue coding withequalized mixing》中所述(于 2004 年 5 月发表在《Preprint 116thConv. Aud. Eng. Soc.》中)。但是，如果原始音频通道信号之间存在时延，则幅度均衡法并不一定足以纠正消除信号(在为生成混音信号添加异相信号时进行消除)带来的不良效应。当由录音师进行了混音的音乐使用通道间时延、倒相间时延或间隔麦克风之间的时延来进行录音时，就会出现这个问题。在将参数立体声或多通道音频编码用于语音应用(例如，电话或IP语音)的情况下，如果在电话会议上使用多个麦克风来获取语音，则可能会出现上述问题
发明内容
本发明的一个目的是提供一个能够更高效地从多个音频通道信号生成混音信号的概念。本发明基于这样一个研究结果在对表现为输入音频通道信号的音频通道信号求和之前使用时自适应相位校准可以更高效地生成混音音频信号。在组合生成的音频通道信号以获得混音信号时，进行相位校准可以减少信号消除，而且可以逐帧地和/或根据一个求平均值过程(对于多个帧)进行相位校准。另外，除了求平均值过程，还可以采用幅度均衡法。根据第一方面，本发明涉及一种音频信号产生装置，该音频信号产生装置用于从包括第一音频通道信号和第二音频通道信号的多通道音频信号生成混音音频信号，它包括一个处理器和一个合成单元，该处理器使用第一相移系数来修改第一音频通道信号的相位，和/或使用第二相移系数来修改第二音频通道信号的相位，使得合成修改后的第一音频通道信号和第二音频通道信号时减少信号消除；该合成单元用于合成修改后的第一音频通道信号和第二音频通道信号以获得混音音频信号。根据第一方面的一种实施形式，该处理器可用于修改第一音频通道信号的相位和/或第二音频通道信号的相位，以匹配参考信号的相位。参考信号可以是预定的参考信号，也可以是从第一音频信号和第二音频信号生成的信号。根据第一方面的一种实施形式，该处理器可用于确定第一音频通道信号与第二音频通道信号之乘积的平均值，以获得第一相移因子和/或第二相移因子。可以根据求平均值过程通过对这些乘积(例如，针对多个帧)进行求和来确定该平均值。根据第一方面的一种实施形式，该处理器可用于将第一相移系数或第二相移系数设为I。因此，可以只修改一个音频通道信号的相位。根据第一方面的一种实施形式，第一相移系数是第二相移系数的复共轭形式。要获得第一相移系数或第二相移系数的复共轭形式，可以转换其虚数部分的符号。根据第一方面的一种实施形式，该处理器可用于根据以下公式确定第一相移系数P1Gi, )和第二相移系数P2(k，i)，其中，k表示时间指数，I表示频率指数
权利要求
1.一种音频信号产生装置，用于从包含第一音频通道信号和第二音频通道信号的多通道音频信号生成混音音频信号，该音频信号产生装置包括一个处理器(103)，用于使用第一相移系数修改第一音频通道信号的相位，和/或使用第二相移系数修改第二音频通道信号的相位，使得合成修改后的第一音频通道信号和第二音频通道信号时减少信号消除；以及一个合成单元(109)，用于合成修改后的第一音频通道信号和第二音频通道信号以获得混音音频信号。
2.根据权利要求I所述的音频信号产生装置，其中所述处理器(103)用于修改第一音频通道信号的相位或第二音频通道信号的相位，以匹配参考信号的相位。
3.根据权利要求I或2所述的音频信号产生装置，其中所述处理器(103)用于确定第一音频通道信号与第二音频通道信号之乘积的平均值，以获得第一相移因子或第二相移因子。
4.根据上述任何权利要求之一所述的音频信号产生装置，其中所述处理器(103)用于将第一相移系数或第二相移系数设为I。
5.根据上述任何权利要求之一所述的音频信号产生装置，其中所述第一相移系数是第二相移系数的复共轭形式。
6.根据上述任何权利要求之一所述的音频信号产生装置，其中所述处理器(103)根据以下公式确定第一相移系数P1 (k，i)和第二相移系数P2 (k，i)，其中，k表示时间指数，i表示频率指数 P1 (k, i) = I rEjXl(U)XUk J)\ 其中，Xi(k，i)和X2(k，i)分别表示第一音频通道信号和第二音频通道信号，E{.}表示求平均值运算。
7.根据上述任何权利要求之一所述的音频信号产生装置，其中所述处理器(103)根据以下公式确定第一相移系数P1 (k，i)和第二相移系数P2 (k，i)，其中，k表示时间指数，i表示频率指数P1 (k, i) = P(k，i)* P2 (k, i) = P(k, i) Pik 0 = InXl(Ki)Xlikjy] 其中，Xi(k，i)和X2(k，i)分别表示第一音频通道信号和第二音频通道信号，E{.}表示求平均值运算。
8.根据上述任何权利要求之一所述的音频信号产生装置，其中所述处理器(103)根据以下公式确定第一相移系数P1 (k，i)和第二相移系数P2 (k，i)，其中，k表示时间指数，i表示频率指数
9.根据上述任何权利要求之一所述的音频信号产生装置，其中所述处理器(103)通过功率因数对混音信号进行加权，尤其是功率因数依赖于第一音频通道信号和第二音频通道信号的功率之和。
10.根据上述任何权利要求之一所述的音频信号产生装置，其中所述合成单元(109)可用于叠加第一辅助信号和第二辅助信号来获得混音信号。
11.根据上述任何权利要求之一所述的音频信号产生装置，其中所述处理器(103)可用于将第一音频通道信号乘以第一相移系数，或者将第二音频通道信号乘以第二相移系数，以便进行相位修改。
12.根据上述任何权利要求之一所述的音频信号产生装置，该音频信号产生装置还包括一个转换器(101)，该转换器用于将第一时域信号转换为频域信号以获得第一音频通道信号，以及将第二时域信号转换为频域信号以获得第二音频通道信号。
13.根据上述任何权利要求之一所述的音频信号产生装置，其中所述混音音频信号是频域信号，而该音频信号产生装置还包括一个转换器(113)，该转换器用于将混音音频信号转换为时域信号。
14.一种用于从包含第一音频通道信号和第二音频通道信号的多通道音频信号生成混音音频信号的方法，该方法包括使用第一相移系数来修改第一音频通道信号的相位，以便在合成生成的第一音频通道信号和第二音频通道信号时减少信号消除(步骤201);和/或使用第二相移系数来修改第二音频通道信号的相位，以便在合成生成的第一音频通道信号和第二音频通道信号时减少信号消除(步骤203);以及合成修改后的第一音频通道信号和第二音频通道信号以获得混音音频信号(步骤205)。
全文摘要
本发明涉及一种用于从包含第一音频通道信号和第二音频通道信号的多通道音频信号生成混音音频信号的音频信号产生装置。该音频信号产生装置包括一个处理器(103)，用于使用第一相移系数来修改第一音频通道信号的相位，和/或使用第二相移系数来修改第二音频通道信号的相位，使得合成修改后的第一音频通道信号和第二音频通道信号时减少信号消除；和一个合成单元(109)，用于合成修改后的第一音频通道信号和第二音频通道信号以获得混音音频信号。
文档编号H04S5/00GK102986254SQ201080067974
公开日2013年3月20日申请日期2010年7月12日优先权日2010年7月12日
发明者富勒·克里斯托弗, 郎玥, 许剑峰申请人:华为技术有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：富勒·克里斯托弗;郎玥;许剑峰
技术所有人：华为技术有限公司
我是此专利的发明人

上一篇：用于可配置双集群资源分配的信令的制作方法
上一篇：用于使用事件分析通信系统的操作的方法和装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。