一种用于处理音频信号的方法和设备的制作方法

文档序号：7794182阅读：114来源：国知局

一种用于处理音频信号的方法和设备的制作方法
【专利摘要】本发明通常涉及一种音频信号处理方法和装置，用于处理一音频信号，并且此方法包括的步骤如下：接收一缩混（DMX）信号；接收通道间相位差（IPD）信息，通道间相位差信息对应于第一相位通道和第二相位通道间的相位差；接收一通道电平差，通道电平差对应于第一相位通道和第二相位通道间的电平差；判定基于通道电平差的第一权重和第二权重的定义；根据判定的定义，使用IPD计算第一权重和第二权重；产生总的相位差（OPD）信息，基于第一权重和第二权重，总的相位差信息对应于第一相位通道和DMX信号间的相位差。
【专利说明】一种用于处理音频信号的方法和设备

【技术领域】
[0001] 本发明通常涉及一种音频信号处理方法和装置，可用于处理音频信号，尤其是涉及一种音频信号处理方法和设备，可用于编码或解码音频信号。

【背景技术】
[0002] 通常，随着大规模视频图像的使用，需要向听众提供一种具有沉浸感的音频，类似声音环绕于聆听着的周围。为了提高环绕立体声的临场感受和身临其境的环绕感觉，声频通道的数量可大于2个通道或5. 1个通道。音频信号可处理的通道数量（例如，22. 2个通道）最多可至数十个。

【发明内容】

[0003] 抟术问是页
[0004] 多个通道的最多可至数十个的信号，可通过一编码器进行缩混，这个缩混信号可传输至一解码器。缩混信号必须被解码器分离，以便使之接近于原始的通道信号。
[0005] 抟术方案
[0006] 本发明关注上述的问题，因此本发明的目的是提供一种音频信号处理方法和设备，可通过使用一从编码器接收的上混参数（例如，一通道间相位差），上混一或多个缩混的通道信号为两个或多个通道信号。
[0007] 本发明的另一目的是提供一音频信号处理方法和设备，它是如此配置，即当通道间相位差（IPD)从编码器收到相应的第一相位通道和第二相位通道间的相位差时，可使用 iro产生一总的相位差（0PD)，总的相位差对应于第一相位通道和缩混信号间的相位差。
[0008] 本发明的进一步目的是提供一音频信号处理方法和设备，可以应用权重，从一通道间相位差（IPD)中产生一总的相位差（0PD)，以防止在第一相位通道（例如，左声道）和第二相位通道间（例如，右声道）间的相位差约为180°时，产生一错误。
[0009] 本发明的另一目的是提供一音频信号处理方法和设备，可根据第一相位通道使用权重的水平，改变第一相位通道（例如，左声道）使用的第一权重的定义。
[0010] 本发明的另一目的是提供一音频信号处理方法和设备，它在从一编码器中接收上混参数和一上混残余信号时，有选择的在一缩混信号上使用此上混参数和上混残余信号，因而通过差异化设置输出信号的信道数量，进行了可扩展的音频上混。
[0011] 为了完成上述目标，本发明提供了一种音频信号处理方法，包括接收一缩混信号，接收通道间相位差（IPD)信息，通道间相位差信息对应于第一相位通道和第二相位通道间的相位差；接收一通道电平差（CLD)，通道电平差对应于第一相位通道和第二相位通道间的电平差；判定了基于CLD的第一权重和第二权重的定义；基于已判定的定义，使用IH)计算第一权重和第二权重；以及产生总的相位差（0PD)信息，基于第一权重和第二权重，总的相位差信息对应于第一相位通道和缩混信号间的相位差。
[0012] 本发明的音频信号处理方法可进一步包括：使用总的相位差（0PD)和缩混信号产生第一相位通道和第二相位通道。
[0013] 本发明的定义包括一第一定义和一第二定义，其中根据IPD，当第一相位通道的电平值大于第二相位通道的电平值时，第一权重可大于第二权重。而根据IPD，当第二相位通道的电平值大于第一相位通道的电平值时，第二权重可大于第一权重。
[0014] 本发明的另一目的是提供一音频信号处理设备，包括一多路分解单元，用于接收一缩混信号，接收一通道间相位差（iro)，通道间相位差对应于第一相位通道和第二相位通道间的相位差，以及接收一通道电平差（CLD)，通道电平差对应于第一相位通道和第二相位通道间的电平差；一权重定义判定单元，用于判定基于通道电平差的第一权重和第二权重间的定义；一权重产生单元，用于基于定义使用iro计算第一权重和第二权重；以及一总的相位差（0PD)产生单兀，用于基于第一权重和第二权重，产生0PD信息，0PD信息对应于第一相位通道和缩混信号间的相位差。
[0015] 本发明的装置可进一步包括一 (PD应用单元，用于使用(PD和缩混信号，产生第一相位通道和第二相位通道。
[0016] 本发明的定义包括一第一定义和一第二定义，其中根据IPD，当第一相位通道的电平值大于第二相位通道的电平值时，第一权重可大于第二权重。而根据IPD，当第二相位通道的电平值大于第一相位通道的电平值时，第二权重可大于第一权重。
[0017] 本发明的另一目的是提供一音频信号处理方法，包括接收一缩混信号，接收一通道间相位差（iro)，通道间相位差对应于第一相位通道和第二相位通道间的相位差；接收一通道电平差，通道电平差对应于第一相位通道和第二相位通道间的电平差；计算一应用于第一相位通道的第一权重，以及计算一应用于第二相位通道的第二权重；基于通道电平差，判定一第一相位通道和缩混信号之和的定义；以及产生总的相位差（opd)信息，根据之前总和的定义，基于第一权重和第二权重，总的相位差信息对应于第一相位通道和缩混信号间的相位差。
[0018] 本发明的方法可进一步包括，使用oro和缩混信号，产生第一相位通道和第二相位通道。
[0019] 本发明的总和定义可包括一第一总和定义和一第二总和定义，其中根据IPD，当第一相位通道的电平值大于第二相位通道的电平值时，在第一总和定义中的第一权重可大于第二权重。而根据IPD，当第二相位通道的电平值大于第一相位通道的电平值时，在第二总和定义中的第二权重可大于第一权重。
[0020] 本发明的另一目的是提供一音频信号处理方法，包括接收一缩混信号，接收一或多个上混参数和一上混残余信号；当收到上混参数是，对缩混信号使用此上混参数，因而产生了 M参数输出通道；当收到上混参数和一上混残余信号时，对缩混信号使用此上混参数和上混残余信号，因而产生了 N离散输出通道。
[0021] 有益效果
[0022] 本发明提供了以下的有益效果。
[0023] 首先，既然一缩混信号可以通过使用上混参数，上混为5. 1通道或更多通道的多通道信号，因而相对于多通道信号编码没有变化，此方法的比特效率提高了。
[0024] 其次，既然扬声器设置为单声道或立体声格式，当缩混信号在不需一上混步骤时，没有必要在一 5. 1通道或更多通道的信号被重建后缩混一重建的多通道信号，因而减少了计算负荷和复杂性。
[0025] 第三，既然基于一通道间相位差（iro)，可计算总的相位差（0PD)，因此不需要单独的传输0PD，因而减少了比特数量。
[0026] 第四，在为了上混而产生一 (PD时，使用了权重，因而当在第一相位通道和第二相位通道间间的相位差约为180°时，减少了发生的破坏性的干涉效果。
[0027] 第五，如果在第一相位通道的电平较低的情况下使用较高的权重，可防止增加的失真的现象。
[0028] 第六，一解码单元具有一可扩展结构，因此根据独立设备的扬声器设置，比特流的解码电平为差异化的设置，因而不仅增加了比特效率，而且减少了计算负荷和复杂性。

【专利附图】

【附图说明】
[0029] 图1是一示意图，根据图像（UHDTV和HDTV)的尺寸，显示了在相同的视距内的视角；
[0030] 图2是一示意图，作为一多通道实例显示了 22. 2个通道的扬声器的分配；
[0031] 图3是一示意图，显示了一缩混多通道信号的步骤；
[0032] 根据本发明的一实施例，图4是一示意图，显示了解码器的配置。
[0033] 图5说明了图4的输出通道产生单元120的第一实施例；
[0034] 图6说明了图4的输出通道产生单元120的第二实施例；
[0035] 图7说明了图4的输出通道产生单元120的第三实施例；
[0036] 图8是一详细的示意图，显示了图5至图7的上混单元122的实施例；
[0037] 图9是一不意图，显不了由相位差引起的失真现象；
[0038] 根据本发明的另一实施例，图10是一示意图，显示了一编码器和解码器的配置；以及
[0039] 根据本发明的一实施例，图11是一产品的示意配置图，其中使用了一音频信号处理设备。具体实施例
[0040] 在下文中，本发明的优选的实施例将会结合附图进行详细的描述。在此之前，应当注意文中使用的术语和单词及权利要求不应当翻译成限定于普通的含义或词典的定义，并且应当理解，本发明具有的含义和概念中的技术精髓，是基于
【发明者】能恰当的定义术语的概念原则的基础上的，以便更好的描述他或她的发明。因而，文中描述的实施例和附图中说明的配置并不是优选的例子，并且没有完全的展现本发明的技术精神。因此，在本发明申请的同时，还会有不同的等同物和修改替代此实施例和配置。
[0041] 本发明的术语可以基于以下标准翻译，并且即使未在本文中描述的术语，也可以根据下述要点翻译。根据语境，代码可翻译成编码或解码，而信息是一术语，包含值，参数，系数，元素等，并可依据语境翻译，但是本发明并不仅限于上述含义。
[0042] 图1是一示意图，根据图像（例如，超高清电视（UHDTV)和高清晰度电视（HDTV)) 的尺寸，显示了在相同的视距内的视角。随着显示器的产品技术的发展和消费者需求的增力口，图像的尺寸呈一增长趋势。如图1所示，一幅UHDTV图像（7680*4320像素图像）的尺寸比一幅HDTV图像（1920*1080像素图像）的尺寸大约大16倍。当一 HDTV安装于起居室的墙面上，而观看者以一预设的视距坐在沙发上时，视角可以为30°。然而，当一 UHDTV以相同视距安装时，视角可达到100°。这样，当安装一高质量的和高分辨率的屏幕时，优选的提供高真实感的和高还原性的声音，以便与大尺寸的视频相一致。为提供这样一种环境，以便让观察者有身临其境的感觉，只提供一或两个环绕的通道扬声器时不够的。因而，需要一种多通道音频环境，具有大量的扬声器和通道。
[0043] 如上所述，除了一家庭影院外，可能的环境还有，一个人3D TV，一智能电话TV，一 22. 2通道音频程序，一传播媒介，一 3D视频，一远程呈现室，基于云的游戏，等。
[0044] 图2是一示意图，显示了一多通道环境实例，其中说明了 22. 2通道扬声器的配置。 22. 2通道可以是一多通道环境的实例，用于提高声场效果，并且本发明并不仅限于特定数据的通道或特定的扬声器分配。参考图2,可以为顶层提供总共9条通道。也就是，可看到总共设置了 9个扬声器，3个设置于顶部前端，3个设置于顶部中间，3个设置于顶部后端。在中间层，5个扬声器可设置于前端，2个设置侧边位置，3个设置于后端。在前端的5个扬声器中间，中间3个扬声器可以包括在TV显示屏内。在底层，在前部位置可安装3个通道和2个低频效果（LFE)通道。
[0045] 这样，在传输和再生产一至多数十个通道的多通道信号时，可能需要一高计算负荷。进一步的，考虑到通信环境等，也可能需要高压缩率。此外，在标准的家庭中，一多通道的（例如，22. 2通道）扬声器环境并不是经常拥有的，并且许多听众具有2通道或5. 1通道设备。因而，在信号被各自的解码为一多通道信号后，以普通方式传输至所有用户的信号被发送出去的情况下，当多通道信号必须被转换回2通道和5. 1通道信号时，无效的通信发生了。此外，22. 2通道脉冲编码调制（PCM)信号必须被存储，因而可能进行了无效的内存管理。
[0046] 因而，在一缩混步骤执行后（M-N缩混），而非各自的编码和传输多通道的信号后 (总共M个通道，代表输入的通道数），可以传输一缩混信号至一解码器。缩混步骤用于把通道的数量减少至更小的数量（N个通道，代表输入的通道数）。解码器可以接收缩混信号，并毫无改变的再生缩混信号，或者可使用从缩混步骤中抽取的信息，从缩混信号中产生一些通道信号，其中通道信号的数量同原始信号的数量相同。
[0047] 图3是一示意图，显示了一步骤，用于缩混一多通道信号。根据由编码器定义的树形结构，多通道信号可以缩混。一缩混步骤可以在5. 1通道信号为一多通道信号例子的情况下使用。然而，本发明并不仅限于一特定的树形结构或特定的输入通道数量，并且一多通道信号可以是一 22. 2通道信号。进一步的，虽然缩混信号的通道（N通道）可以作为一单声道或立体声信号的例子在图3中使用，应当注意，只要通道的N数目小于输入通道的M数目，通道可以在任何情况下自由使用（5. 1通道或诸如此类）。
[0048] 参考图3, 一左声道，一右声道，一中央声道，一环绕左声道，以及一环绕右声道，可以成为一多通道配置或是其中的一部分。中央声道被测量权重，并且随后被单独的分配给左声道和右声道。此外，当环绕左声道和环绕右声道出现时，它们可能被测量权重并随后被分别的纳入左声道和右声道。其结果是，产生一总的左声道（Lt/Lo)和一总的右声道（Rt/ R〇)，并且它们可以互相混合以产生一单声道信号。
[0049] 同时，在缩混步骤中，由于反相信号间的相消干扰，可能产生信号质量恶化的问题。具体的，当缩混以简单获得临近通道的总和的方式进行时，具有不同相位的相同信号很有可能被随之求和。在此步骤中，放大效应或衰减效应在一些信号中发生，因此会产生相关的失真结果。进一步的，当缩混只是简单的通过在顶层或底层添加通道至中间层来进行时，实际上无法达到需要的声音的场景。
[0050] 这样的话，信号缩混入一单声道或立体声信号或类似信号可以通过一解码器上混至一 5. 1通道或更多通道的多通道信号。如上所述，虽然在缩混步骤中声音质量可以由于相消干扰效果而恶化，此类恶化可以在上混步骤中进行处理。这个步骤将会在有关图4中描述。
[0051] 根据本发明的实施例，图4显示了一解码器的配置。参考图4,解码器包括一信号分离器110和一输出通道产生单元120。信号分离器110从解码器接收一音频比特流，并从比特流中抽取一缩混信号DMX和一上混参数UP。当然，缩混信号和上混参数可以通过分开的独立音频信号比特流，而非单个比特流接收。
[0052] 输出通道产生单元120可以通过对接收的缩混信号DMX使用上混参数UP，产生一多通道信号（对应于N个通道）。如上所述，多通道信号具有比缩混信号的M个通道更多的通道，并可以是一 5. 1通道或22. 2通道的信号。多通道信号的N个通道数可以等于编码器的输入通道数，但根据情况，也可能不相等。
[0053] 这里，上混参数UP可包括一空间参数和通道间相位差（IPD)信息。空间参数可包括通道电平差（CLD)，并可进一步的包括通道间相干性（相关性）（ICC)。当两个通道（第一通道和第二通道）通过一单个一拖二（0TT)盒子缩混成一单通道（第一输出通道）时，通道电平差（CLD)为第一输入通道和第二输入通道间的电平差，并且ICC为第一输入通道和第二输入通道间的相关性。
[0054] 同时，通道间相位差（IPD)信息可以是一 IH)本身，或者是一通过量化或编码IPD 所得的数值。信号分离器110从接收的iro信息中获取一 IPD。这里，iro对应于第一输入通道和第二输入通道间的相位差。第一输入通道和第二输入通道也可以视为第一相位通道和第二相位通道。
[0055] 这样，通过一或多个上混单元对缩混信号使用上混参数UP，输出通道产生单元 120可产生多通道的输出通道信号。输出通道产生单元120不同的实施例120A，120B，120C 将会在下面相关的图5至图7中描述。
[0056] 图5至图7说明了图4的输出通道产生单元120的第一实施例120A至第三实施例120B。首先，参考图5,第一实施例的输出通道产生单元120A包括一单个上混单元122。通过对一单个输入信号使用一上混参数UP，上混单元122产生一第一相位通道P1和一第二相位通道P2。这里，输入信号可以是一接收的缩混信号本身，或是一涵盖在一缩混信号内的单个通道信号。这里，上混参数UP可包含一通道间相位差（IPD)和一通道电平差（CLD)。同时，如120A. 1中的实施例所不，一输入信号可以被一去相关器D去相关，并且随后输入信号和去相关信号可被输入上混单兀122。
[0057] 同时，上混单元122可把通道间相位差（IPD)转换为总的相位差（0PD)，并对输入信号使用此0PD。这里，(PD对应于第一相位通道和缩混信号间的相位差（或是第一相位通道和输入信号间的相位差）。上混单元122的详细描述将会在之后的相关图8中描述。
[0058] 参考图6,根据第二实施例，可知晓输出通道产生单元120B的配置。输出通道产生单元120B包括两个上混单元122,它们以平行配置。通过对输入信号1使用一上混参数 UP，第一上混单元122. 1产生一第一相位通道P1和一第二相位通道P2,其中输入信号1可以是缩混信号的一部分。例如，当缩混信号是一立体声信号，输入信号1可以是一左声道信号。通过对输入信号2使用一上混参数UP，第二上混单元122. 2产生一第三相位通道P3和一第四相位通道P4。当缩混信号是一立体声信号时，输入信号2可以是一右声道信号。
[0059] 类似的，第一上混单元122. 1和第二上混单元122. 2的详细配置可以在之后的关于图8中描述。
[0060] 参考图7,根据第三实施例，可知晓输出通道产生单元120C的配置。在输出通道产生单元120C中，三个上混单元122可分层排列。第一上混单元122. 1输出的第一相位通道P1和第二相位通道P2分别作为输入通道作用于第二上混单元122. 2和第三上混单元 122.3。第一上混单元122. 1可执行几乎同第一实施例中的上混单元相同的功能。通过对第一相位通道P1使用上混参数UP，第二上混单元122. 2产生一第三相位通道P3和一第四相位通道P4,并且通过对第二相位通道P2使用上混参数UP，第三上混单元122. 3产生一第五相位通道P5和一第六相位通道P6。
[0061] 除了第一至第三实施例中的输出通道产生单元120A至120C，多个上混单元122可进行并联或串联，并可配置成不同的树形结构，但本发明并不仅限于特定的树形结构。
[0062] 以下，将会描述实施例中的一或多个上混单元122的详细配置。
[0063] 图8是一详细的配置图，显示了图5至图7的上混单元122的实施例。上混单元 122把通道间相位差（IPD)信息转换为总的相位差（0PD)，对(PD使用一空间参数，并随后从一或多个通道中产生两个或更多的通道信号。参考图8,上混单元122包括一权重定义判定单元122a，一权重产生单元122b，一 0PD产生单元122c，以及一 IPD应用单元122d。
[0064] 图9中描述了由一相位差引起的有害的失真现象。参考图9,图中说明了在一单声道信号和左声道和右声道间的相位。图9(A)显示了当一左声道信号和一右声道信号只是简单的求和，以产生一单声道信号时的相位差，如下列方程式1所示：
[0065] [方程式1]

【权利要求】
1. 一种音频信号处理方法，包括：接收一缩混信号；接收通道间相位差（IPD)信息，所述通道间相位差信息对应于第一相位通道和第二相位通道间的相位差；接收一通道电平差（CLD)，所述通道电平差对应于第一相位通道和第二相位通道间的电平差；判定基于CLD的第一权重和第二权重的定义，其中所述第一权重应用于第一相位通道，所述第二权重应用于第二相位通道；使用已判定的定义和IPD，计算第一权重和第二权重；产生总的相位差（OPD)信息，基于第一权重和第二权重，总的相位差信息对应于第一相位通道和缩混信号间的相位差。
2. 如权利要求1所述的音频信号处理方法，进一步包括，使用总的相位差（OPD)信息和缩混信号，产生第一相位通道和第二相位通道间。
3. 如权利要求1所述的音频信号处理方法，其特征在于：所述定义包括一第一定义，其中所述第一权重大于等于所述第二权重，以及一第二定义，其中所述第一权重小于等于所述第二权重，以及基于所述CLD，所述判定设置成：当所述第一相位通道的电平值大于所述第二相位通道的电平值时，选择所述第一定义，以及当所述第二相位通道的电平值大于所述第一相位通道的电平值时，选择所述第二定义。
4. 一种音频信号处理装置，包括：一多路分解单元，用于接收一缩混信号，接收一通道间相位差（IPD)信息，所述通道间相位差信息对应于第一相位通道和第二相位通道间的相位差，以及接收一通道电平差 (CLD)，所述通道电平差对应于第一相位通道和第二相位通道间的电平差；一权重定义判定单兀，用于基于CLD判定第一权重和第二权重的定义，其中第一权重应用于第一相位通道，第二权重应用于第二相位通道；一权重产生单元，用于使用判定的定义和IPD，计算第一权重和第二权重；以及一总的相位差（OPD)产生单元，用于基于第一权重和第二权重产生(PD信息，其中OPD 信息对应于第一相位通道和缩混信号间的相位差。
【文档编号】H04S5/00GK104509131SQ201380038930
【公开日】2015年4月8日申请日期:2013年7月26日优先权日:2012年7月31日
【发明者】吴贤午, 宋政旭申请人:英迪股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吴贤午;宋政旭;
技术所有人：英迪股份有限公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。