一种参数域回声控制装置和方法

文档序号:2832687阅读:187来源:国知局
专利名称:一种参数域回声控制装置和方法
技术领域
本发明涉及通话语音信号处理领域,尤其涉及一种參数域回声控制装置和方法。
背景技术
通话语音质量是衡量电信网络优劣的关键指标之一,也是各电信设备制造商的核心竞争カ之所在。为了在通话过程中保证语音质量,关键的一点即是需要对通话过程中产生的回声及其他干扰源进行有效处理,以提升通话双方的主观感受。通话过程中所产生的回声根据其来源主要可包括电学回声和声学回声两大类,其中,电学回声的产生机理如图I所示,由于电信网络中的ニ /四线混合变换器(Hybrid)的 工作状态与外线阻抗特性紧密相关,当hybrid与外线阻抗不匹配吋,就无法做到将发送端和接收端完全隔离,因此,如图I所示,不同的话机和不同长度的用户线导致在hybrid处信号泄露,从而使得对方用户能听到自己的声音。声学回声的产生机理如图2所示,其主要由扬声器与话筒之间的稱合导致。參照图2,从近端扬声器播放出来的远端声音信号总会有一部分通过话筒又传回远端,这样远端用户就又听到了自己的声音。传统的回声控制算法是基于线性域的脉冲编码调制(Pulse Code Modulation,PCM)来实现的,所谓线性域,就是基于直接样点值的方式,如果通信链路存在编解码压缩环节,则需要一个对应的解码器将压缩码流完全解码后还原到样点值,其适用于所经网元 需要解码或者输入为线性域PCM的场景。但随着近年来免二次编解码操作(Tandem FreeOperation, TF0)和免码变换操作(Transcoder Free Operation, TrFO)的兴起,不需要再在收发端之间进行多次语音编解码的转换,因此传统的回声控制算法不再适用,而是需要通过參数域解码得到參数域的特征參数,从而在參数域上进行回声控制。所谓參数域解码,就是只对压缩码流进行部分解码,提取出每ー帧自身的參数域特征參数,包括固定码本增益、自适应码本增益、线谱频率等,通过修改压缩码流中的这些參数域特征參数来实现回声控制,而不需要通过解码器将压缩码流全部还原到样点值。在參数域对回声进行控制时,由于输入输出的都是压缩编码信号,对于ー些编码类型,例如自适应多速率声码器(Adaptive Multi Rate Codec, AMR)和增强型全速率声码器(Enhanced Full Rate Codec, EFR),其巾贞与巾贞之间是互相关联的,不能只简单独立地对某一帧进行回声控制,尤其是在回声与非回声切换时,需要进行ー些特殊处理才能使得回声与非回声的过渡更为自然。现有技术提供了ー种可应用于TFO/TrFO业务场景的回声控制方法,该方法通过对近端输入信号中的固定码本增益和自适应码本增益进行重新量化输出,以达到对回声与非回声的切換进行过渡处理的目的。图3示出了现有技术提供的通过上述方法在參数域实现回声控制的装置的结构示意图。然而,现有技术在处理回声与非回声的过渡时,当需要对诸如AMR和EFR这样的编码类型信号进行相关处理吋,由于这些信号的帧与帧之间存在相互关联,因此參数的量化与前一帧该參数的预测误差也存在相互关联。而现有技术并未对相关的线性预测系数进行重新量化,因此,通过现有技术对采用上述编码方式的信号进行处理时,最終解码得到的线性预测參数存在出现异常的风险,进而带来信号的突变,使得回声与非回声之间进行切換时无法平滑过渡。

发明内容
本发明的目的在于提供一种參数域回声控制装置,g在解决现有技术中在处理回声到非回声过渡时,容易导致回声与非回声的切換无法过渡自然的问题。本发明实施例是这样实现的,一种參数域回声控制装置,所述装置包括回声检测模块,用于通过參数域解码,分别提取远端输出信号和近端输入信号的參数域特征參数,并根据所述參数域特征參数检测近端输入信号帧是否为回声帧,所述參数域特征參数包括线谱频率(Line Spectral Frequency, LSF)、固定码本增益以及自适应码本增益; 过渡模块,用于当所述回声检测模块检测出近端输入信号帧为非回声帧时,对该近端输入信号帧中的固定码本增益、自适应码本增益以及LSF预测误差进行重新量化,并分别替换近端输入信号帧原始的固定码本增益、自适应码本增益和LSF。本发明的另一目的在于提供一种參数域回声控制方法,所述方法包括下述步骤根据远端输出信号和近端输入信号的參数域特征參数,检测近端输入信号帧是否为回声帧,所述參数域特征參数包括LSF、固定码本增益以及自适应码本増益;当检测出近端输入信号帧为非回声帧时,对该近端输入信号帧中的固定码本增益、自适应码本增益以及LSF预测误差进行重新量化,以分别替换该近端输入信号帧原始的固定码本增益、自适应码本增益和LSF。本发明实施例对通话过程中产生的回声在參数域进行控制,相比于传统的线性域回声控制需要对压缩码流进行完全解码的方法,其很大程度上提高了回声控制的效率,当检测到非回声帧时,通过对该非回声帧的固定码本增益和自适应码本增益进行重新量化来完成回声与非回声之间的切換,同时,考虑到该非回声帧中的LSF与前ー帧的LSF预测误差存在相互关联,通过对该非回声帧中的LSF预测误差进行重新量化以替代原始的LSF,从而降低了最終解码得到的LSF出现异常的风险,由此避免了信号的突变,实现了回声与非回声之间进行切換时的平滑过渡。


图I为现有技术提供的电学回声的产生机理不意图;图2为现有技术提供的声学回声的产生机理不意图;图3为现有技术提供的可应用于TFO/TrFO业务场景的參数域回声控制的装置的结构示意图;图4为本发明实施例提供的參数域回声控制装置的结构框图;图5为本发明实施例提供的參数域回声控制装置回声检测模块的具体结构图;图6为本发明实施例提供的參数域回声控制装置舒适噪声插入模块的具体结构图;图7为采用本发明实施例提供的參数域回声控制装置舒适噪声插入模块进行回声消除的优化效果图;图8为本发明实施例提供的參数域回声控制装置过渡模块的具体结构图;图9为采用本发明实施例提供的參数域回声控制装置过渡模块进行回声与非回声过渡的优化效果图;图10为本发明实施例提供的參数域回声控制装置A ロ IP或者ATM组网下的TrFO应用场景;图11为本发明实施例提供的參数域回声控制装置A ロ TDM组网下的TFO应用场
旦 牙ヽ;图12示出了本发明实施例提供的參数域回声控制方法的实现流程图;图13示出了本发明实施例提供的參数域回声控制方法检测近端输入信号帧是否为回声帧的具体流程图;图14示出了本发明实施例提供的參数域回声控制方法在当近端输入信号帧为回声帧时,对回声帧进行替换的具体流程图;图15示出了本发明实施例提供的參数域回声控制方法当近端输入信号帧为非回声帧时,回声控制方法的具体流程图。
具体实施例方式在对通话过程中产生的回声在參数域进行控制的过程中,当面临回声与非回声之间的切换时,本发明实施例对当前帧的LSF预测误差进行重新量化,并作为近端输出信号中的LSF输出,从而在切换过程中考虑了帧与帧之间的联系,避免了对当前帧进行独立处理而导致的回声与非回声之间的硬切換,提升了回声与非回声之间的过渡效果。图4示出了本发明实施例提供的參数域回声控制装置的结构框图,为了便于说明,仅不出了与本实施例相关的部分。參照图4,该装置包括回声检测模块41、舒适噪声插入模块42、过渡模块43和比特打包模块44 回声检测模块41,通过參数域解码,分别提取远端输出信号和近端输入信号的參数域特征參数,井根据提取出的參数域特征參数检测近端输入信号是否为回声。图5示出了本发明实施例提供的參数域回声控制装置回声检测模块的具体结构图,參照图5,回声检测模块41包括了 部分解码单元411,其分别对输入的远端输出信号和近端输入信号进行部分解码,从而提取出远端输出信号和近端输入信号当前子帧的參数域特征參数,包括LSF、基音周期、固定码本增益、自适应码本增益、能量以及其他參数。互相关单元412,其将部分解码单元411提取出的近端输入信号和远端输出信号的两组參数域特征參数分别作为近端向量和远端(区间[固定延时,固定延时+动态延吋])向量,并将这两组向量分别进行互相关运算,以得到一系列的互相关系数,并记录每组互相关系数所对应的时刻。子帧判断単元413,其将上述一系列互相关系数中的最大值所对应的远端区间中的时刻记录为初始回声延时,并判断该时刻的远端基音周期与近端基音周期是否均小于第一预设门限(即判断远近端基音周期的相似性),或者判断该时刻的远端能量与近端能量差是否小于第二预设门限,当判断结果为是时,则子帧判断単元413判断出近端输入信号的当前子帧为回声子帧,否则为非回声子帧。需要说明的是,上述部分解码单元411、互相关单元412与子帧判断単元413的计算和判断均是基于远端输出信号和近端输入信号的当前帧中的每ー个子帧来进行的。回声判断単元414,其在部分解码单元411、互相关单元412与子帧判断単元413均对当前帧的全部子帧进行了计算和判断之后,根据当前帧中每一个子帧的判断结果来进行综合判决,以判断出近端输入信号的当前帧为回声帧还是非回声帧。在本实施例中,回声判断単元414的综合判决首先需要判断当前的近端输入帧是否为静默(插入)指示(Silence Insertion Descriptor, SID)巾贞,是则无论其是否包含了回声子帧,均将当前的近端输入帧判定为非回声帧;若当前近端输入帧不是SID帧时,则根据“少数服从多数”的原则,当该近端输入帧中回声子帧多于非回声子帧时,将当前的近端输入帧判定为回声帧,反之,当该近端输入帧中非回声子帧多于回声子帧时,将当前的近端输入帧判定为非回声帧。上述有关当前帧是否为SID帧的判定过程由下文中的近端输入判断単元415执行,在此不赘述。作为本发明的一个实施例,如图5所示,回声检测模块41还包括了近端输入判断单元415、缓存单元416和能量累加单元417,其中近端输入判断単元415,对近端输入信号进行单独判断,通过检测近端输入信号中当前帧的相关标志位是否指示当前帧为SID帧,从而判断出近端输入的当前帧是否为静音帧。当判断结果为不是静音帧时,再通过近端输入信号部分解码得到的參数(例如计算信噪比、频谱、能量等參数)来综合判断当前帧是否为背景噪声帧。缓存单元416,当近端输入信号的当前帧为静音帧或者背景噪声帧时,则将其部分解码后得到的LSF在缓存单元416中进行缓存。在本实施例中,缓存单元416对输入的LSF进行循环缓存,即只保存距离当前时间最近的8帧LSF。能量累加単元417,其在当近端输入信号的当前帧为静音帧或者背景噪声帧时,对近端输入信号部分解码后得到的当前帧能量进行长时平均累加计算。上述缓存单元416和能量累加単元417的输出结果用于输入到舒适噪声插入模块42,以便更加缓和、自然地对回声帧进行替换,其具体实施方式
将在下文进行说明,在此不赘述。本实施例中,在回声检测单元41对近端输入信号是否为回声进行了检测之后,根据检测的不同结果控制图4中开关A闭合至Al处或者A2处,当检测结果为近端输入信号当前帧为回声帧时,开关A闭合至Al处时,此时回声检测模块41的输出结果输入舒适噪声插入模块42,以进ー步对回声帧进行消除处理;当检测结果为近端输入信号当前帧为非回声帧时,开关A闭合至A2处,此时回声检测模块41的输出结果输入过渡模块43中,并根据需要进行回声至非回声的过渡处理。对回声帧进行消除,可以通过舒适噪声插入方法或者回声衰减方法来实现,在此以舒适噪声插入方法作为实施例进行说明。一般说来,在通话的过程中,大约有40%的时间属于静默时间,即约有40%的时间没有传输语音信息,只传输了环境噪声,因此这部分信号 大部分是无用的信号,如果把这部分信号用另外ー种更低比特率的编码方式来编码,则可以实现降低回声控制开销且节省带宽的目的。目前,AMR、EFR等编码方式都引入了该不连续发射机制。舒适噪声插入模块42正是基于上述原理,将回声检测模块41中已确定为回声的帧用静音帧或者背景噪声帧进行替换,再利用低比特率的SID编码方式编码后输出。图6示出了本发明实施例提供的參数域回声控制装置舒适噪声插入模块的具体结构图,具体说明如下參照图6,该舒适噪声插入模块42具体包括了 LSF生成单元421和LSF量化单元422,其中LSF生成单元421用于生成将替代回声帧LSF部分的量化前的LSF。在具体的生成过程中,LSF生成単元421首先对缓存単元416中的当前缓存情况进行判断,判断该缓存中是否记录满了 8帧的LSF,是则从缓存单元416中随机选取ー帧LSF,以此作为将要替代回声帧LSF部分的量化前的LSF ;当该缓存中记录的LSF数量小于8帧时,则将已记录的每 ー帧LSF分别转换为线谱对(Line Spectral Pair, LSP),全部累加后求取LSP均值,再将该LSP均值转换为LSF,以作为替代回声帧LSF部分的量化前的LSF。LSF量化単元422即根据不同的编码类型,对LSF生成単元421输出的LSF进行相应的量化处理,并替代近端输入信号原始的LSF部分。通过上述处理方式,采用了低比特率的SID帧对回声帧进行了替换,即降低了回声控制的开销,又节省了带宽,同时,利用SID帧对回声帧进行替换的时域优化效果如图7所示,由图7可以看出,近端输入信号为远端输出信号的回声,而最终进行了帧替换的近端输出信号的电平与近端实际背景噪声的电平相匹配,由此达到了回声消除的效果,相应地,进行了帧替换后的近端输出信号的频谱也具备与近端实际背景噪声的频谱相匹配的优化效果。作为本发明的一个实施例,舒适噪声插入模块42还包括了 能量量化単元423,其根据不同的编码类型,对能量累加単元417中能量的长时累加平均值进行相应的量化处理,以替代近端输出信号的能量部分(对于EFR的编码类型来说对应近端输出信号的固定码本增益部分),使得回声替换后的帧能量变化缓慢,过渡自然,很好地提升了通话方的主观体验。在本实施例中,当回声检测模块41判断出近端输入信号的当前帧为非回声帧时,回声检测模块41的输出进入到过渡模块43,在过渡模块43中,对近端输入信号当前帧的LSF的预测误差进行了重新量化,从而在切换过程中将帧与帧之间的关系考虑充分,大大降低了例如AMR和EFR等编码方式从回声到非回声过渡中出现异常的风险。该模块为本发明的重点,其具体的结构图如图8所示,下面进行具体说明參照图8,过渡模块43包括LSF预测误差计算单元431、码本增益计算单元432和量化单元433,其中LSF预测误差计算单元431,其首先将近端输入信号前ー帧的LSF预测误差与LSF预测误差系数相乗,将相乘的结果与LSF均值进行相加运算,得到当前帧的LSF预测值。而后,将近端输入信号部分解码后得到的LSF与LSF预测值相减,得到当前帧的量化前的LSF预测误差,并将该LSF预测误差进行缓存以便在下ー帧LSF计算时使用。在本实施例中,上述LSF预测误差系数以及LSF均值根据不同的信号编码方式来确定,针对不同的编码方式为相应的常数。
在本发明实施例中,通过LSF预测误差计算单元431,能够在切换过程中将帧与帧之间的关系考虑充分,大大降低了例如AMR和EFR等编码方式从回声到非回声过渡中出现异常的风险。需要说明的是,上述LSF计算方式不限于在AMR和EFR编码方式中使用,对于其他编码方式的參数域回声控制中回声与非回声的切換同样适用。码本增益计算单元432,其对近端输入信号部分解码后得到的固定码本增益和自适应码本增益进行限制操作,为了避免回声与非回声切换时波形突变导致异常现象的发生,当部分解码后得到的固定码本增益值或者自适应码本增益值超过I时,将该固定码本增益值或者自适应码本增益值设定为1,以保证回声到非回声过渡时近端输出信号解码后的激励不会突变。 量化単元433,其分别对LSF预测误差计算单元431和码本增益计算单元432输出 的LSF和码本增益进行重新量化,并分别替换该近端输入信号帧原始的LSF、固定码本增益和自适应码本增益。图9示出了采用上述处理方式对回声与非回声进行过渡的优化效果图,其中,上图为未加入LSF过渡的信号处理前后的波形对比图,可以看出在输出的信号波形中出现了多处波形突变,而下图为加入了 LSF过渡的信号处理前后波形对比图,可以看出在过渡过程中对LSF的预测误差进行了量化之后,波形突变的现象不再出现,大大降低了波形异常现象发生的风险。需要特别说明的是,在本实施例中,当需要进行过渡吋,过渡模块43只对近端输入信号中的LSF、固定码本增益以及自适应码本增益这三部分进行修改后重新量化输出,对其他參数不作修改。作为本发明的一个实施例,參照图8,过渡模块43还包括了过渡选择单元434、參数记录单元435和状态判断单元436 过渡选择单元434,决定当前输入到过渡模块43中的非回声帧是否需要进行过渡。參数记录单元435,当过渡选择单元决定当前输入到过渡模块43中的非回声帧不需要进行过渡,即近端输入信号当前帧的上一帧也为非回声帧时,參数记录单元435记录该非回声帧进行部分解码后的一些參数域特征參数(例如需要在LSP计算单元431中用到的LSF预测误差),之后该非回声帧通过直接透传输出,而不需要重新计算LSF、固定码本增益以及自适应码本増益,很好地降低了回声控制的处理开销。状态判断単元436,对量化単元433中输出的近端输入信号进行反量化后与原始近端输入信号进行比较,判断其中的LSF部分和码本增益部分是否完全一致,是则将结果输出给过渡选择单元436,使过渡选择单元436将过渡模块43的内部状态选择为不需要过渡的状态,否则保持过渡模块43的现有状态。同时,在本实施例中,当过渡模块43的内部状态进入到不需要过渡的状态期间,过渡选择单元434会对回声检测模块41的输出结果进行判断,一旦回声检测模块41输出了回声帧,则过渡选择单元434会再次另过渡模块43进入到需要过渡的内部状态,以便在下一非回声帧到来时,能够及时实现由回声帧到非回声帧的切換。由此,在本发明实施例中,当近端输入信号长时间未出现回声时,通过过渡选择直接对非回声帧进行透传,不需要对近端输入信号的每ー帧都计算LSF、固定码本增益以及自适应码本増益,而在需要对回声与非回声之间进行切换时,很好地实现了自然过渡,大大降低了出现异常的风险,提升了通话方的主观体验。最終,由舒适噪声插入模块42或者过渡模块43中输出的近端输入信号输入到比特打包模块44中,比特打包模块44根据不同的帧类型和帧速率等信息,将输入的信号进行比特打包。由于比特打包是按照标准协议来进行,已有相对固定的流程,因此在此不再赘述。上述装置实施例中,所包括的各个单元只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能単元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。在本发明实施例中,以上说明的參数域回声控制装置可以与无线基站、基站控制器、核心网(Universal Media Gateway, UMG)以及其他网关类网元一同组成无线网络的回声控制系统,也可以与公共交换电话网(Public Switched Telephone Network,PSTN)交换机等设备一同组成PSTN网的回声控制系统,且该装置提供上行和下行的通信接ロ,通过上 述接ロ并行地提供上行和下行的參数域回声控制功能。作为本发明的ー个具体实施示例,如图10所示,參数域回声控制装置可以应用于A ロ互联网协议(Internet Protocol, IP)或者异步传输模式(Asynchronous TransferMode, ATM)组网下的TrFO场景,且參数域回声控制装置可以部署在无线侧,也可以部署在核心网侧。在该组网场景下,主被叫两个终端对应的编码器类型相同,这样就省去了进行编解码转换的必要,节省了设备成本、提升了语音质量。作为本发明的另ー个具体实施示例,如图11所示,參数域回声控制装置可以应用于A ロ时分复用(Time Division Multiplexing, TDM)组网下的TFO场景,且參数域回声控制装置可以部署在无线侧,也可以部署在核心网侧。在该组网场景下,主被叫两个终端对应的编码器类型也相同,同样省去了进行编解码转换的必要,但仍然多基于PCM数据传输形式。在该组网场景下,对上行或下行网元中出现回声进行控制,从而达到提升主观感受的目的。图12示出了本发明实施例提供的參数域回声控制方法的实现流程,详述如下在步骤S1201中,根据远端输出信号和近端输入信号的參数域特征參数,检测近端输入信号帧是否为回声帧,所述參数域特征參数包括线谱频率LSF、基音周期、固定码本増益、自适应码本增益和能量。由于本发明实施例是在參数域中进行回声控制,只需要针对信号中的參数域特征參数进行修改来达到回声控制的目的,因此首先从远端输出信号和输入信号中提取出用来进行回声控制的參数域特征參数。在步骤S1202中,当检测出近端输入信号帧为回声帧时,将该近端输入信号帧用静音帧或者背景噪声帧进行替换。由于静音帧和背景噪声帧均采用较低比特率的SID编码方式进行传输,因此,在本发明实施例中,当出现回声帧需要进行回声消除时,通过将回声帧替换为静音帧或者背景噪声帧,从而达到了降低处理开销、节省带宽的目的。在步骤S1203中,当检测出近端输入信号帧为非回声帧时,对该近端输入信号帧中的固定码本增益、自适应码本增益以及LSF预测误差进行重新量化,以分别替换近端输入信号帧原始的固定码本增益、自适应码本增益和LSF。在步骤S1204中,根据近端输入信号帧的帧类型以及帧速率,对经过修改的近端输入信号进行比特打包输出。在本发明实施例中,通过上述步骤,当在參数域进行回声控制面临回声与非回声之间的切换时,由于将当前控制输入信号帧的LSF预测误差进行重新量化,并作为近端输出信号中的LSF输出,从而在切换过程中考虑了当前帧LSF的量化与前ー帧LSF的预测误差之间的联系,避免了对当前帧进行独立处理而导致的回声与非回声之间的硬切換,提升了回声与非回声之间的过渡效果。下面,对本发明实施例提供的參数域回声控制方法的实现流程进行一一的具体说明。图13示出了检测近端输入信号帧是否为回声帧的具体流程,详述如下
在步骤S1301中,分别提取远端输出信号和近端输入信号当前子帧的參数域特征參数,以分别作为近端向量和远端(区间[固定延时,固定延时+动态延时])向量。在步骤S1302中,将得到的远端向量和近端向量进行互相关运算,得到多组互相关系数,并记录每组互相关系数所对应的时刻。在步骤S1303中,取值最大的互相关系数所对应的时刻即为初始回声延时,因此,检测该时刻的远端基音周期和近端基音周期的相似性,或者通过检测远端能量和近端能量的差是否小于ー预设门限,从而判断当前子帧是否为回声子帧,是则近端输入信号的当前子帧为回声子帧,否则为非回声子帧。上述步骤S1301至S1303均是对子帧进行处理,因此,在步骤S1304中,根据近端输入信号帧中每个子帧的回声检测结果进行综合判决,以判断近端输入信号帧是否为回声帧。图14示出了当近端输入信号帧为回声帧时,对回声帧进行替换的具体实现流程在步骤S1401中,判断近端输入信号帧是否为静音帧或者背景噪声帧,是则缓存距离当前时刻最近的8帧近端输入信号的静音帧或者背景噪声帧的LSF。在步骤S1402中,判断缓存的LSF帧的数量是否达到了 8巾贞,当缓存的LSF达到8帧时,随机选取其中ー帧LSF以生成量化前的LSF,当缓存的LSF数量小于8帧时,将缓存的每ー帧LSF分别转换成LSP后进行全部累加求取LSP均值,再将LSP均值转换成LSF,以生成量化前的LSF。在步骤S1403中,将生成的量化前的LSF进行量化后替代近端输入信号帧的原始LSF。同时,在本实施例中,当近端输入信号帧为静音帧或者背景噪声帧时,将近端输入信号的静音帧或者背景噪声帧的能量进行长时平均累加,生成能量长时累加均值,再通过将该能量长时累加均值进行量化后以替代近端输入信号帧的原始能量,以使得回声替换后的帧能量变化缓慢且过渡自然。图15示出了当近端输入信号帧为非回声帧时,回声控制方法的具体实现流程在步骤S1501中,判断非回声的近端输入信号帧的固定码本增益或者自适应码本増益的值是否超过I,是则将其取值限制为I。通过上述限制操作,能够保证回声到非回声过渡时近端输出信号解码后的激励不会产生突变。在步骤S1502中,将前ー近端输入信号帧的LSF预测误差与LSF预测误差系数相乘后再与LSF均值相加,得到当前近端输入信号帧的LSF预测值后,将近端输入信号帧的LSF与所述LSF预测值相减,得到当前近端输入信号帧的量化前的LSF预测误差,其中,LSF预测误差系数和LSF均值均由近端输入信号帧的编码方式決定。在步骤S1503中,将上述步骤中得到的码本增益和LSF预测误差进行重新量化。
同时,在结束了上述步骤之后,如图15所示,将重新量化的近端输入信号与原始近端输入信号进行比较,判断两者的LSF和码本增益是否完全一致,是则返回相应状态,不对近端输入信号帧进行过渡,当不对近端输入信号帧进行过渡时,则不执行上述步骤S1501至S1503,而是在记录近端输入信号帧的LSF预测误差后,直接对近端输入信号进行输出,由此,当长时间没有回声产生时,通过直接透传避免了毎次均对码本増益等參数进行量化,从而大大减小了回声控制的开销。本发明实施例在对通话回声在參数域进行控制的过程中,当面临回声与非回声之间的切换时,通过对当前帧的固定码本增益和自适应码本增益进行重新量化来完成回声与非回声之间的切換,同时通过对当前帧的LSF的预测误差进行重新量化,并替代近端输出信号中的原始LSF输出,从而在切换过程中考虑了帧与帧之间的联系,避免了对当前帧进行独立处理而导致的回声与非回声之间的硬切換,提升了回声与非回声之间的过渡效果。本领域技术人员可以理解,本发明实施例提供的參数域的回声控制方法中,其全部或部分步骤是可以通过程序指令相关的硬件来完成。比如可以通过计算机运行程序来完成。该程序可以存储在可读取存储介质,例如,随机存储器、磁盘、光盘等。
权利要求
1.一种参数域的回声控制装置,其特征在于,包括 回声检测模块,用于通过参数域解码,分别提取远端输出信号和近端输入信号的参数域特征参数,并根据所述参数域特征参数检测近端输入信号帧是否为回声帧,所述参数域特征参数包括线谱频率LSF、固定码本增益以及自适应码本增益; 过渡模块,用于当所述回声检测模块检测出近端输入信号帧为非回声帧时,对该近端输入信号帧中的固定码本增益、自适应码本增益以及LSF预测误差进行重新量化,并分别替换该近端输入信号帧原始的固定码本增益、自适应码本增益和LSF。
2.根据权利要求I所述的装置,其特征在于,所述参数域特征参数还包括基音周期以及能量,且所述回声检测模块包括 部分解码单元,用于分别提取远端输出信号和近端输入信号当前子帧的所述参数域特征参数,以分别构成远端向量和近端向量; 互相关单元,用于将所述远端向量与所述近端向量进行互相关运算,得到多组互相关系数,并记录每组互相关系数所对应的时刻; 子帧判断单元,用于通过检测取值最大的互相关系数所对应的时刻的远端基音周期和近端基单周期的相似性,或者通过检测远端能量和近端能量的差是否小于一预设门限,来判断当前子帧是否为回声子帧; 回声判断单元,用于根据近端输入信号帧中每个子帧的回声检测结果,判断该近端输入信号帧是否为回声帧。
3.根据权利要求I所述的装置,其特征在于,所述过渡模块包括 LSF预测误差计算单元,用于通过将前一近端输入信号帧的LSF预测误差与LSF预测误差系数相乘后再与LSF均值相加,得到当前近端输入信号帧的LSF预测值;再通过将所述回声检测模块输出的LSF与所述LSF预测值相减,得到当前近端输入信号帧的量化前的LSF预测误差,所述LSF预测误差系数和所述LSF均值均为常数,且根据近端输入信号帧的编码方式来确定; 码本增益计算单元,用于将近端输入信号帧中值大于I的固定码本增益或者自适应码本增益取值限制为I ; 量化单元,用于将所述LSF预测误差计算单元获取的LSF预测误差以及所述码本增益计算单元输出的固定码本增益和自适应码本增益进行量化,并分别替换该近端输入信号帧原始的LSF、固定码本增益和自适应码本增益。
4.根据权利要求3所述的装置,其特征在于,所述过渡模块还包括 过渡选择单元,用于决定所述过渡模块是否对近端输入信号帧进行过渡; 参数记录单元,用于在所述过渡模块不对近端输入信号帧进行过渡时,记录近端输入信号帧的LSF预测误差; 状态判断单元,用于通过将所述量化单元输出的近端输入信号与所述回声检测模块输出的近端输入信号进行比较,当其中的LSF、固定码本增益和自适应码本增益均完全一致时,令所述过渡选择单元选择不对近端输入信号帧进行过渡,否则,保持所述过渡选择单元的当前状态。
5.根据权利要求I所述的装置,其特征在于,所述装置还包括 舒适噪声插入模块,用于当所述回声检测模块检测出近端输入信号帧为回声帧时,将该近端输入信号帧用静音帧或者背景噪声帧进行替换后,以静默插入指示SID编码方式进行编码。
6.根据权利要求5所述的装置,其特征在于,所述回声检测模块包括 近端输入判断单元,用于判断近端输入信号帧是否为静音帧或者背景噪声帧; 缓存单元,用于将近端输入信号的静音帧或者背景噪声帧的LSF进行缓存,所述缓存单元缓存距离当前时刻最近的8帧LSF ; 所述舒适噪声插入模块包括 LSF生成单元,用于根据所述缓存单元中缓存的LSF,生成量化前的LSF ; LSF量化单元,用于将所述LSF生成单元生成的LSF进行量化,并替代近端输入信号帧原始的LSF。
7.根据权利要求6所述的装置,其特征在于,当所述缓存单元缓存了8帧的LSF时,所述LSF生成单元从所述缓存单元中随机选取一巾贞LSF以生成量化前的LSF ; 当所述缓存单元缓存的LSF数量小于8巾贞时,所述LSF生成单元通过将所述缓存单元中缓存的每一帧LSF分别转换成线谱对LSP,将转换成的LSP全部累加后求取LSP均值,再将LSP均值转换成LSF,以生成量化前的LSF。
8.根据权利要求5所述的装置,其特征在于,所述参数域特征参数还包括能量,且所述回声检测模块包括 能量累加单元,用于将近端输入信号的静音帧或者背景噪声帧的能量进行长时平均累力口,生成能量长时累加均值; 所述舒适噪声插入模块包括 能量量化单元,用于将所述能量长时累加均值进行量化后替代近端输入信号帧的原始倉tfi。
9.根据权利要求I或5所述的装置,其特征在于,所述装置还包括 比特打包模块,用于根据近端输入信号帧的帧类型以及帧速率,对所述过渡模块或者所述舒适噪声插入模块输出的近端输入信号进行比特打包后,作为近端输出信号输出。
10.一种参数域的回声控制方法,其特征在于,所述方法包括下述步骤 根据远端输出信号和近端输入信号的参数域特征参数,检测近端输入信号帧是否为回声帧,所述参数域特征参数包括LSF、固定码本增益以及自适应码本增益; 当检测出近端输入信号帧为非回声帧时,对该近端输入信号帧中的固定码本增益、自适应码本增益以及LSF预测误差进行重新量化,以分别替换该近端输入信号帧原始的固定码本增益、自适应码本增益和LSF。
11.根据权利要求10所述的方法,其特征在于,所述根据远端输出信号和近端输入信号的参数域特征参数,检测近端输入信号帧是否为回声帧的步骤具体为 分别提取远端输出信号和近端输入信号当前子帧的所述参数域特征参数,以分别构成远端向量和近端向量,所述参数域特征参数还包括基音周期和能量; 将所述远端向量和所述近端向量进行互相关运算,得到多组互相关系数,并记录每组互相关系数所对应的时刻; 通过检测取值最大的互相关系数所对应的时刻的远端基音周期和近端基单周期的相似性,或者通过检测远端能量和近端能量的差是否小于一预设门限,来判断当前子帧是否为回声子帧; 根据近端输入信号帧中每个子帧的回声检测结果,判断该近端输入信号帧是否为回声帧。
12.根据权利要求10所述的方法,其特征在于,所述对近端输入信号帧中的固定码本增益和自适应码本增益进行重新量化的步骤具体为 将近端输入信号帧中值大于I的固定码本增益或者自适应码本增益取值限制为I ; 将经过了限制处理的固定码本增益和自适应码本增益进行量化。
13.根据权利要求10所述的方法,其特征在于,所述对近端输入信号帧中的LSF预测误差进行重新量化的步骤具体为 将前一近端输入信号帧的LSF预测误差与LSF预测误差系数相乘后再与LSF均值相力口,得到当前近端输入信号帧的LSF预测值,所述LSF预测误差系数和所述LSF均值均为常数,且根据近端输入信号帧的编码方式来确定; 将近端输入信号帧的LSF与所述LSF预测值相减,得到当前近端输入信号帧的量化前的LSF预测误差; 将所述LSF预测误差进行量化。
14.根据权利要求13所述的方法,其特征在于,当近端输入信号帧为非回声帧时,所述方法还包括下述步骤 将重新量化的近端输入信号与原始近端输入信号进行比较,判断两者的LSF、固定码本增益以及自适应码本增益是否完全一致,是则选择不对下一近端输入信号帧进行过渡,否则持续对近端输入信号帧进行过渡; 当不对近端输入信号帧进行过渡时,记录近端输入信号帧的LSF预测误差。
15.根据权利要求10所述的方法,其特征在于,当检测出近端输入信号帧为回声帧时,所述方法还包括下述步骤 将该近端输入信号帧用静音帧或者背景噪声帧进行替换后,以SID编码方式进行编码。
16.根据权利要求15所述的方法,其特征在于,所述将该近端输入信号帧用静音帧或者背景噪声帧进行替换的步骤具体为 判断近端输入信号帧是否为静音帧或者背景噪声帧,是则缓存距离当前时刻最近的8帧近端输入信号的静音帧或者背景噪声帧的LSF ; 根据缓存的LSF生成量化前的LSF ; 将生成的量化前的LSF进行量化后替代近端输入信号帧的原始LSF。
17.如权利要求16所述的方法,其特征在于,所述根据缓存的LSF生成量化前的LSF的步骤具体为 当缓存的LSF达到8帧时,随机选取其中一帧LSF以生成量化前的LSF ; 当缓存的LSF数量小于8帧时,将缓存的每一帧LSF分别转换成LSP后进行全部累加求取LSP均值,再将LSP均值转换成LSF,以生成量化前的LSF。
18.根据权利要求15所述的方法,其特征在于,所述方法还包括下述步骤 将近端输入信号的静音帧或者背景噪声帧的能量进行长时平均累加,生成能量长时累加均值;将所述能量长时累加均值进行量化后替代近端输入信号帧的原始能量。
19.根据权利要求10或者15所述的方法,其特征在于,所述方法还包括下述步骤根据近端输入信号帧的帧类型以及帧速率,对经过修改的近端输入信号进行比特打包输出。
全文摘要
本发明涉及通话语音信号处理领域,尤其涉及一种参数域回声控制装置和方法,所述装置包括回声检测模块,用于通过参数域解码,分别提取远端输出信号和近端输入信号的参数域特征参数,并根据所述参数域特征参数检测近端输入信号帧是否为回声帧;过渡模块,用于当所述回声检测模块检测出近端输入信号帧为非回声帧时,对该近端输入信号帧中的固定码本增益、自适应码本增益以及LSF预测误差进行重新量化,并分别替换该近端输入信号帧原始的固定码本增益、自适应码本增益和LSF。本发明避免了信号的突变,实现了回声与非回声之间进行切换时的平滑过渡。
文档编号G10L19/00GK102726034SQ201180003907
公开日2012年10月10日 申请日期2011年7月25日 优先权日2011年7月25日
发明者李 杰, 李玉龙, 梁俊斌, 覃景繁 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1