从基于celp的语音编码器中去除回旋噪声的系统和方法

文档序号:2819519阅读:606来源:国知局
专利名称:从基于celp的语音编码器中去除回旋噪声的系统和方法
技术领域
本发明涉及数字语音通信,更具体地说是涉及当在包括低或中级非周期信号的背景噪声中进行操作时从象向量和激励线性预测(VSELP)编码器这样的基于码激励线性预测(CELP)的编码器中去除回旋噪声。
北美的蜂窝电信系统正在从当前的模拟调频(FM)形式向数字系统发展。为了进行传输,数字系统必须对语音进行编码并接着在接收方从接收到的编码传输信号中合成出语音。对于市场上可接受的系统,合成的语音不仅是清晰的,而且要尽可能地接近原始语音。
码本激励线性预测是一种用于语音编码的技术,其基本技术包括在随机分布激励向量的码本中寻找产生一个与输入序列最接近的输出序列(当经过音调(pitch)与线性预测编码(LPC)短期(short term)合成滤波器滤波后)的向量。为完成这项任务,在码本中所有的候选激励向量必须均经语音和LPC合成滤波器滤波以产生一个可与输入序列进行比较的候选输出序列。使得CELP成为广泛计算的算法,它具有包括1024个入口,每个入口具有40个样本的典型码本。另外,常使用一个增加计算量的误差加权滤波器。
许多技术已被认为可以减轻CELP编码器的计算量。快速数字信号处理器有助于实时地实现象CELP这样的非常复杂的算法。另一种策略是被称作向量和激励线性预测编码(VSELP)的CELP算法的变形。电信工业组织(TIA)已采纳了一个使用一全速率8.0Kbps VSELP语音编码器,防错卷积编码,差分正交移相键控(QPSK)调制和一个时分,多址(TDMA)模式的IS54标准。见IS54修订A,文本号EIA/TIA PN2398。
在Gerson的美国专利第4,817,157号中公开了当前采用的VSELP码本搜寻方法。Gerson指出了针对繁多的码本搜索存在的极高的计算复杂性的问题。Gerson技术是以用按格雷(Gray)码排列的一组向量和码向量对VSELP判断函数进行递归修改为基础的。通过大量地搜索Gray码排序码向量集的集合来获得取最低码向量。电子工业协会(EIA)在1991年8月出版了作为双模式移动站,基站蜂窝电话系统兼容标准的EIA/TIA暂行标准PN 2759。该标准采纳了Gerson VSELP码本搜索方法。
使用LPC系数模拟输入语音的基于CELP的编码器适用于纯净的信号;而当在输入信号中出现背景噪音时,编码器在模拟信号时效果较差。这就导致当在接收方解码后会出现某些噪声。这些噪声严重地降低了传输语音的听觉质量。
因而本发明的一个目的是当在噪声背景条件下进行操作时通过去除在静音阶段的回旋噪声从而在由象VSELP编码器那样的一个基于CELP的编码器处理的语音的听觉方面提供改进。
根据本发明,在没有检测到语音时去除输入信号的低频部分,从而在静音阶段去除回旋噪声。这样导致在接收器方较好的语音听觉。本发明使用了语音活动检测器(VAD)以区分周期信号(如语音)和非周期信号(如噪声)。这种VAD使用了许多VSELP编码器的内部参数来确定语音和非语音条件。更具体地说,即使是实际输入信号并不具有任何周期性,VSELP编码器也倾向于从非周期性输入信号中确定出音调信息。这样从一非语音信号中确定出音调就产生了在接收器方重现信号中的回旋噪声。为防止VSELP编码器根据非周期信号确定音调,对于输入信号使用一个高通滤波器来去除VSELP编码器搜索的音调信息。去除音调信息只允许码搜索过程产生语音帧信息。可选地,可以使VSELP编码器说明一个非音调条件并继续进行没有音调信息的处理。
根据下述对一个参照图例的本发明的最优实施例的详细描述可以较好地理解前述的和其它的目标,方面和优点,其中

图1为使用两个VSELP激励码本的语音解码器的模块图;
图2为使用两个VSELP激励码本和一个过去的激励的长期滤波器的语音合成器的模块图;
图3为用于从VSELP编码器中去除回旋噪声的电路的模块图;
图4为一个说明语音活动检测处理的结构的模块图。
现在参照图例,更具体地讲是参照图1,在这里给出一个关于使用两个如上述EIA/TIA暂行标准宣布的VSELP激励码本12和14的语音解码器10的模块图。这些码本通常均用包含长度为N的M个基向量的只读存储器(ROM)来实现,其中M为码字的位数而N为向量中的样值数。码本12接收一个输入码1并提供一个输出向量。码本14接收一个输入码H并提供一个输出向量。在乘法器16处这些向量均由相应的增益项γ1和γ2分别在乘法器16和18处放大。另外,通常为随机存取存储器的长期滤波器状态存储器2。接收一个输入滞后码L并提供一个表示长期滤波器状态的输出bL(n)。在乘法器22处用增益项b对此加以定标。从三个乘法16,18和22的输出由求和器24组合以构成一个激励信号,ex(n)。如虚线所示,这个组合激励信号被反馈以修改长期滤波器状态存储器20。该激励信号也被用于由Z-变换 1/(A(z)) 表示的线性预测码(LPC)合成滤波器26。合成滤波器26的转移函数为由短期滤波器系数ai控制的时间变式。当用合成滤波器26重新构成语音语号后,使用自适应频谱后置滤波器(postfilter)28来增强重新构成的语音的质量。自适应频谱后置滤波器是语音解码器中的最终处理步骤,而数字输出语音信号被输入一个数模(D/A)转换器(未给出)以产生被一扬声器放大并重现的模拟信号。
下述为针对由EIA/TIA暂行标准规定的7950 bps语音编码器和解码器的基本参数
图2为用于产生传送给图1中解码器的码字I和H,滞后L,增益β,γ1和γ2的编码器30的模块图。编码器包括两个类似于码本12和14的VSELP激励码本32和34。码本32接收一个输入码I并提供一个输出向量。码本34接收一个输入码H并提供一个输出向量。每个向量均由对应的增益项γ1和γ2分别在乘法器36和38处进行换算。另外,长期滤波器状态存储器40接收一个输入滞后码L并提供一个表示长期滤波器状态的输出,bL(n)。在乘法器42处通过一增益项β也对该输出加以换算。从三个乘法器36,38和42的输出被求和器44组合以构成一个激励信号,ex(n)。这个组合激励信号被加到由z-变换H(z)表示的加权合成滤波器46。这是一个全极滤波器和带宽扩展合成滤波器 1/(A(γ-1Z)) 。合成滤波器46的输出为向量P’(n)。采样语音信号s(n)被输入到具有一个由Z-变换W(z)表示的转移函数的加权滤波器48以产生加权语音向量p(n)。p(n)为子帧的加权输入语音减去加权合成滤波器46的零输入响应。向量p’(n)在减法器50从加权语音向量p′(n)中减去以产生一个差信号e(n)。信号e(n)经模块52中的平方和分析以产生一个总加权误差的输出,并输入给误差最小化处理54。误差最小化处理顺序地(每次一个)选择滞后L,码字I和H以使总加权误差最小。
参照目前已做到的,图3给出了对基本VSELP编码器的改进。输入信号被模数(A/D)转换器54数字化并被提供给开关56的一极。数字化输入信号也通过一个高通滤波器58提供给开关56的第二个极。通过语音活动检测器(VAD)60控制开关56来选择数字化输入信号或来自滤波器58的高通滤波输出。开关56的输出被提供给VSELP编码器62。VAD60接收原始的数字化输入信号和VSELP编码器62的输出。可以理解,一旦模拟输入信号被A/D转换器54以通常的8KHz采样速率采样,则由图3的模块图中剩余模块表示的所有处理均由如TMS 320C5x单片DSP那样的数字信号处理(DSP)来完成。
如上所述,VSECP编码器62确定音调和输入信号转移函数(即反射系数)。VAD60使用由VSELP编码器62产生的反射系数和输入信号来产生语音(即一个TRUE输出)或非语音(即一个FALSE输出)的判决。TRUE输出使开关56选择来自A/D转换器54的数字化输入信号,而FALSE输出使开关56选择来自高通滤波器58的高通滤波输出。更具体地讲,VAD60使用来自VSELP编码器62的反射系数来确定当前帧LPC系数而这些LPC系数和前面确定的LPC系数历史记录被求平均值并被存储在缓冲区中。原始的160个输入样值经500Hz高通滤波并用于确定自样关函数(ACF),而这个ACF和前面确定的ACF被存在一个缓冲区中。这种数据被VAD的用户确定是否出现语音。参照前已做的,图4给出了这种检测处理的结构。输入数字化语音被输入到语音缓冲区64,在实施例中该缓冲区存储160个语音样值。来自语音缓冲区64的语音样值被提供给帧参数函数66和余音和音调检测器函数68。帧参数函数66使用VSELP反射系数给音调检测器函数68确定当前帧LPC系数67而音调检测器函数68输出一个当在语音帧中检测到音调时则为真的布尔变量69。在语音检测器函数68中确定周期性信号的存在。帧参数函数66也提供一个作为自相关函数(ACF)的当前的和前三个帧的输出70和作为基于平均ACF函数的LPC系数的五个集合的输出71。输出71被提供给平均函数72,并接着产生一个表示当前余音能量的输出73。是布尔变量69时,输出73被输入给噪声分类函数74。作为其输出,噪声分类函数74产生噪声LPC系数75,它和来自帧参数函数66的输出70一起输入给自适应滤波和能量计算函数76,并输出当前余音能量77。VAD判断函数78产生语音/非语音判断输出79。
这样,可以理解VAD 60基本上是一个能量检测器。把滤波信号能量和一个阀值相比较,只要检测到阀值就检测到了语音。VAD 60的一个FALSE输出导致通过高通滤波器58到VSELP编码器62的输入,从而除去输入信号的低频(即语音)部分并因此去除VSELP编码器62在静音阶段产生的回旋噪声。
这样根据一个最优实施例已对本发明进行了描述,本领域的技术人员会认识到本发明可以在所附权利要求书的宗旨和范围内在实际应用中加以修改。
权利要求
1.从基于码激励线性预测(CELP)的编码器(62)中去除回旋噪声的系统,该系统包括一个所连接的接收输入信号的转换开关(56),上述输入信号包括周期和非周期信号;一个所连接的接收上述输入信号并可从上述输入信号中去除低频分量的高通滤波器(58),上述转换开关可被控制有选择地向基于CELP的编码器提供上述输入信号和上述高通滤波器的输出;和一个所连接的接收上述输入信号和来自上述基于CELP的编码器的信息并产生一个指示在上述输入信号中存在周期信号的输出的检测器(60),而上述检测器当检测到周期信号时控制上述转换开关把上述输入信号连接到基于CELP的编码器,而当检测非周期信号时把上述高通滤波器的输出连接到上述基于CELP的编码器。
2.如权利要求1所述的系统,其中上述检测器接收来自上述基于CELP的编码器的反射系数(66)并确定上述输入信号的能量级(76)从而确定在上述输入信号中周期信号的存在。
3.如权利要求1或2所述的系统,其中上述由高通滤波器去除的低频分量对应于音调信息。
4.一个用于从基于码激励线性预测(CELP)的语音编码器(62)中去除回旋噪声的方法,该方法包括的步骤有采样输入信号并把输入信号样值转换成数字值(54),上述输入信号包括周期和非周期信号,上述周期信号为语音类信号而上述非周期信号为噪声类信号;对输入信号的上述数字值进行高通滤波从而从输入信号的样值中去降低频分量,上述低频分量对应于语音信息;使用所连接的用以接收上述输入信号的数字值和来自上述基于CELP的语音编码器的信息的语音活动检测器(VAD)(60)来确定在上述输入信号中语音类信号的存在;并有选择地把上述输入信号的数字值或高通滤波的数字值提供(56)给基于CELP的语音编码器,当检测到语音类信号时上述输入信号的数字值被连接到上述基于CELP的语音编码器而当检测到噪声类信号时高通滤波的数字值被连接到上述基于CELP的语音编码器。
5.如权利要求4所述的方法,该方法进一步包括在上述VAD检测到噪声类信号时有选择地使上述基于CELP的语音编码器说明一个非音调条件,上述基于CELP的语音编码器继续处理没有音调信息的输入信号的数字值,而当上述VAD检测到语音类信号时,上述基于CELP的语音编码器恢复对具有音调信息的输入信号的数字值的处理。
全文摘要
通过去除静音阶段的回旋噪声改进当在噪声背景条件下操作时由一个如VSELP编码器那样的基于CELP的编码器处理的语音的听觉。这是通过在没有检测到语音时去除输入信号的低频分量来实现的。通过使用许多VSELP编码器内部参数确定语音和非语音条件,语音活动检测器区分语音类的周期信号和噪声类的非周期信号。为防止VSELP编码器针对非周期信号确定出语音,对输入信号使用一个高通滤波器来去除VSELP编码器所搜寻的语音信息。
文档编号G10L19/00GK1113586SQ9411298
公开日1995年12月20日 申请日期1994年12月19日 优先权日1993年12月20日
发明者卡尔彦·甘尼山, 侯·里, 普拉伯海特·格普塔 申请人:休斯航空公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1