用于语音快速编码的被选信号脉冲幅度的代数码本的制作方法

文档序号：2820031阅读：319来源：国知局

专利名称：用于语音快速编码的被选信号脉冲幅度的代数码本的制作方法
这是1995年2月6日提交的美国专利申请序号为No.08/383,968，题为“用于语音快速编码的被选信号脉冲幅度的代数码本”的发明的部分继续申请。
本发明涉及一种对声音信号，尤其是对不仅仅是语音信号的声音信号进行数字编码的改进技术，以对这种声音信号进行传送和合成。
在诸如通过卫星，地面移动台、数字无线电或分组网络进行的声音传送、声音存储、声音响应和无线电话等许多应用领域，对具有良好的主观质量/比特率的折衷的高效数字语音编码技术的需求正日益增长。
目前具有良好的主观质量比特率的折衷的最好的现有技术中有一种所谓的码激励线性预测编码(CELP)技术。按照这一技术，语音信号以含L个样值的数据块(即矢量)的形式被采样和处理，其中L是某个预先设定的数值。CELP技术采用一码本(code book)。
在CELP技术中的码本是被称为L维码矢量(定义L个不同位置的脉冲组合，并且包括分配给组合中各个位置p＝1，2……，L的零幅脉冲和非零幅脉冲)的长为L个样值的序列的一个附标集合。该码本包括一个从1至M变化的标引K，其中M表示码本的大小，有时表示为比特数bM＝2b一个码本可以被贮存在物理存储器(如查寻表)中，或者指的是将标引与相应码矢量联系起来的一种机理(例如一个公式)。
为按照CELP技术合成语音，通过模拟语音信号的频谱特性的时间变化滤波器从码本中筛选出适当的码矢量来合成每一块语音样值。在编码器端，对来自码本的所有候选码矢量或候选码矢量的一个子集计算合成的输出信号(码本搜索)。得以保留的码矢量为根据感觉加权失真方法，产生的合成输出信号最接近于原始语音信号的那个码矢量。
一种类型的码本为所谓的“随机”码本。这些码本的一个缺点是它们经常需要相当大的物理存储空间。从标引到相关的码矢量的路径涉及到查寻表，这些查寻表是随机产生的数字或者对大量的语音训练集合应用统计技术的结果。从这个意义来讲，这些码本是随机的，即无规则的。随机码本的容量容易受到存储空间和/或搜索复杂程度的限制。
另一种类型的码本为代数码本。与随机码本相比，代数码本不是随机的且不需要存储空间。一个代数码本是一个附标码矢量的集合，其中第K个码矢量的各脉冲的幅度和位置可通过一种不需要或只需要极少的物理存储空间的规则来根据其标引K推导出来。因而，代数码本的容量不受存储需求的限制。代数码本也能设计用于高效搜索。
因而，本发明的一个目的是提供一种能显著减少对语音信号进行编码时的码本检索复杂程度的方法和装置。这些方法和装置适用于一大类码本。
本发明的另一个目的是提供一种能先验地选择一个码本脉冲组合子集并将待检索的组合限制在该子集内以减少码本搜索复杂程度的方法和装置。
本发明的又一个目的是通过让码矢量的各个非零幅脉冲取q种可能幅度中的至少一种幅度以增加码本容量，而不增加搜索复杂程度。
具体而言，在本发明中，提出了一种在码本中进行搜索以对声音信号编码的方法，该码本由一个脉冲组合的集合组成，并且每一脉冲组合定义了多个不同的位置，并包括分配给该组合中各个位置的脉冲。这一方法包括以下步骤从码本中预选一个与声音信号有关的脉冲组合子集；以及只搜索该脉冲组合子集以对声音信号编码；由于仅搜索码本中的一个脉冲组合子集，因而在操作中搜索的复杂程度就得以减小。
本发明还提供一种在码本中进行搜索以声音信号编码的方法，其中的码本由一个脉冲幅度/位置组合的集合组成，每一脉冲幅度/位置组合定义了L个不同的位置，并包括分配给该组合中各个位置p＝1，2，…，L的零幅脉冲和非零幅脉冲，并且每一个非零幅脉冲至少具有q种可能幅度中的一种。这一方法包括以下步骤从码本中预选一个与该声音信号有关的脉冲幅度/位置组合子集；以及只搜索该脉冲幅度/位置组合子集以对声音信号编码。
由于只搜索码本中的一个脉冲幅度/位置组合子集，搜索的复杂程度再次得以减小。
在本发明中，还提供一种在码本中进行搜索以对声音信号编码的装置，其中的码本由一个脉冲组合的集合组成，并且每一脉冲组合定义了多个不同的位置，并包括分配给该组合中各个位置的脉冲。该装置包括从码本中预选出一个与该声音信号有关的脉冲组合子集的装置；以及只搜索该脉冲组合子集以对声音信号编码的装置。
因为仅搜索码本中的一个脉冲组合子集，因而操作中的搜索的复杂程度就得以减小。
本发明还提供一种对码本进行搜索以对声音信号编码的装置。其中的码本由一个脉冲幅度/位置组合的集合组成，每一脉冲幅度/位置组合定义了L个不同的位置，并包括分配给该组合中各个位置p＝1，2，…，L的零幅脉冲和非零幅脉冲，并且每一个非零幅脉冲至少具有q种可能幅度中的一种幅度。该装置包括从码本中预选一个与声音信号有关的脉冲幅度/位置组合子集的装置；以及只搜索该脉冲幅度/位置组合子集以对声音信号编码的装置，因为只搜索码本中的一个脉冲幅度/位置组合子集，因而搜索的复杂程度得以减小。
在本发明中，还进一步提供一种用于服务于一个被划分为多个小区的大的地理区域的蜂窝通信系统，该系统包括多个移动的便携式发射机/接收机单元；位于各个小区内的多个蜂窝基站；控制各蜂窝基站之间的通信的装置；位于一个小区内的每个移动单元和该小区内的蜂窝基站之间的一个双向无线通信子系统，该双向无线通信子系统包括在移动单元和蜂窝基站之内都有的(a)发射机，该发射机包括对语音信号进行编码的装置和发射编码的语音信号的装置，以及(b)一台接收机，该接收机包括接收被发射的编码语音信号的装置和对接收到的编码语音信号进行解码的装置；其中，语音信号编码装置包含一用于在码本内进行搜索以对语音信号进行编码的装置，该码本由一个脉冲组合的集合组成，并且每一脉冲组合定义了多个不同的位置，并包括分配给该组合中各个位置的脉冲，该搜索执行装置包括用于从码本中预选一个与语音信号有关的脉冲组合子集的装置；以及用于只搜索该脉冲组合子集以对语音信号编码的装置；
因为仅搜索码本中的一个脉冲组合子集，因而，操作中的搜索的复杂程度仍得以减小。
最后，本发明提供一种用于服务于一个被划分为多个小区的大的地理区域的蜂窝通信系统，该系统包括多个移动的便携式发射机/接收机单元；位于各个小区内的蜂窝基站；控制各蜂窝基站之间的通信的装置；位于一个小区内的每个移动单元与该小区内的蜂窝基站之间的一个双向无线通信子系统，该双向无线通信子系统包括在移动单元和蜂窝基站之内都有的(a)发射机，该发射机包含对语音信号进行编码的装置和发射该编码语音信号的装置，和(b)接收机，该接收机包含接收被发射的编码语音信号的装置和对接收到的编码语音信号进行解码的装置；其中该语音信号编码装置包含一用于在码本内进行搜索的以对语音信号编码的装置，该码本由一个脉冲幅度/位置组合的集合组成，每一脉冲幅度/位置组合定义了L个不同的位置，并包括分配给该组合中的各个位置p＝1，2，…，L的零幅脉冲和非零幅脉冲，并且每一个非零幅脉冲至少具有q种可能幅度中的一种幅度，该搜索执行装置包括用于从码本中预选出一个与语音信号有关的脉冲幅度/位置组合子集的装置；以及用于只搜索该脉冲幅度/位置组合以对语音信号编码的装置。
因为仅搜索码本中的脉冲幅度/位置组合的一个子集，因而实际操作中的搜索的复杂程度得以减小。
按照本发明的一个优选实施例，(a)通过预先建立一个与声音信号有关的、所述各个位置p＝1，2，…，L和所述q种可能幅度之间的函数Sp来预选脉冲幅度/位置组合的子集，(b)只搜索码本中的具有满足预先建立的函数关系的非零幅脉冲的脉冲幅度/位置组合。
最好是，通过与声音信号相关地给每一个位置p预先分配q种可能幅度中的一种幅度，就可以很方便地预先建立函数Sp，并且当一个脉冲幅度/位置组合中的每一个非零幅脉冲都具有与预先分配给位置p的非零幅脉冲的幅度Sp相等的幅度时，该预先建立的函数即得到了满足。
最好是，给每一个位置预先分配q种可能幅度中的一种幅度的过程包括以下步骤对声音信号进行处理以产生经逆向滤波(backward-filtered)的目标信号D和已去掉音调的残留信号R′；根据经逆向滤波的目标信号D和已去掉音调的残留信号R′计算幅度估算矢量B；以及对每一个位置p，量化矢量B的幅度估算值Bp以获取位置p的待选幅度。
幅度估算矢量B的计算最好包括以下步骤对具有归一化形式(1-β)D||D||]]>的逆向滤波目标信号D和具有归一化形式βR′||R′||]]>的去音调残留信号求和以由此得到如下形式的幅度预测矢量βB=(1-β)D||D||+βR′||R′||]]>其中β为一个固定常数，最好取位于0和1之间的一值。
按照本发明的另一个优选实施例，采用下述表达式BP/maxn|Bn|]]>来对矢量B的峰值归一化的幅度预测值Bp进行量化。其中分母maxn|Bn|]]>为表示非零幅脉冲的峰值幅度的一个归一化因子。
每一个脉冲组合都可以包含N个非零幅脉冲，并且最好根据至少一个N交织(N-interleaved)的单脉冲置换码对非零幅脉冲的位置p加以约束。
对码本的搜索最好包含以下步骤使一个给定比例值最大，该比例值的分母α2k根据下述关系式采取N层嵌套循环的方式计算而来α2k＝U′(p1，p2)+U′(p2，p2)+2U′(p1，p2)+U′(p3，p3)+2U′(p1，p3)+2U′(p2，p3)…………+U′(pN，pN)+2U′(p1，pN)+2U′(p2，pN)+…+2U′(pN-1，pN)其中每一循环的计算都被写入一条从N层嵌套循环的最外层循环至最内层循环的不同线上，pn为该组合中第n个非零幅脉冲的位置，U′(px，py)为取决于预先分配给位置p中的某一位置px的幅度Spx和预先分配给位置p中的某一位置py的幅度Spy的一个函数。在上面的计算中，当下述不等式成立时，至少可以跳过此N层嵌套循环中的最内层循环。Σn=1N-1SPnDPn<TD]]>其中Spn为预先分配给位置pn的幅度，Dpn为目标矢量D的第pn个分量。Tp为与经逆向滤波的目标矢量D有关的一个阈值。
通过阅读下面的关于优选实施例的叙述，参照附图，就可以对本发明的目的，优点和其它特征有一个更清晰的了解。
在附图中

图1是一个根据本发明的包括一个幅度选择器和一个最佳控制器的声音信号编码装置的示意方框图；图2是一个与图1中的编码装置相关的解码装置的示意方框图；图3a是根据本发明的基于信号选择的脉冲幅度进行快速码本搜索的基本操作步骤的顺序图；图3b是给脉冲幅度/位置组合的每一位置p预先分配q种幅度中的一种幅度的操作步骤的顺序图；图3c是N层嵌套循环搜索过程中包含的操作步骤的顺序图，其中，当认为第一组N-1个脉冲对分子DATK的贡献不够充分时，跳过最内层循环；图4是在码本搜索过程中采用的N层嵌套循环的示意图；图5是说明一个典型蜂窝通信系统的基础结构的示意方框图。
图5图解说明了一个典型蜂窝通信系统1的基础结构。
尽管在本说明书中，作为一个非限制性的例子，对根据本发明的搜索执行方法和装置应用于一个蜂窝通信系统的情况作了说明，但是，应指出这些方法和装置可以被应用到许多其它类型的需要对声音信号进行编码的通信系统中，并具有同样的优点。
对于诸如1的蜂窝通信系统，通过将一个大的地理区域划分成许多较小的小区，可以在这个大的区域内提供通信服务。每一小区有一个蜂窝基站2(图5)，用于提供无线电信令信道，以及音频和数据信道。
无线电信令通道用于在蜂窝基站的覆盖区域范围(小区)内呼叫诸如3的移动无线电话机(移动发射机/接收机单元)，以及与基站所在小区内或外的其它无线电话机通话，或与另外的网络如公共交换电话网(PSTN)4通话。
一旦无线电话机3成功地打通电话或接到电话，音频或数据信道就对于与无线电话机3所处的小区相对应的蜂窝基站2而建立，则基站2和无线电话机3之间的通信就通过该音频或数据通道进行。无线电话机3还可以在通话进行时，通过信令信道接收控制或定时信息。
如果无线电话机3在通话过程中离开某一小区进入另一小区，无线电话机就将电话过区切换到新小区内的可用的音频或数据信道上。类似地，如果没有通话，就通过信令信道发送一条控制信息使得无线电话机登录在与新小区相关的基站2上。采用这种方式，就可能实现在一个宽阔的地域内的移动通信。
蜂窝通信系统1还包含一个终端5，用于在诸如无线电话机3与PSTN4通信期间或者在一第一小区内无线电话机3和第二小区内的无线电话机3之间的通信期间，控制蜂窝基站2和公共交换电话网络4之间的通信。
当然，需要一个双向无线通信子系统来建立位于一个小区内的每一台无线电话机3和该小区内的蜂窝基站2之间的通信。这样一种双向无线通信系统一般包含在无线电话机3和蜂窝基站内都有的(a)发射机，用于对语音信号编码，并通过如6或7的天线发送已被编码的语音信号，以及(b)接收机，用于通过同一天线6或7接收被发送的编码语音信号，并对接收到的编码语音信号进行解码。对本领域普通技术人员都知道，需要对声音编码以减少带宽，这对于通过双向无线通信系统即在无线电话机3和基站2之间发送语音信号来说是必须的。
本发明的目的是提供一种具有良好的主观质量/比特率的折衷的高效数字语音编码技术，例如用于在蜂窝基站2和无线电话机3之间通过音频数据信道进行语音信号的双向传送。图1是适合于实现这一高效技术的一种数字语音编码装置的示意方框图。
图1中的语音编码装置与专利号为No.07/927,528的美国专利中的图1所示的编码装置相同，只是在本发明中增加了一个幅度选择器112。美国专利申请No.07/927,528申请日为1992年9月10日，题为“基于代数码的用于高效语音编码的动态码本”的发明。
模拟语音信号被采样并成块处理。必须明白的是，本发明并不局限于只应用于语音信号。也可以考虑应用本发明对其它类型的声音信号进行编码。在图示的例子中，输入的采样语音的数据块S(图1)由L个样值组成。在CELP的文献中，L表示“子帧”长度，一般位于20和80之间。含L个样值的块也被称为L维矢量。在编码处理过程中会产生各种各样的L维矢量。下面给出了一个在图1和2中出现的矢量的列表，以及一个发送参数的列表关于主要L维矢量的列表S 输入语音矢量；R′ 去掉音调的残留信号；X 目标矢量；D 经逆向滤波的目标矢量；Ak代数码本中标引为k的码矢量；Ck修正矢量(Innovation vector)(经滤波的码矢量)；发送参数的列表k 码矢量的标引(代数码本的输入)；g 增益；STP 短期预测参数(定义A(Z))；以及LTP 长期预测参数(定义音调增益b和音调延时T)解码原理最好是首先叙述图2中的语言解码装置，以说明在数字输入(多路信号分离器205的输入)和输出的取样语音(合成滤波器204的输出)之间进行的各个步骤。
多路信号分离器205从接收自数字输入信道的二进制信息中提取四种不同的参数，即标引k、增益g、短期预测参数STP和长期预测参数LTP。在这四种参数的基础上合成语音信号的当前L维矢量S，在下面的叙述中将对此加以解释。
图2中的语音解码装置包含动态码本208、放大器206、加法器207、长期预测器203和合成滤波器204，其中动态码本208由一个代数码发生器206和一个自适应前置滤波器202组成。
第一步，代数码产生器201响应标引k产生一个码矢量Ak。
第二步，给自适应前置滤波器202提供长期预测参数LTP，由其对码矢量Ak进行处理，以产生输出修正矢量Ck。采用自适应前置滤波器202的目的是对输出修正矢量Ck的频率成分进行动态控制以提高语音质量，也就是减少由刺耳的频率引起的声音失真。下面给出了自适应前置滤波器202的典型传输函数F(Z)Fa(Z)=(A(Z/Y1)A(Z/Y2))]]>Fb(Z)=1(1-b0zT)]]>Fa(Z)是一种共振峰(formant)前置滤波器，γ1和γ2为常数，且0＜γ1＜γ2＜1。这种滤波器能增强共振峰区域的频率成分，并且在编码速率低于5k比特/s时能非常有效地工作。
Fb(Z)是一种音调前置滤波器，其中T是时变音调延时，bo或是常数或者是等于根据当前或以前的子帧量化的长期音调预测参数。Fb(Z)用于加强各种码速率F的音调谐波频率非常有效。因此，F(Z)一般包括一个有时与一个共振峰前置滤波器相结合的音调前置滤波器，即F(Z)＝Fa(Z)Fb(Z)按照CELP技术，首先用经放大器206的增益g来放大码本208中的修正矢量Ck来获得输出的取样语音信号S。然后，由加法器207将放大的波形gck加到提供有LTP参数的长期预测器203的输出E上(合成滤波器204的信号激励的长期预测部分)，长期预测器203置于反馈环中，并具有如下的传输函数B(Z)B(Z)＝bZ其中b和T分别为所述的音调增益和延时。
预测器203是一个模拟语音的音调周期性的滤波器，具有基于最新接收到的LTP参数b和T的传输函数。它引入样值的适当的音调增益b和延时T。复合信号E+gCk构成合成滤波器204的信号激励，合成滤波器的传输函数为1/A(Z)(A(Z)将在下面的叙述中定义)。滤波器204根据最新接收到的STP参数进行正确的频谱整形。具体而言，滤波器204模拟语音的共振频率(共振峰)。输出的样值组S为合成取样语音信号，根据在本技术领域中的公知技术，采用合适的去混叠滤波，可以将该合成取样语音信号转化为模拟信号。
有许多方式来设计代数码发生器201。在所述的专利申请号为No.07/927,528的美国专利中提出了一种较好的方法，该方法采用至少一种N交织的单脉冲置换码。
用一个简单的代数码发生器201来对这一概念加以说明。在这个例子中，L＝40并且40维的码矢量集合中只包含N＝5个非零幅脉冲，称之为Sp1，Sp2，Sp3，Sp4，Sp5。在这种更细致的标注法中，pi表示子帧内的第i个脉冲的位置(即pi在0至L-1范围内取值)。假设脉冲Spi被限制在如下的8种可能位置p1p1＝0，5，10，15，20，25，30，35＝0+8m1；m1＝0，1，…，7在被称为“轨迹”#1的这八种可能的位置内，Sp1和7个零幅脉冲可以自由置换。称之为“单脉冲置换码”。现在让我们通过用类似的方式对余下的脉冲的位置也加以限制来交织五个这种“单脉冲置换码”(即轨迹#2，轨迹#3、轨迹#4和轨迹#5)。
p1＝0，5，10，15，20，25，30，35＝0+8m1p2＝1，6，11，16，21，26，31，36＝1+8m2p3＝2，7，12，17，22，27，32，37＝2+8m3p4＝3，8，13，18，23，28，33，38＝3+8m4p5＝4，9，14，19，24，29，34，39＝4+8m5注意整数m1＝0，1，…，7可以完全确定每一个脉冲Spi的位置pi。因而，采用下述关系式，通过对各mi直接倍乘，就可以推导出一种简单的位置标引KpKp＝4096m1+512m2+64m3+8m4+m5必须指出的是，采用上述脉冲轨迹也能推导出其它的码本。例如，只采用4个脉冲，其中前三个脉冲分别占据前三条轨迹的位置，同时第四个脉冲或者占据第四条轨迹或者占据第五条轨迹，用一个比特来说明其处于哪一个轨迹。这种设计能得到一个13位位置码本。
在现有技术中，由于码矢量搜索的复杂性的缘故，假定非零幅脉冲在各种实际应用中都具有固定的幅度。事实上，如果脉冲Spi可以取q种可能幅度中的一种的话，在搜索中就必须考虑有qN种之多的脉冲一幅度组合。例如，如果允许第一个例子中的5个脉冲取q＝4种可能幅度，如Spi＝+1，-1，+2，-2而不是固定幅度的话，代数码本的大小就会从15位跳至15+(5×2)位＝25位；也就是说，搜索将复杂一千倍。
本发明的目的是指出这样一个令人惊讶的方案，即在不用付出很大代价的情况下，采用有q种幅度的脉冲能取得非常好的性能。这种方案是将搜索范围限制在码矢量的一个限定的子集内。选择码矢量的方法与输入语音信号有关，下面的叙述中将对此加以说明。
本发明的有用之处在于通过允许单个脉冲取不同的可能幅度，能够增加动态代数码本208的大小，而不增加码矢量搜索的复杂性。编码原理取样语音信号S由图1中的编码系统按块编码在一块上。图1中的解码系统可被分解为标号从102至112的11个模块。大多数这些模块的功能和操作相对于美国专利和申请号为No.07/927,528的母专利中的描述来说没有变化。因而，在下面的叙述中尽管将不得不对每一个模块的功能和操作一些简要的解释。但主要将叙述对于美国专利申请号为No.07/927,528的母专利而言为新的内容。
按照现有技术，通过一个LPC频谱分析器102，给语音信号的每一个含L个样值的数据块，产生一组被称为短期预测(STP)参数的线性预测编码(LPC)参数。具体而言，分析器102模拟L个样值的每一块S的频谱特性。
L个样值S的输入块S由“白化”滤波器103白化，“白化”滤波器103具有下述基于STP参数的当前值的传输函数A(Z)=Σi=0Maiz-i]]>其中a0＝1，Z为所谓的Z变换中的一般变量。如图1所示，“白化”滤波器103产生残留矢量R。
音调提取器104用于计算和量化LTP参数，即音调延时T和音调增益g。提取器104的初始状态也被设置为来自初始状态提取器110的一个值FS。在美国专利申请号为No.07/927,528的母专利中对计算和量化LTP参数的详细过程已有叙述，并且相信对本领域普通技术人员是熟知的。因而，在本文中不再对此作进一步的叙述。
给滤波器响应特性计算器105(图1)提供STP和LTP参数以计算滤波器的响应特性FRC供后续步骤使用。FRC信息包括下述三个组成部分，其中n＝1，2，…，L。·f(n)F(Z)的响应注意F(Z)一般包括音调前置滤波器。h(n):1A(zγ-1)]]>对f(n)的响应其中γ是一个感觉因子。更一般而言，h(n)是前置滤波器F(Z)，感觉加权滤波器W(Z)和合成滤波器1/A(Z)的级联F(Z)W(Z)/A(Z)脉冲响应。注意F(Z)和1/A(Z)与在图2的解码器中采用的滤波器相同。U(i，j)基于下述表达式的h(n)的自相关u(i,j)=k=1ΣLh(k-i+1)h(k-j+1)]]>1≤i≤L且i≤j≤L；当n＜1时h(n)＝0给长期预测器106输入以前的激励信号(即前面子帧的E+gCk)，以采用适当的音调延时T和增益b形成新的E成分。
感觉滤波器(perceptual filter)107的初始状态被设置成由初始状态提取器110输入的值FS。然后，将由减法器121(图1)计算出的已去掉音调的残留矢量R′＝R-E输入至感觉滤波器107以使感觉滤波器107输出一个目标矢量X。如图1所示，将STP参数输入滤波器107中以改变其与这些参数相关的传输函数。实质上，X＝R′-p，其中p表示包含由以前的激励信号引起的“振铃”的长期预测(LTP)的贡献。适用于Δ的MSE判据现在能用下述的矩阵符号表述mink||Δ||2=mink||S′-S^′||2=mink||S′-[P-gAkHT]||2]]>=mink||X-gAkHT||2]]>其中M为由如下的h(n)响应形成的一个L×L下三角托普利兹(Toeplitz)矩阵。h(0)项位于矩阵的对角线，h(1)、h(2)……h(L-1)位于相应较低的对角线。
由图1中的滤波器108来完成逆向滤波步骤。设上式对增益g的微分等于0，就可得到如下的最佳增益&PartialD;||Δ||2&PartialD;g=0]]>g=X(AkHT)T||AkHT||2]]>取g为这一值，最小值就变为mink||Δ||2-mink{||X||2-(X(AkHT)T)2||AkHT||2}]]>目的是寻找一个特定的标引k，使得到最小值。注意由于‖X‖2为一固定的数值。因而可以通过使下述数值最大来寻找同一标引maxk(X(AkHT)T)2||AkHT||2=maxk((XH)AkT)2&Proportional;k2=maxk(DAkT)2&Proportional;k2]]>其中D＝(XH)且α2k＝‖AkHT‖2在逆向滤波器108中计算经逆向滤波的目标矢量D＝(XH)。把此运算称为术语“逆向滤波”是因为将(XH)解释为时间反演X的滤波。
只在所述美国专利申请号为No.07/927；528的母专利的图1中增加了一个幅度选择器112。幅度选择器112的功能是通过最佳控制器109将待搜索的码矢量Ak限制在最可能的码矢量Ak的范围内从而减小码矢量搜索的复杂性。如前面的描叙所述。每一个码矢量Ak是一个脉冲幅度/位置组合波形。它定义了L个不同的位置p，并包括分配给该组合中各个位置p＝1，2，…，L的零幅脉冲和非零幅脉冲，其中每一个非零幅脉冲具有q种不同的可能幅度中的至少一种幅度。
现在参照图3a、3b和3c，幅度选择器112的作用是预先建立码矢量波形的位置p和各脉冲幅度的q种可能值之间的函数关系Sp。在码本搜索之前与语音信号相关联推导出预先建立的函数关系Sp。具体而言，这一函数的预先建立过程包括与语音信号相关地，给波形的每一个位置p预先分配q种可能幅度中的至少一种幅度(图3a中的步骤301)。
为给波形的每一个位置p预先分配q种可能幅度中的一种，响应于经逆向滤波的目标矢量D和已去除音调的残留矢量R′来计算幅度预估矢量B。具体而言，通过对归一化形式的经逆向滤波的目标矢量D(1-β)D||D||]]>和归一化形式的已去除音调的残留矢量R′βR′||R′||]]>求和来计算幅度预估矢量B(图3b中的子步骤301-1)从而得到如下形式的幅度预估矢量BB=(1-β)D||D||+βR′||R′||]]>其中β是一个固定常数，其典型值为1/2(β值根据在代数码本中采用的非零幅脉冲的百分比在0和1之间选择)。
对波形的每一个位置p来说，通过量化矢量B的相应的幅度预估值Bp来获取要预先分配给该位置p的幅度Sp。具体而言，对波形的每一个位置p，采用下述表达式来量化矢量B的经峰值归一化的幅度预估值Bp(图3b中的子步骤301-2)SP=Q(BP/maxn|Bn|)]]>其中Q(.)为量化函数而且maxn|Bn|]]>是一个归一化因子，表示非零幅脉冲的峰值幅度。
在下述重要的特殊情形中-q＝2，即脉冲幅度只能取两个值(即Spi＝±1)；以及-非零幅脉冲密度N/L小于等于15％β值可以等于零；因而幅度预估矢量B就简化为只与经逆向滤波的目标矢量D有关，结果为sP＝sign(Dp)。
最佳控制器119的作用是从代数码本中选择出最佳码矢量Ak。选择判据以定额(ration)的形式给出，对每一个码矢量Ak计算其定额，并从所有码矢量中寻找最大值(步骤303)maxk(DAkT)2αk2]]>其中D＝(XH)且α2k＝‖AkHT‖2由于Ak是一个代数码矢量，它具有N个非零幅脉冲，且各个脉冲的幅度分别为Spi，因而分子为下式的平方DAkT=Σi=1NDP1SP1]]>且分母为能够表示为如下形式的一个能量项αk2=Σi=1NSP12U(Pi′Pi)+2Σi=1N-1Σj=i+1NSPiSPjU(Pi,Pj)]]>其中U(pi，pj)是与两个单位幅度脉冲有关的相关量，一个脉冲位于位置pi，另一个脉冲位于位置pj。在滤波器响应特性计算器105中根据上式计算该矩阵。该矩阵被包括在图1的方框图中称FRC的一组参数中。
一种用于计算这一分母的快速方法包含如图4所示的N层嵌套循环。在图4中用对齐符号S(i)和SS(i，j)分别代替参数“Spi”和“SpiSpj”。分母α2k的计算是最费时的过程。对α2k有贡献的在每一个循环中完成的计算可以用如下形式写在从最外层循环至最内层循环的不同线上αk2=SP12U(P1,P1)]]>+SP22U(P2′P2)+2SP1SP2U(P1′P2)]]>+SP32U(P3′P3)+2[SP1SP3U(P1′P3)+SP2SP3U(P2′P3)]]]>+SPN2U(PN′PN)+2[SP1SPNU(P1′PN)+SP2SPNU(P2′PN)+...+SPN-1SPNU(PN-1′PN)]]]>其中pi是第i个非零幅脉冲的位置。值得注意的是图4中的N层嵌套循环能够根据N交织单脉冲置换码来约束码矢量Ak的非零幅脉冲。
在本发明中，通过将待搜索的码矢量Ak的子集限制为其N个非零幅脉冲满足在图3a的步骤301中预先建立的函数关系的码矢量，可以显著减小搜索的复杂程度。当码矢量Ak的N个非零幅脉冲中的每一个都具有与预先分配给处于位置p的非零幅脉冲的幅度相等的幅度时，预先建立的函数关系就得到了满足。
所述码矢量子集的限制过程通过首先将预先建立的函数Sp与矩阵元U(i，j)相结合(图3a中的步骤302)。然后采用假定为固定位置，极性为正、具有单位幅度的所有脉冲S(i)进行N层嵌套循环(步骤303)。因而，即使代数码本中的非零幅脉冲的幅度可以取q种可能值中的任意一种，也可以将搜索的复杂程度减小至固定脉冲幅度的情形。更准确地说，根据下述关系式将由滤波器响应特性计算器105提供的矩阵U(i，j)与预先建立的函数相组合(步骤302)U′(i，j)＝SiSjU(i，j)其中Si来源于幅度选择器102的选择方法，即Si为在对相应的幅度预估值量化之后给每个位置i所选择的幅度。
采用这个新的矩阵，该快速算法的每一循环中的计算可以如下形式写在从最外层至内层循环的不同线上α2k＝U′(p1，p1)+U′(p2，p2)+2U′(p1，p2)+U′(p3，p3)+2U′(p1，p3)+2U′(p2，p3)…………
+U′(pN，pN)+2U′(p1，pN)+2U′(p2，p1)+…+2U′(pN-1，pN)其中px为波形中第X个非零幅脉冲的位置，U′(px，py)为取决于预先分配给位置p中的某一位置px的幅度Spx和预先分配给位置p中的某一位置py的幅度Spy的一个函数。
为了更进一步减小搜索的复杂性，只要下述不等式成立，就可以跳过最内层循环(参照图3c)。而且跳过最内层循环只是个特例，而不是仅仅只指最内层循环Σn=1N-1SPnDPn<TD]]>其中Spn是预先分配给位置pn的幅度，Dpn是目标矢量D的第pn个分量，TD是与经逆向滤波的目标矢量D有关的一个阈值。
全局的信号激励信号E+gCk由加法器120(图1)根据来自控制器109的信号gCk和来自预测器106的输出E来计算。由具有随STP参数变化的传输函数1/A(Zγ-1)的感觉滤波器构成的初始状态提供模块110，从残留信号R中减去信号激励信号E+gCk，以获取最终滤波器状态FS，供滤波器107和音调提取器104作为初始状态使用。
四种参数k，g，LTP和STP的集合通过多路复用器111转换为合适的数字信道格式，从而完成对语音信号的样值块S的编码过程。
尽管上面已经参照优选实施例对本发明进行了描述，在不偏离本发明的精神和实质的情形下，在后附的权利要求所声明的范围之内，还可以对这些实施例进行修改。
权利要求
1.一种对码本进行搜索以对声音信号编码的方法，所述码本由一个脉冲组合的集合组成，每个脉冲组合定义了多个不同的位置并且包括分配给该组合中各个位置的脉冲，所述方法包括以下步骤从所述码本中预选一个与所述声音信号有关的脉冲组合子集；以及仅搜索所述脉冲组合子集以对声音信号编码；由于仅搜索所述码本的一个脉冲组合子集，因而在操作中搜索的复杂程度就得以减小。
2.一种对码本进行搜索以对声音信号编码的方法，所述码本由一个脉冲幅度/位置组合的集合组成，每一个脉冲幅度/位置组合定义了L个不同的位置并且包括分配给该组合中的各个位置p＝1，2，…，L的零幅脉冲和非零幅脉冲组合，每一个非零幅脉冲具有q种可能幅度中的至少一种幅度，所述方法包括以下步骤从所述码本中预选一个与所述声音信号有关的脉冲幅度/位置组合子集；以及仅搜索所述脉冲幅度/位置组合子集以对声音信号编码；由于仅搜索所述码本中的一个脉冲幅度/位置组合子集，因而在操作中搜索的复杂程度就得以减小。
3.如权利要求2所述的方法，其中所述预选步骤包括与所述声音信号相关预先建立所述各个位置p＝1，2，…，L和q种的幅度之间的函数Sp；以及所述搜索步骤包括仅搜索所述码本中的具有满足预先建立的函数的非零幅脉冲的脉冲幅度/位置组合。
4.如权利要求3所述的方法，其中所述函数的预先建立步骤包括与所述声音信号相关给每一位置p预先分配q种可能幅度中的一种幅度的步骤，而且其中当一个脉冲幅度/位置组合中的每一个非零幅脉冲都具有与预先分配给所述非零幅脉冲的位置p的幅度相等的幅度时，所述预先建立的函数即得到了满足。
5.如权利要求4所述的方法，其中给每一位置p预先分配q种可能幅度中的一种幅度的步骤包括以下步骤对所述声音信号进行处理以产生一个经逆向滤波的目标信号D和一个去除音调的残留信号R′；根据经逆向滤波的目标信号D和已去除音调的残留信号R′计算幅度预估矢量B；以及对所述的每一个位置p，量化所述矢量B的幅度预估值Bp以获取准备为所述位置p选择的幅度。
6.如权利要求5所述的方法，其中计算幅度预估矢量B的步骤包括以下步骤对归一化形式的经逆向滤波的目标信号D(1-β)D||D||]]>和归一化形式的已去除音调的残留信号R′βR′||R′||]]>求和以获取如下形式的幅度预估矢量BB=(1-β)D||D||+βR′||R′||]]>其中β为一固定常数。
7.如权利要求6所述的方法，其中的β是一个其值位于0和1之间的固定常数。
8.如权利要求5所述的方法，其中对所述的每一位置p的量化步骤包括采用下述表达式对所述矢量B的经峰值归一化的幅度预估值Bp进行量化；BP/maxn|Bn|]]>其中分母maxn|Bn|]]>为归一化因子，表示所述非零幅脉冲的峰值幅度。
9.如权利要求1所述的方法，其中所述的每一个脉冲组合都包括N个非零幅脉冲，所述的方法还包括用至少一个N交织的单脉冲置换码来约束所述非零幅脉冲的位置p的步骤。
10.如权利要求5所述的方法，其中所述的每一个脉冲幅度/位置组合都包含N个非零幅脉冲，而且其中的所述搜索步骤包括对根据下述关系式通过N层嵌套循环的方法计算的分母为α2k的给定比率进行最大化的步骤α2k＝U′(p1，p1)+U′(p2，p2)+2U′(p1，p2)+U′(p3，p3)+2U′(p1，p3)+2U′(p2，p3)…………+U′(pN，pN)+2U′(p1，pN)+2U′(p2，pN)+…+2U′(pN-1，pN)其中每一循环中的计算写在从N层嵌套循环的最外层循环至最内层循环的不同线上，pn是所述组合中第n个非零幅脉冲的位置，U′(px，py)是取决于预先分配给位置p中间的某一位置px的幅度Spx和预先分配给位置p中间的某一位置py的幅度Spy的一个函数。
11.如权利要求10所述的方法，其中对所述给定比率的最大化步骤包括当下述不等式成立时至少跳过N层嵌套循环的最内层循环的步骤Σn=1N-1SPnDPn<TD]]>其中Spn是预先分配给位置pn的幅度，Dpn是目标矢量D的第pn个分量，TD是与经逆向滤波的目标矢量D有关的一个阈值。
12.一种对码本进行搜索以对声音信号编码的装置，所述码本由一个脉冲组合的集合组成，每个脉冲组合定义了多个不同的位置并且包括分配给该组合中各个位置的脉冲，所述装置包含用于从所述码本中预选出一个与所述声音信号有关的脉冲组合子集的装置；以及用于仅搜索所述脉冲组合子集以对声音信号编码的装置；由于仅搜索码本中的一个脉冲组合子集，因而在操作中搜索的复杂程度就得以减小。
13.一种对码本进行搜索以对声音信号编码的装置，所述码本由一个脉冲幅度/位置组合的集合组成，每个脉冲幅度/位置组合定义了L个不同的位置并且包括分配给该组合中各个位置p＝1，2，…，L的零幅脉冲和非零幅脉冲，每个非零幅脉冲具有q种可能幅度中的至少一种幅度，所述装置包括用于从所述码本中预选出一个与所述声音信号有关的脉冲幅度/位置组合子集的装置；以及用于仅搜索所述脉冲幅度/位置组合子集以对声音信号编码的装置；由于仅搜索码本中的一个脉冲幅度/位置组合子集，因而在操作中搜索的复杂程度就得以减小。
14.如权利要求13所述的装置，其中所述预选装置包括用于根据所述声音信号预先建立各个位置p＝1，2，…，L和q种可能幅度之间的函数Sp的装置；以及所述搜索装置包括用于将搜索限制在所述码本中具有满足所述预先建立的函数的非零幅脉冲的脉冲幅度/位置组合的范围内。
15.如权利要求14所述的装置，其中的函数预先建立装置包括用于与所述声音信号相关给每个位置p预先分配q种可能幅度中的一种幅度的装置，并且其中当一个脉冲幅度/位置组合中的每一个非零幅脉冲都具有与预先分配给所述非零幅脉冲所处的位置p的幅度Sp相等的幅度时，该预先建立的函数即得到了满足。
16.如权利要求15所述的装置，其中用于给每个位置p预先分配q种可能幅度中的一种幅度的装置包括用于对所述声音信号进行处理以产生一个经逆向滤波的目标信号D和一个已去除音调的残留信号R′的装置；用于根据经逆向滤波的目标信号D和已去除音调的残留信号R′计算幅度预估矢量B的装置；以及用于对所述矢量B的每个位置p的幅度预估值Bp进行量化以获取要为所述位置p选择的幅度的装置。
17.如权利要求16所述的装置，其中用于计算幅度预估矢量B的所述装置包括用于对归一化形式的经逆向滤波的目标信号D(1-β)D||D||]]>和归一化形式的已去除音调的残留信号R′βR′||R′||]]>求和以获取如下形式的幅度预估矢量B的装置B=(1-β)D||D||+βR′||R′||]]>其中β为一固定常数。
18.如权利要求17所述的装置，其中β是一个其值位于0和1之间的固定常数。
19如权利要求16所述的装置，其中的所述量化装置包括用于采用下述表达式对所述矢量B的所述每个位置p的经峰值归一化的幅度预估值Bp进行量化的装置
其中分母maxn|Bn|]]>是一个归一化因子，表示所述非零幅脉冲的峰值幅度。
20.如权利要求12所述的装置，其中所述的每一个脉冲组合都包含N个非零幅脉冲，所述的装置还包括根据至少一种N交织单脉冲置换码来约束所述非零幅脉冲的位置的装置。
21.如权利要求16所述的装置，其中所述的每一个脉冲幅度/位置组合都包含N个非零幅脉冲，并且所述搜索装置包括用于对分母为α2k的给定比率进行最大化处理的装置和用于根据下述关系式通过N层嵌套循环的方法计算所述分母α2k的装置α2k＝U′(p1，p1)+U′(p2，p2)+2U′(p1，p2)+U′(p3，p3)+2U′(p1，p3)+2U′(p2，p3)…………+U′(pN，pN)+2U′(p1，pN)+2U′(p2，pN)+…+2U′(pN-1，pN)其中每一循环中的计算都写在从N层嵌套循环的最外层循环至最内层循环的不同线上，pn是所述组合中第n个非零幅脉冲的位置，并且其中U′(px，py)是取决于预先分配给位置p中的某一位置px的幅度Spx和预先分配给位置p中的某一位置py的幅度Spy的一个函数。
22.如权利要求21所述的装置，其中用于计算分母α2k的所述装置包括用于每当下述不等式成立时至少跳过N层嵌套循环的最内层循环的装置Σn=1N-1SPnDPn<TD]]>其中Spn是预先分配给位置pn的幅度，Dpn是目标矢量D的第pn个分量，TD是与所述经逆向滤波的目标矢量D有关的一个阈值。
23.一种用于服务于一个被划分成多个小区的大的地理区域的蜂窝通信系统，包括移动的便携式发射机/接收机单元；分别位于所述各个小区内的蜂窝基站；用于控制所述各蜂窝基站之间的通信的装置；位于一个小区内的每个移动单元和所述一个小区内的蜂窝基站之间的一种双向无线通信子系统，所述双向无线通信子系统包括在所述移动单元和所述蜂窝基站内都具有的(a)发射机，该发射机包括用于对语音信号进行编码的装置和用于发送编码语音信号的装置，和(b)接收机，该接收机包括用于接收编码语音信号的装置和用于对接收到的编码语音信号进行解码的装置；其中所述语音信号编码装置包括一用于对一个码本进行搜索以对语音信号编码的装置，所述码本由一个脉冲组合的集合组成，每个脉冲组合定义了多个不同的位置并且包括分配给该组合中各个位置的脉冲，所述搜索执行装置包括用于从所述码本中预选一个与所述语音信号有关的脉冲组合子集；以及用于仅搜索所述脉冲组合子集以对所述语音信号编码的装置；由于仅搜索码本中的一个脉冲组合子集，因而在操作中的搜索复杂程度就得以减小了。
24.一种用于服务于一个被划分成多个小区的大的地理区域的蜂窝通信系统，包括移动的便携式发射机/接收机单元；分别位于各个小区内的蜂窝基站；用于控制所述各蜂窝基站之间的通信的装置；位于一个小区内的每个移动单元和所述一个小区的蜂窝基站之间的一种双向无线通信子系统，所述双向无线通信子系统包括在所述移动单元和所述蜂窝基站内都具有的(a)发射机，该发射机包括用于对语音信号进行编码的装置和用于发送该编码语音信号的装置；和(b)接收机，该接收机包括用于接收编码语音信号的装置和用于对接收的编码语音信号进行解码的装置，其中所述的语音信号编码装置包含一用于对一个码本进行搜索以对语音信号编码的装置，所述码本由一个脉冲幅度/位置组合的集合组成，每一个脉冲幅度/位置组合定义了L个不同的位置并且包括分配给该组合中各个位置p＝1，2，…，L的零幅脉冲和非零幅脉冲，每个非零幅脉冲具有q种可能幅度中的至少一种幅度，所述搜索执行装置包括用于从所述码本中预选出一个与所述语音信号有关的一个脉冲幅度/位置组合的装置；以及用于仅搜索所述脉冲幅度/位置组合子集以对语音信号编码的装置；由于仅搜索码本中一个脉冲幅度/位置组合子集，因而在操作中搜索的复杂程度就得以减小。
25.如权利要求24所述的系统，其中所述预选装置包括用于与所述语音信号相关预先建立各个位置p＝1，2，…，L和q种可能幅度之间的函数Sp的装置；以及所述搜索装置包括用于将搜索限制在所述码本中具有满足预先建立的函数的非零幅脉冲的脉冲幅度/位置组合的范围内的装置。
26.如权利要求25所述的系统，其中的函数预先建立装置包括用于与所述语音信号相关给每个位置p预先分配q种可能幅度中的一种幅度的装置，而且当一个脉冲幅度/位置组合中的每一个非零幅脉冲都具有与预先分配给所述非零幅脉冲所处位置p的幅度Sp相等的幅度时，该预先建立的函数即得到了满足。
27.如权利要求26所述的系统，其中所述用于给每一位置p预先分配q种可能幅度中的一种幅度的装置包括用于对所述语音信号进行处理以产生一个经逆向滤波的目标信号D和一个已去除音调的残留信号R′的装置；用于根据经逆向滤波的目标信号D和已去除音调的残留信号R′计算幅度预估矢量B的装置；以及用于对所述矢量B的所述每个位置p的幅度预估值Bp进行量化以获取要为所述位置p选择的幅度的装置。
28.如权利要求27所述的系统，其中用于计算幅度预估矢量B的所述装置包括用于对归一化形式的经逆向滤波的目标信号D(1-β)D||D||]]>和归一化形式的残留信号R′βR′||R′||]]>求和以获取如下形式的幅度预估矢量B的装置B=(1-β)D||D||+βR′||R′||]]>其中β是一个固定常数。
29.如权利要求28所述的系统，其中的β是一个其值位于0和1之间的固定常数。
30.如权利要求27所述的系统，其中的所述量化装置包括用于采用下述表达式对所述矢量B的所述每个位置p的经峰值归一化的幅度预估值Bp进行量化的装置BP/maxn|Bn|]]>其中分母maxn|Bn|]]>是一个归一化因子，表示所述各非零幅脉冲的峰值幅度。
31.如权利要求23所述的系统，其中的所述每个脉冲组合都包括N个非零幅脉冲，所述装置还包括用于用至少一个N交织单脉冲置换码来约束所述非零幅脉冲的位置p的装置。
32.如权利要求27所述的系统，其中的所述每个脉冲幅度/位置组合都包括N个非零幅脉冲，其中所述搜索装置包括用于对分母为α2k的给定比率进行最大化处理的装置和用于根据下述关系式通过N层嵌套循环的方法计算所述分母α2k的装置α2k＝U′(p1，p1)+U′(p2，p2)+2U′(p1，p2)+U′(p3，p3)+2U′(p1，p3)+2U′(p2，p3)+U′(pN，pN)+2U′(p1，pN)+2U′(p2，pN)+…+2U′(pN-1，pN)其中每个循环中的计算都写在从N层嵌套循环的最外层循环至最内层循环的不同线上，pn为该组合中第n个非零幅脉冲的位置，U′(px，py)是取决于预先分配给位置p中的某一位置px的幅度Spx和预先分配给位置p中的某一位置py的幅度Spy的一个函数。
33.如权利要求32所述的系统，其中用于计算分母α2k的所述装置包括用于当下述不等式成立时至少跳过最内层循环的装置Σn=1N-1SPnDPn<TD]]>其中Spn是预先分配给位置pn的幅度，Dpn是目标矢量D的第pn个分量，TD是与所述经逆向滤波的目标矢量D有关的一个阈值。
全文摘要
对码本进行搜索以对声音信号进行编码。该码本由一个脉冲幅度/位置组合的集合组成,每一个脉冲幅度/位置组合定义了L个不同的位置,包括分配给该组合的各个位置p=1,2,...,L的零幅脉冲和非零幅脉冲组成,其中每一个非零幅脉冲具有q种可能幅度中的至少一种幅度。为减小搜索的复杂性,从码本中预先选择出与声音信号有关的一个脉冲幅度/位置组合子集,并且只搜索这一组合子集。该组合子集的预选过程包括与声音信号相关预先建立一个在各自位置p=1,2,...,L和q种可能幅度之间的函数S
文档编号G10LGK1181150SQ96193095
公开日1998年5月6日申请日期1996年2月2日优先权日1995年2月6日
发明者让－皮埃尔·阿杜尔, 克劳德·拉弗雷米申请人:舍布鲁克大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：让-皮埃尔·阿杜尔、克劳德·拉弗雷米
技术所有人：舍布鲁克大学
我是此专利的发明人

上一篇：波形语音合成的制作方法
上一篇：数字信息编码的方法和装置的制作方法