具有高效、容错、激励向量编码的声码器的制作方法

文档序号：2820781阅读：167来源：国知局

专利名称：具有高效、容错、激励向量编码的声码器的制作方法
技术领域：
本发明涉及通信系统，尤其涉及语音编码。
声码器(vocoder)用于编码语音信号，以使得通信信道上传输的带宽最小。为了使给定谱段范围内有效信道数目最多，使每个通信信道的带宽最小，这是非常重要的。许多所熟知的声码器是码激励线性预测(CELP)声码器。当前的CELP声码器使用对位差错敏感的低效编码方案，该声码器把固定密码本作为一系列脉冲提供到滤波器激励上。浪费宝贵的带宽并且对位差错敏感的编码方案在易出差错的通信信道如无线通信信道中是尤其不希望的。
编码过程包括把一系列激励脉冲或者激励向量表示为当作固定索引引用的一系列位。该固定索引在接收器上被声码器使用，以重新产生激励脉冲，脉冲接着用于激励语音模型并因此重新产生语音。现有的声码器使用每脉冲3-1/2个或更多的位来表示这些脉冲。另外，现有的声码器对于导致差错的通信信道是敏感的，因为单个位差错会产生高达两个脉冲的差错。

图1表示了将被固定索引表示的一系列脉冲。在该实施例中有十个脉冲，每个脉冲可以是正的或负的。该固定索引指定了四十个可能预定位置中的十个被脉冲和每个脉冲的符号所占据。低效编码方案由图2中的表来表示。对于脉冲有40个可能的位置，然而，该表指出了每个脉冲限于八个位置中的一个。其结果是，声码器局限于使用由一系列脉冲组成的激励向量，这些脉冲按照表中规定的可能组合。图2表示了一个固定索引表，其中两个脉冲与表中的每一行相联系。在第一行中，I0和I5脉冲中每一个被限制到八个位置即位置0、5、10、15、20、25、30和35的一个。相似地，其余的每一行指定了被指定给与该行相关的脉冲对中的每一个脉冲的可能位置。应该注意为每个脉冲指定八个位置中的一个需要每个脉冲的三个位。另外，对每个脉冲要指定一个符号。在现有技术系统中，有一个位用于指定每一行中每个脉冲对中第一个脉冲的符号。每个脉冲对中第二个脉冲的符号由该脉冲的位置来指定。如果第二个脉冲的位置比第一个脉冲的位置小，第二个脉冲的符号与第一个脉冲的符号是相反的，否则脉冲的符号是相同的。其结果是，就十个脉冲而言，三十五个位用于指定其位置和符号(每个脉冲3.5位)。应该注意在该系统中，如果出现单个位差错，它不仅会影响与该差错相联系的脉冲的位置或符号，而且它也会影响脉冲对中第二个脉冲的符号。
本发明提供了CELP声码器，能够以一种对单个位差错敏感度较小的方式高效地对激励向量编码。组成激励向量的每个脉冲被限于到四个预定位置中的一个。其结果是，仅需三个位(位置两个位及符号一个位)来对每个脉冲编码以及，另外，单个位差错仅在一个脉冲中产生。
图1表示了一系列脉冲；图2是一个表示低效编码方案的固定索引表；图3是典型声码器的框图；图4表示了声码器10的编码器14的主要功能；图5是声码器10的解码器20的功能框图；图6是一个为10个脉冲激励向量指定有效脉冲位置的固定索引表；图7是为5个脉冲激励向量指定有效脉冲位置的固定索引表；以及图8是为3个脉冲激励向量指定有效脉冲位置的固定索引表；图3画出了一个典型声码器的框图。声码器10通过输入12接收数字化的语音。数字化的语音是模拟信号，它已经通过一个模数转换器，并分解成帧，典型地，每帧为20毫秒量级。输入12的信号传递到编码器部分14，其对语音信号编码以降低传输语音信号的带宽。在输出端16得到编码的语音。在通信信道的另一端，类似声码器的解码部分接收编码的语音。通信信道另一端的解码器与声码器10的解码部分相同或类似。输入端18通过声码器10接收编码语音，并传递到解码器部分20。解码器部分20使用从传输声码器接收到的编码信号，在输出端22处产生数字化的语音。
在通信技术中，声码器众所周知。比如，1993年，由Kluwer AcademicPublishers出版的，Bishnu S.Atal，Vladimir Cuperman，以及AllenGersho主编的“语音音频编码在无线及网络中的应用”一书中描述了声码器。声码器随处可以得到，研制的公司如加州圣地亚哥的QualComm公司，以及新泽西Murray Hill的朗讯公司。
图4表示了声码器10中编码器14的主要功能。在输入端12接收数字化语音信号，并传递到线性预测编码器40。线性预测编码器40对输入的语音每帧执行一次线性预测分析。线性预测分析在此技术中众所周知，其在输入语音信号基础上产生语音束的线性预测合成模型。描述此模型的线性预测参数或系数作为编码语音信号的一部分通过输出16传输。编码器40使用此模型产生残留语音信号，其表示模型用于复原输入语音信号的激励。在输出端42得到残留语音信号。输出端42的残留语音信号提供到开环音调搜索单元50的输入端48、自适应码本单元72输入端，以及固定码本单元82上。
脉冲响应单元60接收来自编码器40的线性预测参数，并生成在编码器40中产生的模型的脉冲响应。该脉冲响应用于自适应和固定码本单元。
开环音调搜索单元50使用编码器40的残留语音信号来模拟其音调并提供音调，或者是现在通常所称的在输出端52上的音调阶段或音调延迟信号。输出端52音调延迟信号和输出端64的脉冲响应信号被自适应码本单元72的输入端70接收。自适应码本72产生音调增益输出和音调索引输出，这成为声码器10的编码语音输出端16的一部分。自适应码本72的输出端74也给固定码本单元82的输入端80提供音调增益和音调索引信号。另外，自适应码本72给输入端80提供激励信号和自适应码本目标信号。
自适应码本72利用输入端12的数字化语音信号和线性预测编码器40产生的残留语音信号产生其输出。自适应码本72使用数字化语音信号和线性预测编码器40的残留语音信号来形成自适应码本目标信号。自适应码本目标信号用作对固定码本82的输入、以及对产生自适应码本单元72的音调增益、音调索引和激励输出的计算的输入。另外，自适应码本目标信号、开环音调搜索单元50的音调延迟信号、以及脉冲响应单元60的脉冲响应用于产生音调索引、音调增益和激励信号，它们被传送到固定码本单元82上。这些信号的计算方法在声码器技术中非常常见。
固定码本82利用从输入端80接收到的输入来产生固定增益输出和固定索引输出，它们被用作输出端16编码语音的一部分。固定码本单元试图模拟线性预测编码器40的残留语音信号的随机部分。固定码本搜索的目标通过确定固定码本差错或者当前自适应码本目标信号和线性预测编码器40的残留语音信号之间的差异产生。固定码本差错在现有技术中众所周知并在电信标准中被描述为加权语音信号和加权合成语音信号之间的均方差。这些标准由不同的组织发布，象国际电信协会、欧洲电信标准协会、以及电信行业协会。固定码本搜索产生固定增益和固定索引，它们使得固定码本差错或者均方差最小。固定索引描述了一个激励脉冲集。固定索引通过搜索使固定码本差错最小化的激励脉冲集来获得；然而，对激励脉冲集的搜索局限于由固定码本的固定索引表定义的有效激励脉冲集。固定索引表限制了每个脉冲占有的可能位置的数目。利用自适应码本单元72的输出计算固定增益和固定索引信号的方法在声码器技术中是常见的。
图5表示了声码器10的解码器20的功能框图。编码语音信号在编码器20的输入端18上接收。编码语音信号由解码器100接收。解码器100产生固定和自适应代码向量，各自响应固定索引和音调索引信号。这些代码向量连同音调增益和固定增益信号被传送到单元110的增益构造部分。音调增益信号用于测量利用音调索引信号产生的自适应向量，以及固定增益信号用于测量利用固定索引信号得到的固定向量。解码器100把线性预测代码参数传送到滤波器或者单元110的模型合成部分。然后单元110利用所测量的向量来激励滤波器，该滤波器通过线性预测编码器40产生的线性预测系数合成，并且产生表示最初由输入端12所收到的数字化语音的输出信号。任选的，后置滤波器120可用于形成在输入端20产生的数字化语音信号谱段。
回到图3，固定码本82的一个输出是固定索引。固定索引每帧产生四次(每子帧一次)，即对于系统每5毫秒使用20个毫秒帧。固定索引规定了激励向量或者一系列激励脉冲，其中固定索引的各位描述了脉冲的位置和符号。如上所述，这些激励脉冲用作对接收编码器中语音模型的输入。
图6描述了固定索引表，用于指定组成有效激励向量的激励脉冲的可能的预定位置。每个脉冲被限于四个预定位置中的一个，因此只需要两个位来指定位置。第三个位用于指定符号。例如，如果指定十个脉冲，表格中包括每个具有四个可能位置的十行。在该例中，脉冲I0可能占据位置0、10、20或30。类似地，其它脉冲中的每个可占据在其所在行中指定的可能位置中的一个。在该例中，仅需要30个位来指定10个脉冲的位置和符号(3个位/脉冲)，因为每个脉冲的两个位指定位置并且每个脉冲的一个位指定符号。
图7描述了固定索引表，用于指定五个脉冲的可能的预定位置，其中每个脉冲可只占据四个位置中的一个。
图8描述了固定索引表，其指定了三个脉冲激励向量中脉冲的可能的预定位置，其中由最后两行中的一行指定的激励脉冲限于三个可能的预定位置。也可能使用一个固定索引表，其限制一个或多个激励脉冲到两个可能的预定位置。图6、7和8中的方案可适用于具有任何脉冲数目的激励向量，并且每个脉冲占据的可能的预定位置的数目可限于四个或更少。
功能框图可以通过不同的方式实现。每个框图可以使用多个微处理器或者微计算机单独实现，或者它们可以通过使用单个微处理器或微计算机来实现。利用可编程的数字信号处理设备或者来自前述的制造商或其它半导体制造商的专门设备来实现功能框图的全部或每个，这也是可能的。
权利要求
1.对激励向量编码的一种方法，包括以下步骤从多个有效激励脉冲集中选择被选激励脉冲集，每个激励脉冲集具有多个激励脉冲；限制多个有效的激励脉冲集到诸集合，其中每个激励脉冲限于最多四个预定位置中的一个；以及产生描述被选激励脉冲集的输出。
2.根据权利要求1的方法，其中限制步骤包括限制多个有效的激励脉冲集到诸集合，其中每个激励脉冲限于四个预定位置中的一个。
3.根据权利要求1的方法，其中限制步骤包括限制多个有效的激励脉冲集到诸集合，其中第一激励脉冲限于最多四个预定位置中的一个、以及第二激励脉冲限于最多三个预定位置中的一个。
4.根据权利要求1的方法，其中限制步骤包括限制多个有效的激励脉冲集到诸集合，其中第一激励脉冲限于四个预定位置中的一个、以及第二激励脉冲限于三个预定位置中的一个。
5.根据权利要求1的方法，其中产生输出的步骤包括产生用最多两个位来描述被选激励脉冲集中每个激励脉冲的位置的输出。
6.根据权利要求5的方法，其中产生输出的步骤包括产生用一个位来描述被选激励脉冲集中每个激励脉冲的符号的输出。
7.根据权利要求1的方法，其中选择步骤包括选择具有十个脉冲的被选激励脉冲集。
8.根据权利要求1的方法，其中选择步骤包括选择具有五个脉冲的被选激励脉冲集。
9.根据权利要求1的方法，其中选择步骤包括选择具有四个脉冲的被选激励脉冲集。
10.根据权利要求1的方法，其中选择步骤包括选择具有三个脉冲的被选激励脉冲集。
11.一种对激励向量编码的方法，包括以下步骤通过搜索多个有效的激励脉冲集寻找使固定码本差错最小的被选激励脉冲集，每个激励脉冲集具有多个激励脉冲；限制多个有效的激励脉冲集到诸集合，其中每个激励脉冲被限于最多四个预定位置中的一个；以及产生描述被选激励脉冲集的输出。
12.根据权利要求11的方法，其中限制步骤包括限制多个有效的激励脉冲集到诸集合，其中每个激励脉冲限于四个预定位置中的一个。
13.根据权利要求11的方法，其中限制步骤包括限制多个有效的激励脉冲集到诸集合，其中第一激励脉冲限于最多四个预定位置中的一个、以及第二激励脉冲限于最多三个预定位置中的一个。
14.根据权利要求11的方法，其中限制步骤包括限制多个有效的激励脉冲集到诸集合，其中第一激励脉冲限于四个预定位置中的一个、以及第二激励脉冲限于三个预定位置中的一个。
15.根据权利要求11的方法，其中产生输出的步骤包括产生用最多两个位来描述被选激励脉冲集中每个激励脉冲的位置的输出。
16.根据权利要求15的方法，其中产生输出的步骤包括产生用一个位来描述被选激励脉冲集中每个激励脉冲的符号的输出。
17.根据权利要求11的方法，其中选择步骤包括选择具有十个脉冲的被选激励脉冲集。
18.根据权利要求11的方法，其中选择步骤包括选择具有五个脉冲的被选激励脉冲集。
19.根据权利要求11的方法，其中选择步骤包括选择具有四个脉冲的被选激励脉冲集。
20.根据权利要求11的方法，其中选择步骤包括选择具有三个脉冲的被选激励脉冲集。
全文摘要
CELP声码器以一种对单个位差错敏感性较低的方式高效地对激励向量编码。组成激励向量的每个脉冲被限于四个预定位置中的一个。因此，仅需要三个位对每个脉冲编码(位置两个以及符合一个)并且，此外，单个位差错仅在一个脉冲中产生一个差错。
文档编号G10L19/12GK1239796SQ99101060
公开日1999年12月29日申请日期1999年1月12日优先权日1998年1月13日
发明者米切尔·D·特纳申请人:朗迅科技公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：米切尔.D.特纳
技术所有人：朗迅科技公司
我是此专利的发明人