降低语音编码所需处理容量的方法以及网络单元的制作方法

文档序号：2827966阅读：274来源：国知局

专利名称：降低语音编码所需处理容量的方法以及网络单元的制作方法
技术领域：
本发明一般涉及在数字无线电系统中使用的语音编码和解码，尤其涉及一种在电信系统中利用发射机和接收机之间的非连续传输能降低所需的处理容量的方法。
背景技术：
在用于现代语音编码技术的设备中，语音编解码器周期性地处理语音信号，它们被称之为语音帧或仅称之为帧。在此术语编解码器指能编码语音的设备。它最好包括一种编码算法和用于在语音信号上实施这种算法的装置。语音编解码器的典型帧长为20ms，这对应抽样频率为8khz时160个抽样。语音帧通常从10ms～30ms变化。每个语音帧在一个语音编码器中处理，而且用这些帧形成一定的编码参数并发送到解码器。解码器通过这些参数形成一个合成语音信号。
在数字蜂窝无线电话系统，如GSM(全球移动通信系统)中，通常使用一种非连续传输方法(DTX，非连续传输)，这种方法在许多语音编码标准中也有定义。非连续传输方法通常是指终端的发射机部分在用户不说话，即终端没有信号可发送的大部分时间内关机。这样做的目的是减小终端的平均功耗以及提高无线电频率的使用，因为发送一个只传播寂静的信号也将对其他同时无线电连接造成不必要的干扰。根据一项研究，传输的数据中只有40％包含实际的语音数据，其余为寂静或背景噪声。因此，非连续传输方法，其中不包含实际语音的帧被去除，具有很多优点。首先，可以降低编码器的处理工作量，因为根本就不编码“冗余”帧。其次，当待发送的帧数降低时，设备的功耗也将降低。此外，当从待发送的数据中去除了“冗余”帧后网络的负荷也可降低。
在非连续传输方法中，一种称之为话音激活检测(VAD)的操作用于语音检测。话音激活检测的发生使得例如一个话音激活检测器能安排检查待发送的每个帧，而且基于该检查推断该帧是否包含语音数据。话音激活检测器的工作基于其内部变量，而且该检测器的输出最好是一个比特，在此称之为VAD标志。VAD标志的值为1对应有语音要被处理的情况，而值为0对应用户无声的情况。因此当该标志上升(up)时，该帧包含语音数据而且能被发送。相应地，当该VAD标志下降(down)时，该帧能整个地被去除。
非连续传输方法有一个缺陷。当传输中断时，在包含语音的帧中存在的背景噪声也将消失。这可能会让接收端感觉很不舒适。在非连续传输方法中，传输的中断可迅速而且以不规则间隔发生，由此接收机将经历类似扰乱的话音电平的快速变化。尤其是在背景噪声电平很高时，传输的中断可能甚至使得该语音更难理解。因此，即使在不发送任何帧到接收端时，也最好在接收机中产生一些合成噪声，其类似于发射机的背景噪声，在此称之为舒适噪声(CN)。
产生舒适噪声，以便例如当VAD标志的值从1变为0时，通过一些包含背景噪声的帧首先估计实际背景噪声的电平。决定该非连续传输方式的单元发送这少数帧作为语音帧到接收机。语音突发已结束但语音帧的传输尚未切断的这个周期称之为释放延迟(hangover)周期。在该释放延迟期间发送的帧只包含背景噪声引起的数据，因此通过这些帧可安全地确定舒适噪声的参数。寂静描述(SID)帧最好用于发送舒适噪声参数到接收机。SID帧的参数值被有规则地更新，至少是在背景噪声的电平改变时更新。实际上，SID帧可用于至少下述两种方式。首先，在该释放延迟周期后立即发送一个SID帧。之后，有规则地发送SID帧。在例如GSM系统的语音编解码器使用这样的类似设备。另一种可能性是在该释放延迟周期后立即发送一个SID帧，但仅在编码器检测到背景噪声的特性发生变化时才发送下一个SID帧。
在理想情况下，发送终端和接收终端都使用相同的语音编码方法。在类似这种情况下，无需改变该编码语音以适合某一其他编码方法。然而，实际上这常常是必需的。在类似这种情况下，借助于码型变换器对编码语音数据进行不同编码。该码型变换器可放置于发射机和接收机之间的信号路径上的任意一点。
现有技术码型变换器典型地以图1所示的方式实现。该码型变换器的输入由发射机发送的输入参数101构成。码型变换器的非连续传输接收部件102已安排用于估计接收的参数包含语音还是舒适噪声。有关该帧内容的信息通过例如SP(语音存在)标志103发送到语音编码器104。另外，该帧还发送到语音解码器104。该帧的解码方法取决于SP标志103的值。解码后，合成的语音或舒适噪声被传送到该码型变换器的内部缓冲器电路105。当缓冲器电路105包含足够量的数据时开始记录缓冲器电路105的内容。当数据被记录时，首先使用话音激活检测器106来检查该帧包含语音还是背景噪声。根据该帧包含的数据质量，话音激活检测器106形成一个VAD标志107并对其赋值。另外，该检测器发送该VAD标志107的值以及同样转发到达的帧到语音解码器108。VAD标志107的值也提供给码型变换器的发射机单元110。语音编码器108处理到达的数据并发送该编码数据的参数109到发射机单元110。发射机单元110根据其接收的VAD标志107的值检查哪些帧将被发送到网络，而哪些帧不发送。为使接收该信号的终端的接收机部件也继续生成舒适噪声，一些包含舒适噪声的帧也可发送到接收机，包含舒适噪声的这些帧的参数在需要时已经在语音编码器108被更新。
现有技术解决方案的问题在于要两次使用话音激活检测器。首先是在发送终端的编码器电路，接着是在码型变换器。实际上，这意味着发送语音数据时执行了不必要的计算过程，因为在现有技术解决方案中，在同一数据流执行了两次相同的话音激活检测过程。
发明目的本发明的一个目的是排除上面提及的现有技术问题。
通过提供一种码型变换器设备可实现本发明的目的，通过这种设备可以一种简单方式检查该帧的内容质量，从而避免了过多地占用处理容量。
根据本发明，用于在电信系统中在发射机和接收机之间使用非连续传输方法来匹配两种不同编码方法的方法，其特征在于，在该信号路径上使该发射机发送的信号适合该接收机，以便
-对一个数据帧，用接收的数据参数形成包含至少两个内容标识符的至少一个信息参数，-从接收帧的数据参数合成对应原始数据的数据，-发送该合成数据以利用适合该接收机的编码方法记录，-在记录期间，根据该内容标识符的至少一个值更新这些帧的至少一些数据参数，以及-根据至少一个其他内容标识符的值，从所有记录的数据帧中选择待发送到接收机的帧。
根据本发明用于在电信系统中在发射机和接收机之间使用非连续传输方法来匹配两种不同编码方法的网络单元，其特征在于，在该信号路径上，一个网络单元安排该发射机发送的信号适合该接收机，该网络单元包括-对一个数据帧，用接收的数据参数形成包含至少两个内容标识符的至少一个信息参数的装置，-用接收帧的数据参数形成对应该数据原始内容的合成数据的装置，-利用一种适合该接收机的编码方法记录合成数据的装置，-根据该内容标识符的至少一个值更新至少一些帧的数据参数的装置，以及-根据该内容标识符的至少一个其他值从所有记录的数据帧中选择待发送到接收机的帧的装置。
本发明的优选实施例在从属权利要求中描述。
根据本发明，从该信号路径，尤其是从码型变换器中去除执行话音激活检测的程序。通过类似这样的设备，可简化码型变换器的结构而且可节省处理容量用于其他目的。有关这些帧内容的信息最好通过包括至少两个不同内容标识符的至少一个信息参数发送，到使有关帧决定向前发送的单元。

下面参考附图详细描述本发明，其中图1为一种现有技术码型变换器的方框图；
图2示出了根据本发明一个实施例的码型变换器；图3a和3b示出了根据本发明利用码型变换器的标志比特指示帧内容的一些可能情况；图4示出了根据本发明的码型变换器所应用的第一网络设备；图5示出了根据本发明的码型变换器所应用的另一网络设备；图6示出了根据本发明的码型变换器所应用的第三网络设备。
在这些附图中，相同的参考数字和记号用于相对应的部分。上面已连同对现有技术的描述讨论了图1。
图2示出了根据本发明的码型变换器的一个优选实施例。在发送端，码型变换器接收由语音信号形成的参数101作为输入。该码型变换器的接收部件102处理接收的数据并形成其一个SP标志103。SP标志103指示接收的帧包含语音数据还是舒适噪声。因此在此的语音数据为实际的语音信号或背景噪声。例如，当SP标志103的值为1时，该帧包含语音数据或背景噪声，而当SP标志103的值为0时，该帧包含舒适噪声。根据上面的描述，包含舒适噪声的帧在此称为SID帧。除了SP标志103，接收部件102还从接收的帧中确定HO标志201。如果该帧是释放延迟周期后的第一个帧，则HO标志201可赋值1，否则赋值0。本领域的技术人员知道，HO标志指示在释放延迟周期期间的传输中已发送了背景噪声，通过该背景噪声可更新SID帧包含的参数。SP标志103和HO标志201最好发送到缓冲器电路105。一个特定帧的SP标志103的值与该帧包含的数据参数一起也发送到解码器104。解码器104用于解码到达此处的帧的数据参数为合成的语音数据并发送合成的语音帧或舒适噪声帧到内部缓冲器电路105。解码器104采用的解码方法最好依赖于SP标志103的值。缓冲器电路105后的语音编码器108用于读出HO标志201、SP标志103以及与缓冲器电路105的数据相关的合成数据帧。语音编码器108以例如对应于现有技术解决方案的方式开始记录该数据，即在适量数据已送入到缓冲器电路105时开始记录。语音编码器108也可更新SID帧包含的舒适噪声的数据参数。语音编码器108发送由该数据形成的参数107和SP标志103到发射机单元110。发射机单元110检查每个帧的SP标志103的值并向前发送至少包含语音数据的帧的参数。除了这些帧外，包含舒适噪声参数的一些帧最好也发送到接收机，这样接收机就能利用它们使不舒适的接收效果减到最小。本领域的技术人员直到，解码器104和编码器108也能安排使用不同的编解码器。
上面已描述了两种标志，SP标志103和HO标志201，它们均为独立的内容标识符，可用于指示例如每个帧包含的数据类型。本领域的技术人员知道，这些内容标识符包含的信息也可归拢为一个参数。类似这样的参数可称为例如信息参数，它可为一个十六进制数或类似的数。在该信息参数设置中，该参数值的第一比特例如指示SP标志103的值，而第二比特指示HO标志201的值，这些比特值的改变可相互独立。该信息参数因此具有一个值，而且通过检查该值的不同部分可找到不同内容标识符的值。本领域的技术人员还知道，其他相应标志的值在需要时也可包含于该信息参数中，在例如语音编码中可能需要这些值用于其他目的。该信息参数可属于适合上述目的任何数值系统或类似系统。
图3a以时序图形式示出了根据该帧的内容，在本发明中使用的内容标识符，即SP标志103和HO标志201的模式。在此示出的示例性实施例中，头三个帧包含语音数据，因此SP标志103的值为1。在这个实施例中，这些帧后跟随一个释放延迟周期，总共持续4个帧，此时SP标志103的值也为1。在该释放延迟周期期间，尽管语音突发已结束但传输尚未中断。背景噪声最好在这些帧中传输，这样就能为背景噪声形成的舒适噪声定义可能的新参数。本领域的技术人员知道，当包含实际语音数据的帧后有一个释放延迟周期时，HO标志201最好用于定义语音编码器108。属于这个释放延迟周期的帧包含背景噪声，而且基于这些帧包含的信息可更新SID帧的舒适噪声参数。在这些SID帧的传输期间，SP标志103和HO标志201的值为0。本领域的技术人员知道，当包含一些数据，如语音或背景噪声的帧到达待发送的信号时，根据上面的描述，这些标志上升到正确值。
图3b示出了根据本发明另一方案的时序图，其中SP标志103和HO标志201的模式设置与图3a所示的情况不同。在这个示例性情况中，头三个帧包含语音数据，因此SP标志103的值为1。在这个实施例中，这些帧后跟随一个释放延迟周期，总共持续4个帧，此时SP标志103的值也为1。在该释放延迟周期期间，尽管语音突发已结束但传输尚未中断。背景噪声最好在这些帧中传输，由此可为背景噪声形成的舒适噪声定义可能的新参数。在这个示例性实施例中，当轮到该释放延迟周期第一个帧传输时安排HO标志201上升。该释放延迟周期的第一个帧的识别可安排在例如接收机部件102。在这个示例性实施例中，HO标志201也安排保持上升直到该释放延迟周期后的第一个SID帧。本领域的技术人员知道，可这样设计上面提及的标志模式，以便它们极适合使用这些标志的每个应用。
上述方案相比现有技术解决方案具有明显的优势。显然，话音激活检测所使用的算法通常很复杂，因此很难执行。通过略去一项额外的话音激活检测，可整个地简化信号处理而且可节省处理容量用于其他操作。根据本发明的方案尤其适用于在一个装置中综合了一个以上码型变换器的情况。在此情况下，处理容量的总节省量可很显著。根据一些测试，在用于例如GSM的全速率(FR)编解码器的情况下，减少一项话音激活检测的确定能显著地降低处理难度。
根据本发明的方案的另一优势也与实现更为简单相关。即，尽管对每个编解码器话音激活检测都相同，但在话音激活检测器的实现方式可能有差异。在现有技术方案中，由某一编解码器产生的舒适噪声可解释为在另一编解码器的话音激活检测器中的语音，在此情况下系统不必加载。特别是必须注意，编解码器编码归类为噪声等的帧的方式经常比编码归类于语音的帧的方式简单。因此，如果包含噪声的帧被归类为语音，则这个帧将占用大量的处理容量，因此该过程的负担变得更重。通过从码型变换器中去除话音激活检测，就可避免导致使用不必要的高处理功率的类似问题。
在上面对本发明的描述中已假设，在不同编解码器中的帧时间(frametime)相同。根据本发明的方案最好也能用于不同编解码器之间的帧时间不同的情况。通过举例假设，帧时间长例如20ms的编解码器A，已用于到达该码型变换器的数据。该数据将被发送的系统使用的编解码器B帧时长例如30ms。在根据本发明的一种方案中，在类似这种情况下，可通过例如以10ms的间隔在缓冲器电路105的数据中排列SP和HO标志，实现帧时间的匹配。因此，当编解码器A的数据变为编解码器B的数据时，该解码器在缓冲器电路105中为每个帧写入2个SP和HO标志。相应地，当语音编码器从缓冲器电路105中读出数据时，最好每帧或总共30ms读出3个SP和HO标志。基于这3对标志，码型变换器将新的帧分类为语音或噪声并根据该分类为SP标志赋值。最简单的情况是，可基于如果至少两个SP标志上升则新SP标志的值也为1的标准分类。本领域的技术人员知道其他可能的解决方案，如SP和HO标志的不同组合也可用于该分类。如果该码型变换器工作于其他方向，显然，解码器在缓冲器电路中写入3对标志，其中语音编码器最好每帧读出2对标志。本领域的技术人员知道，也可以不同于上述的间隔在数据流中排列该标志。最好该间隔为，使编解码器A和编解码器B的帧间隔都被该间隔整除。
本领域的技术人员知道，对HO标志的值有影响的释放延迟周期取决于该编解码器。例如，GSM系统的FR编解码器的释放延迟周期为4个20ms的帧，然而，在例如ITU-T G.723.1标准提供的编解码器中，释放延迟周期为6个长30ms的帧。利用根据本发明的方法，可避免因释放延迟周期长度的不同导致的问题。例如，如果编解码器A的释放延迟周期暂时长于编解码器B产生的释放延迟周期，就不会有任何问题，因为语音编码器在需要时能去除该释放延迟周期的多余部分。另一方面，如果编解码器A的释放延迟周期暂时短于编解码器B的释放延迟周期，则在需要时该释放延迟周期可在该语音编码器增大。这可通过例如在释放延迟周期期间利用包含舒适噪声的相同帧到新帧实现。
在下一段落，讨论根据本发明的方案在诸如GSM网络的移动通信网络中的应用。码型变换器最好位于连接到一个网络单元的终端之间。在例如GSM网络中，配置了一个独立的网络单元称为TRAU(码变换/速率适配单元)。一般来说，TRAU单元的任务是利用不同信号匹配网络。这意味着，例如这些信号传送速率适用于这些系统。另外，语音在TRAU中记录以适合传输到使用另一语音编码系统的网络。图4示出了根据本发明的一个优选实施例TRAU 305在一个移动通信网络中的位置。这个TRAU 305包括用于处理接收的语音参数的装置308，以便从这些参数能确定SP标志以指示接收的帧包含语音参数还是舒适噪声参数。另外，TRAU 305包括装置308，由此从接收参数中能确定HO标志以指示该释放延迟周期后的第一个帧。此外，TRAU 305包括装置309，该装置用于利用一个例如预先协商的编解码器解码该语音。TRAU 305还包括装置310，合成的语音数据以及SP和HO标志可暂时移动到该装置。另外，TRAU 305包括装置311，通过该装置可从缓冲器电路读出所述信息以及根据该信息由某一其他编解码器记录，而且通过该装置311可在需要时更新包含舒适噪声的帧的参数。此外，TRAU 305还包括装置312，编码数据的参数和SP标志可移入该装置，而且在该装置312可基于例如SP标志的值选择将向前发送的帧。根据一个优选实施例，TRAU 305仅向前发送包含语音数据的帧。本领域的技术人员知道，所提供的这些装置可理解为微处理器电路或类似电路，能通过例如输入的程序实现上述的操作。最好该微处理器装有存储器，其中可暂时存储例如语音数据和各个标志的值。
图4所示的TRAU 305与该移动通信网络的基站收发信台(BTS)304放置在一起。图4还示出了该移动通信网络的基站控制器(BSC)和移动交换中心(MSC)。本领域的技术人员知道，这些网络单元为独立的工作单元，如图4的线301、302和303所示。图5示出了相应的网络单元。在这个示例性实施例中，TRAU 305紧靠着基站控制器306。图6示出了与作为独立工作单元的移动交换中心307一起放置TRAU 305的第三种可能性。本领域的技术人员知道，TRAU 305也可位于其他可能的网络单元。在描述根据本发明的码型变换器如何放置于该网络拓扑结构的描述中，GSM系统的网络单元已用作例子。显然，根据本发明的码型变换器也可放置于除TRAU 305外的其他网络单元中以及除GSM外的其他系统中，以执行在此提出的相应操作。
本领域的技术人员知道，上面使用的术语仅用作例子，它们的唯一目的是阐明根据本发明的方法的应用。根据本发明的方案也可用于除GSM外的其他系统。在所附权利要求书定义的范围内，上面提供的方法最好应用于编码和解码语音的任何系统。
权利要求
1.一种在电信系统中，在发射机和接收机之间使用非连续传输方法来匹配两种不同编码方法的方法，其特征在于，在该信号路径上使该发射机发送的信号适合于该接收机，以便-对一个数据帧，用接收的数据参数(101)形成包含至少两个内容标识符的至少一个信息参数，-根据接收帧的数据参数(101)合成对应原始数据的数据，-发送该合成数据以利用适合该接收机的编码方法记录，-在记录期间，根据该信息参数的所述内容标识符的至少一个值，来更新这些帧的至少一些数据参数(107)，以及-根据该信息参数的至少一个其他内容标识符的值，从所有记录的数据帧中选择待发送到接收机的帧。
2.根据权利要求1的方法，其特征在于，待更新的帧的数据参数(107)为描述背景噪声的数据参数。
3.根据权利要求1的方法，其特征在于，该信息参数的至少一个所述内容标识符的值包括有关一个释放延迟周期后的第一个帧的信息。
4.根据权利要求1的方法，其特征在于，该信息参数的至少一个所述内容标识符的值包括有关该帧内容的信息。
5.一种网络单元，用于在电信系统中在发射机和接收机之间使用非连续传输方法来匹配两种不同编码方法，其特征在于，在该信号路径上，一个网络单元用于使该发射机发送的信号适合于该接收机，该网络单元包括-对一个数据帧，用接收的数据参数(101)形成包含至少两个内容标识符的至少一个信息参数的装置(308)，-用接收帧的数据参数(101)形成对应该数据原始内容的合成数据的装置(309)，-利用一种适合该接收机的编码方法记录合成数据的装置(311)，-根据所述信息参数的内容标识符的至少一个值，来更新至少一些帧的数据参数的装置(311)，以及-根据该信息参数的内容标识符的至少一个其他值，从所有记录的数据帧中选择待发送到接收机的帧的装置(312)。
6.根据权利要求5的网络单元，其特征在于，其为一个码变换/速率适配单元(TRAU)(305)。
全文摘要
本发明一般涉及在数字无线电系统中使用的语音编码和解码,以及一种在电信系统中利用发射机和接收机之间的非连续传输能降低所需的处理容量的方法。根据本发明的方法尤其用于在发射机和接收机之间利用不同编码方法来匹配两种电信系统。在该方法中,在该信号路径上使该发射机发送的信号适合该接收机,以便在第一步骤,对每个数据帧,用接收的数据参数(101)形成包括至少两个内容标识符的至少一个信息参数。在下一步骤,从接收帧的数据参数(101)合成对应原始数据的数据,之后发送该合成数据以利用适合该接收机的编码方法记录。在最后步骤,在记录期间,根据该信息参数的所述内容标识符的至少一个值更新这些帧的至少一些数据参数(107),而且根据该信息参数的至少一个其他内容标识符的值,从所有记录的数据帧中选择待发送到接收机的帧。本发明还涉及一种用于实现上述方法的网络单元。
文档编号G10L19/012GK1364287SQ00810295
公开日2002年8月14日申请日期2000年7月14日优先权日1999年7月14日
发明者阿里·拉卡尼米申请人:诺基亚公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：阿里.拉卡尼米
技术所有人：诺基亚公司
我是此专利的发明人

上一篇：语料数据的查询方法和装置制造方法
上一篇：语音编码系统中的双向音调增强的制作方法