具有增加的通道密度的多通道语音处理器的制作方法

文档序号：2834588阅读：293来源：国知局

专利名称：具有增加的通道密度的多通道语音处理器的制作方法
技术领域：
本发明一般涉及语音和音频信号处理。更具体地，本发明涉及多通道语音和音频信号处理。
背景技术：
在传统的基于分组的语音(“VoP”)系统或者基于IP的语音(“VoIP”)系统中，电话通话或者模拟语音可以通过本地环路或者公共交换电话网(“PSTN”)传送到中心局(“CO”)，在这里，语音根据现有的诸如G.711的协议被数字化。被数字化的语音从CO传送到位于基于分组的网络的边缘的网关设备。网关设备接收数字语音，并对其分组化。网关设备可将G.711样本结合成分组，或者使用任何其它压缩机制。接下来，被分组化的数据通过诸如因特网的分组网络传输，由远程网关设备接收，并以与上述相反的方式转换回模拟语音。
为了本申请的目的，术语“语音编码器”或“语音处理器”一般用于描述能够对通过基于分组的网络传输的语音编码和/或对通过基于分组的网络接收的被编码的语音解码的设备的操作。如上所述，语音编码器或语音处理器可以在用于将语音样本转换为可通过分组网络传输的分组化形式和/或将被分组化的语音转换为语音样本的网关设备内实现。
语音处理器可被配置为处理多通道的语音编码。因此，来自多通道的输入语音信号帧可以由语音处理器处理。采用可变速率编解码器(编码器-解码器)，输入语音信号帧通常通过使比特率适合于由输入语音信号帧中承载的信息量进行处理，并且可包括使用非连续传输(“DTX”)的单速率编解码器。该可变比特率与可变处理复杂度或编码算法复杂度相关。总的来说，不同的比特率随复杂度变化。复杂度的增加对应处理要求的增加。然而，传统的语音处理器分配其处理能力的效率很低。例如，为了防止超过其可用的计算能力，传统的语音处理器根据最坏情况定义支持最大通道密度，例如假设每个通道的输入语音信号帧都用最高的复杂度进行处理。这种分配处理能力效率低的结果是这样的语音处理器的每端口价格大大增加，这是不希望的情况。
因此，在本领域强烈需要一种信号处理装置和方法，其提供有效的语音处理能力的分配。

发明内容
根据在此主要讨论的本发明的目的，提供一种具有增加的通道密度的多通道语音处理器和方法。本发明解决了本领域对于提供有效的语音处理能力的分配的信号处理装置和方法的需求。
在本发明的一个示例性实施例中，多通道语音处理器包括能够与多个通道接口的控制器，耦合到控制器并被配置为存储语音信号处理时间值的存储器，以及至少一个耦合到控制器的信号处理单元。通常，多通道语音处理器支持多个比特率，并且具有用于通过处理来自多个通道的每一个的单帧每次一个通道地处理所有帧的最大执行时间，。
根据本发明，信号处理单元被配置为每次一个通道地对来自多个通道的每一个的每个单帧编码，以生成被编码的帧，直到最大执行时间到达或者将要到达。然后，被编码的帧由控制器传输。控制器还被配置为对由于最大执行时间到达或者将要到达而在编码步骤中没有被处理的多个通道的每一个传输预定帧，以致预定帧使接收预定帧的解码器生成帧擦除帧。
预定帧可以例如是帧擦除分组、非法分组或空白分组，以致预定帧在接收到时被解码器处理为帧擦除。
进一步参照下述附图和说明，本发明的这些和其它方面将变得更加明显。在本说明书中包括的所有额外的系统、方法、特征和优点都在本发明的范围之内，并由所附的权利要求保护。

在阅读了以下的详细描述和附图之后，本发明的特征和优点对于本领域技术人员来说将变得更加明显，其中图1表示可以实施本发明的各个方面的基于分组的网络的框图；图2表示根据一个实施例的示例性多通道语音处理器的框图；图3A表示一个通道的MIPS的实际时间轨迹的直方图实例；图3B表示N个通道的MIPS的实际时间轨迹的直方图实例；图4描述根据一个实施例的用于增加多通道语音处理器中的通道密度的示例性方法的流程图；图5描述根据一个实施例的由通道密度管理器执行的操作的流程图。
具体实施例方式
在此，本发明可以采用功能模块部件和各种处理步骤的方式描述。应该知道，这样的功能模块可以通过任何数量的被配置为执行特定功能的硬件部件和/或软件部件实现。例如，本发明可以采用各种集成电路器件，例如存储单元，数字信号处理单元，逻辑单元等等，这些单元可以在一个或多个微处理器或其它控制设备的控制下执行多种功能。另外，应当注意，本发明可以采用任意数量的数据传输、发信号、信号处理和调节、语音编码和解码等等的传统技术。这些本领域技术人员公知的一般技术在此不进行详细的描述。
应该知道，在此显示和描述的特定实施例仅仅是示例性的，并不意图在任何程度上限制本发明的范围。例如，本发明可以在多个通信系统结构中实现，包括有线和/或无线系统结构。为了简洁起见，传统的数据传输、语音编码、语音解码、发信号和信号处理以及数据通信系统(和系统的独立操作部件)的其它功能在此不再详细地描述。另外，在各附图中显示的连接线是为了表示在各种单元之间的示例性的功能关系和/或物理耦合。应当注意，许多可选的或附加的功能关系或物理连接可以在实际的通信系统中出现。
图1描述了示例性的通信环境100，其能够支持被分组化的语音信息通过传输媒体116传输。分组网络110，诸如那些符合网际协议(“IP”)的网络，可以支持因特网电话应用，该应用使多个参与者104、114能够根据VoP技术进行语音通信。网络102可以是诸如交换网络或PSTN的非分组网络，其支持参与者104之间的电话通话。在实际的环境100中，网络102可以与传统的电话网络、局域网、广域网、公共电话交换机和/或家庭网进行通信，在某种意义上使用户的参与可以有不同的通信设备和不同的通信服务提供商。另外，在图1中，网络102的参与者104可以经由网关106和传输媒体116与其它分组网络110的其它参与者114进行通信。
网关106的语音处理器108将网络102的参与者104的语音信息转换为可传输到其它分组网络110的分组化形式。网关是在中心局或本地交换机(例如，与公共电话交换机相关的交换机)等中可设置在网络边缘的系统。应当注意，除了语音编码和解码，网关还执行从网络102接收和发送信息(语音样本)以及从分组网络接收和发送信息(语音分组)的各种功能(例如填充和剥离报头信息)。网关还执行数据(调制解调器、传真)传输和接收功能。应当知道，本发明可以结合各种网关设计实现。相应的网关和语音处理器(未示出)也可以与其它网络110的每一个相关，并且它们的操作的方式实质上与在此描述的用于将语音信息编码为分组数据以传输到其它分组网络的网关106和语音处理器108的相同。在参与者114到网络110的通信不需要任何网关或附加的语音处理的情况下，参与者114也可以生成被分组化的语音。
本发明的语音处理器108能够经由通信线路112与多个通信通道接口(例如1到n个通道)，用于接收网络102中的语音信号以及控制信号。例如，来自参与者104的语音信号经由合适的通道传输，由如下详细描述的语音处理器108处理。然后，语音处理器108的输出通过网关106传输到合适的目的分组网络。
现在参照图2，显示了根据本发明的一个实施例的示例性多通道语音处理器208的框图。如下详细描述的，多通道语音处理器208在满足服务质量(“QoS”)要求的同时，提供增加的处理效率和增加的通道密度。多通道语音处理器208对应于图1的语音处理器108，包括至少一个执行通道密度管理器(“CDM”)228的控制器220。为了通信，控制器220连接到一个或多个信号处理单元(SPU)222。控制器220分别经由输入线路232a、232b、232c和232n接收对应于通道224的输入语音信号帧230a、230b、230c和230n，并分别经由输出线路236a、236b、236c和236n生成被编码的语音分组234a、234b、234c和234n。
控制器220包括处理器，例如ARM微处理器。在某些实施例中，多个控制器220可用于增强多通道语音处理器208的性能。类似地，多个SPU222可用于提供多通道语音处理器208的增加的性能和/或通道密度。
存储器225存储由控制器220访问的信息。具体地，存储器225存储用于如下详述地计算最大执行时间是否已经到达的语音处理时间值。结合图5详细描述执行该计算的示例。存储器225还可以用于存储由SPU 222处理的输入语音信号数据以及在由SPU 222处理之后的被编码的语音分组。
应当注意，如图2所示的多通道语音处理器208的结构仅是示意性的，其它用于执行CDM 228的操作的结构都适合与本发明一起使用。例如，控制器220的时钟可用于测量实际的执行时间。在这种情况下，所有的定时信息都将由控制器220产生，并在存储器225中不与SPU 222共享。在其它实施例中，CDM 228的操作可以完全在SPU 222中执行。然而在其它结构中，CDM 228的操作可以分布在控制器220和SPU 222之间。
SPU 222使用语音编解码器的一个编码速率将来自通道224的输入语音信号帧230a、230b、230c和230n的数据转换为分组化的格式。例如，SPU 222可以使用可变速率编解码器的一个速率，将经由线路238从控制器220接收的输入语音信号帧230a、230b、230c和230n转换为被编码的语音分组234a、234b、234c和234n，这些被编码的语音分组经由线路240传输到控制器220。任何合适的算法都可以用于确定SPU 222使用哪个编码速率进行该编码过程。例如，根据一个示例性的实施例，用于对输入语音信号帧230a、230b、230c和230n编码的比特率与由输入语音信号帧230a、230b、230c和230n承载的信息量有关。
图3A是示例的直方图，其显示了EVRC(增强可变速率编码器)的一个通道的MIPS的实际时间轨迹，图3B也是示例的直方图，其显示了EVRC的一个通道的MIPS的实际时间轨迹，其已经自卷积了N-1次(N＝80)。轨迹使用在信号广播中仅能够支持六十(60)个通道的代码捕获。但是，如果假设这些通道都是独立的，则遇到误差的概率大约是4.3135e-07。参照图3B，在图中，N＝80，在水平轴显示了语音处理器在1200MIPS的实际时间限制。换句话说，用完实际时间的概率被计算为从水平轴的1200到结尾的积分。
现在参照图4，示出了描述根据本发明的一个实施例的增加语音处理器中的通道密度的方法的示例性流程图400。更具体地说，流程图400描述了计算增加的通道224的数量的示例性方法，该数量是多通道语音处理器208在满足QoS要求的同时能够支持的。
图4的流程图400没有示出对于本领域的普通技术人员很显然的某些细节和特征。例如，一个步骤可以包括一个或多个子步骤或者可涉及专门的设备，如本领域中已知的。虽然流程图400所示的步骤402到412足以描述本发明的一个实施例，但本发明的其它实施例也可以采用不同于流程图400中所示的步骤。
从步骤402开始，基于最坏情况定义确定多通道语音处理器能够支持的最大通道数量。如上所述，根据最坏情况定义支持的最大通道数量通过将语音处理器的最大MIPS(百万指令每秒)除以最大算法复杂度路径计算。作为示例，根据最坏情况定义，图2的多通道语音处理器208的最大通道数量可以是六十(60)个通道。在步骤404，所支持的可能通道数量最初设置为如根据步骤402计算的所支持的最大通道数量。
在判断步骤406，确定基于所支持的可能通道数量的误差概率是否大于预定的阈值。考虑在多通道配置中，所有通道在给定时间要求最大处理复杂度的概率非常低，因此该误差概率对应于通道的总复杂度高于语音处理器的最大MIPS的可能性。预定的阈值可以被设置为使得对于给定应用，满足QoS要求。作为示例，移动电话应用在源设备和目的设备之间通常有1-5％的帧误差率。在预定的阈值被设置为小于或等于移动电话应用的1-5％的帧误差率的情况下，即便有，用户也极少感觉到QoS的任何降低。根据另一个实施例，预定的阈值可以被设置为固定的值，诸如(10-3/(N-M))，其中N是能被处理的最大通道数量，M是不能被处理的最大通道数量。
在步骤406，如果确定基于所支持的可能通道数量的误差概率大于预定的阈值，则执行步骤408。否则，在步骤410，增加所支持的可能通道数量，然后重复判断步骤406。
在步骤408，所支持的可能通道数两减少一个通道，在步骤412，所支持的实际通道数量被设置为调整后的所支持的可能通道数量。参考图2的多通道语音处理器208，如在此计算出的所支持的实际通道数量对应于通道224的数量。然而，在某些实施例中，根据最坏情况定义支持的通道数量可以仅限制为60个通道，本发明可以提供例如支持80个通道的实际通道数量。
因此，通过增加由多通道语音处理器支持的通道密度，根据流程图400配置的语音处理器使效率显著地提高。更具体地，如流程图400所示的增加多通道语音处理器中的通道密度的方法考虑到所有通道在给定时间要求最大处理复杂度的概率非常低的事实。结果，SPU 222被控制器220“过度驱动”，以致SPU 222能够处理超过根据最坏情况定义支持的最大通道数量的额外的通道，从而允许SPU 222在SPU 222保持空闲得情况下处理额外的输入语音信号帧。由于如在流程图400中所述的计算产生在预定的阈值内的误差概率，因此，在支持更多通道数量的同时QoS要求也得到满足。作为更进一步的好处，以这种方式配置的多通道语音处理器的每端口价格也大幅降低。
接下来参考图5，示出了描述根据本发明的一个实施例的由图2的控制器220执行的CDM 228的示例性操作的流程图500。图5的流程图500没有示出对于本领域的普通技术人员非常明显的细节和特征。例如，一个步骤可以包括一个或多个子步骤，如本领域中已知的。虽然流程图500中的步骤502到516足以描述本发明的一个实施例，但本发明的其它实施例也可以采用不同于流程图500的步骤。
从步骤502开始，总执行时间由CDM228重置。通常，总执行时间在启动或者重新启动期间以及在处理通道224的每一组输入语音信号帧230a、230b、230c和230n之后重置。总执行时间用于记录处理当前组帧中的输入语音信号帧230a、230b、230c和230n所消耗的时间量。
在步骤504，CDM 228经由输入线路232a、232b、232c或232n接收第一个/下一个输入语音信号帧。在步骤506，在步骤504接收的输入语音信号帧经由线路238传输到SPU 222进行处理。CDM 228经由线路240从SPU 222接收被编码的语音分组。在步骤508，CDM 228测量SPU 222处理输入语音信号帧所消耗的时间，并经由各个输出线路236a、236b、236c或236n传输被编码的语音分组。
在步骤510，将在步骤508中测量的处理输入语音信号帧的时间加入当前组帧的总执行时间。在判断步骤512，确定当前组帧的总执行时间是否已达到或者超过多通道语音处理器的最大执行时间。如果当前组帧的总执行时间已经达到或者超过多通道语音处理器的最大执行时间，则执行步骤516。否则，执行判断步骤514。
在判断步骤514，确定通道224的所有输入语音信号帧230a、230b、230c和230d是否都已经被处理。如果没有，则重复步骤504到512以处理下一个输入语音信号帧。否则，处理下一组帧，并且重复步骤502。
在步骤516，当前组帧的总执行时间已经超过多通道语音处理器的最大执行时间。这种情况例如可以在大量高复杂度的帧在当前组帧中被处理时发生。如上所述，由于出现这种情况的可能性低并且在QoS要求内，因此一定数量的帧误差被认为可以接受。因此，在当前组帧中还没有被SPU222处理的剩余输入语音信号帧不被SPU 222处理。相反，CDM 228通过对还没有被SPU 222处理的剩余输入语音信号帧的每一个传输帧擦除分组来处理剩余输入语音信号帧。该帧擦除分组经由相应的输出线路236a、236b、236c和236n传输，并且被格式化，使得当目的设备收到时，目的设备使用传统的帧擦除过程处理帧擦除分组，例如当帧误差在传统操作过程中发生时。帧擦除分组可采用任何方式进行格式化以达到该结果，例如包括以违反编码规则的方式格式化帧擦除分组，诸如非法分组或空白帧。然后，重复步骤502以处理下一组帧。
在如上所述根据流程图500处理每一组帧的过程中，CDM 228还可以采用确定通道224的帧230a、230b、230c和230n的处理顺序的算法。例如，CDM 228可以例如在帧的组中采用循环排序机制，使得来自与前面的通道相同的通道的数据在步骤516中被处理成帧擦除分组的可能性进一步减小。这样，帧擦除处理(步骤516)可以均匀地分布在通道224中。
如上所述的方法和系统可以驻留在在设备上的软件、硬件或固件中，其可以在微处理器、数字语音处理器、专用IC或现场可编程门阵列(“FPGA”)或其任何组合中实现，而不脱离本发明的精神。进而，本发明可以具体化为其它特定形式，而不脱离本发明的精神或本质特征。所述的实施例在各个方面被认为仅仅是示例性地，而非限制性的。
权利要求
1.一种支持多通道语音处理器中增加的通道密度的方法，所述多通道语音处理器能够与多个通道接口，其中所述多通道语音处理器具有用于通过处理来自所述多个通道的每一个通道的单帧每次一个通道地处理所有帧的最大执行时间，所述方法包括以下步骤每次一个通道地对来自所述多个通道的每一个通道的每一个所述单帧进行编码以生成被编码的帧，并传输所述被编码的帧，直到所述最大执行时间到达或将要到达；以及对由于所述最大执行时间到达或者将要到达而在所述编码步骤中没有被处理的所述多个通道的每一个通道传输预定帧，以致所述预定帧使接收所述预定帧的解码器生成帧擦除帧。
2.如权利要求1所述的方法，其中，所述预定帧是帧擦除分组。
3.如权利要求2所述的方法，其中，在所述解码器收到所述帧擦除分组时，所述帧擦除分组被所述解码器处理为帧擦除。
4.如权利要求1所述的方法，其中，所述预定帧是非法分组。
5.如权利要求4所述的方法，其中，在所述解码器收到所述非法分组时，所述非法分组被所述解码器处理为帧擦除。
6.如权利要求1所述的方法，其中，所述预定帧是空白帧。
7.如权利要求6所述的方法，其中，在所述解码器收到所述空白帧时，所述空白帧被所述解码器处理为帧擦除处理。
8.如权利要求1所述的方法，其中，所述多通道语音处理器支持多个比特率。
9.如权利要求1所述的方法，还包括加入用于对来自所述多个通道的每一个通道的每一个所述单帧编码的执行时间，以确定所述最大执行时间是否已经到达或者将要到达。
10.一种多通道语音处理器，其中所述多通道语音处理器具有用于通过处理来自多个通道的每一个通道的单帧每次一个通道地处理所有帧的最大执行时间，所述多通道语音处理器包括能够与所述多个通道接口的控制器；耦合到所述控制器的存储器，被配置为存储语音信号处理时间值；以及至少一个耦合到所述控制器的信号处理单元(SPU)，所述SPU被配置为每次一个通道地对来自所述多个通道的每一个通道的每一个所述单帧编码，以生成被编码的帧，直到所述最大执行时间到达或者将要到达；所述控制器被配置为传输所述被编码的帧，所述控制器还被配置为输对由于所述最大执行时间到达或将要到达而在编码步骤中没有被处理的所述多个通道的每一个通道传输预定帧，以致所述预定帧使接收所述预定帧的解码器生成帧擦除帧。
11.如权利要求10所述的多通道语音处理器，其中，所述预定帧是帧擦除分组。
12.如权利要求11所述的多通道语音处理器，其中，在所述解码器收到所述帧擦除分组时，所述帧擦除分组被所述解码器处理为帧擦除。
13.如权利要求10所述的多通道语音处理器，其中，所述预定帧是非法分组。
14.如权利要求13所述的多通道语音处理器，其中，在所述解码器收到所述非法分组时，所述非法分组被所述解码器处理为帧擦除。
15.如权利要求10所述的多通道语音处理器，其中，所述预定帧为空白帧。
16.如权利要求15所述的多通道语音处理器，其中，在所述解码器收到所述空白帧时，所述空白帧被所述解码器处理为帧擦除。
17.如权利要求10所述的多通道语音处理器，其中，所述多通道语音处理器支持多个比特率。
18.如权利要求10所述的多通道语音处理器，其中，所述控制器还被配置为加入用于对来自所述多个通道的每一个通道的每一个所述单帧编码的执行时间，以确定所述最大执行时间是否已经到达。
19.一种支持多通道语音处理器中增加的通道密度的方法，所述方法包括基于最坏情况定义确定所述多通道语音处理器能够支持的最大通道数量；以及支持实际通道数量，如果支持所述实际通道数量的误差概率小于预定的阈值，则所述实际通道数量比所述最大通道数量大至少一个通道。
20.如权利要求19所述的方法，其中，所述多通道语音处理器支持多个比特率。
21.如权利要求19所述的方法，其中，所述误差概率满足服务质量要求。
22.如权利要求19所述的方法，其中，所述预定的阈值小于或等于由所述多通道语音处理器使用的传输媒体的帧误差率。
23.如权利要求19所述的方法，其中，所述多通道语音处理器具有用于通过处理来自所述多个通道的每一个通道的单帧每次一个通道地处理所有帧的最大执行时间，所述方法还包括每次一个通道地对来自所述多个通道的每一个通道的每一个所述单帧编码以生成被编码的帧，并传输所述被编码的帧，直到所述最大执行时间到达或将要到达。
24.如权利要求23所述的方法，还包括对由于所述最大执行时间到达或将要到达而在所述编码步骤中没有被处理的所述多个通道的每一个通道传输预定帧，以致所述预定帧接收所述预定帧的解码器生成帧擦除帧。
25.如权利要求24所述的方法，其中，所述预定帧是帧擦除分组。
26.如权利要求24所述的方法，其中，所述预定帧是非法分组。
27.如权利要求24所述的方法，其中，所述预定帧是空白帧。
28.一种多通道语音处理器，包括能够与多个通道接口的控制器；耦合到所述控制器的存储器，其被配置为存储语音信号处理时间值；以及至少一个耦合到所述控制器的信号处理单元(SPU)，所述SPU被配置为对经由所述多个通道接收的输入语音信号帧编码，其中所述多个通道包括实际通道数量，如果支持所述实际通道数量的误差概率小于预定的阈值，则所述实际通道数量比根据最坏情况定义的最大通道数量大至少一个通道。
29.如权利要求28所述的多通道语音处理器，其中，所述多通道语音处理器支持多个比特率。
30.如权利要求28所述的多通道语音处理器，其中，所述误差概率满足服务质量要求。
31.如权利要求28所述的多通道语音处理器，其中，所述预定的阈值小于或等于由所述多通道语音处理器使用的传输媒体的帧误差率。
32.如权利要求28所述的多通道语音处理器，其中，所述多通道语音处理器具有用于通过处理来自所述多个通道的每一个通道的单帧每次一个通道地处理所有帧的最大执行时间，其中所述SPU被配置为每次一个通道地对来自所述多个通道的每一个通道的每一个所述单帧编码，以生成被编码的帧，直到所述最大执行时间到达或将要到达。
33.如权利要求32所述的多通道语音处理器，其中，所述控制器被配置为传输所述被编码的帧，所述控制器还被配置为对由于所述最大执行时间到达或将要到达而在所述编码步骤中没有被处理的所述多个通道的每一个通道传输预定帧，以致所述预定帧使接收所述预定帧的解码器生成帧擦除帧。
34.如权利要求33所述的多通道语音处理器，其中，所述预定帧是帧擦除分组。
35.如权利要求33所述的多通道语音处理器，其中，所述预定帧是非法分组。
36.如权利要求33所述的多通道语音处理器，其中，所述预定帧是空白帧。
全文摘要
一种示例的多通道语音处理器(208)包括能够与多个通道接口的控制器(220)，以及至少一个耦合到所述控制器(220)的信号处理单元SPU(222)，其中多通道语音处理器具有用于通过处理来自多个通道的每一个的单帧每次一个通道(224)地处理所有帧的最大执行时间。信号处理单元每次一个通道地对来自多个通道的每一个的每一个单帧编码，以生成被编码的帧(234a－234n)，直到最大执行时间到达或将要到达。控制器(220)还对由于最大执行时间到达或者将要到达而在编码步骤中没有被处理的多个通道的每一个传输预定帧，以致预定帧使接收预定帧的解码器生成帧擦除帧。
文档编号G10L19/00GK1809874SQ200480017145
公开日2006年7月26日申请日期2004年3月30日优先权日2003年6月17日
发明者C·穆尔贾, J·D·克莱因, 苏环宇申请人:曼德斯必德技术公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：C.穆尔贾;J.D.克莱因;苏环宇
技术所有人：曼德斯必德技术公司
我是此专利的发明人