测速编码法的制作方法

文档序号:2822665阅读:418来源:国知局
专利名称:测速编码法的制作方法
背景技术
1.发明领域本发明一般涉及信号编码,尤其涉及可变位速率话音编码。
2.背景话音编码一般受到带宽因素与效率的推动,因而现代通信系统通常应用各种话音编码和压缩技术来降低对带宽的要求,实现更高的传输效率。
提供话音编码的一种典型方法就是所谓的脉码调制(PCM)技术,它将话音信号转换成数字形式,已被诸电话公司广泛应用于T1电路中,每天的每一分钟,都有上百万次电话通话以及经由调制解调器的数据传输通过PCM转换成数字而通过高速城市间干线传输。PCM对模拟波每秒取样8000次,把每个样本转换成一个8位数,形成64Kbps数据流。实际上,PCM技术在G.711标准下一直被国际电信联盟(ITU)所采纳,该标准规定了一种64Kbps的单速率编码法。
ITU采纳的另一种技术应用了自适应差分PCM(ADPCM)方法,可将话音等模拟声音转换成数字。用该技术代替在各取样点对绝对测量值的编码,可对样本间的差值编码。ADPCM能动态切换编码标度而补偿幅值变化。已应用该技术的ITU标准包括G.721(32Kbps)、G.722(64Kbps)、G.723(20Kbps和40Kbps)、G.726(16Kbps、24Kbps、32Kbps和40Kbps)和G.727(16Kbps、24Kbps、32Kbps和40Kbps)。
在G.729族的主体和附件A(8Kbps)、附件B(0Kbps和1.5Kbps)、附件D(6.4Kbps)、附件E(11.2Kbps)和附件I(0、1.5、6.4、8和11.2Kbps)中,更新的ITU标准采纳了码激线性预测技术(CELP),实现了高压缩比和长途电话质量的窄带(电话波段)音频。G.723.1(5.3Kbps和6.4Kbps)也采纳了类似的方法。G.728(16Kbps)标准还使用了所谓的低延迟CELP(LD-CELP)法,通过应用处理更迅速的较小样本尺寸,提供接近长途电话质量的音频,降低了延迟。
如上所述,G.723、G726、G727、G729附件I和G.723.1标准都对话音数据传递规定了多速率性能。今天,这些多速率已被AT&T、MCI或Sprint等网络提供者所利用,可按预定的诸因素如时刻或网络特定用途来控制数据位速率。如网络提供者可决定在营业时间内节省网络带宽,把数据位速率限制到6.4Kbps。但在营业时间后,网络提供者可将数据位速率提高到11.2Kbps。另外,网络提供者可在特定时间内对优质话音数据传递分配若干线路。


图1示出网络提供者用来实施上述方法的典型系统100。如图所示,系统100包括多个话音编码器1、2、…、n,分别标为模块130、140、…、150。在一实施例中,系统100可以是与ITUG.729附件I兼容的,话音编码器130可以6.4Kbps编码,话音编码器140可以8.0Kbps编码,而话音编码器150可以11.2Kbps编码。
如图1所示,编码选择器112由网络控制器120定位。如上所述,在网络提供者控制下,选择器112按预定的因素定位。例如,当通信信道160用于要求高数据速率以保持话音质量的音乐广播时,网络控制器120可以决定在营业时间以后或从下午200~400以11.2Kbps数据位速率使用话音编码器150。另一方面,网络控制器120可以对编码选择器112定位,对从下午400~800的话音通信选择数据位速率为6.4Kbps的话音编码器130。
尽管这类传统的多速率话音编码器已成功地应用于数字通信系统,但是在使用和应用场合方面有局限性。这类系统有若干缺点而且不灵活,因为数据位速率的设置是以似是而非的预定因素为基础的。结果,对一指定的话音而言,可以应用过少或过多的网络带宽。例如,音乐之类的优质话音可以在选成以低数据速率发射的通信信道上发射,造成质量劣化。另一方面,若发射只是低质量的话音,如不要求高带宽的话音,则会浪费高数据速率的通信信道。
因此,在技术上强烈要求有一种灵活的话音编码器,它能有效地应用指定通信信道的带宽。另外,业界还强烈要求有一种既能组合各种话音编码方法,又能与原有的话音解码器和标准保持可互操作性的话音编码系统。

发明内容
根据这里广义描述的本发明的目的,提供了测速编码的方法与系统。
在一实施例中,本发明包括一数据测速器和多个数据信号编码器。数据测速器测定数据信号的数据速率,根据测定的数据速率选择其中一个数据信号编码器,并相应地对该数据信号编码。
在另一实施例中,系统包括多个话音编码器、一个能选择至少两个话音编码器的网络控制器和一个数据测速器,后者能测定话音信号的数据速率,并按该数据速率选择其中一只由网络控制器选出的话音编码器。
在本发明的一个方面,数据或话音信号包括若干帧,数据测速器测定每一帧的数据速率,并根据各帧的数据速率选择一个编码器,然后信号被逐帧编码。在本发明的另一个方面,可用不同的编码标准对信号的各帧编码。
参照附图和下述的说明书,将会明白本发明的其它诸方面内容。
附图简介本领域技术人员在参阅了以下详细描述和附图后,将更容易明白本发明的诸特征与优点,其中图1示出常规话音编码系统。
图2示出本发明话音编码系统的一实施例。
图3示出图2的一例输入信号。
图4示出本发明话音编码系统的另一实施例。
发明的详细描述本发明一实施例示于图2。如图所示,话音编码系统200包括话音编码器1…n。在一实施例中,话音编码器1…n可以支持单一标准话音编码数据速率的一个子集或全集。但在该特定实例中,话音编码器(1…3)230、240和250分别可支持G.729附件I标准中6.4、8.0和11.2Kbps的数据位速率。在另一实施例中,话音编码系统200可以包括5个话音编码器,支持G.729附件I标准规定的所有数据位速率。在再一个实施例中,各话音编码器可支持不同的标准,例如话音编码器230可支持32Kbps的G.721 ADPCM标准,话音编码器240可支持5.3Kbps的G.723.1标准,而话音编码器250可支持11.2Kbps的G.729附件I标准。
如图所示,话音信号210进入编码系统200通过通信信道260传输。“通信信道”指通信的媒体或通道。通信信道可以包括(但不限于)电话线、调制解调器连接、因特网连接、综合业务数字网(ISDN)连接、异步传递方式(ATM)连接、帧中继连接、以太网连接、同轴电缆连接、光纤连接、卫星连接(如数字卫星服务等)、无线连接、射频(RF)链路、电磁链路、双向寻呼连接等,以及它们的组合。
根据计算机编程领域技术人员的实践,下面参照由系统200(图2)和/或系统400(图4)执行的操作符号标志来描述本发明,除非另有指示。这类操作有时指计算机执行。显然,符号表示的操作包括处理器对代表数据位的电信号的处理和把数据位保存在系统存储器(未示出)中的存储单元里,以及其它信号处理。保存数据位的存储单元是具有对应于数据位的特定电、磁、光或有机特性的物理单元。
以软件实践时,本发明的诸单元实际上是执行必要任务的代码段。程序或代码段可以贮存在处理器可读媒体里,或由埋置在载波里的数据序号通过传输媒体或通信链路发射。“处理器可读媒体”可以包括任何一种能贮存或传递信息的媒体,其实例包括电子线路、半导体存储器、ROM、快闪存储器、可擦ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤媒体、射频(RF)链路等。计算机数据信号可以包括任何能通过电子网络信道、光纤、大气、电磁、RF链路等传输媒体传播的信号。代码段可通过因特网、内部网等计算机网下载。
转看图1,话音信号220传至测速控制模块220,对该话音信号逐帧分析。为了选择话音编码器230~250中的一个以便最有效地应用通信信道260,测速控制器220分析每个话音帧。例如,如本领域技术人员理解的那样,在G.729标准下,以10ms间隔或字组对话音帧取样。用已知方法分析各10ms话音帧,测速控制器220可在多个话音编码器230、240和250中选择一个。
例如,若话音信号的形状或特征是男士话音,测速控制器220就把编码选择器212定位成选择一种中间数据速率的话音编码器,如话音编码器230(G.729,6.4Kbps)对该特定帧编码。然而,对下一帧,若测速控制器220发现更高质量的话音帧,如音乐类话音,它就把编码选择器215定位成选择一高数据速率编码器,如话音编码器250(G.729,11.2Kbps)对该话音帧编码,以防质量劣化。在一实施例中,系统200的话音编码器250可以是G.727 ADPCM24.0Kbps,此时测速控制器220把编码选择器212定位至话音编码器250,将用G.727标准对该话音帧编码。
应该指出,根据本发明一实施例,话音编码系统200中可以包括各种数量的不同标准的话音编码器。当然,这类实施例为了对话音逐帧解码,需要一个能支持这些各种话音编码器的互补话音解码系统。
然而,在有些实施例中,话音编码系统200可以用各种属于单一标准如G.729附件I的话音编码器对语音帧编码。此类系统的优点在于无须改变常规的解码系统。
测速控制器220可以构成硬件、固件或软件,或者它们的任一组合。从每个话音编码器230、240和250得到的位流送至通信信道260。
如上所述,话音信号210首先逐帧传给测速控制器220。话音信号210一传到其中一个测速控制器220,就分析该话音帧首部里预定的标志,以确定该话音帧的类别。例如,话音帧的标志值可能指明该话音帧是非活性话音信号(背景噪声或寂静),因而用低位速率编码器处理。话音帧的标志值可能指明该话音帧是优质的活性话音,如音乐,则要用高位速率编码器处理。在替代方式中,话音帧的标志值可能指明该话音帧是中等质量的活性话音,如男士的话音,则要用中位速率编码器处理。编码方法一确定,就把该话音帧经编码选择器212传给话音编码器1…n中的一个。应该理解,根据预定的标准、判据或成组判据,或根据系统要求和/或需要,可用任一类控制电路或软件对输入话音分类。
转看图3,图示为一话音信号图300。图3示出被映射成幅值310/时间320轴的话音信号330,语音信号330分成垂直虚线表示的诸时段,时间线340上各时段a~v代表一个话音帧。如上所述,例如按G.729 ITU标准一个话音帧的持续时间为10ms,或在有些实施例中,帧为5ms的间隔。再参照图2,假设话音编码器230、240和250分别是G.729 1.5Kbps、G.729 8.0Kbps和G.72632.0Kbps,当话音信号330的话音帧(a)进入编码系统200时,测速控制器220首先根据本领域技术人员已知的方法测定话音帧(a)里的类型话音。如图所示,话音帧(a)是低质量话音或背景噪声,因而测速控制器220可以把编码选择器212定位成选择一低数据速率话音编码器,如1.5Kbps的话音编码器230对话音帧(a)编码。对下一话音帧(b),测速控制器220可对编码选择器212保持同一位置。但对于话音帧(c)与(f),测速控制器220可选择中数据速率,如8.0Kbps的话音编码器240。对于话音帧(h)、(i)、(1)与(m),测速控制器220可以选择一高数据速率话音编码器,如32.0Kbps的话音编码器250来维持话音质量。
图4不出本发明另一实施例。如图所不,话音编码系统400包括网络控制器430、测速控制器420和多个分别标为440、450、460、470与480的话音编码器1…n,用于通过通信信道460发射话音信号410。根据该实施例,网络控制器430可选择其中一个话音编码器对话音信号410编码。根据网络提供者预定的因素,网络控制器430通过线路412或414传送话音信号410。如图所示,线路412把话音信号410传给第一组编码器,包括话音编码器440、460和480。另一方面,线路414把话音信号410传给第二组话音编码器,包括话音编码器440、450、460、470和480。在一实施例中,话音编码器440、450、460、470和480可以分别支持G.729附件I的0、1.5、6.0、8.0和11.2Kbps的不同数据速率。在另一实施例中,话音编码器440可支持G.729附件I标准的0Kbps数据速率,话音编码器450可支持G.723.1标准的5.3Kbps,话音编码器460可支持G.729附件I标准的8.0Kbps数据速率,话音编码器470可支持G.728标准的16.0Kbps数据速率,话音编码器480可支持G.711标准的64.0Kbps数据速率。总之,可以相应地组合和支持不同标准的各种数据速率。
正如以上对图2实施例说明的那样,测速控制器420可以应用编码选择其413和415,根据各话音帧的特征而把话音信号410的每一帧传给其中一个话音编码器。然而,网络控制器430可以指定特定的一组话音编码器被测速控制器420应用。如在一定时间内,网络控制器430可将话音信号通过线路412传给编码选择器413,而后者提供少量话音编码器供测速控制器420选用。
这样,本发明提供了一种供灵活可变位速率编码的设备与方法,该方法便于应用任何期望的标准、判据或固定速率位编码器对话音编码。在一实施例中,话音编码器440~480可以是现有的固定位速率编码器,如GSM EFR(增强型全速率)、IS-641(TIA/EIA TDMA标准)等,或在其它实施例中,话音编码器440~480可以包括单一多速率标准,如GSM AMR(自适应多速率),或上述的任何组合。
在任一指定的时间间隔,可用一种或多种标准和/或判据对话音编码。本发明的编码系统可同基于现有标准的解码系统相接,或者同用新标准构制的解码系统或用现有和新标准结合的解码系统相接。这样,本发明可灵活地选用标准、带宽要求或服务质量,而且可以配用现有的系统和/或新系统。现有的解码系统可同本发明的编码系统相接而无须改变或更换。同时,该编码系统能应用新标准并加以灵活选用。
本发明能以其它特定形式实施而不违背其精神或基本特征。描述的诸实施例在各方面仅作示例而不作限制。因此,本发明的范围由所附的如权利要求而不是上述的描述来指明。所有符合如权利要求同等含义与范围的变化都包括在其范围内。
权利要求
1.一种对包含多个帧的话音数据信号编码的话音编码系统,其特征在于所述话音编码系统包括话音数据测速器;和多个话音数据信号编码器;其中所述话音数据测速器测定每个所述帧的数据速率,并按各个所述帧的各个所述数据速率选择其中一个所述话音数据信号编码器。
2.如权利要求1所述的系统,其特征在于,每个所述帧的长度约为10ms。
3.如权利要求1所述的系统,其特征在于,所述数据信号包括第一帧与第二帧,所述第一帧用其中第一个所述数据信号编码器编码,所述第二帧用第二个所述数据信号编码器编码。
4.如权利要求1所述的系统,其特征在于,所述多个话音编码器包括符合G.727 ITU的话音编码器。
5.如权利要求1所述的系统,其特征在于,所述多个话音编码器包括符合G.729 ITU的数据速率为0、8.0和11.2Kbps的话音编码器和符合G.723.1 ITU的数据速率为5.3和6.4Kbps的话音编码器。
6.如权利要求1所述的系统,其特征在于,所述系统是可变位速率话音编码系统,每个所述话音数据信号编码器工作于不同的固定位速率。
7.如权利要求1所述的系统,其特征在于,所述帧的间隔约为5ms。
8.如权利要求1所述的系统,其特征在于,所述多个话音编码器包括原有的固定位速率编码器。
9.如权利要求1所述的系统,其特征在于,所述多个话音编码器包括符合GSM EFR、IS-641和GSM AMR的编码器。
10.一种对包含多个帧的话音数据信号编码的话音编码系统,其特征在于,所述话音编码系统包括话音数据测速器;多个话音数据信号编码器;能选择所述多个话音编码器中至少两个的网络控制器;而且其中所述话音数据测速器测定每一所述帧的数据速率,并根据每一所述帧的每个所述数据速率,选择所述网络控制器选择的所述话音数据信号编码器中的一个。
11.如权利要求10所述的系统,其特征在于,所述多个话音编码器包括符合G.729 ITU的数据速率为0、1.5、6.4、8.0和11.2Kbps的话音编码器。
12.如权利要求10所述的系统,其特征在于,所述多个话音编码器包括符合G.729 ITU的数据速率为0、8.0和11.2Kbps的话音编码器和符合G.723.1ITU的数据速率为5.3和6.4Kbps的话音编码器。
13.如权利要求10所述的系统,其特征在于,所述网络控制器能选择两组或多组话音编码器,每个所述组包括至少一个所述话音编码器,一个所述组包括至少两个所述话音编码器。
14.如权利要求13所述的系统,其特征在于,所述话音编码器组各不相同。
15.如权利要求13所述的系统,其特征在于,一个所述组包括符合G.729ITU的0、1.5、8.0Kbps的话音编码器,另一个所述组包括符合G.721的32Kbps的话音编码器。
16.一种对包含多个话音信号帧的话音信号编码的方法,其特征在于所述编码法包括以下步骤测定一个所述话音信号帧的数据速率;按所述数据速率选择多个话音编码器中的一个;和用所述多个话音编码器中的一个对所述一个话音信号帧编码;其中重复所述测定、选择和编码步骤,对所述话音信号逐帧编码。
17.如权利要求16所述的方法,其特征在于,每个所述帧含约10ms的话音信号。
18.如权利要求16所述的方法,其特征在于,所述数据信号包括第一帧和第二帧,所述第一帧用第一个所述数据信号编码器编码,所述第二帧用第二个所述数据信号编码器编码。
19.如权利要求16所述的方法,其特征在于,所述数据信号是单帧活性语音信号。
20.如权利要求16所述的方法,其特征在于,所述多个所述话音编码器包括符合G.729 ITU的数据速率为0、1.5、6.4、8.0和11.2Kbps的话音编码器。
21.如权利要求16所述的方法,其特征在于,所述多个所述话音编码器包括符合G.729 ITU的数据速率为0、8.0和11.2Kbps的话音编码器和符合G.726ITU的数据速率为24.0和40.0Kbps的话音编码器。
22.一种对包含多个话音信号帧的话音信号编码的方法,其特征在于,所述编码法包括以下步骤按一预定因素从多组话音编码器中选择其中一组话音编码器;测定一个所述话音信号帧的数据速率;按所述数据速率在所述选择的组中选择其中一个所述话音编码器;和用所述选择的话音编码器对所述一个话音信号帧编码;其中重复所述测定、选择和编码步骤,对所述话音信号逐帧编码。
23.如权利要求22所述的方法,其特征在于,所述多个所述话音编码器包括符合G.729 ITU的数据速率为0、1.5、6.4、8.0和11.2Kbps的话音编码器。
24.如权利要求22所述的方法,其特征在于,所述多个话音编码器包括符合G.729 ITU的数据速率为0、8.0、和11.2Kbps的话音编码器和符合G.723.1ITU的数据速率为5.3和6.4Kbps的话音编码器。
25.如权利要求22所述的方法,其特征在于,所述网络控制器能选择两组或多组话音编码器,每个所述组包括至少一个所述话音编码器,一个所述组包括至少两个所述话音编码器。
26.如权利要求25所述的方法,其特征在于,所述话音编码器组各不相同。
27.如权利要求25所述的方法,其特征在于,一个所述组包括符合G.729ITU的0、1.5、8.0Kbps的话音编码器,另一个所述组包括符合G.721的32Kbps的话音编码器。
28.一种编码系统,其特征在于,包括数据测速器;和多个数据信号编码器;其中所述数据测速器测定数据信号的数据速率,并按所述数据速率选择其中一个所述数据信号编码器对所述数据信号编码。
29.如权利要求28所述的系统,其特征在于,所述数据信号是单帧活性话音信号。
30.如权利要求28所述的系统,其特征在于,所述帧包含约10ms话音信号。
31.如权利要求28所述的系统,其特征在于,所述数据信号包括多帧数据,所述数据测速器测定每个所述帧的数据速率,并按每个所述帧的所述数据速率选择其中一个所述数据信号编码器对每个所述帧编码。
32.如权利要求28所述的系统,其特征在于,所述数据信号包括第一帧和第二帧,所述第一帧用第一个所述数据信号编码器编码,所述第二帧用第二个所述数据信号编码器编码。
33.如权利要求28所述的系统,其特征在于,所述多个话音编码器包括符合G.729 ITU的数据速率为0、1.5、8.0和11.2Kbps的话音编码器。
34.如权利要求28所述的系统,其特征在于,所述多个话音编码器包括符合G.729 ITU的数据速率为0、8.0和11.2Kbps的话音编码器和符合G.723.1ITU的数据速率为5.3和6.4Kbps的话音编码器。
35.一种编码系统,其特征在于,包括多个话音编码器;能选择所述多个话音编码器中至少两个的网络控制器;和数据测速器,能测定话音信号的数据速率,并按所述数据速率选择所述网络控制器选择的所述话音编码器中的一个。
36.如权利要求35所述的系统,其特征在于,所述话音信号包括多个帧,所述数据测速器测定每个所述帧的数据速率,并按每个所述数据速率选择由所述网络控制器选择的所述话音编码器中的一个。
37.如权利要求35所述的系统,其特征在于,所述多个话音编码器包括符合G.729 ITU的数据速率为0、1.5、6.4、8.0和11.2Kbps的话音编码器。
38.如权利要求35所述的系统,其特征在于,所述多个话音编码器包括符G.729 ITU的数据速率为0、8.0和11.2Kpbs的话音编码器和符合G.722 ITU的数据速率为64.0Kbps的话音编码器。
39.如权利要求35所述的系统,其特征在于,所述网络控制器能选择两组或多组话音编码器,每个所述组包括至少一个所述话音编码器,一个所述组包括至少两个所述话音编码器。
40.如权利要求39所述的系统,其特征在于,所述话音编码器组各不相同。
41.如权利要求39所述的系统,其特征在于,一个所述组包括符合G.727ITU的16.0和24.0Kbps的话音编码器,另一个所述组包括符合G.721的32Kbps的话音编码器。
全文摘要
一种对含多帧的话音数据信号编码的话音编码系统与方法,该话音编码系统包括一话音数据测速器和多个话音数据信号编码器。话音数据测速器测定每一帧的数据速率,并根据各数据速率选择一个话音数据信号编码器。每一帧可用不同的编码法或标准编码。该编码系统还包括一网络控制器,用于根据预定的因素选择任意多个话音数据信号编码器。
文档编号G10L19/04GK1401115SQ01804689
公开日2003年3月5日 申请日期2001年2月8日 优先权日2000年2月8日
发明者苏环宇 申请人:科恩格森特系统股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1