基于amr-nb语音信号的可变码率编码器和解码器及其编码和解码方法

文档序号:2826300阅读:323来源:国知局
基于amr-nb语音信号的可变码率编码器和解码器及其编码和解码方法
【专利摘要】本发明公开了一种基于AMR-NB语音信号的可变码率编码器,包括:预处理单元,将语音信号数值化形成语音帧;语音帧质量判定单元,判定当前语音帧的质量等级给予语音帧各自的编码模式和目标比特率;编码模式选择单元,根据质量等级选择语音帧编码模式;比特率确定单元,根据编码模式来确定语音帧的目标比特率;码激励线性预测编码单元,根据语音帧目标比特率对语音帧执行编码形成编码后的语音帧。本发明还公开了一种与所述编码器对应使用的可变码率解码器,以及一种可变码率编码方法和一种可变码率解码方法。本发明相较于AMR的码率更低,能根据语音帧内容实现可变码率,能通过设置信道的语音质量,根据语音帧内容的重要性判定来选择所需要的编码速率模式。
【专利说明】基于AMR-NB语音信号的可变码率编码器和解码器及其编 码和解码方法

【技术领域】
[0001] 本发明涉及通信领域,特别是涉及一种在移动互联网通信语音技术中基于AMR-NB 语音信号的可变码率编码器;本发明还涉及一种与所述编码器对应使用的基于AMR-NB语 音信号的可变码率解码器,以及一种基于AMR-NB语音信号的可变码率编码方法和一种基 于AMR-NB语音信号的可变码率解码方法。

【背景技术】
[0002] 在诸如移动互联网上语音的各种应用领域中,对在主观质量和比特率之间具有好 的、平衡的、高效的数字窄带语音编码技术的需求正在增加。主观质量级别通常由为输入流 的已编码的语音部分所指定的比特率来规定。较高的比特率通常指示关于原始语音的较大 量信息被编码和保留,并且因此在语音回放期间将呈现原始输入语音的更准确的再现。相 反,较低的比特率指示关于原始输入语音的较少信息被编码和保留,并且因此在语音回放 期间将呈现原始语音的不太准确的再现。
[0003] 自适应多速率(Adaptive Multi Rate, AMR)是由 3GPP (3rd Generation Partnership Project)制定的第三代移动通讯系统中的语音编解码技术。窄带自适应多 速率(AMR-NB)编解码器支持八种速率:12. 2kbit/s, 10. 2kbit/s, 7. 95kbit/s, 7. 40kbit/ s, 6. 7kbit/s, 5. 9kbit/s, 5. 15kbit/s, 4. 75kbit/s,此外它还包括低速率 I. 8kbit/s 背景 噪声模式。实际的语音编码速率取决于信道的条件,AMR-NB语音编码可根据无线信道和传 输状况自适应地选择一种最佳信道模式和编码模式来进行编码传输。当信道质量差时,采 用低的编码速率,这样信道编码中的冗余比特就会增加,从而对信息更好的保护;当信道质 量好时,可以采用高的编码速率来提高语音的质量。但是,当带宽固定和信道环境平衡的信 道中,编码速率将是固定不变的,每帧语音内容却有重要和不重要之分,如果用一样的码率 来编码全部的语音帧,将会增加多余的比特在信道中传输,即使减少这些冗余比特,也不会 对主观声音质量造成影响。
[0004] 码激励线性预测(CELP)编码是能够在主观质量和比特率之间获得好的折中的已 知技术。该编码技术是无线和有线应用中几个语音编码标准的基础。CELP语音编码算法 用线性预测提取声道参数,用一个包含许多典型的激励矢量的码本作为激励参数,每次编 码时都在这个码本中搜索一个最佳的激励矢量,这个激励矢量的编码值就是这个序列的码 本中的序号。激励信号特征的参数被传送到解码器,其中重建的激励信号被用作线性预测 (LP)滤波器的输入。
[0005] 根据3GPP TS26. 090,自适应多速率(AMR)编解码方式中采用的码书激励线性预测 编码器将一个语音信号帧分成若干个子帧,进行线性预测和量化,自适应码书搜索和量化 以及固定码书搜索和量化。AMR-NB (自适应多速率窄带)语音编码支持最低的编码速率模 式4. 75kbps来进行语音编解码,在实际移动通讯互联网的应用中,带宽频率资源变得愈加 宝贵,更低码率的编解码器将更显的重要。
[0006] 根据3GPP TS26. 101,AMR帧分为三部分:帧类型、语音和噪声数据构成的AMR核心 帧、比特填充。进一步,AMR核心帧根据数据重要性又分成三种类型:类型A、类型B和类型 C。类型A数据的正确性是保证语音质量的关键,类型B和类型C相较于类型A就显得不那 么重要,如果判定的语音帧内容不重要的时候,适当的降低类型B和类型C的比特对主观质 量不会有影响。
[0007] 标准的AMR语音编解码方法虽然已经投入使用,但它只能通过信道的环境的变换 来选择编码的比特率,无法实现根据语音帧本身的内容来选择编码比特率,在不变的信道 中,用统一码率的编码方式将增加冗余比特,且编码速率模式4. 75kbit/s已经满足不了实 际的应用中。


【发明内容】

[0008] 本发明要解决的技术问题是提供一种相较于AMR的码率更低,且能根据语音帧内 容实现可变码率基于AMR-NB语音信号的可变码率编码器,其能通过设置信道的语音质量, 根据语音帧内容的重要性判定来选择所需要的编码速率模式。
[0009] 本发明要解决的另以技术问题是提供一种固定码率比4. 75kbit/s更低去除了语 音帧相对不重要的冗余比特,能实现在低码率环境中的应用的基于AMR-NB语音信号的可 变码率编码器,其相比较现有技术增加四种语音帧类型分别代表四种速率:3. 25kbit/s, 3. 50kbit/s,4. 00kbit/s 和 4. 50kbit/s。
[0010] 本发明还提供了一种与所述基于AMR-NB语音信号的可变码率编码器对应使用的 基于AMR-NB语音信号的可变码率解码器。
[0011] 本发明还提供了一种基于AMR-NB语音信号的可变码率编码方法和一种基于 AMR-NB语音信号的可变码率解码方法。
[0012] 为解决上述技术问题,本发明的基于AMR-NB语音信号的可变码率编码器,包括:
[0013] 预处理单元,将语音信号数值化形成语音帧,对语音帧进行滤波和增益控制,将语 音帧发送至语音帧质量判定单元;通常使用每抽样16比特来抽样和量化,每帧语音信号有 低频信号和高频信号,且采样后的增益各不相同,预处理单元主要是语音信号通过一个截 止频率为80Hz的2阶高通滤波器,然后降低信号增益的过程。
[0014] 语音帧质量判定单元,根据预处理单元发送的语音帧内容来判定当前语音帧的质 量等级,按语音帧的质量级别排序,质量等级越高,选择的模式将更接近高比特的模式,依 次给予语音帧各自的编码模式和目标比特率,其设置有可变码率的判定规则来判定当前帧 的质量等级,将计算所得的质量等级值发送至模式选择单元;
[0015] 其中,所述判定规则如下:
[0016] I )判定当前语音帧能量为高即计算的能量值大于10. 309dB,代表当前语音帧的 质量等级趋向于12,需要给予更多的比特即编码比特率趋向于5. 15kbit/s ;
[0017] II)判定当前语音帧为浊音,代表当前语音帧的质量等级趋向于12,需要给予更多 的比特即编码比特率趋向于5. 15kbit/s ;
[0018] IID判定当前语音帧能量为低即计算的能量值小于10. 309dB,代表当前语音帧的 质量等级趋向于〇,需要给予较少的比特即编码比特率趋向于3. 25kbit/s ;
[0019] IV)判定当前语音帧为固定的摩擦音,代表当前语音帧的质量等级趋向于0,需要 给予较少的比特即编码比特率趋向于3. 25kbit/s ;
[0020] V)在时域中,判定当前语音帧能量与上一语音帧能量的差方小于20%以下,代表 当前语音帧的质量等级趋向于〇,需要给予较少的比特即编码比特率趋向于3. 25kbit/s ;
[0021] VD判定当前语音帧为低音调,代表当前语音帧的质量等级趋向于0,需要给予较 少的比特即编码比特率趋向于3. 25kbit/s ;
[0022] W)判定当前语音帧为连续噪声,代表当前语音帧的质量等级趋向于0,需要给予 较少的比特即编码比特率趋向于3. 25kbit/s ;
[0023] 本发明中将当前语音帧的质量等级从0到12排序,如果质量等级为0表示当前语 音帧为不重要帧,如果质量等级为12表示当前语音帧为重要帧;
[0024] 编码模式选择单元,预设有编码模式,能根据语音帧质量等级选择语音帧的编码 模式,当前语音帧质量等级越大,从将预设编码模式中选择更接近高比特的编码模式;
[0025] 比特率确定单元,根据模式选择单元选择的编码模式来确定语音帧的目标比特 率;
[0026] 在基于语音帧内容的可变码率编码器中,编码后的语音帧框架结构如图2所示, 其中重新定义封装帧头如图3所示;每个模式确定各自的帧类型,每个帧类型代表最终编 码的比特率如图5所示。
[0027] 码激励线性预测编码单元,根据确定的语音帧目标比特率对语音帧执行码激励线 性预测变换编码,形成编码后的语音帧;
[0028] 对一输入语音帧进行线性预测,并根据所得到的线性预测参数确定线性预测合成 滤波器,按当前帧的语音模式编码速率对输入语音帧自适应码书搜索、固定码书搜索,同时 对码书的索引值经行量化,此外还包括线谱对LSP,整数和分数基音延迟,固定码书增益和 固定码书预测增益f。的量化,最终封装成一个编码后的语音帧。
[0029] 其中,模式选择单元增加了四种低码率的编码模式:MR325、MR350、MR400和 MR450,分别代表四种速率:3. 25kbit/s,3. 50kbit/s,4. OOkbit/s 和 4. 50kbit/s,通过减少 编码参数的冗余比特来压缩编码率。
[0030] 在现有的AMR帧类型中,本发明重构语音帧类型,添加四种语音帧类型 0000, 0001,0010,0011 分别代表 3. 25kbit/s,3. 50kbit/s,4. 00kbit/s 和 4. 50kbit/s,全部 帧的类型如图1所示,枚举出了全部可用的语音帧类型;由于语音帧有质量等级之分,根据 质量等级,即当前语音帧质量等级越高,选择的模式将更接近高比特的模式。本发明设置七 种模式作为可变码率的选择模式,七种模式各自对应帧类型如图4所示;
[0031] 所述的四种编码模式的量化方式为:预测线谱对量化,基音延迟整数和小数部分 的量化,代数码本量化以及代数码本和固定码本的增益量化。
[0032] 其中,所述比特率确定单元通过设置语音帧的质量阀值来确定最终实际的平均编 码率。该步骤中语音帧的质量阀值是通过测试20个语音文件来统计获得,给出了如图13 的统计数组值,数组中每一行代表每种帧类型的质量阀值统计值;数组中的12列表示语音 帧质量阀值可以从〇. 〇到12. 0设置,每个值代表最终实际的平均编码率。
[0033] 本发明基于AMR-NB语音信号的可变码率解码器,包括:
[0034] 帧类型解码单元,当编码后的语音帧到达解码器,对每帧的前3比特进行解码来 确定该编码后的语音帧的类型,根据编码后的语音帧的类型索引值,从解码模式选择单元 中选择预设的解码模式进行解码,解码出每一帧的类型;
[0035] 解码模式选择单元,预设有解码模式,每个编码后的语音帧类型对应一个解码模 式,确定解码的实际模式,选择对该类型的编码后的语音帧的解码模式;
[0036] 码激励线性预测解码单元,根据解码模式选择单元得到的解码模式对编码后的语 音帧执行码激励线性预测变换解码。
[0037] 根据得到的解码模式,解码线谱对LSP获得预测系数LP,解码整数和分数基音延 迟来获得每帧的基音,根据自适应码书和固定码书索引值来搜索码书,解码固定码书增益, 并根据所得到的自适应码书参数和固定码书参数生成激励信号,最后在用该线性预测合成 滤波器对该激励信号滤波生成合成数字语音帧。
[0038] 其中,解码模式选择单元增加了四种低码率的解码模式:AMR_325、AMR_350、 AMR_400 和 AMR_450,分别代表四种速率:3. 25kbit/s,3. 50kbit/s,4. 00kbit/s 和 4. 50kbit/s。
[0039] 本发明基于AMR-NB语音信号的可变码率编码方法,包括:
[0040] 1)将语音信号数值化形成语音帧,对语音帧进行滤波和增益控制;通常使用每抽 样16比特来抽样和量化,每帧语音信号有低频信号和高频信号,且采样后的增益各不相 同,预处理单元主要是语音信号可通过一个截止频率为80Hz的2阶高通滤波器,然后降低 信号增益的过程。
[0041] 2)根据语音帧内容来判定当前语音帧的质量等级,按语音帧的重要级别排序,质 量等级越高,选择的模式将更接近高比特的模式,依次给予语音帧各自的编码模式和目标 比特率,设置有可变码率的判定规则来判定当前帧的质量等级,选择最适当的编码率; [0042] 其中,所述判定规则如下:
[0043] I )判定当前语音帧能量为高即计算的能量值大于10. 309dB,代表当前语音帧的 质量等级趋向于12,需要给予更多的比特即编码比特率趋向于5. 15kbit/s ;
[0044] II)判定当前语音帧为浊音,代表当前语音帧的质量等级趋向于12,需要给予更多 的比特即编码比特率趋向于5. 15kbit/s ;
[0045] IID判定当前语音帧能量为低即计算的能量值小于10. 309dB,代表当前语音帧的 质量等级趋向于〇,需要给予较少的比特即编码比特率趋向于3. 25kbit/s ;
[0046] IV)判定当前语音帧为固定的摩擦音,代表当前语音帧的质量等级趋向于0,需要 给予较少的比特即编码比特率趋向于3. 25kbit/s ;
[0047] V)在时域中,判定当前语音帧能量与上一语音帧能量的差方小于20%以下,代表 当前语音帧的质量等级趋向于〇,需要给予较少的比特即编码比特率趋向于3. 25kbit/s ;
[0048] VD判定当前语音帧为低音调,代表当前语音帧的质量等级趋向于0,需要给予较 少的比特即编码比特率趋向于3. 25kbit/s ;
[0049] W)判定当前语音帧为连续噪声,代表当前语音帧的质量等级趋向于0,需要给予 较少的比特即编码比特率趋向于3. 25kbit/s ;
[0050] 本发明中将当前语音帧的质量等级从0到12排序,如果质量等级为0表示当前语 音帧为不重要帧,如果质量等级为12表示当前语音帧为重要帧;
[0051] 3)根据预设的编码模式,根据语音帧质量等级选择语音帧的编码模式,当前语音 帧质量等级越大,从预设编码模式中选择更接近高比特的编码模式;
[0052] 4)根据选择的编码模式来确定语音帧的目标比特率;在基于语音帧内容的可变码 率编码器中,编码后的语音帧框架结构如图2所示,其中重新定义封装帧头如图3所示;每 个模式确定各自的帧类型,每个帧类型代表最终编码的比特率如图5所示。
[0053] 5)根据确定的语音帧目标比特率对语音帧执行码激励线性预测变换编码,形成编 码后的语音帧。对一输入语音帧进行线性预测,并根据所得到的线性预测参数确定线性预 测合成滤波器,按当前帧的语音模式编码速率对输入语音帧自适应码书搜索、固定码书搜 索,同时对码书的索引值经行量化,此外还包括线谱对LSP,整数和分数基音延迟,固定码书 增益和固定码书预测增益f。的量化,最终封装成一个编码后的语音帧。
[0054] 其中,步骤3)预设的编码模式增加了四种低码率的编码模式:MR325、MR350、 MR400和MR450,通过减少编码参数的冗余比特来压缩编码率。
[0055] 其中,所述的四种低码率的编码模式的量化方式为:预测线谱对量化,基音延迟整 数和小数部分的量化,代数码本量化以及代数码本和固定码本的增益量化。
[0056] 本发明基于AMR-NB语音信号的可变码率解码方法,包括:
[0057] 1)对每编码后的语音帧的前3比特进行解码来确定该编码后的语音帧的类型,根 据编码后的语音帧的类型索引值,从解码模式选择单元中选择预设的解码模式进行解码, 解码出每一帧的类型;
[0058] 2)根据预设的解码模式,每个编码后的语音帧类型对应一个解码模式,确定解码 的实际模式,选择对该类型的编码后的语音帧的解码模式;
[0059] 3)根据选择的解码模式对编码后的语音帧执行码激励线性预测变换解码。
[0060] 根据得到的解码模式,解码线谱对LSP获得预测系数LP,解码整数和分数基音延 迟来获得每帧的基音,根据自适应码书和固定码书索引值来搜索码书,解码固定码书增益, 并根据所得到的自适应码书参数和固定码书参数生成激励信号,最后在用该线性预测合成 滤波器对该激励信号滤波生成合成数字语音帧。
[0061] 本发明采用了基于语音内容的可变码率的方法,根据当前语音帧判定的语音质量 等级可以确定最佳的比特模式,除去了不重要帧中一些冗余的比特,实现了比特率的压缩; 本发明能改进的AMR在信道条件不变的情况下,能进行码率模式的选择编码,能在解码端 解码出相对应的语音帧。本发明提供了四种低码率编解码器/编解码方法,能应用于更低 的固定码率环境中,能在编码的比特率更低的情况下保证主观质量,使其应用于低码率的 移动互联网环境中。
[0062] 本发明提供的四种新的编解码模式,包括:3. 25kbit/s,3. 50kbit/s,4. 00kbit/s 和4. 50kbit/s。这四种新的编码都是减少AMR核心帧的类型B中的比特数;其中减少比特 的方法是重新训练线谱对(Linear Spectrum Pair, LSP)矢量码本和增益码本,缩小激励矢 量码本的尺寸。

【专利附图】

【附图说明】
[0063] 下面结合附图与【具体实施方式】对本发明作进一步详细的说明:
[0064] 图1是本发明重构语音帧类型示意图,枚举了所有可用的帧类型;
[0065] 图2是本发明可变码率编码后语音帧的框架结构示意图;
[0066] 图3是本发明可变码率编解码器重定义的封装帧头示意图;
[0067] 图4是本发明可变码率编码器的模式,帧类型对应的结构示意图;
[0068] 图5是本发明可变码率编码器的模式,帧类型和比特率对应的结构示意图;
[0069] 图6是本发明语音编码器和解码器的语音通信系统的方框图;
[0070] 图7是本发明语音帧参数重要级别排序示意图;
[0071] 图8是本发明可变码率编码器的工作流程图;
[0072] 图9是本发明可变码率解码器的工作流程图;
[0073] 图10是本发明语音帧质量等级判定流程图;
[0074] 图11是本发明模式判定和比特率确定的流程图;
[0075] 图12是本发明可变码率编解码和固定码率编解码的语首主观质量比较图;
[0076] 图13是本发明语音帧质量阀值统计数组图;

【具体实施方式】
[0077] 本发明是基于AMR-NB通过对语音帧内容的重要性判断,确定最终的比特编码模 式,在解码端通过语音帧类型指示AMR-NB解码器作出不同的处理。
[0078] 为了充分公开本发明的内容,在说明本发明的具体实施例之前,首先说明标准 AMR-NB语音编解码方法的原理:
[0079] AMR-NB语音编解码方法的基本原理是:编码器的输入为8kHz采样,16比特量化的 线性PCM编码,编码操作以20ms的语音为一帧,S卩160个采样点。编码器提取代数码本激 励线性预测(ACELP)的参数。这些参数包括线性预测滤波器(LP)的参数、自适应码本、固定 码本的索引和增益。这些参数编码之后被传输。在解码器端,这些参数从接收到的比特流 中提取,然后构造合成滤波器和激励信号,重构语音还要经过后置滤波器并进行比例放大。
[0080] AMR-NB核心帧中用4比特来表示帧类型,一共16种状态,即8种AMR-NB语音编码 模式和4种舒适背景噪声模式和空帧。当信道条件好时,采用编码速率较高的模式来提高 语音质量;而当信道条件差时,采用编码速率较低的模式来保证语音的质量。然而,在信道 条件平衡时,编码速率将是固定不变。
[0081] 下面结合附图对本发明于实际应用中实施例一进行详细的描述;
[0082] 如图6所示,互联网语音通信系统描述了根据本发明的实施例一的语音编码和解 码的使用方法。整个语音通信系统包括解码端的麦克风601,模数转换器602,语音编码器 603和固定信道604,以及在解码端的语音解码器605,数模转换器606,和扬声器607 ;
[0083] 麦克风601产生模拟语音信号,该模拟语音信号被传输到模数(A/D)转换器602, 将它转换成数字形式,语音编码器603将数字化的语音信号编码,以产生一组被编码成二 进制形式的参数并被发送到固定信道604传送到解码端。
[0084] 在解码端一侧,语音解码器605将从信道中获得比特流转换回一组编码参数从而 产生合成语音信号。在语音解码器605中被重建的合成语音信号在数模(D/A)转换器606 中被转换成模拟形式,并且在扬声器单元607中回放。
[0085] 在移动互联网中,麦克风601和A/D转换器602在实施例中表不了手机的麦克风 和米样功能;扬声器607和D/A转换器606在实施例中表不了手机的播放功能;固定信道表 示移动互联网传输媒介。
[0086] 编码器603和解码器605被配置来实现一种对语音帧内容可变码率的低码率编码 的方法。
[0087] 为了达到更低编码率,本发明将增加 AMR-NB低码率模式,将以前的8种语音模式 扩充为12种语音模式,新添加的语音模式比特率为:3. 25kbit/s,3. 50kbit/s,4. OOkbit/s 和4. 50kbit/s。且4种新的语音模式都是基于AMR-NB4. 75kbit/s改进后都得到。
[0088] 首先我们了解下AMR-NB4. 75kbit/s的各个参数的比特分配如表1所示。根据四 个参数在语音合成时的重要性排序如图7所示。根据参数重要性的高低依次来减少各个参 数上的比特数。
[0089]

【权利要求】
1. 一种基于AMR-NB语音信号的可变码率编码器,其特征是,包括: 预处理单元,将语音信号数值化形成语音帧,对语音帧进行滤波和增益控制,将语音帧 发送至语音帧质量判定单元; 语音帧质量判定单元,根据预处理单元发送的语音帧内容来判定当前语音帧的质量等 级,按语音帧的质量级别排序,质量等级越高,选择的模式将更接近高比特的模式,依次给 予语音帧各自的编码模式和目标比特率,其设置有可变码率的判定规则来判定当前帧的质 量等级,将计算所得的质量等级值发送至编码模式选择单元; 其中,所述判定规则如下: I )判定当前语音帧能量为高即计算的能量值大于10. 309dB,代表当前语音帧的质量 等级趋向于12,需要给予更多的比特即编码比特率趋向于5. 15kbit/s ; II) 判定当前语音帧为浊音,代表当前语音帧的质量等级趋向于12,需要给予更多的比 特即编码比特率趋向于5. 15kbit/s ; III) 判定当前语音帧能量为低即计算的能量值小于10. 309dB,代表当前语音帧的质量 等级趋向于〇,需要给予较少的比特即编码比特率趋向于3. 25kbit/s ; IV) 判定当前语音帧为固定的摩擦音,代表当前语音帧的质量等级趋向于0,需要给予 较少的比特即编码比特率趋向于3. 25kbit/s ; V) 在时域中,判定当前语音帧能量与上一语音帧能量的差方小于20%以下,代表当前 语音帧的质量等级趋向于〇,需要给予较少的比特即编码比特率趋向于3. 25kbit/s ; VI) 判定当前语音帧为低音调,代表当前语音帧的质量等级趋向于〇,需要给予较少的 比特即编码比特率趋向于3. 25kbit/s ; W)判定当前语音帧为连续噪声,代表当前语音帧的质量等级趋向于0,需要给予较少 的比特即编码比特率趋向于3. 25kbit/s ; 本发明中将当前语音帧的质量等级从〇到12排序,如果质量等级为0表示当前语音帧 为不重要帧,如果质量等级为12表示当前语音帧为重要帧; 编码模式选择单元,预设有编码模式,能根据语音帧质量等级选择语音帧的编码模式, 当前语音帧质量等级越大,从预设编码模式中选择更接近高比特的编码模式; 比特率确定单元,根据模式选择单元选择的编码模式来确定语音帧的目标比特率; 码激励线性预测编码单元,根据确定的语音帧目标比特率对语音帧执行码激励线性预 测变换编码,形成编码后的语音帧。
2. 如权利要求1所述基于AMR-NB语音信号的可变码率编码器,其特征是:模式选择单 元增加了四种低码率的编码模式:MR325、MR350、MR400和MR450,通过减少编码参数的冗余 比特来压缩编码率;且所述比特率确定单元通过设置语音帧的质量阀值来确定最终实际的 平均编码率。
3. 如权利要求2所述基于AMR-NB语音信号的可变码率编码器,其特征是:所述的四种 低码率的编码模式的量化方式为:预测线谱对量化,基音延迟整数和小数部分的量化,代数 码本量化以及代数码本和固定码本的增益量化。
4. 一种基于AMR-NB语音信号的可变码率解码器,其特征是,包括: 帧类型解码单元,当编码后的语音帧到达解码器,对每帧的前3比特进行解码来确定 该编码后的语音帧的类型,根据编码后的语音帧的类型索引值,选择解码模式选择单元中 预设的解码模式进行解码,解码出每一帧的类型; 解码模式选择单元,预设有解码模式,每个编码后的语音帧类型对应一个解码模式,确 定解码的实际模式,选择对该类型的编码后的语音帧的解码模式; 码激励线性预测解码单元,根据解码模式选择单元得到的解码模式对编码后的语音帧 执行码激励线性预测变换解码。
5. 如权利要求4所述基于AMR-NB语音信号解码器,其特征是:解码模式选择单元增加 了四种低码率的解码模式:AMR_325、AMR_350、AMR_400和AMR_450。
6. -种基于AMR-NB语音信号的可变码率编码方法,其特征是,包括: 1) 将语音信号数值化形成语音帧,对语音帧进行滤波和增益控制; 2) 根据语音帧内容来判定当前语音帧的质量等级,按语音帧的重要级别排序,质量等 级越高,选择的模式将更接近高比特的模式,依次给予语音帧各自的编码模式和目标比特 率,设置有可变码率的判定规则来判定当前帧的质量等级,选择最适当的编码率; 其中,所述判定规则如下: I )判定当前语音帧能量为高即计算的能量值大于10. 309dB,代表当前语音帧的质量 等级趋向于12,需要给予更多的比特即编码比特率趋向于5. 15kbit/s ; ID判定当前语音帧为浊音,代表当前语音帧的质量等级趋向于12,需要给予更多的比 特即编码比特率趋向于5. 15kbit/s ; III) 判定当前语音帧能量为低即计算的能量值小于10. 309dB,代表当前语音帧的质量 等级趋向于〇,需要给予较少的比特即编码比特率趋向于3. 25kbit/s ; IV) 判定当前语音帧为固定的摩擦音,代表当前语音帧的质量等级趋向于0,需要给予 较少的比特即编码比特率趋向于3. 25kbit/s ; V) 在时域中,判定当前语音帧能量与上一语音帧能量的差方小于20%以下,代表当前 语音帧的质量等级趋向于〇,需要给予较少的比特即编码比特率趋向于3. 25kbit/s ; VI) 判定当前语音帧为低音调,代表当前语音帧的质量等级趋向于〇,需要给予较少的 比特即编码比特率趋向于3. 25kbit/s ; W)判定当前语音帧为连续噪声,代表当前语音帧的质量等级趋向于0,需要给予较少 的比特即编码比特率趋向于3. 25kbit/s ; 本发明中将当前语音帧的质量等级从〇到12排序,如果质量等级为0表示当前语音帧 为不重要帧,如果质量等级为12表示当前语音帧为重要帧; 3) 根据预设的编码模式,根据语音帧质量等级选择语音帧的编码模式,当前语音帧质 量等级越大,从预设编码模式中选择更接近高比特的编码模式; 4) 根据选择的编码模式来确定语音帧的目标比特率; 5) 根据确定的语音帧目标比特率对语音帧执行码激励线性预测变换编码,形成编码后 的语音帧。
7. 如权利要求6所述基于AMR-NB语音信号的可变码率编码方法,其特征是:步骤3)预 设的编码模式增加了四种低码率的编码模式通1?325、1?350、1?400和1?450,通过减少编码 参数的冗余比特来压缩编码率。
8. 如权利要求7所述基于AMR-NB语音信号的可变码率编码方法,其特征是:所述的四 种低码率的编码模式的量化方式为:预测线谱对量化,基音延迟整数和小数部分的量化,代 数码本量化以及代数码本和固定码本的增益量化。
9. 一种基于AMR-NB语音信号的可变码率解码方法,其特征是,包括: 1) 对每个编码后的语音帧的前3比特进行解码来确定该编码后的语音帧的类型,根据 编码后的语音帧的类型索引值,选择解码模式选择单元中预设的解码模式进行解码,解码 出每一巾贞的类型; 2) 根据预设的解码模式,每个编码后的语音帧类型对应一个解码模式,确定解码的实 际模式,选择对该类型的编码后的语音帧的解码模式; 3) 根据选择的解码模式对编码后的语音帧执行码激励线性预测变换解码。
10. 如权利要求9基于AMR-NB语音信号的可变码率解码方法,其特征是:步骤2)预设 的解码模式增加了四种低码率的解码模式:AMR_325、AMR_350、AMR_400和AMR_450。
【文档编号】G10L19/24GK104517612SQ201310461595
【公开日】2015年4月15日 申请日期:2013年9月30日 优先权日:2013年9月30日
【发明者】须泽中, 郝飞, 卢家义 申请人:上海爱聊信息科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1