基于网络协议的低速语音编码方法

文档序号：2835803阅读：708来源：国知局

专利名称：基于网络协议的低速语音编码方法
技术领域：
本发明涉及数字通信系统中数据编码方法，尤其是基于网络协议的低速语音编码方法。
在数字通信系统中，用以传输信息的信道带宽总是有限的，要在有限的带宽内尽可能多地增加系统容量或用户数，就必须提高信道带宽的利用率。采用低速语音编码对信源数据进行压缩是提高带宽利用率的重要手段。目前，低速语音编码方法以固定帧长为基础，基于IP(网络协议)传送的语音信号的数据报分割是以一帧或多帧语音的比特数为单位的。
基于固定帧长的单帧或多帧IP语音传送系统的工作流程如下在发送端，当语音PCM(脉冲编码调制)信号输入后，首先确定语音性质，再根据语音性质和帧长确定编码速率并对其进行压缩编码，最后对压缩后的单帧或多帧语音编码TCP(传输控制协议)或UDP(用户数据报协议)打包和IP打包后，通过信道传送给接收端；在接收端，首先进行IP和TCP或UDP解包，然后判断数据包是否出错、丢包或延迟，如没有上述情况，则正常译码后输出语音PCM信号，否则，经单帧或多帧语音预测译码后输出语音PCM信号。在上述过程中，无论采用单帧还是多帧，由于采用了固定帧长，则其编码效率低，不利于编码效率的进一步下降。当采用多帧时，还不利于IP数据包丢失、传送比特出错、延迟太大时对信源译码的处理，对语音译码质量有影响。
针对以上现有技术中的问题，本发明的目的是，提供一种有利于提高编码效率、降低压缩速率、保证语音译码质量的基于网络协议的低速语音编码方法。
为达到上述目的，本发明采用的技术方案是一种基于网络协议的低速语音编码方法，该方法包括以下步骤(1)信源根据语音数据采样频率，顺序输入量化的语音数据；(2)根据TN时间内输入的语音数据确定语音的性质参数；(3)根据上述步骤(2)得到的语音性质参数，确定语音后继处理的最佳帧长T；(4)对最佳帧长T的语音数据进行压缩编码；(5)对语音数据压缩编码后的数据比特，在利用TCP或UDP协议打包和IP协议打包后，通过信道输出。
由于本方法采用变帧长语音压缩编码方法，可提高编码效率，有利于编码压缩速率的进一步下降，进而提高了数据传输效率。同时由于本方法采用单帧语音编码，在IP包数据丢失、传送比特出错、延迟太大时，有利于信源译码的处理，对语音译码有好处，进而保证了语音译码质量。采用非正式听音表明，使用本方法的数据编码压缩能力或在同等误码率上，以及在对语音译码能力方面，MOS分值提高0.1～0.2。
下面结合附图和实施例对本发明作进一步的详细说明。

图1是本发明的流程示意图；图2是基于自适应变帧长变速率的单帧IP语音传送系统流程示意图；图3是本发明的一个实施例系统逻辑示意图；图4是本发明的基于自适应变帧长变速率的单帧IP语音传送系统实施例流程示意图。
本发明的原理描述如下，参考图1、2。信源输入为采样量化的语音数据，数据是根据采样率顺序输入的，语音性质确定模块根据每TN毫秒输入的数据，确定输入语音的性质参数。上述时间TN按照下述原则确定首先编码效率、压缩率要尽可能高，其次延迟时间不能太长；经实验证明，5ms≤TN≤30ms时为最佳。根据语音性质参数，即语音的变化频度确定输入语音后续处理的最佳帧长T，基本原则为使输入语音满足短时特性不变，而可以分析的语音帧长尽量长，具体说，若语音的变化频度快，则帧长短，反之帧长长。最佳帧长T＝T1，T2，...，TN，为一个有限集。对最佳帧长T的语音，再采用内部变速率算法对其进行压缩编码，输出压缩编码后的比特，其比特数NUM也是在一个有限集中，NUM＝NUM1，NUM2，......，NUMM。对语音压缩编码后输出的NUM个比特利用TCP或UDP协议加上包头，比特数变为NUM_P，IP打包模块对NUM_P个比特再打包加上路由信息，得到NUM_IP个比特，由此，传送到接收方，接收方进行IP解包，TCP或UDP解包。在正常情况下，语音译码模块正常译码，但由于在传送过程中，可能会引入信道误码，传输延迟等情况，此时，由于只有一帧语音传送，语音译码模块可以很容易地处理传输中出现的问题。
编码的基本操作流程如下(1)信源输入为采样量化的语音数据，数据是根据采样率顺序输入的；(2)语音性质确定模块根据每TN毫秒输入的数据确定输入语音的性质参数，根据语音的性质参数，即语音的变化频度确定输入语音后续处理的最佳帧长T，T＝T1，T2，...，TN，为一个有限集；(3)对最佳帧长T的语音，再采用内部变速率算法对其进行压缩编码，输出压缩编码后的比特，其比特数NUM也是在一个有限集中，NUM＝NUM1，NUM2，......，NUMM；(4)对语音压缩编码后输出的NUM个比特利用TCP或UDP协议加上包头，比特数变为NUM_P；(5)IP打包模块对NUM_P个比特再打包加上路由信息，得到NUM_IP个比特。
上述IP打包后的NUM_IP个比特通过信道，传送到接收方。
译码的基本操作流程如下(1)接收方进行IP解包；(2)TCP或UDP解包；
(3)在正常情况下，语音译码模块正常译码；在处错条件下，进行单帧预测译码；(4)输出恢复的语音数据。
本发明可以应用于目前Internet上公用网或专用网IP语音传送，也可用于未来移动通信中基于IP的核心网语音传送。参考图3。其中IP网关采用本发明提出的编译码，在Internet传送IP包出现丢包、传输比特出错等情况下，译码器能够根据本发明内容纠正译码质量，由于是变帧长传输，纠正的语音译码质量能够更好。对于IP网关，本例给出了一个结合变帧长、变速率语音编码方法的实例，参考图4，编码速率为2Kbitps，4Kbitps，8Kbitps，其基本操作流程如下编码(1)信源输入为采样量化的语音数据，采样率8000Hz，数据是根据采样率顺序输入的；T1＝5，T2＝10，T3＝15，T4＝20，T5＝25，T6＝30ms；(2)语音性质确定模块根据每30ms输入的数据确定输入语音的性质参数，计算方法如下，计算每5ms的分段基音周期，分别计算10ms，15ms，20ms，25ms，30ms的基音周期方差D10，D15，D20，D25，D30；(3)根据语音的性质参数，即语音的变化频度确定输入语音后续处理的最佳帧长T当{D30<Threshold则T＝30；D25<Threshold则T＝25；
D20<Threshold则T＝20；D15<Threshold则T＝15；D10<Threshold则T＝10；否则T＝5}其中Threshold是基音周期的一个方差的比较，其值的确定应考虑在编码效率和质量之间作一个较好的权衡。
(4)对最佳帧长T的语音，采用内部变速率算法压缩编码，压缩编码后的比特数为NUM，NUM＝T*2，T*4，T*8，为三个档次；(5)对语音压缩编码后输出的NUM个比特利用TCP协议加上包头，比特数变为NUM_P；(6)IP打包模块对NUM_P个比特再打包加上路由信息，得到NUM_IP个比特。该NUM_IP个比特通过信道，传送到接收方。译码(1)接收方进行IP解包；(2)TCP解包；(3)在正常情况下，语音译码模块正常译码；在处错条件下，进行单帧预测译码；(4)·输出恢复的语音数据。
权利要求
1.一种基于网络协议的低速语音编码方法，其特征在于，该方法包括以下步骤(1)信源根据语音数据采样频率，顺序输入量化的语音数据；(2)根据TN时间内输入的语音数据确定语音的性质参数；(3)根据上述步骤(2)得到的语音性质参数，确定语音后继处理的最佳帧长T；(4)对最佳帧长T的语音数据进行压缩编码；(5)对语音数据压缩编码后的数据比特，在利用TCP或UDP协议打包和IP协议打包后，通过信道输出。
2.根据权利要求1所述的基于网络协议的低速语音编码方法，其特征在于所述TN时间为满足TN≥5ms且TN≤30ms的任一时间。
3.根据权利要求1所述的基于网络协议的低速语音编码方法，其特征在于，所述根据语音性质参数确定语音后继处理的最佳帧长T是按照下述方法确定的若语音的变化频度快，则帧长短，反之帧长长。
4.根据权利要求1所述的基于网络协议的低速语音编码方法，其特征在于所述对最佳帧长T的语音数据进行压缩编码是采用内部变速率算法进行的。
全文摘要
本发明提供了一种基于网络协议的低速语音编码方法,由于本方法采用单帧、变帧长、帧内比特自适应的低速语音压缩编码方法,可使编码压缩的能力进一步提高,进而提高了数据传输效率。同时由于IP的数据报分割以该语音编码帧的分割为单位,对信源语音编译码的质量会有较大的提高。采用非正式听音表明,使用本方法的数据编码压缩能力或在同等误码率上,以及在对语音译码能力方面,MOS分值提高0.1～0.2。
文档编号G10L19/18GK1338834SQ0012611
公开日2002年3月6日申请日期2000年8月19日优先权日2000年8月19日
发明者潘胜昔, 李英涛申请人:华为技术有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：潘胜昔;李英涛
技术所有人：华为技术有限公司
我是此专利的发明人