语音数据的编码方法和系统的制作方法_3

文档序号：9616942阅读：来源：国知局

-means算法的输入，取值K= 32,执行上述又一个具体示例的流程，得到矢量量化码本L2 = {βm}，m= 1，. . .，32。
[0074]进一步示例性地，采用K-Means算法对通信终端最近上传的N个语音特征矢量进行计算，得到精确编解码参数中的矢量量化码本L3时，具体可以通过如下方式实现：
[0075] 计算采用矢量量化码本L1对{xj进行矢量量化的误差& =Xi-VQUi,LI); 其中，VQ(Xl，L1)表示采用矢量量化表L1对矢量\进行矢量量化，S卩：从码本L1中找到一个码本矢量如使得其与~的欧式距离最小，S卩：| |Xl-ak| |彡||Χι-α]| |，k弇j， je[1，2,·· ·，128];
[0076] 分别提取每个矢量量化的误差yi的后5维:^ ;
[0077] 以j代替{vj作为K-means算法的输入，取值K= 32,执行上述又一个具体示例的流程，得到矢量量化码本L3 = {γm}，m= 1，. . .，32。
[0078] 本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
[0079] 图4为本发明语音数据的编码系统一个实施例的结构示意图。该实施例语音数据的编码系统可用于实现本发明上述各语音数据的编码方法实施例。如图4所示，其包括：进行语音通话的通信终端和对端通信终端、以及分析服务器。其中通信终端和对端通信终端中均设置有编码器和解码器。其中：
[0080] 通信终端，用于在与对端通信终端进行语音通话的过程中，提取通信终端采集的语音数据的语音特征矢量，并发送给分析服务器；以及将该通信终端中编码器的编码参数更新为分析服务器发送的新的编解码参数；以及通过编码器利用更新后的编码参数对通信终端采集的语音数据进行编码，并通过通信网络向对端通信终端传输编码得到的语音码流数据。
[0081] 分析服务器，用于采用基于距离的聚类算法对通信终端最近上传的N个语音特征矢量进行计算，获得新的编解码参数，其中，N为预设正整数；以及将该新的编解码参数作为编码参数发送给通信终端，将新的编解码参数作为解码参数发送给对端通信终端。可选地，分析服务器还可用于获得新的编解码参数后，删除通信终端用户的数据库表中的语音特征矢量。
[0082] 对端通信终端，用于将该对端通信终端中解码器的解码参数更新为接收到的新的编解码参数；以及通过解码器利用更新后的解码参数对通信终端传输的采集的语音码流数据进行解码。
[0083]上述图4所示实施例中的通信终端包括建立语音通话的两个通信终端中的一个或另一个。
[0084] 根据上述语音数据的编码系统实施例的一个具体示例而非限制，通信终端具体用于从采集的语音数据中，每隔第一预设时间tl提取一组语音特征矢量。相应地，分析服务器采用基于距离的聚类算法对通信终端最近上传的N个语音特征矢量进行计算时，具体用于将通信终端发送的语音特征矢量存储在通信终端用户的数据库表中；以及每隔第二预设时间t2,采用基于距离的聚类算法，对通信终端用户的数据库表中在最近一个t2存储的N 个语音特征矢量进行计算。
[0085] 根据上述语音数据的编码系统实施例的另一个具体示例而非限制，编码器具体为 G. 729编码器，解码器具体为G. 729解码器；新的编解码参数、编码参数与解码参数具体包括矢量量化码本LI、L2、L3。相应地，通信终端提取通信终端采集的语音数据的语音特征矢量时，具体用于从采集的语音数据中，提取一组10维的MA预测残差矢量作为语音特征矢量。
[0086] 根据上述语音数据的编码系统实施例的另一个具体示例而非限制，基于距离的聚类算法具体为硬聚类K-Means算法。相应地，分析服务器采用基于距离的聚类算法对通信终端最近上传的N个Μ预测残差矢量进行计算，获得新的编解码参数时，具体用于采用 K-Means算法，对通信终端最近上传的Ν个语音特征矢量进行计算，得到精确编解码参数；以及对计算得到的精确编解码参数进行四舍五入取整，得到矢量量化码本L1、L2、L3。
[0087] 进一步地示例性地，采用K-Means算法，对通信终端最近上传的N个语音特征矢量进行计算，分别获取精确编解码参数中的矢量量化码本LI、L2、L3时，具体可以通过本发明上述各语音数据的编码方法实施例的示例实现，在此不再赘述。
[0088] 如下表1所示，为G. 729编码器中原始矢量量化码本L1 :
[0089]表1
[0090]

[0094] 如下表2所示，为G. 729编码器中原始矢量量化码本L2和L3,其中，前5维对应于L2,后5维对应于L3 :
[0095] 表 2
[0096]

[0098] 如下表3所示，为通过本发明实施例，对一个应用实例中用户上传的语音特征矢量优化后G. 729编码器中的矢量量化码本L1 :
[0099] 表 3
[0100]

[0104] 如下表4所示，为通过本发明实施例，对上述一个应用实例中用户上传的语音特征矢量优化后G. 729编码器中的矢量量化码本L2和L3,其中，前5维对应于L2,后5维对应于L3 :
[0105]表 4
[0106]

[0108] 本说明书中各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言，由于其与方法实施例基本对应，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。
[0109] 可能以许多方式来实现本发明的方法、系统。例如，可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本发明的方法和系统。用于所述方法的步骤的上述顺序仅是为了进行说明，本发明的方法的步骤不限于以上具体描述的顺序，除非以其它方式特别说明。此外，在一些实施例中，还可将本发明实施为记录在记录介质中的程序，这些程序包括用于实现根据本发明的方法的机器可读指令。因而，本发明还覆盖存储用于执行根据本发明的方法的程序的记录介质。
[0110] 本发明的描述是为了示例和描述起见而给出的，而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本发明的原理和实际应用，并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。
【主权项】
1. 一种语音数据的编码方法，其特征在于，包括：通信终端在与对端通信终端进行语音通话的过程中，提取所述通信终端采集的语音数据的语音特征矢量，并发送给分析服务器；分析服务器采用基于距离的聚类算法对所述通信终端最近上传的N个语音特征矢量进行计算，获得新的编解码参数；其中，N为预设正整数；分析服务器将所述新的编解码参数作为编码参数发送给所述通信终端，将所述新的编解码参数作为解码参数发送给所述对端通信终端；所述通信终端将该通信终端中编码器的编码参数更新为所述新的编解码参数，所述对端通信终端将该对端通信终端中解码器的解码参数更新为所述新的编解码参数；所述通信终端中编码器利用更新后的编码参数对所述通信终端采集的语音数据进行编码，并通过通信网络向所述对端通信终端传输编码得到的语音码流数据；所述对端通信终端中解码器利用更新后的解码参数对所述通信终端传输的采集的语音码流数据进行解码。2. 根据权利要求1所述的方法，其特征在于，所述通信终端包括建立语音通话的两个通信终端中的一个或另一个。3. 根据权利要求2所述的方法，其特征在于，所述通信终端具体从采集的语音数据中，每隔第一预设时间tl提取一组语音特征矢量；所述分析服务器采用基于距离的聚类算法对所述通信终端最近上传的N个语音特征矢量进行计算包括：所述分析服务器将所述通信终端发送的语音特征矢量存储在所述通信终端用户的数据库表中；所述分析服务器每隔第二预设时间t2,采用基于距离的聚类算法，对所述通信终端用户的数据库表中在最近一个t2存储的N个语音特征矢量进行计算。4. 根据权利要求3所述的方法，其特征在于，还包括：所述分析服务器获得新的编解码参数后，删除所述通信终端用户的数据库表中的语音特征矢量。5. 根据权利要求1至4任意一项所述的方法，其特征在于，所述编码器为G. 729编码器，所述解码器为G. 729解码器；提取所述通信终端采集的语音数据的语音特征矢量包括；所述通信终端从采集的语音数据中，提取一组10维的切换滑动平均MA预测残差矢量作为语音特征矢量；所述新的编解码参数、所述编码参数与所述解码参数具体包括矢量量化码本LUL2、 13。6. 根据权利要求5所述的方法，其特征在于，基于距离的聚类算法具体为硬聚类 K-Means算法；所述分析服务器采用基于距离的聚类算法对所述通信终端最近上传的N个M预测残差矢量进行计算，获得新的编解码参数包括：所述分析服务器采用K-Means算法，对所述通信终端最近上传的N个语音特征矢量进行计算，得到精确编解码参数；对计算得到的精确编解码参数进行四舍五入取整，得到矢量量化码本LUL2、L3。7. 根据权

完整全部详细技术资料下载

当前第3页1 2 3 4