基于禁忌转移矩阵的声码器参数误码掩盖方法及系统与流程

文档序号：31160919发布日期：2022-08-17 07:53阅读：150来源：国知局

技术简介：
本专利针对低速率声码器在误码信道中合成语音质量差的问题，提出基于禁忌转移矩阵的误码掩盖方法。通过构建参数帧间相关性的禁忌转移矩阵，无需额外检错比特即可实现误码检测，并利用比特反转技术从量化码本中选择高概率矢量替代错误参数，有效提升语音质量。
关键词：禁忌转移矩阵,误码掩盖

1.本发明属于语音信号处理技术领域，尤其涉及基于禁忌转移矩阵的声码器参数误码掩盖方法及系统。

背景技术：

2.本部分的陈述仅仅是提供了与本发明相关的背景技术信息，不必然构成在先技术。
3.低速率声码器技术在卫星通信、短波通信、水声通信以及保密通信等领域中有着广泛的应用需求。比如，极端恶劣的山区通信环境中，超短波电台要保障全天候24小时通信，声码器的编码速率往往要低于600bps。声码器的编码速率越低，对信道误码的鲁棒性能就越差，发生误码时，语音质量就会严重下降。实际应用中，往往会采用纠错码或者检错码等技术来提高声码器在误码信道中的传输质量。在采用检错码的技术中，若在接收端发现信道传输存在误码而导致声码器参数出现错误，往往会采用之前最近邻帧的同类参数代替，来进行误码掩盖。
4.发明人发现，利用检错码和最近历史帧参数替代当前帧同类参数的误码掩盖技术，一方面需要增加额外的比特流用于检错，而在应用低速率声码器的很多场合往往并无多余的比特可用；另一方面，用过往历史帧的参数来替代当前帧参数，会产生较大的参数误差，对合成语音质量仍然有较大影响。

技术实现要素：

5.为了解决上述背景技术中存在的至少一项技术问题，本发明提供基于禁忌转移矩阵的声码器参数误码掩盖方法及系统，其在不额外增加检错比特的前提下，充分利用声码器参数的帧间相关性，构造有关参数的禁忌转移矩阵，禁忌转移矩阵主要表征声码器参数不同模式间的转移概率，提高声码器通过误码信道后的合成语音质量。
6.为了实现上述目的，本发明采用如下技术方案：
7.本发明的第一个方面提供基于禁忌转移矩阵的声码器参数误码掩盖方法，包括如下步骤：
8.基于声码器各参数的帧间相关性，构造声码器各参数的禁忌转移矩阵；
9.利用禁忌转移矩阵进行误码检测，将声码器当前帧的各参数分别与上一帧的同类参数组成转移对，从禁忌转移矩阵中查找该转移对模式，若该模式为禁忌转移模式，则从禁忌转移矩阵中查找转移概率最大的模式，将其所对应的当前帧索引作为正确的索引寻找得到正确的参数，否则正常解码合成语音。
10.本发明的第二个方面提供基于禁忌转移矩阵的声码器参数误码掩盖系统，包括：
11.禁忌转移矩阵构建模块，被配置为：基于声码器各参数的帧间相关性，构造声码器各参数的禁忌转移矩阵；
12.误码掩盖模块，被配置为：利用禁忌转移矩阵进行误码检测，将声码器当前帧的各
参数分别与上一帧的同类参数组成转移对，从禁忌转移矩阵中查找该转移对模式，若该模式为禁忌转移模式，则从禁忌转移矩阵中查找转移概率最大的模式，将其所对应的当前帧索引作为正确的索引寻找得到正确的参数，否则正常解码合成语音。
13.本发明的第三个方面提供一种计算机可读存储介质。
14.一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上述所述的基于禁忌转移矩阵的声码器参数误码掩盖方法中的步骤。
15.本发明的第四个方面提供一种计算机设备。
16.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述所述的基于禁忌转移矩阵的声码器参数误码掩盖方法中的步骤。
17.与现有技术相比，本发明的有益效果是：
18.本发明在不额外增加检错比特的前提下，充分利用声码器参数的帧间相关性，构造声码器相关参数的禁忌转移矩阵，在接收端利用禁忌转移矩阵进行误码检测，当发现禁忌模式而判断参数出现误码时，再利用比特反转技术从量化码本中寻找转移概率最大的矢量进行差错参数替代，从而进行有效的误码掩盖。
19.本发明附加方面的优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。
附图说明
20.构成本发明的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。
21.图1是传统的基于检错码的声码器参数误码掩盖技术流程图；
22.图2是本发明基于禁忌转移矩阵的声码器参数误码掩盖技术流程图。
具体实施方式
23.下面结合附图与实施例对本发明作进一步说明。
24.应该指出，以下详细说明都是例示性的，旨在对本发明提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
25.需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本发明的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
26.术语解释：
27.声码器：基于参数编码的超低速率语音压缩编码技术，比如混合激励线性预测编码技术等，这一类语音压缩编码技术也称之为声码器。
28.实施例一
29.传统的基于检错码的声码器参数误码掩盖的方法如图1所示，包括如下步骤：
30.步骤1：发送端对输入语音信号样点按时间顺序分帧；
31.步骤2：基于语音信号生成模型(比如混合激励线性预测编码模型，但不限于此)，将每帧语音进行参数提取，再对每帧(或由多个语音帧组成的超级帧)的参数进行量化与编码；
32.步骤3：对参数编码后的比特流采用额外的比特进行纠错，然后发送；
33.步骤4：接收端对收到的比特流进行检错；若无差错，则反量化得到每帧(或由多个语音帧组成的超级帧)的参数；若有差错，则采用之前最近邻帧(或超级帧)的相关参数进行替代；
34.步骤5：根据步骤4中得到的当前帧(或超级帧)参数，基于语音信号生成模型，合成得到当前帧(或超级帧)语音。
35.上述传统的方法通过利用检错码和最近历史帧参数替代当前帧同类参数的误码掩盖技术，存在的问题是：一方面需要增加额外的比特流用于检错，而在应用低速率声码器的很多场合往往并无多余的比特可用；另一方面，用过往历史帧的参数来替代当前帧参数，会产生较大的参数误差，对合成语音质量仍然有较大影响。
36.因此，本发明的主要目的是在不额外增加检错比特的前提下，充分利用声码器参数的帧间相关性，构造有关参数的禁忌转移矩阵，禁忌转移矩阵主要表征声码器参数不同模式间的转移概率。由于声码器的相邻帧参数具有较强的相关性，因此帧间参数之间转移概率常常呈现稀疏分布，很多模式转移极少发生或者不可能发生，因此禁忌转移矩阵常常为稀疏矩阵。在接收端利用禁忌转移矩阵进行误码检测，当发现禁忌转移模式出现时，即判断为参数出现误码，再利用比特反转技术从改参数的量化码本中寻找当前帧参数的最大似然替代矢量，从而进行有效的误码掩盖，有效改善误码发生时的合成语音质量。
37.如图2所示，本实施例提供基于禁忌转移矩阵的声码器参数误码掩盖方法，包括如下步骤：
38.基于声码器各参数的帧间相关性，构造声码器各参数的禁忌转移矩阵；
39.利用禁忌转移矩阵进行误码检测，将声码器当前帧的各参数分别与上一帧的同类参数组成转移对，从禁忌转移矩阵中查找该转移对模式，若该模式为禁忌转移模式，则从禁忌转移矩阵中查找转移概率最大的模式，将其所对应的当前帧索引作为正确的索引寻找得到正确的参数，否则正常解码合成语音。
40.作为一种或多种实施例，所述基于声码器各参数的帧间相关性，构造声码器各参数的禁忌转移矩阵包括：
41.根据声码器各参数的量化比特分配，生成各参数的量化码本；
42.基于各参数的量化码本，利用训练语音集生成各参数的禁忌转移矩阵。
43.所述声码器的参数包括线谱频率、基音周期、能量、带通浊音度等。
44.为了更清楚地理解本发明的技术方案，本实施例以基音周期参数矢量为例进行详细说明:
45.以基音周期参数矢量为例进行详细说明:
46.s101：利用训练语音集，根据各参数的量化比特分配，生成各参数的量化码本；
47.以基音周期参数为例，按美国政府混合激励的线性预测(melp)语音编码算法标准所描述的方法提取，并将多帧语音的基音周期参数组成矢量。设基音周期矢量的量化比特数为8，则量化码本尺寸k＝256，其中码本根据所有训练矢量集得到，根据训练矢量集得到
码本的方法可以参考杨行峻等人著《语音信号数字处理》p92-95中所述lbg方法；
48.s102：利用步骤s101得到的各参数的量化码本，利用训练语音集生成各参数的禁忌转移矩阵，存储于解码器接收端；
49.以基音周期参数矢量为例(但不限于次，适用于线谱频率参数、能量参数、带通浊音度参数等)，利用训练语音集，构造一个基音周期参数矢量的禁忌转移矩阵：
[0050][0051]
其中，n为转移矩阵的列数，m为转移矩阵的列数，pt
i,j
代表训练集中上一帧基音周期参数量化索引为i而当前帧基音周期参数量化索引为j的概率，若pt
i,j
《t，则令pt
i,j
＝0，t为经验统计值。从而构造出基音周期参数的禁忌转移矩阵；
[0052]
例如本实施例中矩阵尺寸可以为256*256。
[0053]
s103：发送端对输入语音信号样点按时间顺序分帧；
[0054]
对输入语音信号样点按时间顺序分帧中，按8khz频率采样、已经过高通滤波去除工频干扰的语音样点。每20ms，也就是160个语音样点构成一帧，但不限于此。
[0055]
s104：基于语音信号生成模型，将每帧语音进行参数提取，再对每帧(或由多个语音帧组成的超级帧)的参数进行量化与编码，并将编码后的比特流发送给接收端；
[0056]
仍以基音周期参数为例，按美国政府混合激励的线性预测(melp)语音编码算法标准所描述的方法提取，利用步骤s101中得到的量化码本进行量化与编码，假设其量化索引为index_cur_enc，并对量化索引采用二进制编码转化为比特流；
[0057]
s105:接收端利用收到的比特流对参数进行反量化；
[0058]
假设解码端对比特流进行解析后得到当前帧基音周期参数矢量的量化索引为index_cur_dec；
[0059]
s106：对声码器当前帧的各参数，分别与上一帧(超帧)的同类参数组成转移对，从禁忌转移矩阵中查找该模式是否为禁忌转移模式；
[0060]
将s105中得到的量化索引index_cur_dec与上一帧的量化索引index_last_dec组成转移模式(index_last_dec，index_cur_dec)，从基音周期参数的禁忌转移矩阵中查找pt
index_last_dec,index_cur_dec
的值；
[0061]
s107：若是禁忌转移模式，则对当前帧参数的量化索引逐个比特反转形成候选索引集，并分别与上一帧(超帧)的同类参数组成转移对，从禁忌转移矩阵中查找转移概率最大的模式，将其所对应的当前帧索引作为正确的索引，反量化后得到正确的参数，送入解码端合成语音；
[0062]
若pt
index_last_dec,index_cur_dec
＝0，则代表当前转移模式为禁忌模式，将index_cur_dec的8个量化比特逐个反转，分别形成候选索引集合c＝{index_cur_dec_c1,...,index_cur_dec_c8}，从基音周期参数矢量的禁忌转移矩阵中分别查找pt
index_last_dec,index_cur_dec_ci
的值，将转移概率最大的转移模式对应的index_cur_dec_c
max
作为当前帧基音周参数矢量的正确量化索引，反量化后得到正确的基音周期参数矢量，送入解码端，按美国政府混合激
励的线性预测(melp)语音编码算法标准进行语音合成；
[0063]
同时，令index_last_dec＝index_cur_dec_c
max
；
[0064]
s108：若不是禁忌转移模式，直接送入解码端合成语音。
[0065]
若pt
index_last_dec,index_cur_dec
》0，则将反量化后得到基音周期参数送入解码器端，按照美国政府混合激励的线性预测(melp)语音编码算法标准进行语音合成；同时，令index_last_dec＝index_cur_dec；
[0066]
s109：转至步骤s103，重复上述步骤，直到语音信号处理完成。
[0067]
上述方案的优势在于，充分利用声码器参数的帧间相关性，构造声码器相关参数的禁忌转移矩阵，在接收端利用禁忌转移矩阵进行误码检测，当发现禁忌模式而判断参数出现误码时，再利用比特反转技术从量化码本中寻找转移概率最大的矢量进行差错参数替代，从而进行有效的误码掩盖。
[0068]
实施例二
[0069]
本实施利提供基于禁忌转移矩阵的声码器参数误码掩盖系统，包括：
[0070]
禁忌转移矩阵构建模块，被配置为：基于声码器各参数的帧间相关性，构造声码器各参数的禁忌转移矩阵；
[0071]
误码掩盖模块，被配置为：利用禁忌转移矩阵进行误码检测，将声码器当前帧的各参数分别与上一帧的同类参数组成转移对，从禁忌转移矩阵中查找该转移对模式，若该模式为禁忌转移模式，则从禁忌转移矩阵中查找转移概率最大的模式，将其所对应的当前帧索引作为正确的索引寻找得到正确的参数，否则正常解码合成语音。
[0072]
实施例三
[0073]
本实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上述所述的基于禁忌转移矩阵的声码器参数误码掩盖方法中的步骤。
[0074]
实施例四
[0075]
本实施例提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述所述的基于禁忌转移矩阵的声码器参数误码掩盖方法中的步骤。
[0076]
本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
[0077]
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0078]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或
多个方框中指定的功能。
[0079]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0080]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(read-only memory，rom)或随机存储记忆体(random accessmemory，ram)等。
[0081]
以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李晔沈自强白全民张存阳王金颖
技术所有人：山东省科技发展战略研究所
我是此专利的发明人

上一篇：一种宽聚酯薄膜片材收卷机的制作方法
下一篇：一种双向滚筒导轮复合输送机构的制作方法