用于在语音数据的错误传输时进行错误隐藏的方法

文档序号：2823232阅读：152来源：国知局

专利名称：用于在语音数据的错误传输时进行错误隐藏的方法
技术领域：
本发明从一种根据独立权利要求分类的方法和装置出发。
背景技术：
为了通过有线网络或无线网络传输语音信号，已知的是，借助语音信号帧传输语音信号，其中，接收器在接收到语音信号帧之后使用所述语音信号帧以产生待输出的语音信号。在此，优选作为所谓的分组形式的数据通过网络——例如GSM网络、根据互联网协议的网络或者根据WLAN(无线局域网)协议的网络传输语音信号帧，其中，由于错误的数据传输可能会出现语音信号帧的丢失。同样可能的是，在数据的分组传输中可能出现语音信号帧的传输的较大时间延迟，从而在语音信号的连续输出的过程中不可以考虑所述语言信号帧，因为例如为了输出语音信号延迟传输的或者也丢失的语音信号帧不存在。如果没有取代没有接收到的语音信号帧在待输出的语音信号的相应位置上添加任何信号，则由此待输出的语音信号的在相应的位置上缺失，这导致语音信号的声音质量的退化。出于这样的原因，需要取代没有接收到的语音信号帧使用等效语音信号帧，以便实现所谓的错误隐藏。在图1中示出借助语音信号帧传输语音信号以及借助所述语音信号帧产生语音信号的基本原理。图1示出语音信号10，所述语音信号例如划分成语音信号帧1、2、3形式的三个片段。在此，三个片段的数量仅仅是示例性地选择的。对于本领域技术人员而言应理解的是，语音信号帧1、2、3的数量可以不是三个。如果语音信号帧1、2、3在传输之后被接收，则在不同的时刻持续地进行语音信号10的输出。根据图1示出了时间轴20，沿着所述时间轴标出了时刻31、32、33，在这些时刻31、32、33分别已经完成语音信号帧1、2、3的接收。根据此实施例，在第一时刻31，第一语音信号帧31的接收已经完成，从而在第一时刻 31可以输出语音信号10直到一确定的部分。根据此实施例，在第二时刻32第二语音信号帧2的接收已经完成，从而在所述第二时刻32可以输出语音信号10的另一部分。此外同样适用于第三时刻33，在所述第三时刻33第三语音信号帧33已经完整地接收。根据图2中的实施例，示出了待输出的另一语音信号11的产生。在此实施例中，另一语音信号11如此组成，使得接收到的语音信号帧1、2、3在时间上不是彼此邻接的，而是交叉的。根据此实施例，在图2中，另一语音信号11由第一片段111、第二片段112以及第三片段113组成。从图2中可以看出，可以借助于第一语音帧1以及第二语音帧2的至少一部分确定第一片段111。可以借助于第二语音帧以及第三语音帧3的至少一部分确定第二片段112。可以根据第三语音帧3以及根据可能随后的其他语音帧确定第三片段113。在图2中示出的第二时间轴21上标出了第一时刻41，所述第一时刻与另一语音信号11的第一片段111的时间末端一致。为了在第一时刻41可以输出另一语音信号11至少直到其第一片段111的时间末端，必须存在至少第一语音信号帧1以及第二语音信号帧2。此外，在第二时间轴21上具有第二时刻42，所述第二时刻与另一语音信号11的第二片段112的时间末端一致。为了可以输出另一语音信号11至少直到其第二片段112的时间末端，必须在第二时刻42存在第二语音信号帧2和第三语音信号帧3。此外，在第三时刻43，关于第三语音信号帧3以及可能随后的语音信号帧也适用于另一语音信号11的第三片段113。在图1和2中示出的语音信号帧1、2、3优选具有相应的索引11、12、13，以便可以使接收到的语音信号帧与一个时间序列相对应。图3示出没有接收到第二语音信号帧2的情形。如果根据图3直到第一时刻41 虽然已经接收到第一语音信号帧1但没有接收到第二语音信号帧2，则不可能以正确的方式在第一时刻41输出图2的另一语音信号11。为了在第二时刻42输出另一语音信号，虽然可以根据接收到的第三语音信号帧3产生另一语音信号，但在所述第二时刻42缺少第二语音信号帧2。因此，需要取代没有接收到的语音信号帧2产生一个等效语音信号帧100，以便使用所述等效语音信号帧100来产生另一待输出的语音信号。为此，相应的方法已经由[1，2]公开。在图4中详细地阐述所述方法的工作原理。图4示出一个方法的步骤，借助于所述方法根据接收到的语音信号帧50产生等效语音信号帧100。为此，接收到的语音信号帧50首先输送给线性预测分析单元62，所述线性预测分析单元确定用于线性预测单元61的分析滤波器的线性预测系数51。本领域技术人员由[1，4]已知了线性预测的原理以及用于接收到的语音信号帧50的由脉冲编码构造的语音信号的线性预测的分析滤波器的线性预测系数的确定。线性预测分析滤波器61滤除接收到的语音信号帧50的语音信号，由此获得剩余信号52。所述剩余信号52输送给判定器63，所述判定器借助于剩余信号52确定接收到的语音信号帧50的语音信号涉及有声的语音信号还是涉及无声的语音信号。判定器63向基频确定单元64传输其关于语音信号有声或者无声的判定53。所述基频确定单元64借助于剩余信号52和判定53确定语音信号的基频M。在此，基频借助于归一化的自相关函数的那个所述归一化的自相关函数的值取其最大值时的自变量确定[1，2]。在此，本领域技术人员仅仅使用基频的证实对于人的语音信号有意义的值。对于存在具有噪声类型的特征并且因此不具有明确的基频的无声语音信号的情形，将基频M 置于最小值，以便减少高频范围中在待确定的信号中由非自然的周期性导致的假象。借助于估计单元65根据剩余信号52和基频M确定估计剩余信号55 [1]。估计剩余信号55输送给线性预测合成滤波器66，其根据之前确定的线性预测系数51对估计剩余信号阳进行合成滤波，从而获得等效语音信号帧100的语音信号。由此，外插语音信号的频谱包络，而同时保持信号的周期结构。根据图4，根据接收到的语音信号帧50产生等效语音信号帧100。在此，接收到的语音信号帧50例如涉及图3中的第一语音信号帧1。对于在接收或者传输语音信号帧时出现短时间干扰的情形，根据现有技术仅仅需要产生一个语音信号帧。但是如果也没有接收到图3中的第三语音信号帧3，则需要产生另一等效语音信号帧。在这样的情形中，为了产生所述另一等效语音信号帧使用基频M，所述基频通过分析按照时间顺序在最后接收到的第一语音信号帧之前已经获得的那个语音信号帧获得。由此，得出不同的、所产生的语音信号帧的语音信号的基频的偏差，由此避免不期望的谐波假象，所述谐波假象在过长的时间间隔上输出相同的语音信号的情形中产生。对于需产生另一、第三等效语音信号帧的情形，为了产生所述另一、第三等效语音信号帧使基频讨变化，其方式是，根据按照时间顺序在最后接收到的第一语音信号1的两个位置上接收到的那个语音信号帧获得基频M。对于需产生其他等效语音信号帧的情形，在已经确定三个等效语音信号帧后不在进行基频的进一步修改。取而代之地，借助于为了产生第三等效语音信号帧而使用的那个基频M来产生其他等效语音信号帧。使用所述用于产生第三替代语音信号的基频M，直到接收干扰结束。使用这样产生的等效语音信号帧来取代没有接收到的语音信号帧。优选地，在产生待输出的语音信号11时进行语音信号帧的平滑过渡。

发明内容
与此相比，根据本发明的具有独立权利要求的特征的方法具有以下优点为了估计等效语音信号帧的语音信号，在根据接收到的、具有无声的语音信号的语音信号帧产生等效语音信号帧的语音信号的情形中实现语音信号的更好信号质量。所述优点通过以下方式实现对于接收到的语音信号帧的无声的语音信号，借助于噪声信号产生至少一个替代语音信号的语音信号。在此，噪声信号是不具有明确的基频的信号。优选地，在此使用在一个确定的值范围内具有均勻分布的随机信号作为噪声信号。通过在从属权利要求中记载的措施实现在独立权利要求中说明的方法的有利扩展和改进。根据本发明的另一实施方式，在至少一个之前接收到的语音信号帧具有有声的语音信号的情形中，借助于基频信号产生至少一个等效语音信号帧的语音信号。这具有以下优点通过区分语音信号是有声的还是无声的以及相应地应用噪声信号还是基频信号来产生等效语音信号帧的语音信号在所述产生方面实现更大的灵活性。根据本发明的另一实施方式，使用与一个缩放因数相乘的、均勻分布的噪声信号作为噪声信号。这具有以下优点通过噪声信号的缩放可以实现噪声信号的幅度或者信号能量的匹配并且因此可以实现由此估计出的等效语音信号帧的语音信号的幅度或者能量的匹配。由此获得以下优点通过所述匹配产生等效语音信号帧的语音信号，所述语音信号尽可能类似于之前接收到的语音信号帧的语音信号。根据本发明的另一实施方式，根据一个经滤波的语音信号的信号能量确定所述缩放因数，所述经滤波的语音信号由借助于线性预测滤波器对之前接收到的语音信号帧的语音信号进行滤波得出。这具有以下优点借助于如此确定的缩放因数通过与所述缩放因数相乘产生估计噪声信号，所述估计噪声信号的信号能量尽可能地类似于之前通过线性预测获得的语音信号的信号能量，因为估计测量信号稍后重新通过具有之前的分析滤波器的线性预测系数的线性合成滤波器滤除，以便获得等效语音信号帧的信号。根据本发明的另一实施方式，在借助线性预测单元的分析滤波器进行滤波后将经滤波的语音信号划分为相应的部分帧和相应的语音信号帧，其中，对于每个部分帧确定部分语音信号的相应的信号能量。根据相应的信号能量中具有最小值的那个信号能量确定缩放因数。由此得出缩放因数并且因此得出估计剩余信号，它们导致等效语音信号帧的语音信号，所述语音信号帧为了产生待输出的语音信号导致对于收听者而言在声音方面高的感知质量。根据本发明的另一实施方式，根据接收到的语音信号帧的语音信号的归一化的自相关函数和根据接收到的语音信号帧的语音信号的过零率来判定之前接收到的语音信号帧具有有声的语音信号还是无声的语音信号。这具有以下优点通过归一化的自相关函数和过零率的这样的关联可以在语音信号的有声或者无声方面做出比现有技术更可靠的判定。根据一个并列的权利要求，要求保护一种用于输出语音信号的控制设备。所述控制设备具有第一接口，所述控制设备通过所述第一接口接收语音信号帧。此外，所述控制设备具有计算单元，所述计算单元使用接收到的语音信号帧按照预给定的顺序产生待输出的语音信号。根据本发明的控制设备通过第二接口输出待输出的语音信号。计算单元在至少一个待接收的语音信号帧没有被接收到的情形中取代所述至少一个没有接收到的语音信号帧使用等效语音信号帧，其中，计算单元根据至少一个之前接收到的语音信号帧产生所述等效语音信号帧。根据本发明的控制设备的特征在于，在之前接收到的语音信号帧具有无声的语音信号的情形中，计算单元借助于噪声信号产生等效语音信号帧的语音信号。这具有以下优点通过使用噪声信号来产生等效语音信号帧的语音信号对于收听者而言在声音方面实现比现有技术的方法更好的感知质量，在现有技术中总是使用基频信号来产生等效语音信号帧。根据一个并列的权利要求，要求保护一种控制设备，其中，在之前接收到的语音信号帧具有有声的语音信号的情形中，计算单元借助于基频信号产生等效语音信号帧的语音信号。这具有以下优点通过使用基频信号或者噪声信号来产生等效语音信号帧的语音信号可以相应地产生这样的语音信号，其中，可以相应于之前接收到的语音信号帧的语音信号的有声或者无声。根据另一并列的权利要求，要求保护一种控制设备，所述控制设备还具有存储单元，所述存储单元提供噪声信号和/或基频信号。这具有以下优点不必由计算单元自己产生噪声信号和/或基频信号——例如通过移位寄存器，而是可从存储单元中通过简单的方式调取这些信号。

在附图中示出并且在以下说明中详细地解释本发明的实施例。附图示出图5 根据本发明的方法的实施例；图6 语音信号帧，其划分成一些部分帧；图7 根据本发明的控制设备的实施方式。
具体实施例方式根据图5示出了根据本发明的方法的优选实施方式。之前接收到的语音信号帧50 的语音信号借助于线性预测分析单元62输送给用于确定线性预测系数的单元，由此获得线性预测系数51。借助于线性预测系数51和接收到的语音信号帧50的语音信号，线性预测单元61的分析滤波器产生剩余信号52。用于判定语音信号的有声或者无声的经修改的判定单元83不是如根据现有技术教导地那样根据剩余信号52做出判定，而是根据接收到的语音信号帧50的语音信号做出判定。此外，根据接收到的语音信号帧50的语音信号，借助于经修改的基频确定单元84获得经修改的基频74，所述经修改的基频信号确定单元84 由文档[3]公开。根据由经修改的判定单元83做出的关于有声或者无声的经修改的判定 73,或者将剩余信号52转接到产生单元65上或者将剩余信号52转接到能量计算单元85上，其中，所述产生单元65根据剩余信号52和经修改的基频74产生经修改的估计剩余信号75。如果如此做出经修改的判定73，使得接收到的语音信号帧50的语音信号识别为无声的，则如此进行转接，使得剩余信号52被连接到能量计算单元85上。在判定有声的信号时，如此进行转接，使得剩余信号52被连接到产生单元65上。现在，产生单元65根据经修改的基频74和剩余信号52产生经修改的估计剩余信号75，其中，由[1，2]公开了根据基频和剩余信号的产生的方式。在无声的信号的情形中，能量计算单元85由剩余信号52计算出增益因数77，所述增益因数在乘法单元87中与由噪声生成器86产生的噪声信号76相乘。通过所述相乘，在判定接收到的语音信号帧50的无声信号的情形中产生经修改的估计噪声信号75。为了截取经修改的估计剩余信号75，同样根据经修改的判定73如此连接第二转接单元89，使得根据接收到的语音信号帧50的语音信号的有声或者无声或者截取通过经修改的基频产生的剩余信号或者截取通过噪声信号产生的剩余信号。所述经修改的估计剩余信号75输送给线性预测单元的合成滤波器，所述合成滤波器为了进行合成而使用之前获得的线性预测系数51。因此，在线性预测单元66的合成滤波器的输出端上获得等效语音信号帧100的语音信号。优选地，在经修改的判定单元83中根据语音信号的归一化的自相关函数以及语音信号的过零率进行关于接收到的语音信号帧50的语音信号的有声或者无声的判定。对于长度为N、基频的之前确定的周期长度为Ptl的优选数字的语音信号χ (η)(其中，索引η = 0，...，Ν-1)，优选借助于以下计算规则确定归一化的自相关函数ζ (χ(η))
权利要求
1.用于输出语音信号(11)的方法，其中，接收语音信号帧(1，3)以及使用语音信号帧(1，；3)按照预给定的顺序来产生待输出的语音信号(11)，其中，在至少一个待接收的语音信号帧( 没有被接收到的情形中，在所述至少一个没有接收到的语音信号帧的位置上使用至少一个等效语音信号帧(100)，其中，根据至少一个之前接收到的语音信号帧(1)产生所述至少一个等效语音信号帧 (100)，其特征在于，在所述至少一个之前接收到的语音信号帧(1)具有无声的语音信号的情形中，借助于噪声信号产生所述至少一个等效语音信号帧(100)的语音信号。
2.根据权利要求1所述的方法，其特征在于，在所述至少一个之前接收到的语音信号帧(1)具有有声的语音信号的情形中，借助于基频信号产生所述至少一个等效语音信号帧 (100)的语音信号。
3.根据权利要求2所述的方法，其特征在于，根据所述至少一个之前接收到的语音信号帧(1)的语音信号的归一化的自相关函数和过零率进行关于所述至少一个之前接收到的语音信号帧(1)具有有声的还是无声的语音信号的判定。
4.根据权利要求3所述的方法，其特征在于，如果所述归一化的自相关函数超过第一预给定的阈值并且如果所述过零率没有超过第二预给定的阈值，则所述至少一个之前接收到的语音信号帧(1)的语音信号被判定为有声的。
5.根据以上权利要求中任一项所述的方法，其特征在于，使用与缩放因数(77)相乘的、均勻分布的噪声信号(76)作为所述噪声信号(75)。
6.根据权利要求5所述的方法，其特征在于，借助于线性预测滤波器对至少一个接收到的语音信号帧(1)的语音信号进行滤波，以及根据经滤波的语音信号(5 的信号能量确定所述缩放因数(77)。
7.根据权利要求6所述的方法，其特征在于，将所述经滤波的语音信号(5 划分为具有相应的部分语音信号的相应的部分帧，对于每个部分语音信号确定相应的信号能量，根据相应的信号能量中具有最小值的那个信号能量确定所述缩放因素(77)。
8.用于输出语音信号的控制设备(1000)，具有第一接口(1001)，所述控制设备(1000)通过所述第一接口接收语音信号帧，具有计算单元(1003)，所述计算单元使用接收到的语音信号帧按照预给定的顺序来产生待输出的语音信号，具有第二接口(1002)，所述控制设备(1000)通过所述第二接口输出所述语音信号，其中，所述计算单元(100 在至少一个待接收的语音信号没有被接收到的情形中在所述至少一个没有接收到的语音信号帧的位置上使用至少一个等效语音信号帧，其中，所述计算单元(100 根据至少一个之前接收到的语音信号帧来产生所述至少一个等效语音信号帧，其特征在于，在所述至少一个之前接收到的语音信号具有无声的语音信号的情形中，所述计算单元借助于噪声信号产生所述至少一个等效语音信号帧的语音信号。
9.根据权利要求8所述的控制设备，其特征在于，在所述至少一个之前接收到的语音信号帧(1)具有有声的语音信号的情形中，所述计算单元(100 借助于基频信号产生所述至少一个等效语音信号帧的语音信号。
10.根据权利要求8或9所述的控制设备，其特征在于，所述控制设备(1000)具有存储单元(1005)，所述存储单元提供所述噪声信号和/或所述基频信号。
全文摘要
本发明涉及一种用于输出语音信号的方法。接收语音信号帧以及使用语音信号帧按照预给定的顺序来产生待输出的语音信号。如果一个待接收的语音信号帧没有被接收到，则在其位置上使用一个等效语音信号帧，其中，根据一个之前接收到的语音信号帧产生所述等效语音信号帧。根据本发明，在之前接收到的语音信号帧具有无声的语音信号的情形中，借助于噪声信号产生所述等效语音信号帧。
文档编号G10L19/00GK102171753SQ200980139149
公开日2011年8月31日申请日期2009年9月28日优先权日2008年10月2日
发明者F·默茨, P·瓦里申请人:罗伯特·博世有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：Ｐ·瓦里
技术所有人：罗伯特·博世有限公司
我是此专利的发明人