向量信息插入、向量信息发送以及语音数据估计方法

文档序号：2837257阅读：235来源：国知局

专利名称：向量信息插入、向量信息发送以及语音数据估计方法
技术领域：
本发明涉及一种插入用于估计音调再同步时间段中的语音数据的向量信息的方法、一种发送向量信息的方法以及一种使用向量信息估计音调再同步时间段中的语音数据的方法，当在单向无线通信环境中传输加密的数字语音
时，所述方法可以估计与在音调(key)再同步过程中出现的静默时间段相对应的语音数据。更具体地，本发明涉及一种向音调再同步帧中插入向量信息的方法，一种发送向量信息的方法，以及一种使用向量信息估计音调再同步过程中出现的静默时间段中的语音数据的方法，所述向量信息是通过从语音特征中提取语音变化方向信息而构造的，该语音特征构成了非突变的正弦波。
背景技术：
在常规的通信方法中，是这样处理音调再同步时间段的音调数据被当作语音数据处理或者在音调再同步处理中再次使用在前的语音数据。但是，该方法引起了原始语音和输出语音之间的较大差异，观众因而可以清晰地发现音调再同步时间段中的语音质量损失。
特别地，由于在单向无线环境中仅在一个方向传输数据，所以无法确认数据是否已被正常地接收到。因此，当加密数据在上述环境中传输时，如果接收端不能收到初始的音调信息，则在相应的会话中的全部数据都无法被解码。
为了解决迟参与(late participation )问题，为在单向无线环境中的加密通信使用用于周期性地传输音调信息的音调再同步方法。如果在通过加密通信来发送和接收的数据是数字化语音的状态下使用音调再同步方法，则静默时间段将随着再同步时间段出现。由于该静默时间段周期性出现，所以它降低了接收端的通信质量。
本发明涉及一种在单向无线加密通信中，估计再同步时间段的静默时间段中语音数据值的技术，并且还涉及校正损耗帧的技术。
可以使用诸如HAM、拼接(splicing)、静默代替、噪声代替和重复等方法
作为处理在单向无线通信的语音数据传输中的帧损失的方法。
这些技术是估计在单向无线通信中丢失语音帧的值。拼接是将两个邻近
的帧叠加的方法，其缺点在于由于损耗而造成没有间隙出现，而流的定时却
是间断的。静默代替是向丢失的时间段添加静默的方法。但是随着丢失分组
尺寸的增加，其性能会降低。
噪声代替是一种使用周围信号恢复被忽略的语音信号的方法，其中将噪
声添加到语音信号被忽略的部分中。该方法使用人类音位(phoneme)恢复的能力，每个人的该种能力差异很大。重复是一种反复在语音丢失时间段中插入最接近时刻接收到的语音信号的方法。该方法具有以下缺点如果帧被延长，则声音也被延长。
此外，还有一种使用语音压缩多媒体数字信号编解码器(codec)的状态信息来恢复语音丢失时间段中的静默的技术。由于该方法使用状态信息，而该状态信息对于每个多媒体数字信号编解码器来说有可能是不同的，因此该方法完全依赖于多媒体数字信号编解码器，并且极大地增加了计算量。

发明内容
因此，本发明涉及一种插入用于估计音调再同步时间段中的语音数据的向量信息的方法、一种发送向量信息的方法以及一种使用向量信息估计音调再同步时间段中的语音数据的方法，所述方法充分地避免了由于相关技术的限制和缺陷所引发的一个或多个问题。
本发明的一个目的是提供一种使用正弦波语音特征构造向量信息并且在音调再同步时间段中插入该向量信息的方法，以及一种发送该向量信息的方法，以便估计在单向无线通信环境下的音调再同步时间段中的语音数据。
本发明的另一个目的是提供一种在单向无线通信环境中使用向量信息估计与周期性出现的音调再同步时间段中的静默时间段对应的语音数据值的方法，所述向量信息是语音变化方向信息。
本发明的其它优点、目的和特征将在后续的说明中部分地被阐明，并且在那些具有本领域普通知识的技术人员验证后续说明内容或实践本发明时部分地变得显而易见。借助在此处公开的说明书、权利要求以及附图中所具体描述的结构可以实现并达到本发明的目的和其它优点。
为了实现上述目的，提供了一种根据本发明具体实施方式
的、在使用单
向无线环境的加密数字语音通信的发射机端中插入用于估计音调再同步时间
段中的语音数据的向量信息的方法，该方法包括以下步骤如果相对于要发送的帧音调再同步时间到达，则删除音调再同步时间段中的语音数据；获取当前帧的语音数据和在前帧的语音数据之间的差异并且用(+，-)信息构造向量信息，所述(+,-)信息是所获得的差异的结果；以及在已从其删除语音数据的音调再同步时间段中插入向量信息。
根据本发明的另一个方面，提供了一种在使用单向无线环境的加密数字语音通信的发射机端发送用于估计音调再同步时间段中的语音数据的向量信息的方法，该方法包括以下步骤通过对输入的语音进行语音合成(vocoding) 来对语音数据编码；判断相对于所编码的语音数据音调再同步时间是否到达；根据判断的结果，通过在语音数据中插入由语音变化方向信息构成的向量信息而产生音调再同步帧并且从语音数据产生语音帧；以及发送所产生的音调再同步帧和语音帧。
根据本发明的又一个方面，提供了一种在使用单向无线环境的加密数字语音通信的接收机端使用向量信息估计音调再同步时间段中的语音数据的方法，该方法包括以下步骤通过分析所述帧的头部来分析所接收到的帧的类型；如果所接收到的帧是音调再同步帧，则从所发送的音调再同步帧中提取音调再同步信息和向量信息；使用所提取的音调再同步信息执行音调再同步、获得并比较所述向量信息和所接收到的帧的语音数据的坡度；如果由向量信息分析得到的语音变化方向信息和所述坡度位于相同的方向，则在斜线上提取语音数据值，否则在与所述斜线对称的斜线上提取语音数据值；以及使用提取的语音数据值估计音调再同步时间段中的语音数据，以及对语音数据解码以便输出相应的语音。
应当理解前面对本发明的概括性描述和后续的详细描述都是示范性和说明性的，并且意在为所要求权利的发明提供进一步的解释。

后附的附图示出了本发明的具体实施方式
，并且与说明书一起用于解释本发明的原理，所述附图被包含于此以提供对本发明的进一步理解并且被引入并构成本申请的一部分。在附图中
图l是示出根据本发明一个具体实施方式
的、用于使用向量信息估计音调再同步时间段中的语音数据的装置的整体结构的示意图2是示意性地示出根据本发明一个具体实施方式
的、在发射机端插入
向量信息以便可以估计音调再同步时间段中的语音数据的过程的流程图；图3是示意性地示出根据本发明一个具体实施方式
的、在接收机端通过
提取向量信息而估计音调再同步时间段的语音数据的过程的流程图4A和图4B是示意性地示出根据本发明一个具体实施方式
的、在用于
估计音调再同步时间段中的语音数据的装置中使用向量信息估计音调再同步
时间段的静默时间段中的语音数据值的过程，其中图4A示出发射机端构造
和插入向量信息；而图4B示出接收机端提取向量信息，并且估计音调再同步
时间段的静默时间段中的语音数据值。
具体实施例方式
现在参照附图详细描述根据本发明的优选实施方式的插入用于估计音调再同步时间段中的语音数据的向量信息的方法、发送向量信息的方法以及使用向量信息估计音调再同步时间段中的语音数据的方法。
图1是示出根据本发明一具体实施方式
的用于使用向量信息估计音调再同步时间段中的语音数据的装置的整体构造的示意图。
参照图1,根据本发明一具体实施方式
的、用于估计音调再同步时间段中的语音数据的装置主要由发射机端IO和接收机端100组成。
所述发射机端10包括用于接收来自麦克风的语音输入的输入单元11、用于通过对输入语音进行语音合成来对输入语音编码的语音合成机12、用于通过判断相对于已编码的语音数据的音调再同步时间段而构造音调再同步帧和语音帧的帧构造单元13、以及用于发送所构造的帧的帧发送单元14。
帧构造单元13获得当前语音数据和紧接在前的语音数据之间的差异，并且连续地累积和存储语音变化方向(+ ,-)信息，所述语音变化方向(+ ， -)信息是获取所述差异的结果。
此外，当产生用于发送音调再同步信息的音调再同步帧时，帧构造单元 13删除在音调再同步时间段中的语音数据，使用累积的语音变化方向(+, -)信息构造向量信息，并且随后^1夸该向量信息与音调再同步信息一同插入音调再同步时间段中。随后，所述帧构造单元13向接收机端100发送所产生的音调再同步帧。而且，当发送所述语音帧时，所述帧构造单元将所述向量信息插入语音帧中。
这就是说，所述帧构造单元13累积并存储语音数据的语音变化方向(+ ， -)信息，并且当发送语音的时候，它判断相对于要发送的语音数据，音调再同步时间是否到达。如果音调再同步时间到达，则所述帧构造单元13使用所存储的语音变化方向(+,-)信息构造向量信息，并且通过将向量信息插入音调再同步时间段中产生音调再同步帧。
但是，如果音调再同步时间没有到达，则所述帧构造单元13为要发送的
语音数据构造语音帧，并且将向量信息插入语音帧中。
此处，所述向量信息可以仅被构造为在(+)和(-)方向之间进行区分。例如，可以将(+ )和(-)分别映射为"r和"o"。相应地，可以使用
各种在(+)和(-)之间区分的方法来构造向量信息。
另一方面，接收机端100包括接收单元，用于接收从发射机端10发送的帧；帧分析单元102,用于通过判断存在/不存在所接收到的帧的音调再同步信息来分析帧类型，并且如果所接收到的帧是音调再同步帧，则估计与音调再同步时间段的静默时间段对应的语音数据值；解码器103，用于解码语音数据以产生语音信号；以及输出单元104，用于输出语音信号。
所述帧分析单元102通过分析所接收到的帧的头部，判断存在/不存在音调再同步信息。如果在所述头部中存在音调再同步信息，则所述帧分析单元判定存在音调再同步帧，并且从该帧中提取所述向量信息。
随后，所述帧分析单元102从最近接收到的在前帧中获得语音数据的坡度，并且使用所获得的语音数据的坡度以及所提取的语音数据的向量信息计算音调再同步时间段中的语音数据值。
这就是说，如果所提取的语音数据的向量信息对应于(+ ),则所述帧分析单元从所获得的语音数据的坡度中获取音调再同步时间段中的语音数据值，而如果向量信息对应于(-)，则它获取与所获得的语音数据的坡度对称的坡度，并且在斜线上获取音调再同步时间段中的语音数据值。
图2是示意性地示出根据本发明一具体实施方式
的、在发射机端10中插入向量信息以便可以估计音调再同步时间段中的语音数据的过程的流程图。
通过一声音合成过程将经由所述输入单元ll(如麦克风)输入的声音200 编码为语音数据(步骤210)。
判断相对于要发送的语音数据帧，音调再同步时间是否到达(步骤220 ),
并且如果音调再同步时间到达(步骤220的"Y")，则删除当前帧的相应语音数据(步骤230)。随后，根据在前帧的语音数据与当前帧的语音数据之间的差异获得语音变化方向(+ ，-)信息(步骤231 )。
由于正弦波语音的波形特性，如果语音数据值处于增加方向，则语音变化方向(+,-)信息连续增加，而如果语音数据值处于减小方向，则语音变化方向(+ ,-)信息连续减小。如果当前语音数据与紧接的在前语音数据之间的差异是(+ )，则语音数据处于增加方向，而如果差异是(-),则语音数据处于减小方向。
通过语音数据的所提取出的语音变化方向(+ ,-)信息来构造向量信息(步骤232),通过将所述向量信息以及音调再同步信息插入删除了语音数据的时间段中来构造音调再同步帧(步骤233 )，以及发送所构造的音调再同步帧(步骤234)。
如果音调再同步时间没有到达(步骤220的"N")，则使用语音数据构造所述语音帧(步骤240),并且通过分析在前帧和当前帧的语音数据来构造向量信息(步骤241)。在发射机端的内部存储器(未示出)中存储语音帧和向量信息(步骤242)，并且随后发送所构造的语音帧(步骤243 )。
图3是示意性地示出根据本发明一具体实施方式
的、在接收机端100中通过提取向量信息来估计音调再同步时间段中的语音数据的过程的流程图。
接收机端IOO接收所发送的帧(步骤300),并且通过分析所接收到的帧的头部(步骤310)来分析所接收的帧的类型(步骤320)。
如果分析的结果是所接收到的帧是音调再同步帧(步骤320的"Y")，则接收机端从所接收到的帧中提取音调再同步信息和由语音变化方向(+, - ) 信息构成的向量信息(步骤330)。
所述接收机端使用所提取的音调再同步信息执行音调再同步(步骤 331 )，并且通过比较从所接收帧的语音数据获得的坡度信息和向量信息来判断i皮度和向量信息的语音变化方向是否相同(步骤332 )。
如果从存储在所述接收机端的内部存储器中(未示出)的、所接收到的帧的语音数据获得的坡度与向量信息的语音变化方向是相同的方向(步骤332 中的"Y"),则在由存储在所述接收机端的内部存储器中的、所接收到的帧的语音数据获得的斜线上提取静默时间段中的语音数据值(步骤333 )。
如果判断的结果是它们的方向不同(步骤332中的"N"),则获取与从所
接收到的帧的语音数据获得的坡度相对称的坡度，并且在对称的斜线上提取
静默时间段中的语音数据值(步骤334)。所提取的语音数据值被估计为音调再同步时间段的静默时间段中的语音数据，并且通过解码过程(步骤335 ) 作为语音输出(步骤336)。
另一方面，如果判断的结果是所接收到的帧不是音调再同步帧(步骤320 中的"N"),则通过解码过程的所接收到的语音数据被提供作为语音信号(步骤340)。随后，使用在前帧和当前帧计算并存储当前语音数据的坡度(步骤 341),并且当前帧被存储在接收机端的内部存储器中(步骤342)以便之后使用该当前帧。随后，所接收到的语音信号被作为实际的语音输出(步骤343 )。
因此，接收机端100可以使用变化率(即接收到的语音帧的语音数据值的坡度)与语音数据的提取出的向量信息的语音变化方向信息来估计单向无线通信环境下的音调再同步中出现的静默时间段中的接近原始语音的语音数据值。
图4A和图4B是示意性地示出根据本发明一具体实施方式
的、在用于估计音调再同步时间段中的语音数据的装置中使用向量信息估计音调再同步时间段的静默时间段中的语音数据值的过程的示意图。更具体地，图4A示出了发射机端构造和插入向量信息，而图4B示出了接收机端提取向量信息和估计音调再同步时间段的静默时间段中的语音数据值。
参照图4A和4B,假设第5和第8时间段对应于音调再同步时间。如果在发射机端10中的正弦波语音编码过程中音调再同步时间到达，则删除对应于音调再同步时间的第5和第8时间段中的语音数据，并用音调再同步信息代替上述语音数据。
这就是说，第5时间段的语音数据被语音变化方向(+ )信息代替，其中所述语音变化方向(+ )信息是使用在第4时间段的语音数据与第5时间段的语音数据之间的差异以及音调再同步信息X获得的。第8时间段的语音数据被语音变化方向(+ )信息代替，其中所述语音变化方向(+ )信息是使用在第7时间段的语音数据与第8时间段的语音数据之间的差异以及音调再同步信息Y获得的。将如上所重新构建的数据发送给接收机端100。
如果对应于第5时间段的音调再同步数据到达，则由于使用第3和第4 时间段的语音数据获得的坡度值(+ )等于在接收到的帧中的语音方向(+ ) 信息，所以接收机端100将音调再同步数据估计为位于直线A上的语音数据值。
如果对应于第8时间段的音调再同步数据到达，则由于使用第6和第7
时间段的语音数据获得的坡度值(+)不同于在接收到的帧中的语音方向(+)
信息，所以接收机端100将音调再同步数据估计为位于直线c上的语音数据值，其中直线C与直线B对称。
特别地，在第8时间段的情况下，由于从第6和第7时间段的语音数据计算得到的坡度值(+ )与第8时间段的语音方向(+ )信息不同，所以计算与直线B对称的直线C,并且随后估计出位于直线C上的语音数据值。
如上所述，根据本发明，在单方向性无线环境中通过使用显示出平緩变化的语音数据值的特征近似地估计由于周期性的音调再同步而出现的静默时间段中的语音数据值，并且因此可以改善接收机端的通信质量。此外，由于根据本发明的方法几乎不需要附加信息来校正语音并且与传统方法相比本方法只需要相对较少量的计算，因此不会给系统增加额外的负担。
虽然在此相对于本发明的优选实施方式描述和说明了根据本发明的用于实时传输计算机线程信息(cyber thread information)的系统和方法，但是本领域的技术人员应当理解在不背离由权利要求所限定的本发明的主旨和范围的前提下，可以对本发明进行多种变化和更改。
权利要求
1.一种在使用单向无线环境的加密数字语音通信的发射机端插入用于估计音调再同步时间段中的语音数据的向量信息的方法，该方法包括如果相对于要发送的帧，音调再同步时间到达，则删除音调再同步时间段中的语音数据；获取当前帧的语音数据和在前帧的语音数据之间的差异，并且使用(+，-)信息构造向量信息，其中所述(+，-)信息是所获得的差异的结果；以及在已从其删除语音数据的音调再同步时间段中插入所述向量信息。
2. 根据权利要求1所述的方法，其中，通过使用构成正弦波的语音特征，按照下述方式，所述(+ ，-)信息被用作语音变化方向信息(+ )信息对应于处于增加方向的语音数据，而(-)信息对应于处于减小方向的语音数据。
3. —种在使用单向无线环境的加密数字语音通信的发射机端发送用于估计音调再同步时间段中的语音数据的向量信息的方法，该方法包括通过对输入的语音进行声音合成来编码语音数据；判断相对于已编码的语音数据，音调再同步时间是否到达；根据判断的结果，通过在所述语音数据中插入由语音变化方向信息构成的向量信息来产生音调再同步帧，并且^Mv所述语音数据产生语音帧；以及发送所产生的音调再同步帧和所述语音帧。
4. 根据权利要求3所述的方法，其中，如果判断的结果是音调再同步时间到达，则通过从音调再同步时间段中删除所述语音数据并且在所述音调再同步时间段中插入由语音变化方向信息构成的所述向量信息及所述音调再同步信息来产生音调再同步帧。
5. 根据权利要求3所述的方法，其中，如果判断的结果是音调再同步时间未到达，则产生包含所述语音数据的所述语音帧。
6. 根据权利要求3所述的方法，其中，通过当前帧的语音数据和在前帧的语音数据之间的差异获得所述向量信息，并且通过使用构成正弦波的语音特征，按照下述方式构造所述向量信息(+ )信息对应于处于增加方向的语音数据，而(-)信息对应于处于减小方向的语音数据。
7. —种在使用单向无线环境的加密数字语音通信的接收机端使用向量信息估计音调再同步时间段中的语音数据的方法，该方法包括通过分析所述帧的头部来分析所接收到的帧的类型；如果所述所接收到的帧是音调再同步帧，则从已发送的音调再同步帧中提取音调再同步信息和所述向量信息；使用所述提取的音调再同步信息执行音调再同步，获取并比较所述向量信息和所接收到的帧的语音数据的i皮度；如果从所述向量信息分析得到的语音变化方向信息和所述坡度是处于同样的方向，则在斜线上提取语音数据值，否则在与所述斜线对称的直线上提取所述语音数据值；以及使用所提取的语音数据值估计所述音调再同步时间段中的语音数据，并且解码所述语音数据以输出对应的语音。
8. 根据权利要求7所述的方法，其中，如果判断的结果是所接收到的帧不是音调再同步帧，则解码所述所接收到的语音数据，并且使用在前帧和当前帧计算并存储当前语音数据的坡度。
9. 根据权利要求7所述的方法，其中，所述向量信息是(+,-)语音变化方向信息，该语音变化方向信息是通过当前帧的语音数据和在前帧的语音数据之间的差异获得的，并且通过使用构成正弦波的语音特征，按以下方式构造所述语音变化方向信息(+ )信息对应于处于增加方向的语音数据，而(-)信息对应于处于减小方向的语音数据。
全文摘要
公开了一种插入用于估计音调再同步时间段中的语音数据的向量信息的方法、一种发送向量信息的方法以及一种使用向量信息估计音调再同步时间段中的语音数据的方法，当在单向无线通信环境中传输加密的数字语音时，所述方法可以估计与在音调再同步过程中出现的静默时间段相对应的语音数据。当为再同步构造音调再同步帧时，发射机端使用构成正弦波的语音特征在音调再同步帧中插入所发送的在前帧的语音变化方向的累积信息(即向量信息)，并且发送带有插入其中的向量信息的音调再同步帧。接收机端使用在语音变化方向中的累积信息(即向量信息)以及所接收到的语音数据的坡度估计音调再同步时间段中的语音数据值，从而最小化原始语音和估计语音之间的差异。
文档编号G10L21/02GK101183528SQ20071010393
公开日2008年5月21日申请日期2007年5月15日优先权日2006年11月13日
发明者南宅俊, 安秉浩, 李相二, 郑镛益, 金起弘申请人:韩国电子通信研究院

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：南宅俊;安秉浩;金起弘;郑镛益;李相二
技术所有人：韩国电子通信研究院
我是此专利的发明人

上一篇：一种控制图像采集装置进行目标定位的系统及方法
上一篇：许可信息变换装置的制作方法