语音通信方法及装置的制造方法

文档序号：8261285阅读：242来源：国知局

语音通信方法及装置的制造方法
【技术领域】
[0001] 本发明涉及语音技术领域，尤其涉及语音通信方法及装置。
【背景技术】
[0002] 目前，经过多年发展，语音通信已经成为人们生活中必不可少的部分。基于语音通信，有蜂窝网电话、有线电话、IP电话等多种形式。这些传统的通信方法中，其技术特点大致相同。
[0003] 图1为传统的语音通信示意图，如图1所示，在传统语音通信方法中，通话者将语音信号经过编码器转化为编码信号，这些编码信号通过各类网络传输至通话的目的地，并通过解码器解码送给另外的通话者。
[0004] 在传统的语音通信方法中采用了不同的编码方法，例如基于人类听觉掩蔽效应的变换域编码方法(如MP3,AAC等)，基于人类发生模型的码激励线性预测编码方法(如AMR 系列、G. 729)等，以及较为原始的利用声音统计概率编码方法(如有线电话中使用的G. 711 等)。
[0005] 这些方法的核心思想就是将声音信号进行处理，提取一定的有规律的参数之后，将残余的信号以及提取的参数打包传送给接收端。然后接收端再根据传输过来的参数和残余信号，进行逆过程解码，还原信号数据。
[0006] 在当前技术方案中，语音信号是以数据信号的形式传输，数据信号本身为二进制信号，不代表任何意义，并且数据量很大，导致出现几个问题：
[0007] -、在较低码率情况或者通信环境较差的情况下，信号容易被干扰，一旦被干扰，信号无法正常的还原，造成通信失败。
[0008] 二、语音信号编码为二进制的数据信号，数据信号本身不代表任何意义，而其中混杂的噪声、干扰以及失真，为语音识别造成了较大的难度，使信号不能被有效使用。尤其在需要自动生成字幕或是同声传译的通信需求下。

【发明内容】

[0009] 本发明提供语音通信方法及装置，以提高终端的语音通信质量。
[0010] 本发明的技术方案是这样实现的：
[0011] 一种语音通信方法，该方法包括：
[0012] 对于任一用户，用户终端采集该用户发出的语音信号，对采集的语音信号进行采样，每个采样样本作为一个训练样本；用户终端对该用户的训练样本进行训练，得到该用户的音色合成数据：目标线型滤波器系数和目标噪声序列；
[0013] 用户终端将该用户的音色合成数据同步到其他终端上；
[0014] 当所述用户与其他用户通信时，所述用户终端从该用户发出的语音信号中提取出基频信号，将该基频信号发送给对端用户终端，以便：对端用户终端根据该用户的音色合成数据，由该基频信号计算得到该用户的原始语音信号。
[0015] 所述对该用户的训练样本进行训练，得到该用户的音色合成数据：目标线型滤波器系数包括：
[0016] 从每个训练样本中提取出基频信号；根据该样本的基频信号和训练样本，计算出该样本的线型滤波器系数h;
[0017] 当针对所有训练样本都已计算出h时，分别计算每个样本的h与目标h的差值，得到每个训练样本的h的误差，统计误差在预先设定的h样本聚合置信区间内的样本数目，计算该数目与样本总数的比值，若该比值不小于预先设定的h数据精度，则确定本次训练成功，对目标h进行量化处理，得到最终的目标h。
[0018] 所述对该用户的训练样本进行训练，得到该用户的音色合成数据：目标噪声序列包括：
[0019] 对每个训练样本，采用训练得到的目标h对提取出基频信号的每个训练样本进行滤波，滤波结果即为该训练样本的噪声序列；
[0020] 当得到所有训练样本的噪声序列后，计算每个样本的噪声序列与目标噪声序列的差值，得到每个训练样本的噪声序列的误差，统计误差在预先设定的噪声序列样本聚合置信区间内的样本数目，计算该数目与样本总数的比值，若该比值不小于预先设定的噪声序列数据精度，则确定本次训练成功，对目标噪声序列进行量化处理，得到最终的目标噪声序列。
[0021] 所述用户终端从该用户发出的语音信号中提取出基频信号，将该基频信号发送给对端用户终端进一步包括：
[0022] 所述用户终端计算语音信号的基音周期和每帧语音信号的能量，将该基音周期和每帧语音信号的能量发送给对端用户终端，
[0023] 且，对端用户终端根据该用户的音色合成数据，由该基频信号计算得到该用户的原始语音信号包括：
[0024] 对端用户终端根据音色合成数据中的目标h，对该基频信号进行逆向滤波，将得到的逆向滤波信号与音色合成数据中的目标噪声序列进行叠加，然后根据接收到的基音周期和每帧语音信号的能量，对叠加得到的信号进行调整后得到所述用户的原始语音信号。
[0025] 所述用户终端将该用户的音色合成数据同步到其他终端上为：
[0026] 当所述用户终端空闲时，用户终端将该用户的音色合成数据同步到其他终端上。
[0027] 所述当所述用户与其他用户通信时，用户终端从该用户发出的语音信号中提取出基频信号，将该基频信号发送给对端用户终端包括：
[0028] 用户终端判断所述用户的音色合成数据的精度是否不小于预设精度，若是，执行所述从该用户发出的语音信号中提取出基频信号，将该基频信号发送给对端用户终端的动作；否则，对该用户发出的语音信号进行编码后发送给对端用户终端。
[0029] 一种语音通信装置，该装置包括：
[0030]训练模块：采集用户发出的语音信号，对采集的语音信号进行采样，每个采样样本作为一个训练样本，对该用户的训练样本进行训练，得到该用户的音色合成数据：目标线型滤波器系数和目标噪声序列；
[0031] 训练结果同步模块：将该用户的音色合成数据同步到其他终端上；
[0032] 语音通信模块：当所述用户与其他用户通信时，从该用户发出的语音信号中提取出基频信号，将该基频信号发送给对端用户终端，以便：对端用户终端根据该用户的音色合成数据，由该基频信号计算得到该用户的原始语音信号。
[0033]所述训练模块对该用户的训练样本进行训练，得到该用户的音色合成数据：目标线型滤波器系数包括：
[0034]从每个训练样本中提取出基频信号；根据该样本的基频信号和训练样本，计算出该样本的线型滤波器系数h;
[0035]当针对所有训练样本都已计算出h时，分别计算每个样本的h与目标h的差值，得到每个训练样本的h的误差，统计误差在预先设定的h样本聚合置信区间内的样本数目，计算该数目与样本总数的比值，若该比值不小于预先设定的h数据精度，则确定本次训练成功，对目标h进行量化处理，得到最终的目标h。
[0036]所述训练模块对该用户的训练样本进行训练，得到该用户的音色合成数据：目标噪声序列包括：
[0037] 对每个训练样本，采用训练得到的目标h对提取出基频信号的每个训练样本进行滤波，滤波结果即为该训练样本的噪声序列；
[0038] 当得到所有训练样本的噪声序列后，计算每个样本的噪声序列与目标噪声序列的差值，得到每个训练样本的噪声序列的误差，统计误差在预先设定的噪声序列样本聚合置信区间内的样本数目，计算该数目与样本总数的比值，若该比值不小于预先设定的噪声序列数据精度，则确定本次训练成功，对目标噪声序列进行量化处理，得到最终的目标噪声序列。
[0039] 所述语音通信模块进一步用于，当从该用户发出的语音信号中提取出基频信号时，计算语音信号的基音周期和每帧语音信号的能量，将该基音周期和每帧语音信号的能量发送给对端用户终端。
[0040] 所述训练结果同步模块进一步用于，接收其他终端发来的其他终端用户的音色合成数据，
[0041]且，所述语音通信模块进一步用于，当接收到其他终端发来的基频信号时，在训练结果同步模块查找到对应的音色合成数据，根据该音色合成数据，由该基频信号计算得到该其他终端用户的原始语音信号。
[0042] 所述训练模块进一步用于，当得到该用户的音色合成数据：目标线型滤波器系数和目标噪声序列时，计算用户的音色合成数据的精度；
[0043]所述语音通信模块进一步用于，当所述用户与其他用户通信时，判断训练模块计算得到的所述用户的音色合成数据的精度是否不小于预设精度，若是，执行所述从该用户发出的语音信号中提取出基频信号，将该基频信号发送给对端用户终端的动作；否则，对该用户发出的语音信号进行编码后发送

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：詹建飞;刘霖;
技术所有人：中国移动通信集团公司;
我是此专利的发明人

上一篇：一种音频信号变调的处理方法及其装置的制造方法
上一篇：一种基于音标的语音编码方法