语音通信方法及装置的制造方法_2

文档序号：8261285阅读：来源：国知局

给对端用户终端。
[0044]可见，本发明中，终端预先训练出音色合成数据，当与其他终端通信时，只需将用户语音的基频信号发送给对端，对端根据该基频信号和该用户的音色合成数据，计算得到该用户的原始语音信号，从而提高了语音通信质量。
【附图说明】
[0045]图1为传统的语音通信示意图；
[0046] 图2为本发明实施例提供的语音通信的方法流程图；
[0047] 图3为本发明实施例提供的线型滤波器系数的训练方法流程图；
[0048]图4为本发明实施例提供的噪声序列的训练方法流程图；
[0049]图5为本发明实施例提供的语音通信方法流程图；
[0050] 图6为本发明实施例提供的语音通信装置的组成示意图。
【具体实施方式】
[0051] 下面结合附图及具体实施例对本发明再作进一步详细的说明。
[0052] 图2为本发明实施例提供的语音通信的方法流程图，如图2所示，其具体步骤如下：
[0053] 步骤201:对于任一用户，用户终端采集该用户发出的语音信号，对采集的语音信号进行采样，每个采样样本作为一个训练样本。
[0054] 本发明提到的用户终端可以为移动终端。
[0055] 步骤202:用户终端对该用户的训练样本进行训练，得到该用户的音色合成数据：目标线型滤波器系数和目标噪声序列。
[0056] 步骤203:用户终端将该用户的音色合成数据同步到其他终端上。
[0057] 步骤204:当该用户与其他用户通信时，该用户终端从该用户发出的语音信号中提取出基频信号，将该基频信号发送给对端用户终端。
[0058] 步骤205:对端用户终端根据该用户的音色合成数据，由该基频信号计算得到该用户的原始语音信号。
[0059] 图3为本发明实施例提供的线型滤波器系数的训练方法流程图，如图3所示，其具体步骤如下：
[0060] 步骤300 :预先设定本次训练的h(m)样本聚合置信区间及本次训练的h(m)数据精度。
[0061] 样本聚合置信区间和数据精度可根据实际需要、经验等确定。
[0062] 步骤301:对于任一用户，用户终端采集该用户在预设时长内发出的语音信号，对采集的语音信号进行采样，每个采样样本作为一个训练样本。
[0063] 这里，用户发出的语音内容为预先指定的，其中应包括大多数的浊音和清音，以使得训练结果尽量具有通用性。
[0064] 采样样本的长度可预先设定。
[0065] 步骤302:从每个训练样本中提取出基频信号。
[0066] 本步骤可采用现有技术实现。
[0067] 步骤303:对于每个训练样本，根据该样本的基频信号和训练样本，计算出该样本的线型滤波器系数h(m)。
[0068] 本步骤可采用现有技术实现。其中，m表示线型滤波器系数的阶数
[0069] 步骤304:当针对所有训练样本都已计算出h(m)时，分别计算每个样本的h(m)与目标h(m)的差值，得到每个训练样本的h(m)的误差，统计误差在步骤300设定的h(m)样本聚合置信区间内的样本数目。
[0070]目标h(m)可根据所有训练样本的h(m)得到，例如：目标h(m)为所有训练样本的 h(m)的均值等。
[0071] 步骤305 :计算误差在步骤300设定的h(m)样本聚合置信区间内的样本数目与样本总数的比值，若该比值不小于步骤300设定的h(m)数据精度，则确定本次训练成功，对目标h(m)进行量化处理，将量化后的目标h(m)作为本次训练结果；否则，确定本次训练失败。
[0072] 本步骤中，对目标h(m)进行量化处理时，量化误差范围为预先设定好的，且量化误差范围小于步骤300设定的h(m)样本聚合置信区间。
[0073] 在实际应用中，当训练失败时，在下次训练时，可以调整训练样本，或者调整训练的数据精度。
[0074] 在实际应用中，对于目标h(m)，也可以训练多次，得到多个训练结果，根据该多个训练结果得到最终的训练结果，例如：将数据精度最高的训练结果作为最终的训练结果，或者，对多个训练结果取均值，将该均值作为最终的训练结果。其中，在训练时，可以采用数据精度递增的训练方式，即当本次训练成功时，在下次训练时，增大训练样本的数目，同时增大数据精度，另外，可为不同的数据精度范围设定不同阶数的滤波器系数，其中，数据精度越高，滤波器系数的阶数越大，例如：数据精度在[el，e2)时，滤波器系数为7阶，数据精度在[e2,e3]时，滤波器系数为11阶，其中，el〈e2〈e3。
[0075] 图4为本发明实施例提供的噪声序列的训练方法流程图，如图4所示，其具体步骤如下：
[0076] 步骤400:预先设定本次训练的噪声序列样本聚合置信区间及本次训练的噪声序列数据精度。
[0077] 样本聚合置信区间和数据精度可根据实际需要、经验等确定。
[0078]步骤401 :当通过步骤301?305训练成功，得到了训练结果：目标h(m)时，对每个训练样本，采用该目标h(m)对提取出基频信号的每个训练样本进行滤波，滤波结果即为该训练样本的噪声序列。
[0079] 步骤402 :当得到所有训练样本的噪声序列后，计算每个样本的噪声序列与目标噪声序列的差值，得到每个训练样本的噪声序列的误差，统计误差在步骤400设定的噪声序列样本聚合置信区间内的样本数目。
[0080]目标噪声序列可根据所有训练样本的噪声序列得到，例如：目标噪声序列为所有训练样本的噪声序列的均值等。
[0081] 步骤403 :计算误差在步骤400设定的噪声序列样本聚合置信区间内的样本数目与样本总数的比值，若该比值不小于步骤400设定的噪声序列数据精度，则确定本次训练成功，对目标噪声序列进行量化处理，将量化后的目标噪声序列作为本次训练结果；否则，确定本次训练失败。
[0082]本步骤中，对目标噪声序列进行量化处理时，量化误差范围为预先设定好的，且量化误差范围小于步骤400设定的噪声序列样本聚合置信区间。
[0083]在实际应用中，对于噪声序列，也可以训练多次，得到多个训练结果，根据该多个训练结果得到最终的训练结果。例如：将数据精度最高的训练结果作为最终的训练结果，或者，对多个训练结果取均值，将该均值作为最终的训练结果。其中，在训练时，可以采用数据精度递增的训练方式，即当本次训练成功时，在下次训练时，增大训练样本的数目，同时增大数据精度。
[0084]步骤404:当整个训练过程完成时，用户终端在空闲时将训练得到的目标h(m)和目标噪声序列作为本用户的音色合成数据同步到该本用户的好友终端上。
[0085]另外，对于图3、4所示训练过程，在实际应用中，若已经训练了某些字句，当用户正常通话时，若用户终端识别出了这些字句，可以询问用户是否正确，若正确，则可将这些字句加入到训练样本库中，以便后续训练时使用。
[0086]图5为本发明实施例提供的语音通信方法流程图，如图5所示，其具体步骤如下：[0087]步骤501:当用户a与用户b通话时，用户a的用户终端A采集用户a发出的语音信号。
[0088] 步骤502:用户终端A判断自身是否已经训练得到用户a的音色合成数据，若是，执行步骤504 ;否则，执行步骤503。
[0089] 本步骤中，用户终端A判定自身已经训练得到用户a的音色合成数据后，还可以先判断用户a的音色合成数据是否已经同步到用户b的用户终端B，若是，直接执行步骤504 ; 否则，先将用户a的音色合成数据同步到用户终端B，再执行步骤504。
[0090] 步骤503:用户终端A采用现有方法对语音信号进行编码后发送给用户b的用户终端B，本流程结束。
[0091]步骤504:用户终端A从用户a的语音信号中提取基频信号，并计算语音信号的基音周期和每帧语音信号的能量，将基频信号及计算得到的基音周期和每帧语音信号的能量发送给用户终端B。
[0092] 基音周期可采用现有技术计算得到。
[0093]步骤505:用户终端B接收该基频信号及基音周期和和每帧语音信号的能量，在自身查找到用户a对应的音色合成数据，根据该音色合成数据中的目标h(m)对该基频信号进行逆向滤波，对逆向滤波信号和该音色合成数据中的目

完整全部详细技术资料下载

当前第2页1 2 3