语音通信方法及装置的制造方法

文档序号:8261285阅读:242来源:国知局
语音通信方法及装置的制造方法
【技术领域】
[0001] 本发明涉及语音技术领域,尤其涉及语音通信方法及装置。
【背景技术】
[0002] 目前,经过多年发展,语音通信已经成为人们生活中必不可少的部分。基于语音通 信,有蜂窝网电话、有线电话、IP电话等多种形式。这些传统的通信方法中,其技术特点大 致相同。
[0003] 图1为传统的语音通信示意图,如图1所示,在传统语音通信方法中,通话者将语 音信号经过编码器转化为编码信号,这些编码信号通过各类网络传输至通话的目的地,并 通过解码器解码送给另外的通话者。
[0004] 在传统的语音通信方法中采用了不同的编码方法,例如基于人类听觉掩蔽效应的 变换域编码方法(如MP3,AAC等),基于人类发生模型的码激励线性预测编码方法(如AMR 系列、G. 729)等,以及较为原始的利用声音统计概率编码方法(如有线电话中使用的G. 711 等)。
[0005] 这些方法的核心思想就是将声音信号进行处理,提取一定的有规律的参数之后, 将残余的信号以及提取的参数打包传送给接收端。然后接收端再根据传输过来的参数和残 余信号,进行逆过程解码,还原信号数据。
[0006] 在当前技术方案中,语音信号是以数据信号的形式传输,数据信号本身为二进制 信号,不代表任何意义,并且数据量很大,导致出现几个问题:
[0007] -、在较低码率情况或者通信环境较差的情况下,信号容易被干扰,一旦被干扰, 信号无法正常的还原,造成通信失败。
[0008] 二、语音信号编码为二进制的数据信号,数据信号本身不代表任何意义,而其中混 杂的噪声、干扰以及失真,为语音识别造成了较大的难度,使信号不能被有效使用。尤其在 需要自动生成字幕或是同声传译的通信需求下。

【发明内容】

[0009] 本发明提供语音通信方法及装置,以提高终端的语音通信质量。
[0010] 本发明的技术方案是这样实现的:
[0011] 一种语音通信方法,该方法包括:
[0012] 对于任一用户,用户终端采集该用户发出的语音信号,对采集的语音信号进行采 样,每个采样样本作为一个训练样本;用户终端对该用户的训练样本进行训练,得到该用户 的音色合成数据:目标线型滤波器系数和目标噪声序列;
[0013] 用户终端将该用户的音色合成数据同步到其他终端上;
[0014] 当所述用户与其他用户通信时,所述用户终端从该用户发出的语音信号中提取出 基频信号,将该基频信号发送给对端用户终端,以便:对端用户终端根据该用户的音色合成 数据,由该基频信号计算得到该用户的原始语音信号。
[0015] 所述对该用户的训练样本进行训练,得到该用户的音色合成数据:目标线型滤波 器系数包括:
[0016] 从每个训练样本中提取出基频信号;根据该样本的基频信号和训练样本,计算出 该样本的线型滤波器系数h;
[0017] 当针对所有训练样本都已计算出h时,分别计算每个样本的h与目标h的差值,得 到每个训练样本的h的误差,统计误差在预先设定的h样本聚合置信区间内的样本数目,计 算该数目与样本总数的比值,若该比值不小于预先设定的h数据精度,则确定本次训练成 功,对目标h进行量化处理,得到最终的目标h。
[0018] 所述对该用户的训练样本进行训练,得到该用户的音色合成数据:目标噪声序列 包括:
[0019] 对每个训练样本,采用训练得到的目标h对提取出基频信号的每个训练样本进行 滤波,滤波结果即为该训练样本的噪声序列;
[0020] 当得到所有训练样本的噪声序列后,计算每个样本的噪声序列与目标噪声序列的 差值,得到每个训练样本的噪声序列的误差,统计误差在预先设定的噪声序列样本聚合置 信区间内的样本数目,计算该数目与样本总数的比值,若该比值不小于预先设定的噪声序 列数据精度,则确定本次训练成功,对目标噪声序列进行量化处理,得到最终的目标噪声序 列。
[0021] 所述用户终端从该用户发出的语音信号中提取出基频信号,将该基频信号发送给 对端用户终端进一步包括:
[0022] 所述用户终端计算语音信号的基音周期和每帧语音信号的能量,将该基音周期和 每帧语音信号的能量发送给对端用户终端,
[0023] 且,对端用户终端根据该用户的音色合成数据,由该基频信号计算得到该用户的 原始语音信号包括:
[0024] 对端用户终端根据音色合成数据中的目标h,对该基频信号进行逆向滤波,将得到 的逆向滤波信号与音色合成数据中的目标噪声序列进行叠加,然后根据接收到的基音周期 和每帧语音信号的能量,对叠加得到的信号进行调整后得到所述用户的原始语音信号。
[0025] 所述用户终端将该用户的音色合成数据同步到其他终端上为:
[0026] 当所述用户终端空闲时,用户终端将该用户的音色合成数据同步到其他终端上。
[0027] 所述当所述用户与其他用户通信时,用户终端从该用户发出的语音信号中提取出 基频信号,将该基频信号发送给对端用户终端包括:
[0028] 用户终端判断所述用户的音色合成数据的精度是否不小于预设精度,若是,执行 所述从该用户发出的语音信号中提取出基频信号,将该基频信号发送给对端用户终端的动 作;否则,对该用户发出的语音信号进行编码后发送给对端用户终端。
[0029] 一种语音通信装置,该装置包括:
[0030]训练模块:采集用户发出的语音信号,对采集的语音信号进行采样,每个采样样本 作为一个训练样本,对该用户的训练样本进行训练,得到该用户的音色合成数据:目标线型 滤波器系数和目标噪声序列;
[0031] 训练结果同步模块:将该用户的音色合成数据同步到其他终端上;
[0032] 语音通信模块:当所述用户与其他用户通信时,从该用户发出的语音信号中提取 出基频信号,将该基频信号发送给对端用户终端,以便:对端用户终端根据该用户的音色合 成数据,由该基频信号计算得到该用户的原始语音信号。
[0033]所述训练模块对该用户的训练样本进行训练,得到该用户的音色合成数据:目标 线型滤波器系数包括:
[0034]从每个训练样本中提取出基频信号;根据该样本的基频信号和训练样本,计算出 该样本的线型滤波器系数h;
[0035]当针对所有训练样本都已计算出h时,分别计算每个样本的h与目标h的差值,得 到每个训练样本的h的误差,统计误差在预先设定的h样本聚合置信区间内的样本数目,计 算该数目与样本总数的比值,若该比值不小于预先设定的h数据精度,则确定本次训练成 功,对目标h进行量化处理,得到最终的目标h。
[0036]所述训练模块对该用户的训练样本进行训练,得到该用户的音色合成数据:目标 噪声序列包括:
[0037] 对每个训练样本,采用训练得到的目标h对提取出基频信号的每个训练样本进行 滤波,滤波结果即为该训练样本的噪声序列;
[0038] 当得到所有训练样本的噪声序列后,计算每个样本的噪声序列与目标噪声序列的 差值,得到每个训练样本的噪声序列的误差,统计误差在预先设定的噪声序列样本聚合置 信区间内的样本数目,计算该数目与样本总数的比值,若该比值不小于预先设定的噪声序 列数据精度,则确定本次训练成功,对目标噪声序列进行量化处理,得到最终的目标噪声序 列。
[0039] 所述语音通信模块进一步用于,当从该用户发出的语音信号中提取出基频信号 时,计算语音信号的基音周期和每帧语音信号的能量,将该基音周期和每帧语音信号的能 量发送给对端用户终端。
[0040] 所述训练结果同步模块进一步用于,接收其他终端发来的其他终端用户的音色合 成数据,
[0041]且,所述语音通信模块进一步用于,当接收到其他终端发来的基频信号时,在训练 结果同步模块查找到对应的音色合成数据,根据该音色合成数据,由该基频信号计算得到 该其他终端用户的原始语音信号。
[0042] 所述训练模块进一步用于,当得到该用户的音色合成数据:目标线型滤波器系数 和目标噪声序列时,计算用户的音色合成数据的精度;
[0043]所述语音通信模块进一步用于,当所述用户与其他用户通信时,判断训练模块计 算得到的所述用户的音色合成数据的精度是否不小于预设精度,若是,执行所述从该用户 发出的语音信号中提取出基频信号,将该基频信号发送给对端用户终端的动作;否则,对该 用户发出的语音信号进行编码后发送
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1