话音信号处理方法和相关装置和系统的制作方法

文档序号:10513523阅读:639来源:国知局
话音信号处理方法和相关装置和系统的制作方法
【专利摘要】本发明实施例公开了话音信号处理方法和相关装置及系统,话音信号处理方法包括:网络设备接收来自第一终端的第一话音编码信号,对第一话音编码信号进行话音解码处理以得到话音解码参数和第一话音解码信号;利用所述话音解码参数进行虚拟频带扩展处理以得到与第一话音解码信号对应的扩频带话音解码信号;将所述第一话音解码信号和所述扩频带话音解码信号组合后进行话音编码处理以得到第二话音编码信号;向与所述第一终端建立了通话连接的第二终端发送所述第二话音编码信号,所述第一终端支持的最大频带带宽小于所述第二终端支持的最大频带带宽。本发明实施例有利于提升终端最大频带带宽支持能力非对称情况下的服务质量。
【专利说明】
话音信号处理方法和相关装置和系统
技术领域
[0001]本发明涉及音频技术领域,具体主要涉及了话音信号处理方法和相关装置和系统。
【背景技术】
[0002]由于传输带宽和其它一些条件限制,目前主要电话网络所传输的话音信号的频带带宽一般都小于4kHz,频带常被限制在300Hz?3.4kHz范围内。随着通信带宽的逐步提升,用户对话音质量和临场感提出了越来越高的需求,传统的窄带话音已经越来越不能满足用户的体验需求。且传统电话话音中高频信息的缺乏对听力障碍用户影响极大,听力障碍用户使用电话交谈时常有困难。这些需求是宽带话音乃至超宽带话音等越来越受青睐的原因。
[0003]如今,第二代(2G)、第三代(3G)和第四代(4G)网络并存,因此支持各种不同的话音带宽的终端可能会并存。举例来说,可能并存有最大可支持窄带(NB,Narrow Band)话音带宽的窄带终端、最大支持宽带(WB,Wide Band)话音带宽的宽带终端、最大可以支持超宽带(SffB,Super Wide Band)话音带宽的超宽带终端和最大可以支持全带(FB,Full Band)话音带宽的全带终端等等。
[0004]最大支持相同话音宽带的两个终端之间通话时可建立相对应的话音信号宽带服务。但是,最大支持话音带宽相对较小(例如NB)的终端与最大支持话音带宽相对较大(例如WB或SWB等)的终端之间通话时,传统方案通常只能让最大支持话音带宽相对较大的终端(例如WB终端)享受到基本等同于最大支持话音带宽相对较小的终端(例如NB终端)的话音带宽服务(例如NB带宽服务)。

【发明内容】

[0005]本发明实施例提供话音信号处理方法和相关装置和系统。
[0006]本发明第一方面提供了一种话音信号处理方法,包括:
[0007]网络设备接收来自第一终端的第一话音编码信号。所述网络设备对第一话音编码信号进行话音解码处理以得到话音解码参数和第一话音解码信号;所述网络设备利用所述话音解码参数进行虚拟频带扩展处理以得到与所述第一话音解码信号对应的扩频带话音解码信号;所述网络设备将所述第一话音解码信号和所述扩频带话音解码信号组合后进行话音编码处理以得到第二话音编码信号;所述网络设备向与所述第一终端建立了通话连接的第二终端发送所述第二话音编码信号,所述第一终端支持的最大频带带宽小于所述第二终端支持的最大频带带宽。
[0008]例如,第一终端支持的最大频带带宽和第二终端支持的最大频带带宽例如可为如下典型频带带宽中的其中两个:窄带(NB)、宽带(WB)、超宽带(SWB)和全带(FB)。也就是说,第一终端例如可能是窄带终端、宽带终端或超宽带终端,而第二终端可能是宽带终端、超宽带终端或全带终端。当然第一终端支持的最大频带带宽和第二终端支持的最大频带带宽也并不限于上述举例的典型频带带宽。
[0009]其中,所述第一话音编码信号的频带带宽小于所述第二话音编码信号的频带带宽,其中,所述第一话音编码信号的采样率小于所述第二话音编码信号的采样率。
[0010]所述第一话音编码信号的频带带宽小于或等于所述第一终端支持的最大频带带宽。例如,当所述第一终端为窄带终端,那么第一话音编码信号可为窄带话音编码信号。当所述第一终端为宽带终端,那么第一话音编码信号可为宽带话音编码信号或窄带话音编码信号。当所述第一终端为超宽带终端,那么第一话音编码信号可为超宽带话音编码信号或窄带话音编码信号或宽带话音编码信号)。
[0011]其中,所述第一话音编码信号的频带带宽小于所述第二话音编码信号的频带带宽。其中,所述第一话音编码信号的采样率小于所述第二话音编码信号的采样率。例如,所述第一话音编码信号的频带可为所述第二话音编码信号的频带的子集,当然,所述第一话音编码信号的频带与所述第二话音编码信号的频带的交集,也可能不等于所述第一话音编码信号的频带。
[0012]扩频带话音解码信号可包括高频带扩展话音解码信号,扩频带话音解码信号还可包括低频带扩展话音解码信号。例如假设第一话音解码信号的频带带宽为3400HZ-300HZ =3100Hz,那么第一话音解码信号对应的扩频带话音解码信号可包括高频带扩展话音解码信号(如7000HZ-3400HZ = 3600HZ),第一话音解码信号对应的扩频带话音解码信号还可以进一步包括低频带扩展话音解码信号(如300Ηζ-50Ηζ = 250Hz)。又例如假设第一话音解码信号的频带带宽为7000HZ-50Hz = 6950Hz,那么第一话音解码信号对应的扩频带话音解码信号可以包括高频带扩展话音解码信号(具体如14000Ηζ-7000Ηζ = 7000Hz)。又例如假设第一话音解码信号的频带带宽为14kHz-50Hz = 13950Hz,那么第一话音解码信号对应的扩频带话音解码信号可以包括高频带扩展话音解码信号(具体例如24kHZ-14kHZ = 10kHZ)。其他情况以此类推。
[0013]其中,本实施例提及的网络设备例如可为基站、无线网络控制器、核心网设备或其他网络设备。例如网络设备具体可能是第二终端所接入的无线接入网的基站或无线网络控制器,或第一终端所接入的无线接入网的基站或无线网络控制器,或也可能是分组数据网关或服务网关等核心网设备。
[0014]第一终端和第二终端可为手机、平板电脑、个人电脑或笔记本电脑等具有通话功能的用户设备。
[0015]可以看出,上述举例的技术方案中,网络设备接收来自支持相对较窄带宽的第一终端的第一话音编码信号之后,对所述第一话音编码信号进行话音解码处理以得到话音解码参数和第一话音解码信号,利用话音解码参数进行虚拟频带扩展处理以得到与第一话音解码信号对应的扩频带话音解码信号,而后在将所述第一话音解码信号和所述扩频带话音解码信号组合后进行话音编码处理以得到第二话音编码信号之后,向支持相对较宽带宽第二终端发送,由于处于中转位置的网络设备对支持相对较窄带宽的第一终端发往支持相对较宽带宽的第二终端的话音编码信号进行虚拟频带扩展,进而使得支持相对较宽带宽的第二终端的下行话音编码信号可更好的与第二终端的最大频带带宽支持能力相匹配,有利于使得支持相对较宽带宽的第二终端尽量享受到与其最大频带带宽支持能力相匹配的话音信号带宽服务,并且还无需对第二终端进行特别的功能增强,这样有利于提升用户通话体验。可见,上述举例有利于提升终端最大频带带宽支持能力非对称情况下的服务质量。
[0016]结合第一方面,在第一方面的第一种可能的实施方式中,所述利用所述话音解码参数进行虚拟频带扩展处理以得到与所述第一话音解码信号对应的扩频带话音解码信号包括:
[0017]利用所述话音解码参数估计出与所述第一话音解码信号对应的扩频带激励信号;利用所述话音解码参数估计出与所述第一话音解码信号对应的扩频带谱包络;利用与所述扩频带谱包络对应的滤波器对所述扩频带激励信号进行合成处理以得到与所述第一话音解码信号对应的扩频带话音解码信号。
[0018]结合第一方面的第一种可能的实施方式,在第一方面的第二种可能的实施方式中,所述利用所述话音解码参数估计出与所述第一话音解码信号对应的扩频带激励信号,包括:利用所述话音解码参数,基于谱折叠算法、白噪声激励算法或谐波噪声模型算法估计出与所述第一话音解码信号对应的扩频带激励信号。
[0019]结合第一方面的第一种可能的实施方式或第一方面的第二种可能的实施方式,在第一方面的第三种可能的实施方式中,所述利用所述话音解码参数估计出与所述第一话音解码信号对应的扩频带谱包络,包括:利用所述话音解码参数,基于线性映射法、码本映射法或统计映射法估计出与所述第一话音解码信号对应的扩频带谱包络。
[0020]结合第一方面或第一方面的第一种至第三种可能实施方式中的任意一种可能实施方式,在第一方面的第四种可能的实施方式中,所述话音解码参数包括基因周期、浊音度因子和线性预测编码参数。
[0021]结合第一方面或第一方面的第一种至第四种可能实施方式中的任意一种可能实施方式,在第一方面的第五种可能的实施方式中,对第一话音编码信号进行话音解码处理以得到话音解码参数和第一话音解码信号包括:从多个话音解码器中选用与所述第一终端所支持的最大频带带宽对应的话音解码器,对所述第一话音编码信号进行话音解码处理以得到话音解码参数和第一话音解码信号。
[0022]可以理解,网络设备中内置多种话音解码器,根据需要选择适宜的话音解码器来执行话音编码信号的解码,有利于提升网络设备的转码支持能力和响应处理速度。
[0023]结合第一方面或第一方面的第一种至第五种可能实施方式中的任意一种可能实施方式,在第一方面的第六种可能的实施方式中,所述利用所述话音解码参数进行虚拟频带扩展处理以得到与所述第一话音解码信号对应的扩频带话音解码信号,包括:从多个虚拟频带扩展器中选用与所述第二终端所支持的最大频带带宽对应的虚拟频带扩展器,利用所述话音解码参数进行虚拟频带扩展处理以得到与所述第一话音解码信号对应的扩频带话音解码信号。
[0024]结合第一方面或第一方面的第一种至第六种可能实施方式中的任意一种可能实施方式,在第一方面的第七种可能的实施方式中,所述将所述第一话音解码信号和所述扩频带话音解码信号组合后进行话音编码处理以得到第二话音编码信号,包括:从多个话音编码器中选用与所述第二终端所支持的最大频带带宽对应的话音编码器,将所述第一话音解码信号和所述扩频带话音解码信号组合后进行话音编码处理以得到第二话音编码信号。
[0025]结合第一方面或第一方面的第一种至第七种可能实施方式中的任意一种可能实施方式,在第一方面的第八种可能的实施方式中,
[0026]所述第一话音编码信号和所述第二话音编码信号的频带带宽为如下频带带宽中的其中两个:窄带、宽带、超宽带和全带。
[0027]结合第一方面或第一方面的第一种至第八种可能实施方式中的任意一种可能实施方式,在第一方面的第九种可能的实施方式中,所述话音信号处理方法还包括:
[0028]所述网络设备接收来自所述第二终端的第三话音编码信号;
[0029]所述网络设备对所述第三话音编码信号进行话音解码处理以得到第三话音解码信号;
[0030]所述网络设备对所述第三话音解码信号降采样处理以得到第四话音解码信号;所述网络设备对所述第四话音解码信号进行话音编码处理以得到第四话音编码信号,其中,所述第四话音编码信号的频带带宽小于所述第三话音编码信号的频带带宽,所述第四话音编码信号的采样率小于所述第三话音编码信号的采样率;
[0031]所述网络设备向所述第一终端发送所述第四话音编码信号;或者所述网络设备在对所述第四话音编码信号进行话音增强处理以得到话音增强处理后的第四话音编码信号之后,向所述第一终端发送所述话音增强处理后的第四话音编码信号。
[0032]可以理解,通过对发往第一终端的话音编码信号进行话音增强处理,有利于提升所述第一终端收到的话音编码信号的增益,进而有利于提升较窄带宽支持能力的终端的通话体验。
[0033]结合第一方面的第九种可能实施方式,在第一方面的第十种可能的实施方式中,所述对所述第三话音编码信号进行话音解码处理以得到第三话音解码信号包括:从多个话音解码器中选用与所述第二终端所支持的最大频带带宽对应的话音解码器,对所述第三话音编码信号进行话音解码处理以得到第三话音解码信号。
[0034]结合第一方面的第九种至第十种可能实施方式之中的任意一种可能实施方式,在第一方面的第十一种可能的实施方式中,所述对所述第三话音解码信号降采样处理以得到第四话音解码信号包括:从多个降采样器中选用与所述第一终端所支持的最大频带带宽对应的降采样器,对所述第三话音解码信号降采样处理以得到第四话音解码信号。
[0035]结合第一方面的第九种至第十一种可能实施方式之中的任意一种可能实施方式,在第一方面的第十二种可能的实施方式中,所述对所述第四话音解码信号进行话音编码处理以得到第四话音编码信号,包括:从多个话音编码器中选用与所述第一终端所支持的最大频带带宽对应的话音编码器,对所述第四话音解码信号进行话音编码处理以得到第四话首编码?目号。
[0036]结合第一方面或第一方面的第一种至第十二种可能实施方式中的任意一种可能实施方式,在第一方面的第十三种可能的实施方式中,所述网络设备为基站、无线网络控制器或核心网设备。
[0037]本发明实施例第二方面提供一种网络设备,包括:
[0038]通信接口,用于接收来自第一终端的第一话音编码信号;
[0039]第一话音解码器,用于对所述第一话音编码信号进行话音解码处理以得到话音解码参数和第一话音解码信号;
[0040]第一虚拟频带扩展处理器,用于利用所述话音解码参数进行虚拟频带扩展处理以得到与所述第一话音解码信号对应的扩频带话音解码信号;
[0041]第一话音编码器,将所述第一话音解码信号和所述扩频带话音解码信号组合后进行话音编码处理以得到第二话音编码信号;其中,所述第一话音编码信号的频带带宽小于所述第二话音编码信号的频带带宽,所述第一话音编码信号的采样率小于所述第二话音编码信号的采样率;
[0042]所述通信接口,用于向与所述第一终端建立了通话连接的第二终端发送所述第二话音编码信号,所述第一终端支持的最大频带带宽小于所述第二终端支持的最大频带带宽。
[0043]可以理解,第一话音解码器、第一虚拟频带扩展处理器和第一话音编码器也可以一体集成。
[0044]结合第二方面,在第二方面的第一种可能的实施方式中,
[0045]所述第一虚拟频带扩展处理器具体用于,利用所述话音解码参数估计出与所述第一话音解码信号对应的扩频带激励信号;利用所述话音解码参数估计出与所述第一话音解码信号对应的扩频带谱包络;利用与所述扩频带谱包络对应的滤波器对所述扩频带激励信号进行合成处理以得到与所述第一话音解码信号对应的扩频带话音解码信号。
[0046]结合第二方面的第一种可能的实施方式,在第二方面的第二种可能的实施方式中,在利用所述话音解码参数估计出与所述第一话音解码信号对应的扩频带激励信号的方面,所述第一虚拟频带扩展处理器具体用于,利用所述话音解码参数,基于谱折叠算法、白噪声激励算法或谐波噪声模型算法估计出与所述第一话音解码信号对应的扩频带激励信号。
[0047]结合第二方面的第一种可能的实施方式或第二方面的第二种可能的实施方式,在第二方面的第三种可能的实施方式中,
[0048]在所述利用所述话音解码参数估计出与所述第一话音解码信号对应的扩频带谱包络的方面,所述第一虚拟频带扩展处理器具体用于利用所述话音解码参数,基于线性映射法、码本映射法或统计映射法估计出与所述第一话音解码信号对应的扩频带谱包络。
[0049]结合第二方面或第二方面的第一种至第三种可能实施方式中的任意一种可能实施方式,在第二方面的第四种可能的实施方式中,所述话音解码参数包括基因周期、浊音度因子和线性预测编码参数。
[0050]结合第二方面或第二方面的第一种至第四种可能实施方式中的任意一种可能实施方式,在第二方面的第五种可能的实施方式中,所述网络设备包括多个话音解码器,所述第一话音解码器为多个话音解码器中与所述第一终端所支持的最大频带带宽对应的话音解码器。
[0051]结合第二方面或第二方面的第一种至第五种可能实施方式中的任意一种可能实施方式,在第二方面的第六种可能的实施方式中,所述网络设备包括多个虚拟频带扩展处理器,所述第一虚拟频带扩展处理器为多个虚拟频带扩展器中的与所述第二终端所支持的最大频带带宽对应的虚拟频带扩展器。
[0052]结合第二方面或第二方面的第一种至第六种可能实施方式中的任意一种可能实施方式,在第二方面的第七种可能的实施方式中,所述网络设备包括多个话音编码器,所述第一话音编码器为多个话音编码器中与所述第二终端所支持的最大频带带宽对应的话音编码器。
[0053]结合第二方面或第二方面的第一种至第七种可能实施方式中的任意一种可能实施方式,在第二方面的第八种可能的实施方式中,所述第一话音编码信号和所述第二话音编码信号的频带带宽为如下频带带宽中的其中两个:窄带、宽带、超宽带和全带。
[0054]结合第二方面或第二方面的第一种至第八种可能实施方式中的任意一种可能实施方式,在第二方面的第九种可能的实施方式中,
[0055]所述网络设备还包括:第二话音解码器、第二话音编码器和降采样器;
[0056]所述通信接口还用于,接收来自所述第二终端的第三话音编码信号;
[0057]所述第二话音解码器用于,对所述第三话音编码信号进行话音解码处理以得到第二话首解码?目号;
[0058]所述第一降采样器,用于对所述第三话音解码信号降采样处理以得到第四话音解码?目号;
[0059]所述第二话音编码器,用于对所述第四话音解码信号进行话音编码处理以得到第四话音编码信号,其中,所述第四话音编码信号的频带带宽小于所述第三话音编码信号的频带带宽,所述第四话音编码信号的采样率小于所述第三话音编码信号的采样率;
[0060]所述通信接口还用于,向所述第一终端发送所述第四话音编码信号;或者所述通信接口还用于,在对所述第四话音编码信号进行话音增强处理以得到话音增强处理后的第四话音编码信号之后,向所述第一终端发送所述话音增强处理后的第四话音编码信号。
[0061]结合第二方面的第九种可能实施方式,在第二方面的第十种可能的实施方式中,所述网络设备包括多个话音解码器,所述第二话音解码器为与所述第二终端所支持的最大频带带宽对应的话音解码器。
[0062]结合第二方面的第九种至第十种可能实施方式之中的任意一种可能实施方式,在第二方面的第十一种可能的实施方式中,所述网络设备包括多个降采样器,所述所述第一降采样器为所述多个降采样器中的与所述第一终端所支持的最大频带带宽对应的降采样器。
[0063]结合第二方面的第九种至第^种可能实施方式之中的任意一种可能实施方式,在第二方面的第十二种可能的实施方式中,所述网络设备包括多个话音编码器,第二话音编码器为与所述第一终端所支持的最大频带带宽对应的话音编码器。
[0064]结合第二方面或第二方面的第一种至第十二种可能实施方式中的任意一种可能实施方式,在第二方面的第十三种可能的实施方式中,所述网络设备为基站、无线网络控制器或核心网设备。
[0065]此外,本发明实施例第三方面提供一种网络设备,包括存储单元、通信接口及与所述存储单元和通信接口耦合的处理器。其中,所述存储单元用于存储指令,所述处理器用于执行所述指令,所述通信接口用于在所述处理器的控制下与其他设备进行通信。当所述处理器在执行所述指令时可根据所述指令执行在第一方面中网络设备所执行的方法。
[0066]此外,本发明实施例第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储了网络设备所执行的用于话音信号处理的程序代码。所述程序代码包括用于执行在第一方面中网络设备所执行的方法的指令。
[0067]此外,本发明实施例的第五方面还提供了一种网络设备,所述网络设备包括的单元能够执行在第一方面中的网络设备所执行的方法。
[0068]本发明实施例第六方面提供一种通信系统,可包括:如本发明实施例提供的任意一种网络设备。
【附图说明】
[0069]为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0070]图1-A和图1_B为本发明实施例提供的两种网络架构的不意图;
[0071]图2-A为本发明实施例提供的一种话音信号处理方法的示意图;
[0072]图2-B为本发明实施例提供的一种典型频带的举例频谱范围示意图;
[0073]图3-A为本发明实施例提供的另一种话音信号处理方法的示意图;
[0074]图3-B为本发明实施例提供的一种网络设备的内部器件的示意图;
[0075]图3-C为本发明实施例提供的一种窄带的频谱范围示意图;
[0076]图3-D为本发明实施例提供的一种窄带扩展宽带的频谱范围示意图;
[0077]图3-E为本发明实施例提供的一种话音信号的流向示意图;
[0078]图4-A为本发明实施例提供的另一种话音信号处理方法的示意图;
[0079]图4-B为本发明实施例提供的一种话音信号的流向示意图;
[0080]图5为本发明实施例提供的一种网络设备的结构示意图;
[0081]图6为本发明实施例提供的另一种网络设备的结构示意图。
【具体实施方式】
[0082]本发明说明书、权利要求书和附图中出现的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。此外,术语“第一”、“第二”和“第三”等是用于区别不同的对象,而并非用于描述特定的顺序。
[0083]下面首先参见图1-A和图1_B,其中,图1-A和图1_B为本申请实施例提供的两种可能的网络架构示意图,在图1-A所示的网络架构中,终端之间通过接入网与核心网建立起通话连接。本申请一些实施例中提供的话音信号处理方法可由接入网设备或核心网设备来执行。本申请一些实施例中提供的话音信号处理方法例如可由互联网中的一些服务器(例如会议服务器、网络电话服务器等)来执行。
[0084]其中,本发明实施例提及的终端可为具有采集、存储、向外传输话音信号等功能的装置,具体的,终端例如可为手机、平板电脑、个人电脑或笔记本电脑等等。
[0085]参见图2-A,图2-A是本申请的一个实施例提供的一种话音信号处理方法的流程示意图。如图2-A举例所示,本申请的一个实施例提供的一种话音信号处理方法可包括:
[0086]201、第一终端发送第一话音编码信号。
[0087]其中,在第一终端与第二终端之间建立起通话连接之后,第一终端可基于所述通话连接发送第一话音编码信号。第二终端也可基于所述通话连接发送话音编码信号。
[0088]其中,所述通话连接可能是基于移动通信网络的通话连接,也可能是基于互联网的通话连接。
[0089]其中,本申请实施例中以所述第一终端支持的最大频带带宽小于所述第二终端支持的最大频带带宽为例。
[0090]例如,第一终端支持的最大频带带宽和第二终端支持的最大频带带宽例如可为如下典型频带带宽中的其中两个:窄带(NB)、宽带(WB)、超宽带(SWB)和全带(FB)。也就是说,第一终端例如可能是窄带终端、宽带终端或超宽带终端,而第二终端可能是宽带终端、超宽带终端或全带终端。当然第一终端支持的最大频带带宽和第二终端支持的最大频带带宽也并不限于上述举例的典型频带带宽。
[0091]参见图2-B,图2-B举例示出了窄带(NB)、宽带(WB)、超宽带(SWB)和全带(FB)等典型频带带宽的举例范围,当然这些典型频带的范围边界并不限于图中举例。
[0092]所述第一话音编码信号的频带带宽小于或等于所述第一终端支持的最大频带带宽。例如,当所述第一终端为窄带终端,那么第一话音编码信号可为窄带话音编码信号。当所述第一终端为宽带终端,那么第一话音编码信号可为宽带话音编码信号或窄带话音编码信号。当所述第一终端为超宽带终端,那么第一话音编码信号可为超宽带话音编码信号或窄带话音编码信号或宽带话音编码信号)。
[0093]202、网络设备接收来自所述第一终端的所述第一话音编码信号,所述网络设备对所述第一话音编码信号进行话音解码处理以得到话音解码参数和第一话音解码信号。
[0094]其中,所述话音解码参数例如可包括基因周期、浊音度因子和线性预测编码参数等。
[0095]203、所述网络设备利用所述话音解码参数进行虚拟频带扩展处理以得到与所述第一话音解码信号对应的扩频带话音解码信号。
[0096]其中,利用所述话音解码参数进行虚拟频带扩展处理以得到与所述第一话音解码信号对应的扩频带话音解码信号,主要机理是利用了低频带话音信号和高频带话音信号之间的相关性,因此,基于上述机理的各种频带扩展相关算法均是可选用来进行VBWE(Virtual Band Width Extens1n,虚拟频带扩展)处理的。
[0097]扩频带话音解码信号可包括高频带扩展话音解码信号,扩频带话音解码信号还可包括低频带扩展话音解码信号。例如假设第一话音解码信号的频带带宽为3400Ηζ-300Ηζ =3100Hz,那么第一话音解码信号对应的扩频带话音解码信号可包括高频带扩展话音解码信号(如7000HZ-3400HZ = 3600HZ),第一话音解码信号对应的扩频带话音解码信号还可以进一步包括低频带扩展话音解码信号(如300Ηζ-50Ηζ = 250Hz)。又例如假设第一话音解码信号的频带带宽为7000HZ-50Hz = 6950Hz,那么第一话音解码信号对应的扩频带话音解码信号可以包括高频带扩展话音解码信号(具体如14000Ηζ-7000Ηζ = 7000Hz)。又例如假设第一话音解码信号的频带带宽为14kHz-50Hz = 13950Hz,那么第一话音解码信号对应的扩频带话音解码信号可以包括高频带扩展话音解码信号(具体例如24kHZ-14kHZ = 10kHZ)。其他情况以此类推。
[0098]204、所述网络设备将所述第一话音解码信号和所述扩频带话音解码信号组合后进行话音编码处理以得到第二话音编码信号。
[0099]其中,所述第一话音编码信号的频带带宽小于所述第二话音编码信号的频带带宽。其中,所述第一话音编码信号的采样率小于所述第二话音编码信号的采样率。例如,所述第一话音编码信号的频带可为所述第二话音编码信号的频带的子集,当然,所述第一话音编码信号的频带与所述第二话音编码信号的频带的交集,也可能不等于所述第一话音编码信号的频带。
[0100]205、所述网络设备向与所述第一终端建立了通话连接的第二终端发送所述第二话音编码信号。
[0101]相应的,所述第二终端可接收所述第二话音编码信号,并对所述第二话音编码信号进行解码播放。
[0102]其中,本实施例提及的网络设备例如可为基站、无线网络控制器、核心网设备或其他网络设备。例如网络设备具体可能是第二终端所接入的无线接入网的基站或无线网络控制器,或第一终端所接入的无线接入网的基站或无线网络控制器,或也可能是分组数据网关或服务网关等核心网设备。
[0103]第一终端和第二终端可为手机、平板电脑、个人电脑或笔记本电脑等具有通话功能的用户设备。
[0104]可以看出,本实施例的方案中,网络设备接收来自支持相对较窄带宽的第一终端的第一话音编码信号之后,对所述第一话音编码信号进行话音解码处理以得到话音解码参数和第一话音解码信号,利用话音解码参数进行虚拟频带扩展处理以得到与第一话音解码信号对应的扩频带话音解码信号,而后在将所述第一话音解码信号和所述扩频带话音解码信号组合后进行话音编码处理以得到第二话音编码信号之后,向支持相对较宽带宽的第二终端发送,由于处于中转位置的网络设备对支持相对较窄带宽的第一终端发往支持相对较宽带宽的第二终端的话音编码信号进行虚拟频带扩展,进而使得支持相对较宽带宽的第二终端的下行话音编码信号可以更好的与第二终端的最大频带带宽支持能力相匹配,有利于使得支持相对较宽带宽的第二终端尽量享受到与其最大频带带宽支持能力相匹配的话音信号带宽服务,并且还无需对第二终端进行特别的功能增强,这样有利于提升用户通话体验。
[0105]下面首先结合相关附图来进一步进行详细的介绍。
[0106]参见图3-A,图3-A是本申请的一个实施例提供的一种话音信号处理方法的流程示意图。如图3-A举例所示,本申请的一个实施例提供的一种话音信号处理方法可包括:
[0107]301、窄带终端与宽带终端之间建立通话连接。
[0108]302、窄带终端话音编码得到第一话音编码信号,基于所述通话连接发送所述第一话音编码信号。
[0109]其中,本实施例中假设第一终端为窄带终端,第二终端为宽带终端。窄带终端支持的最大频带带宽为窄带(例如3400HZ-300Hz = 3100Hz),宽带终端支持的最大频带带宽为宽带(例如7000Hz-50Hz = 6950Hz)。
[0110]具体例如,那么窄带终端可使用AMRNB编码器或其他NB编码器对话音采样信号进行话音编码以得到第一话音编码信号。第一话音编码信号的采样率为8kHz。第一话音编码信号的频带带宽 BWl = 3400Hz-300Hz = 3100Hz。
[0111]303、RNC接收来自所述窄带终端的所述第一话音编码信号,所述RNC对所述第一话音编码信号进行话音解码处理以得到话音解码参数和第一话音解码信号。
[0112]其中,所述话音解码参数例如可包括基因周期、浊音度因子和线性预测编码参数等。
[0113]假设RNC中存在包括多个话音解码器的话音解码器组(话音解码器组例如可包括NB解码器、WB解码器、SWB解码器和FB解码器等),那么,RNC可基于窄带终端支持的最大频带带宽(如NB),从话音解码器组中选用NB解码器对所述第一话音编码信号进行话音解码处理以得到话音解码参数和第一话音解码信号。
[0114]参见图3-B,图3-B举例的网络设备(如RNC)包括话音解码器组(包括多个话音解码器)、VBWE处理器组(包括多个VBWE处理器组)、话音编码器组(包括多个话音编码器)和降采样器组(包括多个降采样器)等。RNC可根据需要来从相应器件组中选用相应器件执行相应操作。
[0115]本申请的各实施例,NB解码器例如为AMR(Adaptive Mult1-Rate,自适应多速率)-NB解码器或其他类型的NB解码器。其中,SWB解码器例如可为EVS(Enhanced VoiceServices,增强型语音服务)-SWB解码器或者其他类型的SWB解码器。其中,WB解码器例如为AMR-WB解码器或者其他类型的WB解码器。其中,FB解码器例如可为EVS-FB解码器或者其他类型的FB解码器。
[0116]304、所述RNC利用所述话音解码参数进行VBWE处理以得到与所述第一话音解码信号对应的扩频带话音解码信号。其中,所述话音解码参数可包括基因周期、浊音度因子和线性预测编码参数等。
[0117]假设RNC中存在包括多个VBWE处理器的VBWE处理器组(VBWE处理器组例如可包括NB-VBWE处理器、WB-VBWE处理器、SWB VBWE处理器和FB VBWE处理器等),那么,RNC可以基于宽带终端支持的最大频带带宽(如WB),从多个VBWE处理器中选用WB VBWE处理器,利用所述话音解码参数进行VBWE处理以得到与所述第一话音解码信号对应的扩频带话音解码信号。
[0118]其中,利用所述话音解码参数进行虚拟频带扩展处理以得到与所述第一话音解码信号对应的扩频带话音解码信号,例如可包括:利用所述话音解码参数估计出与所述第一话音解码信号对应的扩频带激励信号;利用所述话音解码参数估计出与所述第一话音解码信号对应的扩频带谱包络;利用与所述扩频带谱包络对应的滤波器对所述扩频带激励信号进行合成处理以得到与所述第一话音解码信号对应的扩频带话音解码信号。
[0119]其中,利用所述话音解码参数估计出与所述第一话音解码信号对应的扩频带激励信号,例如可包括:利用所述话音解码参数(例如基因周期和浊音度因子等话音解码参数),基于谱折叠算法、白噪声激励算法或谐波噪声模型算法估计出与所述第一话音解码信号对应的扩频带激励信号。
[0120]其中,所述利用所述话音解码参数估计出与所述第一话音解码信号对应的扩频带谱包络,例如可包括:利用所述话音解码参数(例如线性预测编码参数等话音解码参数),基于线性映射法、码本映射法或统计映射法估计出与所述第一话音解码信号对应的扩频带谱包络。
[0121]305、所述RNC将所述第一话音解码信号和所述扩频带话音解码信号组合后进行话音编码处理以得到第二话音编码信号。
[0122]其中,所述第一话音编码信号的频带带宽小于所述第二话音编码信号的频带带宽。其中,所述第一话音编码信号的采样率小于所述第二话音编码信号的采样率。第二话音编码信号的采样速率例如为16kHz,第二话音编码信号的频带带宽BW2。
[0123]其中,第一话音解码信号对应的扩频带话音解码信号包括高的频带扩展话音解码信号的频带带宽BWEl = 7000HZ-3400Hz = 3600Hz。如果第一话音解码信号对应的扩频带话音解码信号包括高频带扩展话音解码信号而不包括低频带扩展话音解码信号,那么例如图3-C和图3-D举例所不,
[0124]BW2 = BWl+BWEl = 3100Hz+(7000Hz-3400Hz)=6700Hz。
[0125]此外,如果第一话音解码信号对应的扩频带话音解码信号包括高频带扩展话音解码信号和低频带扩展话音解码信号,那么,
[0126]BW2 = BW1+BWE1+BWE2 = 3100Hz+( 300Hz_50Hz) + (7000Hz_3400Hz) = 6950Hz。其中,第一话音解码信号对应的低频带扩展话音解码信号的频带带宽BWE2= (300Hz-50Hz)=250Hz ο
[0127]假设,RNC中存在包括多个话音编码器的话音编码器组(话音编码器组例如包括NB编码器、WB编码器、SWB编码器和FB编码器等),那么,RNC可基于宽带终端支持的最大频带带宽(WB),从多个话音编码器中选用WB编码器,将所述第一话音解码信号和所述扩频带话音解码信号组合后进行话音编码处理以得到第二话音编码信号。
[0128]在本申请的各实施例中,NB编码器例如可为AMR-NB编码器或其他类型的NB编码器。其中,SWB编码器例如可为EVS-SWB编码器或者其他类型的SWB编码器。其中,WB编码器例如为AMR-WB编码器或者其他类型的WB编码器。其中,FB编码器例如可为EVS-FB编码器或者其他类型的FB编码器。
[0129]306、所述RNC向与所述窄带终端建立了通话连接的宽带终端发送所述第二话音编码信号。
[0130]相应的,所述宽带终端可接收所述第二话音编码信号,并对所述第二话音编码信号进行解码播放。
[0131]307、宽带终端话音编码得到第三话音编码信号,基于所述通话连接发送所述第三话音编码信号。
[0132]其中,假设第三话音编码信号的采样率例如为16kHz,假设第三话音编码信号的频带带宽 BW3 = (7000Hz-300Hz) = 6700Hz。
[0133]308、所述RNC接收来自所述宽带终端的第三话音编码信号,所述RNC对所述第三话音编码信号进行话音解码处理以得到第三话音解码信号。
[0134]假设,RNC中存在包括多个话音解码器的话音解码器组(话音解码器组例如包括NB解码器、WB解码器、SWB解码器和FB解码器等等),那么RNC可以基于宽带终端支持的最大频带带宽(WB),从多个话音解码器中选用WB解码器对所述第三话音编码信号进行话音解码处理以得到第三话音解码信号。
[0135]309、所述RNC对所述第三话音解码信号降采样处理以得到第四话音解码信号。
[0136]假设,RNC中存在包括多个降采样器的降采样器组(降采样器组例如包括NB降采样器、WB降采样器、SWB降采样器和FB降采样器等),那么RNC可基于窄带终端支持的最大频带带宽(NB),从降采样器组包括的多个降采样器中选用NB降采样器对所述第三话音解码信号降采样处理以得到第四话音解码信号。
[0137]310、所述RNC对所述第四话音解码信号进行话音编码处理以得到第四话音编码信号。
[0138]假设RNC中存在包括多个话音编码器的话音编码器组(话音编码器组例如包括NB编码器、WB编码器、SWB编码器和FB编码器等),那么RNC可基于窄带终端支持的最大频带带宽(NB),从话音编码器组包括的多个话音编码器中选用NB编码器,将所述第四话音解码信号进行话音编码处理以得到第四话音编码信号。
[0139]可以看出,所述第四话音编码信号的频带带宽(NB)小于所述第三话音编码信号的频带带宽(WB),其中,所述第四话音编码信号的采样率(SkHz)小于所述第三话音编码信号的采样率(16kHz)。
[0140]第四话音编码信号的频带带宽BW4=(3400Hz-300Hz)=3100Hz。
[0141]311、所述RNC向所述窄带终端发送所述第四话音编码信号;或者所述RNC在对所述第四话音编码信号进行话音增强处理以得到话音增强处理后的第四话音编码信号之后,向所述窄带终端发送所述话音增强处理后的第四话音编码信号。
[0142]通过话音增强处理可使第四话音编码信号的增益MOS不低于宽带终端直接发送语音信号频带带宽为BWl时的增益MOS。
[0143]窄带终端和宽带终端的产品形态可为用户设备(UE)等具有通话功能的用户终端。
[0144]可以理解,步骤301?步骤306,与步骤307?步骤311之间没有必然的执行先后顺序。
[0145]参见图3-E,参见图3-E举例示出的话音信号在窄带终端、RNC(网络设备的一种举例)和宽带终端之间的流向关系。窄带终端、RNC和宽带终端可具有图3-E中举例的功能器件。
[0146]可以看出,本实施例的举例方案中,RNC接收窄带终端的窄带话音编码信号之后,对窄带话音编码信号进行话音解码处理以得到话音解码参数和窄带话音解码信号,利用话音解码参数进行虚拟频带扩展处理以得到与窄带话音解码信号对应的扩频带话音解码信号,而后在将所述窄带话音解码信号和所述扩频带话音解码信号组合后进行话音编码处理以得到宽带话音编码信号之后,向宽带终端发送,由于处于中转位置的网络设备对窄带终端发往宽带终端的话音编码信号进行虚拟频带扩展,进而使得宽带终端的下行话音编码信号可以更好的与宽带终端的最大频带带宽支持能力相匹配,有利于使得宽带终端尽量享受到与其最大频带带宽支持能力相匹配的话音信号带宽服务,并且还无需对宽带终端进行特别的功能增强,这样有利于提升用户通话体验。
[0147]参见图4-A,图4-A是本申请的一个实施例提供的一种话音信号处理方法的流程示意图。如图4-A举例所示,本申请的一个实施例提供的一种话音信号处理方法可包括:
[0148]401、宽带终端与超宽带终端之间建立通话连接。
[0149]402、宽带终端话音编码得到第一话音编码信号,基于所述通话连接发送所述第一话音编码信号。
[0150]本实施例中假设第一终端为宽带终端,第二终端为超宽带终端。宽带终端支持的最大频带带宽为宽带(例如7kHZ-50HZ = 6950HZ),超宽带终端支持的最大频带带宽为超宽带(例如 14kHz-50Hz = 13950Hz)。
[0151]具体例如,那么宽带终端可使用AMRWB编码器或其他WB编码器对话音采样信号进行话音编码以得到第一话音编码信号。第一话音编码信号的采样率为16kHz。第一话音编码信号的频带带宽BWl = 7kHz-50Hz = 6950Hz。
[0152]403、RNC接收来自所述宽带终端的所述第一话音编码信号,所述RNC对所述第一话音编码信号进行话音解码处理以得到话音解码参数和第一话音解码信号。
[0153]其中,所述话音解码参数例如可包括基因周期、浊音度因子和线性预测编码参数等。
[0154]假设RNC中存在包括多个话音解码器的话音解码器组(话音解码器组例如可包括NB解码器、WB解码器、SWB解码器和FB解码器等),那么,RNC可基于宽带终端支持的最大频带带宽(如WB),从话音解码器组中选用WB解码器对所述第一话音编码信号进行话音解码处理以得到话音解码参数和第一话音解码信号。
[0155]404、所述RNC利用所述话音解码参数进行VBWE处理以得到与所述第一话音解码信号对应的扩频带话音解码信号。其中,所述话音解码参数可包括基因周期、浊音度因子和线性预测编码参数等。
[0156]假设RNC中存在包括多个VBWE处理器的VBWE处理器组(VBWE处理器组例如可包括NB-VBWE处理器、WB-VBWE处理器、SWB VBWE处理器和FB VBWE处理器等),那么,RNC可以基于超宽带终端支持的最大频带带宽(如SWB),从多个VBWE处理器中选用SWB VBWE处理器,利用所述话音解码参数进行VBWE处理以得到与所述第一话音解码信号对应的扩频带话音解码信号。
[0157]其中,利用所述话音解码参数进行虚拟频带扩展处理以得到与所述第一话音解码信号对应的扩频带话音解码信号,例如可包括:利用所述话音解码参数估计出与所述第一话音解码信号对应的扩频带激励信号;利用所述话音解码参数估计出与所述第一话音解码信号对应的扩频带谱包络;利用与所述扩频带谱包络对应的滤波器对所述扩频带激励信号进行合成处理以得到与所述第一话音解码信号对应的扩频带话音解码信号。
[0158]其中,利用所述话音解码参数估计出与所述第一话音解码信号对应的扩频带激励信号,例如可包括:利用所述话音解码参数(例如基因周期和浊音度因子等话音解码参数),基于谱折叠算法、白噪声激励算法或谐波噪声模型算法估计出与所述第一话音解码信号对应的扩频带激励信号。
[0159]其中,所述利用所述话音解码参数估计出与所述第一话音解码信号对应的扩频带谱包络,例如可包括:利用所述话音解码参数(例如线性预测编码参数等话音解码参数),基于线性映射法、码本映射法或统计映射法估计出与所述第一话音解码信号对应的扩频带谱包络。
[0160]405、所述RNC将所述第一话音解码信号和所述扩频带话音解码信号组合后进行话音编码处理以得到第二话音编码信号。
[0161]其中,所述第一话音编码信号的频带带宽小于所述第二话音编码信号的频带带宽。其中,所述第一话音编码信号的采样率小于所述第二话音编码信号的采样率。第二话音编码信号的采样速率例如为32kHz,第二话音编码信号的频带带宽BW2。
[0162]其中,第一话音解码信号对应的扩频带话音解码信号包括高的频带扩展话音解码信号的频带带宽BWEl = 14kHZ-7kHz = 7kHz。如果第一话音解码信号对应的扩频带话音解码信号包括高频带扩展话音解码信号而不包括低频带扩展话音解码信号,那么,
[0163]Bff 2 = Bffl+BffE I = 6950Hz+(14kHz_7kHz) = 13950Hz。
[0164]假设,RNC中存在包括多个话音编码器的话音编码器组(话音编码器组例如包括NB编码器、WB编码器、SWB编码器和FB编码器等),那么,RNC可基于超宽带终端支持的最大频带带宽(SWB),从多个话音编码器中选用SWB编码器,将所述第一话音解码信号和所述扩频带话音解码信号组合后进行话音编码处理以得到第二话音编码信号。
[0165]406、所述RNC向与所述宽带终端建立了通话连接的超宽带终端发送所述第二话音编码?目号。
[0166]相应的,所述超宽带终端可接收所述第二话音编码信号,并对所述第二话音编码信号进行解码播放。
[0167]407、超宽带终端话音编码得到第三话音编码信号,基于所述通话连接发送所述第二话首编码?目号。
[0168]其中,假设第三话音编码信号的采样率例如为32kHz,假设第三话音编码信号的频带带宽 BW3 = (14kHz-50Hz) = 13950Hz。
[0169]408、所述RNC接收来自所述超宽带终端的第三话音编码信号,所述RNC对所述第三话音编码信号进行话音解码处理以得到第三话音解码信号。
[0170]假设,RNC中存在包括多个话音解码器的话音解码器组(话音解码器组例如包括NB解码器、WB解码器、SWB解码器和FB解码器等等),那么RNC可以基于超宽带终端支持的最大频带带宽(SWB),从多个话音解码器中选用SWB解码器对所述第三话音编码信号进行话音解码处理以得到第三话音解码信号。
[0171]409、所述RNC对所述第三话音解码信号降采样处理以得到第四话音解码信号。
[0172]假设,RNC中存在包括多个降采样器的降采样器组(降采样器组例如包括NB降采样器、WB降采样器、SWB降采样器和FB降采样器等),那么RNC可基于宽带终端支持的最大频带带宽(WB),从降采样器组包括的多个降采样器中选用WB降采样器对所述第三话音解码信号降采样处理以得到第四话音解码信号。
[0173]410、所述RNC对所述第四话音解码信号进行话音编码处理以得到第四话音编码信号。
[0174]假设RNC中存在包括多个话音编码器的话音编码器组(话音编码器组例如包括NB编码器、WB编码器、SWB编码器和FB编码器等),那么RNC可基于宽带终端支持的最大频带带宽(WB),从话音编码器组包括的多个话音编码器中选用WB编码器,将所述第四话音解码信号进行话音编码处理以得到第四话音编码信号。
[0175]可以看出,所述第四话音编码信号的频带带宽(WB)小于所述第三话音编码信号的频带带宽(SWB),其中,所述第四话音编码信号的采样率(16kHz)小于所述第三话音编码信号的采样率(32kHz)。
[0176]第四话音编码信号的频带带宽BW4=(7000Hz-500Hz)=6950Hz。
[0177]411、所述RNC向所述宽带终端发送所述第四话音编码信号;或者所述RNC在对所述第四话音编码信号进行话音增强处理以得到话音增强处理后的第四话音编码信号之后,向所述宽带终端发送所述话音增强处理后的第四话音编码信号。
[0178]通过话音增强处理可使第四话音编码信号的增益MOS不低于超宽带终端直接发送语音信号频带带宽为BWl时的增益MOS。
[0179]宽带终端和超宽带终端的产品形态可为用户设备(UE)等具有通话功能的用户终端。
[0180]可以理解,步骤401?步骤406,与步骤407?步骤411之间没有必然的执行先后顺序。
[0181]参见图4-B,参见图4-B举例示出的话音信号在宽带终端、RNC(网络设备的一种举例)和超宽带终端之间的流向关系。宽带终端、RNC和超宽带终端可具有图4-B中举例的功能器件。
[0182]可以看出,本实施例的举例方案中,网络设备(RNC)接收宽带终端的宽带话音编码信号之后,对所述宽带话音编码信号进行话音解码处理以得到话音解码参数和宽带话音解码信号,利用话音解码参数进行虚拟频带扩展处理以得到与宽带话音解码信号对应的扩频带话音解码信号,而后在将所述宽带话音解码信号和所述扩频带话音解码信号组合后进行话音编码处理以得到超宽带话音编码信号之后,向超宽带终端发送,由于处于中转位置的RNC对宽带终端发往超宽带终端的话音编码信号进行虚拟频带扩展,进而使得超宽带终端的下行话音编码信号可以更好的与超宽带终端的最大频带带宽支持能力相匹配,有利于使得超宽带终端尽量享受到与其最大频带带宽支持能力相匹配的话音信号带宽服务,并且还无需对超宽带终端进行特别的功能增强,这样有利于提升用户通话体验。
[0183]其中,图3-A中以第一终端为窄带终端而第二终端为宽带终端为例,图4-B中以第一终端为宽带终端而第二终端为超宽带终端为例,而第一终端和第二终端为其他类型终端的情况可以此类推。
[0184]参见图5,本申请实施例提供一种网络设备500,包括:
[0185]通信接口510,用于接收来自第一终端的第一话音编码信号。
[0186]第一话音解码器520,用于对所述第一话音编码信号进行话音解码处理以得到话音解码参数和第一话音解码信号。
[0187]第一虚拟频带扩展处理器530,用于利用所述话音解码参数进行虚拟频带扩展处理以得到与所述第一话音解码信号对应的扩频带话音解码信号。
[0188]第一话音编码器540,将所述第一话音解码信号和所述扩频带话音解码信号组合后进行话音编码处理以得到第二话音编码信号;其中,所述第一话音编码信号的频带带宽小于所述第二话音编码信号的频带带宽,所述第一话音编码信号的采样率小于所述第二话首编码?目号的米样率。
[0189]所述通信接口510还用于向与所述第一终端建立了通话连接的第二终端发送所述第二话音编码信号,所述第一终端支持的最大频带带宽小于所述第二终端支持的最大频带带宽。
[0190]在本发明的一些可能实施方式中,所述第一虚拟频带扩展处理器530具体用于,利用所述话音解码参数估计出与所述第一话音解码信号对应的扩频带激励信号;利用所述话音解码参数估计出与所述第一话音解码信号对应的扩频带谱包络;利用与所述扩频带谱包络对应的滤波器对所述扩频带激励信号进行合成处理以得到与所述第一话音解码信号对应的扩频带话音解码信号。
[0191]在本发明一些可能实施方式中,在利用所述话音解码参数估计出与所述第一话音解码信号对应的扩频带激励信号的方面,所述第一虚拟频带扩展处理器530具体用于,利用所述话音解码参数,基于谱折叠算法、白噪声激励算法或谐波噪声模型算法估计出与所述第一话音解码信号对应的扩频带激励信号。
[0192]在本发明的一些可能实施方式中,在所述利用所述话音解码参数估计出与所述第一话音解码信号对应的扩频带谱包络的方面,所述第一虚拟频带扩展处理器530具体用于利用所述话音解码参数,基于线性映射法、码本映射法或统计映射法估计出与所述第一话音解码信号对应的扩频带谱包络。
[0193]在本发明的一些可能实施方式中,所述话音解码参数包括基因周期、浊音度因子和线性预测编码参数。
[0194]在本发明的一些可能实施方式中,所述网络设备包括多个话音解码器,所述第一话音解码器为多个话音解码器中与所述第一终端所支持的最大频带带宽对应的话音解码器;
[0195]在本发明的一些可能实施方式中,所述网络设备包括多个虚拟频带扩展处理器,所述第一虚拟频带扩展处理器为多个虚拟频带扩展器中的与所述第二终端所支持的最大频带带宽对应的虚拟频带扩展器;
[0196]在本发明一些可能实施方式中,所述网络设备包括多个话音编码器,所述第一话音编码器为多个话音编码器中与所述第二终端所支持的最大频带带宽对应的话音编码器。
[0197]在本发明的一些可能实施方式中,所述第一话音编码信号和所述第二话音编码信号的频带带宽为例如如下频带带宽中的其中两个:窄带、宽带、超宽带和全带。
[0198]在本发明的一些可能实施方式中,所述网络设备500还包括:第二话音解码器550、第二话音编码器570和第一降采样器560。
[0199]其中,所述通信接口510还用于,接收来自所述第二终端的第三话音编码信号。
[0200]所述第二话音解码器550用于,对所述第三话音编码信号进行话音解码处理以得到第三话音解码信号。
[0201]所述第一降采样器560,用于对所述第三话音解码信号降采样处理以得到第四话音解码信号。
[0202]所述第二话音编码器570,用于对所述第四话音解码信号进行话音编码处理以得到第四话音编码信号,其中,所述第四话音编码信号的频带带宽小于所述第三话音编码信号的频带带宽,所述第四话音编码信号的采样率小于所述第三话音编码信号的采样率。
[0203]通信接口510还用于向所述第一终端发送所述第四话音编码信号;或者所述通信接口 510还用于,在对所述第四话音编码信号进行话音增强处理以得到话音增强处理后的第四话音编码信号之后,向所述第一终端发送所述话音增强处理后的第四话音编码信号。
[0204]在本发明一些可能实施方式中,网络设备500包括多个话音解码器,所述第二话音解码器550为与所述第二终端所支持的最大频带带宽对应的话音解码器。
[0205]在本发明的一些可能实施方式中,所述网络设备包括多个降采样器,所述所述第一降采样器为所述多个降采样器中的与所述第一终端所支持的最大频带带宽对应的降采样器。
[0206]在本发明一些可能实施方式中,网络设备500包括多个话音编码器,所述第二话音编码器570为与所述第一终端所支持的最大频带带宽对应的话音编码器。
[0207]在本发明一些可能实施方式中,所述网络设备为基站、无线网络控制器或核心网设备。
[0208]参见图6,本发明实施例提供一种网络设备600,包括:
[0209]存储单元620、通信接口610及与所述存储单元620和通信接口610耦合的处理器630。所述存储单元620用于存储指令,所述处理器630用于执行所述指令,其中,所述通信接口 610用于在所述处理器630的控制下与其他设备进行通信。当所述处理器630在执行所述指令时可根据所述指令执行在上述实施例中的任意一种话音信号处理方法。
[0210]具体的,所述处理器630用于通过通信接口620接收来自第一终端的第一话音编码信号;对所述第一话音编码信号进行话音解码处理以得到话音解码参数和第一话音解码信号;利用所述话音解码参数进行虚拟频带扩展处理以得到与所述第一话音解码信号对应的扩频带话音解码信号;将所述第一话音解码信号和所述扩频带话音解码信号组合后进行话音编码处理以得到第二话音编码信号;其中,所述第一话音编码信号的频带带宽小于所述第二话音编码信号的频带带宽,所述第一话音编码信号的采样率小于所述第二话音编码信号的采样率;通过所述通信接口 610向与所述第一终端建立了通话连接的第二终端发送所述第二话音编码信号,所述第一终端支持的最大频带带宽小于所述第二终端支持的最大频带带宽。
[0211]在本发明的一些可能实施方式中,所述处理器630具体用于,利用所述话音解码参数估计出与所述第一话音解码信号对应的扩频带激励信号;利用所述话音解码参数估计出与所述第一话音解码信号对应的扩频带谱包络;利用与所述扩频带谱包络对应的滤波器对所述扩频带激励信号进行合成处理以得到与所述第一话音解码信号对应的扩频带话音解码信号。
[0212]在本发明的一些可能实施方式中,在利用所述话音解码参数估计出与所述第一话音解码信号对应的扩频带激励信号的方面,处理器630具体用于,利用所述话音解码参数,基于谱折叠算法、白噪声激励算法或谐波噪声模型算法估计出与所述第一话音解码信号对应的扩频带激励信号。
[0213]在本发明的一些可能实施方式中,在所述利用所述话音解码参数估计出与所述第一话音解码信号对应的扩频带谱包络的方面,处理器630具体用于利用所述话音解码参数,基于线性映射法、码本映射法或统计映射法估计出与所述第一话音解码信号对应的扩频带谱包络。
[0214]在本发明的一些可能实施方式中,所述话音解码参数包括基因周期、浊音度因子和线性预测编码参数。
[0215]在本发明的一些可能实施方式中,所述第一话音编码信号和所述第二话音编码信号的频带带宽为例如如下频带带宽中的其中两个:窄带、宽带、超宽带和全带。
[0216]在本发明的一些可能实施方式中,处理器630还用通过所述通信接口610接收来自所述第二终端的第三话音编码信号;对所述第三话音编码信号进行话音解码处理以得到第三话音解码信号;对所述第三话音解码信号降采样处理以得到第四话音解码信号;对所述第四话音解码信号进行话音编码处理以得到第四话音编码信号,其中,所述第四话音编码信号的频带带宽小于所述第三话音编码信号的频带带宽,所述第四话音编码信号的采样率小于所述第三话音编码信号的采样率;通过通信接口 610向所述第一终端发送所述第四话音编码信号;或者所述通信接口 610还用于,在对所述第四话音编码信号进行话音增强处理以得到话音增强处理后的第四话音编码信号之后,向所述第一终端发送所述话音增强处理后的第四话音编码信号。
[0217]在本发明一些可能实施方式中,网络设备600例如可为基站、无线网络控制器或核心网设备或网络电话服务器等。
[0218]可以看出,上述举例的技术方案中,网络设备600接收来自支持相对较窄带宽的第一终端的第一话音编码信号之后,对所述第一话音编码信号进行话音解码处理以得到话音解码参数和第一话音解码信号,利用话音解码参数进行虚拟频带扩展处理以得到与第一话音解码信号对应的扩频带话音解码信号,而后在将所述第一话音解码信号和所述扩频带话音解码信号组合后进行话音编码处理以得到第二话音编码信号之后,向支持相对较宽带宽第二终端发送,由于处于中转位置的网络设备对支持相对较窄带宽的第一终端发往支持相对较宽带宽的第二终端的话音编码信号进行虚拟频带扩展,进而使得支持相对较宽带宽的第二终端的下行话音编码信号可更好的与第二终端的最大频带带宽支持能力相匹配,有利于使得支持相对较宽带宽的第二终端尽量享受到与其最大频带带宽支持能力相匹配的话音信号带宽服务,并且还无需对第二终端进行特别的功能增强,这样有利于提升用户通话体验。可见,上述举例有利于提升终端最大频带带宽支持能力非对称情况下的服务质量。
[0219]在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
[0220]在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可结合或者可以集成到另一个系统,或一些特征可以忽略或不执行。另一点,所显示或讨论的相互之间的间接耦合或者直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
[0221]所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例的方案的目的。
[0222]另外,在本发明各实施例中的各功能单元可集成在一个处理单元中,也可以是各单元单独物理存在,也可两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,或者也可以采用软件功能单元的形式实现。
[0223]所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(R0M,Read-0nly Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
【主权项】
1.一种话音信号处理方法,其特征在于,包括: 网络设备接收来自第一终端的第一话音编码信号; 所述网络设备对所述第一话音编码信号进行话音解码处理以得到话音解码参数和第一话音解码信号; 所述网络设备利用所述话音解码参数进行虚拟频带扩展处理以得到与所述第一话音解码信号对应的扩频带话音解码信号;所述网络设备将所述第一话音解码信号和所述扩频带话音解码信号组合后进行话音编码处理以得到第二话音编码信号;其中,所述第一话音编码信号的频带带宽小于所述第二话音编码信号的频带带宽,所述第一话音编码信号的采样率小于所述第二话音编码信号的采样率; 所述网络设备向与所述第一终端建立了通话连接的第二终端发送所述第二话音编码信号,所述第一终端支持的最大频带带宽小于所述第二终端支持的最大频带带宽。2.根据权利要求1所述的方法,其特征在于,所述利用所述话音解码参数进行虚拟频带扩展处理以得到与所述第一话音解码信号对应的扩频带话音解码信号包括: 利用所述话音解码参数估计出与所述第一话音解码信号对应的扩频带激励信号;利用所述话音解码参数估计出与所述第一话音解码信号对应的扩频带谱包络;利用与所述扩频带谱包络对应的滤波器对所述扩频带激励信号进行合成处理以得到与所述第一话音解码信号对应的扩频带话音解码信号。3.根据权利要求2所述的方法,其特征在于,所述利用所述话音解码参数估计出与所述第一话音解码信号对应的扩频带激励信号包括:利用所述话音解码参数,基于谱折叠算法、白噪声激励算法或谐波噪声模型算法估计出与所述第一话音解码信号对应的扩频带激励信号。4.根据权利要求2或3所述的方法,其特征在于,所述利用所述话音解码参数估计出与所述第一话音解码信号对应的扩频带谱包络,包括:利用所述话音解码参数,基于线性映射法、码本映射法或统计映射法估计出与所述第一话音解码信号对应的扩频带谱包络。5.根据权利要求1至4任一项所述的方法,其特征在于,所述话音解码参数包括基因周期、浊音度因子和线性预测编码参数。6.根据权利要求1至5任一项所述的方法,其特征在于,所述对所述第一话音编码信号进行话音解码处理以得到话音解码参数和第一话音解码信号包括:从多个话音解码器中选用与所述第一终端所支持的最大频带带宽对应的话音解码器,对所述第一话音编码信号进行话音解码处理以得到话音解码参数和第一话音解码信号; 或者,所述利用所述话音解码参数进行虚拟频带扩展处理以得到与所述第一话音解码信号对应的扩频带话音解码信号,包括:从多个虚拟频带扩展器中选用与所述第二终端所支持的最大频带带宽对应的虚拟频带扩展器,利用所述话音解码参数进行虚拟频带扩展处理以得到与所述第一话音解码信号对应的扩频带话音解码信号; 或者,所述将所述第一话音解码信号和所述扩频带话音解码信号组合后进行话音编码处理以得到第二话音编码信号,包括:从多个话音编码器中选用与所述第二终端所支持的最大频带带宽对应的话音编码器,将所述第一话音解码信号和所述扩频带话音解码信号组合后进行话音编码处理以得到第二话音编码信号。7.根据权利要求1至6任一项所述的方法,其特征在于, 所述第一话音编码信号和所述第二话音编码信号的频带带宽为如下频带带宽中的其中两个:窄带、宽带、超宽带和全带。8.根据权利要求1至7任一项所述的方法,其特征在于,所述话音信号处理方法还包括: 所述网络设备接收来自所述第二终端的第三话音编码信号; 所述网络设备对所述第三话音编码信号进行话音解码处理以得到第三话音解码信号; 所述网络设备对所述第三话音解码信号降采样处理以得到第四话音解码信号;所述网络设备对所述第四话音解码信号进行话音编码处理以得到第四话音编码信号,其中,所述第四话音编码信号的频带带宽小于所述第三话音编码信号的频带带宽,所述第四话音编码信号的采样率小于所述第三话音编码信号的采样率; 所述网络设备向所述第一终端发送所述第四话音编码信号;或者所述网络设备在对所述第四话音编码信号进行话音增强处理以得到话音增强处理后的第四话音编码信号之后,向所述第一终端发送所述话音增强处理后的第四话音编码信号。9.根据权利要求8所述的方法,其特征在于,所述对所述第三话音编码信号进行话音解码处理以得到第三话音解码信号,包括:从多个话音解码器中选用与所述第二终端所支持的最大频带带宽对应的话音解码器,对所述第三话音编码信号进行话音解码处理以得到第三话音解码信号; 或者,所述对所述第三话音解码信号降采样处理以得到第四话音解码信号包括:从多个降采样器中选用与所述第一终端所支持的最大频带带宽对应的降采样器,对所述第三话音解码信号降采样处理以得到第四话音解码信号; 或者,所述对所述第四话音解码信号进行话音编码处理以得到第四话音编码信号,包括:从多个话音编码器中选用与所述第一终端所支持的最大频带带宽对应的话音编码器,对所述第四话音解码信号进行话音编码处理以得到第四话音编码信号。10.根据权利要求1至9任一项所述的方法,其特征在于,所述网络设备为基站、无线网络控制器或核心网设备。11.一种网络设备,其特征在于,包括: 通信接口,用于接收来自第一终端的第一话音编码信号; 第一话音解码器,用于对所述第一话音编码信号进行话音解码处理以得到话音解码参数和第一话音解码信号; 第一虚拟频带扩展处理器,用于利用所述话音解码参数进行虚拟频带扩展处理以得到与所述第一话音解码信号对应的扩频带话音解码信号; 第一话音编码器,将所述第一话音解码信号和所述扩频带话音解码信号组合后进行话音编码处理以得到第二话音编码信号;其中,所述第一话音编码信号的频带带宽小于所述第二话音编码信号的频带带宽,所述第一话音编码信号的采样率小于所述第二话音编码信号的采样率; 所述通信接口,用于向与所述第一终端建立了通话连接的第二终端发送所述第二话音编码信号,所述第一终端支持的最大频带带宽小于所述第二终端支持的最大频带带宽。12.根据权利要求11所述的网络设备,其特征在于, 所述第一虚拟频带扩展处理器具体用于,利用所述话音解码参数估计出与所述第一话音解码信号对应的扩频带激励信号;利用所述话音解码参数估计出与所述第一话音解码信号对应的扩频带谱包络;利用与所述扩频带谱包络对应的滤波器对所述扩频带激励信号进行合成处理以得到与所述第一话音解码信号对应的扩频带话音解码信号。13.根据权利要求12所述的网络设备,其特征在于, 在利用所述话音解码参数估计出与所述第一话音解码信号对应的扩频带激励信号的方面,所述第一虚拟频带扩展处理器具体用于,利用所述话音解码参数,基于谱折叠算法、白噪声激励算法或谐波噪声模型算法估计出与所述第一话音解码信号对应的扩频带激励信号。14.根据权利要求12或13所述的网络设备,其特征在于, 在所述利用所述话音解码参数估计出与所述第一话音解码信号对应的扩频带谱包络的方面,所述第一虚拟频带扩展处理器具体用于利用所述话音解码参数,基于线性映射法、码本映射法或统计映射法估计出与所述第一话音解码信号对应的扩频带谱包络。15.根据权利要求11至14任一项所述的网络设备,其特征在于,所述话音解码参数包括基因周期、浊音度因子和线性预测编码参数。16.根据权利要求11至15任一项所述的网络设备,其特征在于,所述网络设备包括多个话音解码器,所述第一话音解码器为多个话音解码器中与所述第一终端所支持的最大频带带宽对应的话音解码器; 或者, 所述网络设备包括多个虚拟频带扩展处理器,所述第一虚拟频带扩展处理器为多个虚拟频带扩展器中的与所述第二终端所支持的最大频带带宽对应的虚拟频带扩展器; 或者,所述网络设备包括多个话音编码器,所述第一话音编码器为多个话音编码器中与所述第二终端所支持的最大频带带宽对应的话音编码器。17.根据权利要求11至16任一项所述的网络设备,其特征在于,所述第一话音编码信号和所述第二话音编码信号的频带带宽为如下频带带宽中的其中两个:窄带、宽带、超宽带和全带。18.根据权利要求11至17任一项所述的网络设备,其特征在于,所述网络设备还包括:第二话音解码器、第二话音编码器和第一降采样器; 所述通信接口还用于,接收来自所述第二终端的第三话音编码信号; 所述第二话音解码器用于,对所述第三话音编码信号进行话音解码处理以得到第三话音解码信号; 所述第一降采样器,用于对所述第三话音解码信号降采样处理以得到第四话音解码信号; 所述第二话音编码器,用于对所述第四话音解码信号进行话音编码处理以得到第四话音编码信号,其中,所述第四话音编码信号的频带带宽小于所述第三话音编码信号的频带带宽,所述第四话音编码信号的采样率小于所述第三话音编码信号的采样率; 所述通信接口还用于,向所述第一终端发送所述第四话音编码信号;或者所述通信接口还用于,在对所述第四话音编码信号进行话音增强处理以得到话音增强处理后的第四话音编码信号之后,向所述第一终端发送所述话音增强处理后的第四话音编码信号。19.根据权利要求18所述的方法,其特征在于,所述网络设备包括多个话音解码器,所述第二话音解码器为与所述第二终端所支持的最大频带带宽对应的话音解码器; 或者,所述网络设备包括多个降采样器,所述所述第一降采样器为所述多个降采样器中的与所述第一终端所支持的最大频带带宽对应的降采样器; 或者,所述网络设备包括多个话音编码器,第二话音编码器为与所述第一终端所支持的最大频带带宽对应的话音编码器。20.根据权利要求11至19任一项所述的网络设备,其特征在于,所述网络设备为基站、无线网络控制器或核心网设备。21.—种通信系统,其特征在于,包括:如权利要求11至20任一项所述的网络设备。
【文档编号】G10L21/038GK105869653SQ201610379386
【公开日】2016年8月17日
【申请日】2016年5月31日
【发明人】王宾, 夏丙寅, 刘泽新, 苗磊
【申请人】华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1