基于各子带特征参数值的清浊音判决装置及其判决方法

文档序号：2826299阅读：289来源：国知局

基于各子带特征参数值的清浊音判决装置及其判决方法
【专利摘要】本发明公开了一种基于各子带特征参数值的清浊音判决装置，包括语音信号分帧模块、离散高通滤波模块、提取编码的特征参数模块、分割K个频带模块、统计特征参数的特性值模块和清浊音判决模块；本发明还提供了一种基于各子带特征参数值的清浊音判决方法。本发明的判断装置及其判断方法基于当前帧统计特征参数的特性，分析各子带特征参数的相关性来判定各子带的清浊音，能够完全取代IMBE中的判决方进行清浊音判决，能更加精确的获得各个子带的清浊音判定结果，进一步来支持高质量的语音合成；并且，能应用于低码率的移动互联网环境中。
【专利说明】基于各子带特征参数值的清浊音判决装置及其判决方法

【技术领域】
[0001] 本发明涉及语音编码【技术领域】，特别涉及一种基于各子带特征参数值的清浊音判决装置。本发明还涉及一种基于各子带特征参数值的清浊音判决方法

【背景技术】
[0002] 在许多音频应用中需要数字地传送或存储，例如语音信号；音频数字地传送或存储不是试图采样然后再直接复制一语音信号，而是应用一语音编码器，它构造一包含该音频信号的关键特性的合成语音信号，该合成语音信号然后被解码以供复制，所以语音编码在通信系统、语音存储回放系统、具有语音功能的消费类产品中有广泛的应用。
[0003] 近些年来国际电信联盟（ITU)、一些区域组织和一些国家相继制定了一系列语音压缩编码标准，在编码速率为3.6kbit/s到16kbit/s上得到了令人满意的语音质量；例如自适应多速率（Adaptive Multi Rate, AMR)是由 3GPP (3rd Generation PartnershipProject)制定的第三代移动通讯系统中的语音编解码技术。窄带自适应多速率（AMR-NB)编解码器支持八种速率：12. 2kbit/s, 10. 2kbit/s, 7. 95kbit/s, 7. 40kbit/ s, 6. 7kbit/s, 5. 9kbit/s, 5. 15kbit/s, 4. 75kbit/s。目前国内外的研究主要集中在 3. 6kbit/s速率以下高质量语音压缩编码上，主要用于无线通信、保密通信、大容量语音存储回放等。低速率语音编码中激励信号的合成非常重要，而多带激励信号合成是目前激励信号合成的重要手段。其中称作"多带激励（MBE)模型"的一种语音模型首次在Griffin和 Lim的论文"多带激励语音编码器（Multi-Band Excitation Vocoder)"中提出。该MBE模型将语音信号分成多个帧，这些帧被独立地分析以产生描述该帧的语音信号的一个参数集合，这些参数然后被编码以供传输和存储。每帧中的语音信号被分成一定数目的频带，对于每个频带判断该频谱部分是发声的还是不发声的，然后表示为对于发声判定的周期性能量或对于不发声判定的类噪声能量。利用该模型，每帧中的语音信号的特征信息包括：该帧中的语音信号的基本频率、各频带的清浊音判定和每一频带内的各谐音的对应幅度，整个分析的框架如图1所示。这些信息于是被变换及矢量量化以提供编码器输出。该输出以相反过程被解码，语音信号的合成框图如图2所示。从编码和解码的框架图可以看出，要实现这样一个语音编解码器，清浊音判决的精确度显的尤为重要。
[0004] 在现有专利US5216747 "语音信号的清浊音评估算法"中，提出了一种清池音判决的方法，该方法被应用于DVSI (Digital Voice System, Inc.，）公司的 IMBE(ImprovedMulti-Band Excitation "增强的多带激励语音编解码算法"）声码器中，该专利中求取带通浊音度参数主要步骤如下：
[0005] 1).对输入语音信号样点按时间顺序分巾贞；
[0006] 2).使当前帧通过一个离散的高通滤波器来滤除任何残差能量获得其值为s (η)，高通滤波器如公式（1)所示；
[0007]

【权利要求】
1. 一种基于各子带特征参数值的清浊音判决装置，其特征是，包括：语音信号分帧模块，将输入的语音信号编码采样分帧，将分帧后的每一语音帧发送至离散高通滤波模块；离散高通滤波模块，使当前帧通过一个离散的高通滤波器来滤除任何残差能量获得其值为S (η); 提取编码的特征参数模块，其包括5个子模块提取编码的特征参数，将提取出的编码的特征参数发送到分割K个频带模块：所述提取编码的特征参数模块包括：子带能量计算模块，为将经过离散高通滤波后语音信号s (η)通过一个截止频率为O 到500Hz的低通滤波器后的信号S1 (η)来计算子带的能量，其子带的能量计算如下：
其中S1(Ii)是将经过离散高通滤波后的语音信号s (η)通过一个低通滤波器产生的信号；过零率计算模块，为直接将经过离散高通滤波后语音信号s (η)来计算过零率，其过零率的计算公式如下：
其中当X(i)与X(i+1)相乘的值为负，代表过零率产生，判定结果为1，否则其他结果为〇，x(i)为经过离散高通滤波后的语音信号s(n); 能量比率计算模块，将输入信号的能量谱Sw(CO)被截止频率分割成两个带，所以能量比率的计算为低带能量和高带能量之比计算公式如下： energy Ratb = ^jEl/Eh 其中，低带能量E1计算公式如下：
其中，高带能量Eh计算公式：
其中输入信号的能量谱Sw(c〇)定义为对s(n) ·￥κ(η)做256个的离散傅里叶变换获得。基音的误差函数值计算模块，利用误差函数E (P)来计算E (P1)，基音的误差函数值计算公式如下，其中P1为基音粗估的结果； ρ itchError = E(P1) 平均的Yin值计算模块，利用Yin值来计算平均的Yin值，其中Yin值的计算采用：输入参数： wO :基音值 sig(n):高通滤波的当前帧信号值 sig_len :当前帧信号值长度返回值： Yin 值；所以平均的Yin值计算公式如下： meanYin = [Yin (ω 〇)+Yin (ω 〇/2) ] · ω〇/2 分割K个频带模块，将当前帧语音信号分割为i个频带，频带数目f取决于谐波的数目将频带数目#发送到统计特征参数的特性值模块；统计特征参数的特性值模块，在不同的清浊音情况下用原始的MBE清浊音判断结果作为基准参数来获取统计特征参数；清浊音判决模块，基于低次谐波带的&重要性高于高次谐波带，将分离低次谐波带六和其他的高次谐波带t来各自判决，其中高次谐波带中k的取值为2 g A < K。
2. -种基于各子带特征参数值的清浊音判决方法，其特征是，包括：一、对输入语音信号样点按时间顺序分巾贞；二、使当前帧通过一个离散的高通滤波器来滤除任何残差能量获得其值为s (η); 三、基于步骤二中计算的s (η)来抽取编码时的特征参数，抽取编码时的特征参数采用： 1) 用低通滤波器对当前帧的信号值s (η)进行低通滤波，然后计算子带能量； 2) 利用经过高通滤波器后获得的信号值s (η)来计算当前帧的过零率； 3) 计算当前帧的低频带能量和高频带能量，获取两个能量比率； 4) 利用IMBE标准中的误差函数E(P)来计算当前帧基音的误差函数值； 5) 计算当前巾贞的平均的Yin值；四、将当前帧语音信号分割为犮个频带，频带数目f取决于谐波的数目^ ,采用下述公式计算；
五、根据步骤三中抽取的特征参数来统计犮个频段的特征值，通过测试统计至少1000 帧语音帧来获得犮个频段的特征参数特征值的统计数据；六、利用步骤五中统计的特征参数特性来进行清浊音判决，基于低次谐波带的4重要性高于高次谐波带，分离低次谐波带A和其他的高次谐波带^进行分别判决，其中高次谐波带中k的取值范围介<犮。
【文档编号】G10L19/087GK104517614SQ201310461580
【公开日】2015年4月15日申请日期:2013年9月30日优先权日:2013年9月30日
【发明者】须泽中, 郝飞, 卢家义申请人:上海爱聊信息科技有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：须泽中;郝飞;卢家义;
技术所有人：上海爱聊信息科技有限公司;
我是此专利的发明人