基于残差信号频谱重构的声码器的制作方法

文档序号:2833288阅读:300来源:国知局
专利名称:基于残差信号频谱重构的声码器的制作方法
技术领域
本发明涉及电子行业信号处理技术领域,尤其涉及一种基于残差信号频谱重构的声码器。
背景技术
声码器技术是和谐人机交互技术中的ー个重要组成部分,它能够对ー个人的声音进行处理,使之能够合成出自然流畅的语音,其研究成果对语音编码技木、參数语音合成技术、人机交互技术等的发展具有重要的意义。而目前的声码器术采用脉冲加白噪声激励模型,这种激励模型用脉冲串或高斯白噪声来构建激励信号。由于脉冲串周期性过强,采用这种激励模型合成语音音质不高。
此外,传统的基于谱參数的周期频谱计算方法,往往只能拟合出频谱的共振峰结构,而造成频谱精细结构的丢失。基于时域的周期激励建模方法,往往会在做周期采样时造成高频段能量的丢失。基于码本的周期频谱估计模块,往往会在挑选码值时出现过平滑的情況。

发明内容
(一 )要解决的技术问题为解决上述的一个或多个问题,本发明提供了一种基于残差信号频谱重构的声码器,以提高合成语音的音质。( ニ )技术方案根据本发明的ー个方面,提供了一种基于残差信号频谱重构的声码器,包括參数提取模块,用于接收待分析的语音数据,加窗分帧,计算基频參数和频谱參数;逆滤波模块,与參数提取模块相连接,用于根据频谱參数设计逆滤波器对语音数据逆滤波,获得逆滤波后的残差信号;周期信号支路,与逆滤波模块相连接,用于根据基频參数和逆滤波后的残差信号,生成周期激励信号;非周期信号支路,与逆滤波模块相连接,用于根据基频參数和逆滤波后的残差信号,生成非周期激励信号;以及參数语音合成器模块,与周期信号支路和非周期信号支路相连接,用于根据周期频谱參数、周期激励信号和非周期激励信号,调用语音合成器合成语音。(三)有益效果从上述技术方案可以看出,本发明基于残差信号频谱重构的声码器具有以下有益效果:(I)本发明中,对逆滤波后的残差信号进行建模,使生成的激励信号具有较高的准确性,从而提高了合成语音的音质;(2)本发明中,在周期频谱估计模块,通过Pitch-Scaled分析方法来提取周期频谱的精细结构,采用主成分分解方法来对周期频谱进行降维,在最大程度上保留了周期频谱的完整性和内插特性,不需要任何手工标注信息,从而大大降低了系统实现的复杂度和人工參与程度;(3)本发明中,在周期激励生成模块,采用重构残差信号的频谱,逆傅里叶变换合成周期激励信号,能够有效去除合成语音的机器声,同时去除零频段半个谐波的干扰;(4)本发明中,在非周期能量估计模块,利用了光滑曲线来拟合谐波噪声比,能够很好的控制低频段的谐波不被噪声破坏,同时保证合成语音具有较高的自然度;(5)本发明中,在非周期激励生成模块,采用无限冲激响应滤波器的方法,可以通过非周期能量曲线构建无限冲激响应滤波器,只需要一次IDFT和滤波就可以生成非周期激励信号。


图I是本发明实施例基于逆滤波残差信号频谱重构的声码器的结构示意图;图2是本发明实施例基于逆滤波残差信号频谱重构声码器中周期频谱估计模块的结构不意图;图3是本发明实施例基于逆滤波残差信号频谱重构声码器中周期激励生成模块的结构不意图;图4是本发明实施例基于逆滤波残差信号频谱重构声码器中非周期能量估计模块的结构示意图;图5是本发明实施例基于逆滤波残差信号频谱重构声码器中非周期激励生成模块的结构示意图;图6是本发明本发明实施例基于逆滤波残差信号频谱重构声码器中參数语音合成模块的结构示意图。主要元件符号说明I-參数提取模块;2-逆滤波模块;3-周期频谱估计模块; 4-周期激励生成模块;5-非周期能量估计模块;6-非周期激励生成模块;7-參数语音合成器模块;31-频谱计算子模块; 32-子带划分子模块;33-归一化子模块;34-主成分分解子模块;41-周期频谱重构模块; 42-周期激励生成模块;51-频谱计算子模块; 52-非周期度量子模块; 53-最大谐波频率估计模块;54_曲线拟合模块;61-非周期能量曲线生成模块。
具体实施例方式为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并參照附图,对本发明进ー步详细说明。需要说明的是,在附图或说明书描述中,相似或相同的部分都使用相同的图号。且在附图中,以简化或是方便标示。再者,附图中未绘示或描述的实现方式,为所属技术领域中普通技术人员所知的形式。另外,虽然本文可提供包含特定值的參数的示范,但应了解,參数无需确切等于相应的值,而是可在可接受的误差容限或设计约束内近似于相应的值。本发明基于残差信号频谱重构的声码器中,分析语音数据的频谱參数、基频、残差信号的周期频谱和非周期能量,用残差信号的周期频谱和非周期能量构建激励信号来复现逆滤波后的残差信号,在激励建模过程中,不需要人工介入,可对任何输入语音进行激励建模。在本发明的一个示例性实施例中,提出了一种基于残差信号频谱重构的声码器。图I为本发明实施例基于残差信号频谱重构声码器的结构示意图。如图I所示,本实施例包括參数提取模块1,用于接收待分析的语音数据,加窗分帧,计算基频參数和频谱參数;逆滤波模块2,与參数提取模块I相连接,用于接收频谱參数和输入端语音数据,根据频谱參数设计逆滤波器对语音数据逆滤波,获得逆滤波后的残差信号;周期频谱估计模块3,与逆滤波模块2相连接,用于根据基频參数和逆滤波后的残差信号,计算周期频谱參数;周期激励生成模块4,与周期频谱估计模块3相连接,用于根据基频參数和周期频谱參数,构建ー个周期的频谱,通过逆傅里叶变换生成周期激励信号;非周期能量估计模块5,与逆滤波模块2相连接,用于根据基频參数和逆滤波后的残差信号计算非周期能量參数;非周期激励生成模块6,与非周期能量估计模块5相连接,用于根据非周期能量參数,构建滤波器对高斯白噪声滤波生成非周期激励信号;以及,參数语音合成器模块7,与周期激励生成模块4和非周期激励生成模块6相连接,用于根据频谱參数、周期激励信号和非周期激励信号,调用语音合成器合成语音。本发明中,对逆滤波后的残差信号进行建模,使生成的激励信号具有较高的准确性,从而提高了合成语音的音质。以下分别对各个模块进行详细说明。本实施例中,參数提取模块所实现的方式在现有技术中均可以找到,其中的具体參数如下窗长为25ms,帧移为5ms。对于不同帧来讲,基频參数和频谱參数(线性预测系数)随之变化,两者提取的方法可以采用自相关方法,也可以采用本领域公知的其他方法。
图2是本发明实施例基于逆滤波残差信号频谱重构声码器中周期频谱估计模块的结构示意图。如图2所示,周期频谱估计模块3包括频谱计算子模块31,与逆滤波模块2相连接,用于根据逆滤波后的残差信号,加窗分帧进行傅里叶分析得到频谱幅度值向量;其中,在进行加窗分帧时,帧长为两个周期长度,傅里叶分析的长度也为两个周期的长度。本领域普通技术人员可以根据实际需要调整帧长和傅里叶分析的长度,它们的范围均为I 10周期长度。子带划分子模块32,与频谱计算模块31相连接,用于根据频谱幅度值向量的频率值提取周期频谱;其中,频谱幅度值向量的频率通过采样点与采样率使用以下的公式确定N = 2*fs/f0(I)fk = fs*k/N = fs*k/ (2*fs/f0) = f0*k/2 (2)其中N为傅里叶分析的长度,fs为语音信号的采样频率,f0为该帧语音信号的基频,k为样点,fk为对应样点的频率。归ー化子模块33,与子带划分模块32相连接,用于对周期频谱进行能量和长度的归ー化;
其中,归ー化长度通过统计周期长度使用以下公式确定

权利要求
1.一种基于残差信号频谱重构的声码器,包括 參数提取模块,用于接收待分析的语音数据、加窗分帧、计算基频參数和频谱參数;逆滤波模块,与所述參数提取模块相连接,用于根据所述频谱參数设计逆滤波器对所述语音数据逆滤波,获得逆滤波后的残差信号; 周期信号支路,与所述逆滤波模块相连接,用于根据所述基频參数和逆滤波后的残差信号,生成周期激励信号; 非周期信号支路,与所述逆滤波模块相连接,用于根据所述基频參数和逆滤波后的残差信号,生成非周期激励信号;以及 參数语音合成器模块,与所述周期信号支路和非周期信号支路相连接,用于根据所述周期频谱參数、周期激励信号和非周期激励信号,调用语音合成器合成语音。
2.根据权利要求I所述的基于残差信号频谱重构的声码器,其中,所述周期信号支路包括 周期频谱估计模块,与所述逆滤波模块相连接,用于根据所述基频參数和逆滤波后的残差信号,计算周期频谱參数; 周期激励生成模块,与所述周期频谱估计模块相连接,用于根据所述基频參数和周期频谱參数,构建ー个周期的频谱,通过逆傅里叶变换生成周期激励信号。
3.根据权利要求2所述的基于残差信号频谱重构的声码器,其中,所述周期频谱估计模块包括 频谱计算子模块,与所述逆滤波模块相连接,用于根据所述逆滤波后的残差信号,加窗分帧进行傅里叶分析得到频谱幅度值向量; 子带划分子模块,与所述频谱计算模块相连接,用于根据所述频谱幅度值向量的频率值提取周期频谱; 归ー化子模块,与所述子带划分模块相连接,用于根据所述周期频谱,进行能量和长度的归ー化; 主成分分解子模块,与所述归ー化模块相连接,用于根据所述归ー化周期频谱,通过主成分分解进行降維。
4.根据权利要求3所述的基于残差信号频谱重构的声码器,其中, 所述频谱计算子模块,用于采用两个周期长度为帧长来对逆滤波后的残差信号加窗分帧。
5.根据权利要求3所述的基于残差信号频谱重构的声码器,其中, 所述子带划分子模块,用于采用以下公式,根据频谱幅度值向量的频率值提取频谱幅度值向量的频率N = 2*fs/f0fk = fs*k/N = fs*k/ (2*fs/f。)= f0*k/2 其中,N为傅里叶分析的长度,fs为语音信号的采样频率,f0为该帧语音信号的基频,k为样点,fk为对应样点的频率。
6.根据权利要求3所述的基于残差信号频谱重构的声码器,其中, 所述归ー化子模块中,用于采用以下公式定义归一化后的周期频谱长度;
7.根据权利要求2所述的基于残差信号频谱重构的声码器,其中,所述周期激励生成模块包括 周期频谱重构子模块,与所述周期频谱估计模块相连接,用于根据周期频谱參数,由主成分重构方法重构出周期频谱; 周期激励生成子模块,与周期频谱重构模块相连接,用于根据基频和重构出的周期频谱提取单个周期长度的频谱,采用逆傅里叶变换生成单个周期的周期激励信号,通过同步叠加生成周期激励信号。
8.根据权利要求7所述的基于残差信号频谱重构的声码器,其中, 所述周期频谱重构模块,用于采用以下公式根据周期频谱參数进行主成分重构X = YVt 其中,Y为周期频谱參数,Vt为主成分分解后特征向量的转置,X为重构出的周期频谱。
9.根据权利要求I所述的基于残差信号频谱重构的声码器,其中,所述非周期信号支路包括 非周期能量估计模块,与所述逆滤波模块相连接,用于根据所述基频參数和逆滤波后的残差信号计算非周期能量參数; 非周期激励生成模块,与所述非周期能量估计模块相连接,用于根据所述非周期能量參数,构建滤波器对高斯白噪声滤波生成非周期激励信号。
10.根据权利要求9所述的基于残差信号频谱重构的声码器,其中,所述非周期能量估计模块包括 频谱计算子模块,与逆滤波模块相连接,用于根据逆滤波后的残差信号,加窗分帧进行傅里叶分析得到频谱幅度值; 非周期度量子模块,与频谱计算模块相连接,用于通过频谱上的周期和非周期领域来构建ー个三角形以及将这个三角形的面积和对称性的比值作为非周期能量值,多个非周期能量值构成非周期能量曲线; 最大谐波频率估计子模块,与非周期度量子模块相连接,用于根据非周期能量曲线,定义该曲线的最大斜率为最大谐波频率,通过Viterbi算法寻找最优的最大谐波频率; 曲线拟合子模块,与最大谐波频率估计子模块相连接,用于根据非周期能量曲线和最大谐波频率曲线,拟合出非周期能量的光滑曲线。
11.根据权利要求10所述的基于残差信号频谱重构的声码器,其中, 所述频谱计算子模块,用于采用10个周期长度的帧长进行加窗分帧,采用10个周期长度进行傅里叶变换。
12.根据权利要求10所述的基于残差信号频谱重构的声码器,其中,所述非周期度量子模块中,使用以下公式确定频谱上的周期和非周期领域Pi = {k I ki-2N/M ≤k ≤ki+2Ν/Μ}Di = {k I ki_1+2N/M ≤k ≤V2N/M} 其中,Pi为周期领域,Di为非周期领域,N为傅里叶分析的长度,M为分帧长度,2N/M为窗的旁瓣的宽度,も为第i次谐波的位置。
13.根据权利要求12所述的基于残差信号频谱重构的声码器,其中,所述非周期度量子模块中,三角形的定义为ー个周期领域的最大采样点、该周期领域左邻居的非周期领域的最大值和该周期领域右邻居的非周期领域的最大值,使用以下公式计算三角形的面积和对称性的比值 Symmetry = (Pleft-Pright) /PharmonicArea = 2* (PharmoniC_Pright) _ · (Pieft-Pright) 0· 5* (^harmonic ^right^ · 5* (Pharmonic Pleft)Aperiodicity = Symmetry/Area 其中,Phanroni。为ー个周期领域的最大值,Pleft为该周期领域左邻居的非周期领域的最大值,Pright为该周期领域右邻居的非周期领域的最大值。
14.根据权利要求10所述的基于残差信号频谱重构的声码器,其中,所述最大谐波频率估计子模块中,使用以下公式由能量最小化确定非周期谐波频率Dash (k) = sum(abs([zeros(I, k) ;ones (I, length-k+1)」_Ap)) 其中,sum()为求和函数,abs ()为绝对值函数,zeros O为取零函数,ones O为取ー函数,length为非周期能量的长度,Ap为非周期能量,k为ー个分裂点。
15.根据权利要求14所述的基于残差信号频谱重构的声码器,其中,所述最大谐波频率子估计模块中,使用以下公式利用Viterbi算法捜索最优的最大谐波频率路径T_Cost(i, j) = Dash(i,j)C_Cost(j, k) = exp (abs(j-k)) * a Score (i, j) = min (T_Cost (i, j) +C_Cost (j, k) +Score (i, k)) 其中,T_Cost为目标代价,C_Cost为拼接代价,a为平滑系数,Score为路径的总得分,i,j为帧索引,k为候选最大谐波频率索引。
16.根据权利要求10所述的基于残差信号频谱重构的声码器,其中,所述曲线拟合子模块中,使用以下公式拟合非周期能量曲线
17.根据权利要求9所述的基于残差信号频谱重构的声码器,其中,所述非周期激励生成模块包括 非周期能量曲线生成子模块,与非周期能量估计模块相连接,用于根据拟合曲线的參数,最大谐波频率和斜率參数,分高频段和低频段构建非周期能量曲线; 非周期滤波器构建子模块,与非周期能量曲线生成子模块相连接,用于根据非周期曲线和高斯白噪声,采用非周期曲线构建无限冲激响应滤波器,对高斯白噪声滤波得到非周期激励信号。
18.根据权利要求17所述的基于残差信号频谱重构的声码器,其中,所述非周期能量曲线生成子模块,用于采用以下公式分别构建高频段和低频段的非周期能量曲线
19.根据权利要求I至18中任一项所述的基于残差信号频谱重构的声码器,其中,所述參数语音合成模块包括 LPC合成器子模块,与周期激励生成模块和非周期激励生成模块相连接,用于根据周期激励信号和非周期激励信号,通过LPC合成器合成出语音。
全文摘要
本发明提供了一种基于残差信号频谱重构的声码器,包括参数提取模块,用于接收待分析的语音数据、计算基频参数和频谱参数;逆滤波模块,用于根据频谱参数设计逆滤波器对语音数据逆滤波,获得残差信号;周期信号支路,与逆滤波模块相连接,用于根据基频参数和逆滤波后的残差信号,生成周期激励信号;非周期信号支路,与逆滤波模块相连接,用于根据基频参数和逆滤波后的残差信号,生成非周期激励信号;以及参数语音合成器模块,与周期信号支路和非周期信号支路相连接,用于根据周期频谱参数、周期激励信号和非周期激励信号,调用语音合成器合成语音。本发明对逆滤波后的残差信号进行建模,使激励信号具有较高的准确性,提高了合成语音的音质。
文档编号G10L19/12GK102750955SQ20121025394
公开日2012年10月24日 申请日期2012年7月20日 优先权日2012年7月20日
发明者温正棋, 陶建华 申请人:中国科学院自动化研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1