声带-喉室-声道联动的物理模型及精神压力检测方法_2

文档序号:9912694阅读:来源:国知局
道联动的物理模型对应的结构图;
[0069]图2是基于语音生成建模的压力检测方法的方法流程图;
[0070]图3是生理参数估计算法框图;
[0071]图4是生理参数估计算法流程图;
[0072]图5是本发明验证有效性的实验结果图。
【具体实施方式】
[0073] 现在结合附图对本发明作进一步详细的说明。这些附图均为简化的示意图,仅以 示意方式说明本发明的基本结构,因此其仅显示与本发明有关的构成。
[0074] 实施例1
[0075] 如图1所示,本发明的一种声带-喉室-声道联动的物理模型,包括:
[0076] 用于描述声带运动模式的机械方程组,用于描述沿声门深度方向及喉室、假声带
[0078] 和声道方向所对应压降分布的空气动力学方程组。[0077] 具体的,所述机械方程组包括:
[0079]
[0080]
[0081]上式(1)、(2)和(3)中,
[0082] mi、m2和m3分别为用于构建声带模型的三个质量块,且该三个质量块依次排列; [0083] X1、X2和X3分别为三个质量块在垂直方向运动的位移;
[0084] kC1#PkC23分别为三个质量块之间两两耦合的弹簧刚性系数;
[0085] n、r#Pr3分别为三个质量块的等效粘滞阻尼系数;
[0086] 分别为三个质量块所受的强迫作用力;以及
[0087] 81、82和83分别表示与三个质量块相配合的弹簧,且表示为:
[0088] Si(xi) =ki(xi+nxi3) i = 1,2,3 (4)
[0089] 上式(4)中,i表示第i个质量块,1^表示与第i个质量块相配合的弹簧的刚性系数, η是弹簧的非线性系数。
[0090] 在时变条件下,考虑空气质量的惯性,所述空气动力学方程组包括:沿声门深度方 向的空气动力学子方程组,以及喉室、假声带和声道方向所对应压降分布的空气动力学子 方程组。
[0091] 其中,所述沿声门深度方向的空气动力学子方程组包括:
[0096] 上式(5)、(6)、(7)和(8)中,
[0097] Pii、Pi2表不第i个质量块入口处、出口处的压强;
[0098] Agl表示第i个质量块所对应的静态声门隙截面积;
[0099] Ug表示声门波,即通过声门的气流速度;
[0100] 0.37表示由于声门入口截面积的陡降,气流产生射流紧缩现象,导致声带与气管 连接处的压力降的影响损失系数;以及
[0101] ps表示声门下压强,P表示空气密度,μ表示切变粘滞系数,lg表示声带模型的长 度,CU表示与第i个质量块相对应的声带模型的厚度。
[0102] 当说话人处于压力状态,尤其会使得喉室和假声带附近的气流流态发生较为显著 的变化。因此,本物理模型需要进一步扩展,即需考虑对喉室、假声带、声道方向(声门上喉 部中气流)建立相应的方程组。
[0103] 具体的,所述喉室、假声带和声道方向所对应压降分布的空气动力学子方程组包 括:
[0108] 上式(9)、(10)、(11)和(12)中,
[0109] Pv、Av分别表示喉室内压强、喉室截面积,PfjPPf2分别表示假声带两端的压强,A f 表示假声带的截面积,Ae表示喉室入口处的截面积,Μ ^:分别表示声道入口处的截面积、压 强。
[0110]根据空气动力学理论,推导分析压力状态下发声器官的工作运动机制以及其中气 流压力分布规律,以此构造声学等效电路,从而建立语音生成的声带-喉室-声道联动的物 理模型。通过该物理模型模拟声带的运动,可以由声门气流速度仏可以推导出气流通过口 唇时的速度,故所模拟的语音信号即是口唇处气流速度的微分-声压。模拟构造出不同的语 音信号后,可以得到模拟语音信号的频谱,记作#( ω )。
[0111] 实施例2
[0112] 在实施例1基础上,本实施例2提供了一种基于语音生成建模的压力检测方法,包 括:
[0113]步骤S1,建立声带-喉室-声道联动的物理模型;
[0114] 步骤S2,通过所述物理模型,生成在真实世界中的相应压力下的模拟语音信号;
[0115] 步骤S3,根据生理参数估计算法,估计出说话人在相应压力状态下发声时的相应 生理参数,以建立语音信号对应的生理特征关系;
[0116]步骤S4,根据生理特征关系进行精神压力的检测。
[0117]本压力检测方法采用分析合成(Analysis by Synthesis)的拟合方法建立模型与 现实中语音数据的联系,比较模型生成的波形与真实语音信号的波形,通过使成本函数最 小化在解空间里搜索最优解,通过模型的拟合对所需的参数进行估计,进而实现精神压力 的检测。
[0118] 所述步骤S3中根据生理参数估计算法包括如下步骤:
[0119] 步骤S31,通过线性预测(LPC)得到真实语音的声源信息,即残差信号;
[0120] 步骤S32,对残差信号进行傅里叶变换(FFT)得到真实语音的频谱;
[0121] 步骤S32,将残差信号通过带通滤波器分离出高频分量和低频分量,并对该高频分 量和低频分量分别进行一次初拟合,以及将相应初拟合获得的相应参数作为二次拟合的初 始值;
[0122] 具体的,初拟合中使用的局部性成本函数(分为高频成本函数、低频成本函数),主 要使用信号的局部特征来进行构造,局部性成本函数可以对影响基频和明瞭度的语音产生 激励源进行分析,通过语音中高频分量的捕捉和分析,结合频谱高频带谐波结构的平坦型 和不规则性,从而构造成本函数可以更高效地模拟变异语音,通过基频估计,即基频(F0)来 构造低频成本函数,而使用嘹亮度分析,即Spectral Flatness Measure(SFM)反映频带谐 波结构的不规则性来进行高频成本函数的构造。
[0123] 对于低频分量的模型拟合,主要是估计出影响语音信号基频的k#Pkc12(实验证明 k2、k3以及kc23对变异语音的生成影响不大)。而对高频分量的模型拟合,所估计的参数是反 映语音嘹亮度特征SFM的喉室横截面积参数Αν。将所得到的lu、k C12以及Αν作为初始参数值, 带入到二次拟合中。其中关于ki、kci2的定义,见实施例1的相关论述。
[0124] 步骤S33,执行二次拟合,即获得所述模拟语音信号的频谱,进而构造基于语音频 谱的全局性特征的成本函数;
[0125] 具体的,模拟语音信号通过相应线性预测的残差信号进行傅里叶变换得到模拟语 音信号的频谱,比较真实语音与模拟语音信号,构造基于语音频谱的全局性特征成本函数。 全局性成本函数可以通过目标语音的频域频谱进行直接全局构造,以便于捕捉到更加深入 本质并且更加稳定的有用信息。
[0126]
[0127] ω )为模拟语音信号的频谱,而S( ω )为真实语音信号的频谱。
[0128] 步骤S34,不断变化声带声道生理参数,以获得最小化成本函数(全局性特征的成 本函数),使得所述物理模型生成新的语音信号,从而通过成本函数最小化在解空间里搜索 最优解,实现对生理参数进行估计。
[0129] 具体的,估计的生理参数包括声带的刚性系数、声门下压、喉室横截面积以及声门 上声道面积。对于最优解搜索方法,可以采用Nelder-Mead单纯形法,以其很强的局部搜索 能力,可以加快算法的收敛速度,实现搜索算法的高效性。
[0130]所述步骤S4中根据生理特征关系进行精神压力的检测。
[0131]具体的,估计出的生理参数对于压力状态的敏感度,可以分析发声生理系统在压 力状态下所受的影响。通过KNN分类算法对压力下变异语音和正常状态下语音的进行识别 分类,实现所提出方法中生理参数对于压力状态的敏感度的评价,从而对所提出方法的有 效性进行验证。
[0132] 实施例3
[0133] 在实施例1和2的基础上,本实施例3还提供了一种基于语音的生理参数估计算法, 包括如下步骤:
[0134] 步骤S1',获得真实语音的频谱及二次拟合的初始值;
[0135] 步骤S2',执行二次拟合,以构造基于语音频谱的全局性特征的成本函数;
[0136] 步骤S3',根据成本函数对生理参数进行估计。
[0137] 所述步骤S1'中获得真实语音的频谱及二次拟合的初始值的方法包括如下步骤:
[0138] 步骤S11',通过线性预测得到真实语音的声源信息,即残差信号;
[0139] 步骤S
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1