声带-喉室-声道联动的物理模型及精神压力检测方法

文档序号:9912694阅读:466来源:国知局
声带-喉室-声道联动的物理模型及精神压力检测方法
【技术领域】
[0001] 本发明涉及一种智能语音技术领域,特别涉及利用语音技术进行精神压力的检测 方法。
【背景技术】
[0002] 心理压力是指人们发现真实或想象的事情超出自己意料之外时的生理和精神上 的综合反映。心理学表明,过于沉重的压力会导致消极、痛苦的应激反应,引发如抑郁、紧 张、焦虑和愤怒等负面情绪,从而造成工作效率和生活质量的下降。心理学家认为,长期生 活在生活压力下会导致严重的心理疾病,并且使人体对疾病的敏感度增加,严重的甚至引 发癌症。而情感与压力存在着较为显著的相关关系,心理压力能诱发多种情感,如兴奋、失 落、厌烦等,而且在不同程度的压力源下,会引发不同程度的紧张情绪,所以情感可以说在 某种程度上是压力的一种外在表现形式,而且在程度上可以对压力进行量化。
[0003] 压力一个重要体现方式是说话人说话时的语音,成为影响语音产生非常重要的一 个影响因素。当周围环境或话者自身条件发生异常变化时,或者由于使用者大都专注于某 项工作,语音识别只是辅助于其它工作的次要工作,在这个过程中,这时由于工作压力的存 在,说话人受到精神压力,对话者发音将会有较大的影响,从而产生了异常状态,产生的语 音变异,而异常状态往往会体现在说话人的语音当中,形成了压力异常状态下的语音信号。
[0004] 但是,精神压力下的变异语音,特别是多任务脑负荷压力下的变异语音,从听觉上 的区分度相对较低,一般的声学特征不能将其正确分类,缺乏稳定性和鲁棒性。此外,由于 变异语音的生成机制与一般正常语音有比较显著的区别,在声学特征层面对变异状态的表 现程度较低,区分度相对不高。因此,在检测过程中,我们很难提高变异语音分类的可靠性。

【发明内容】

[0005] 本发明的目的是提供一种声带-喉室-声道联动的物理模型,以便于获得模拟语音 数据。
[0006] 为了解决上述技术问题,本发明提供了一种声带-喉室-声道联动的物理模型,包 括:
[0007] 用于描述声带运动模式的机械方程组,用于描述沿声门深度方向及喉室、假声带 和声道方向所对应压降分布的空气动力学方程组。
[0008] 进一来_ 太如《古辟钼仞拓.
[0009]
[0010]
[0011] (3)
[0012]上式(1)、(2)和(3)中,
[0013] mi、m2和Π 13分另丨」为用于构建声带模型的三个质量块,且该三个质量块依次排列;
[0014] Χ1、χ2和X3分别为三个质量块在垂直方向运动的位移;
[0015] kC1#PkC23分别为三个质量块之间两两耦合的弹簧刚性系数;
[0016] n、r#Pr3分别为三个质量块的等效粘滞阻尼系数;
[0017] FhFdPFs分别为三个质量块所受的强迫作用力;以及
[0018] S1、82和83分别表示与三个质量块相配合的弹簧,且表示为:
[0019] Si(xi) =ki(xi+nxi3) i = 1,2,3 (4)
[0020] 上式(4)中,i表示第i个质量块,1^表示与第i个质量块相配合的弹簧的刚性系数, η是弹簧的非线性系数。
[0021] 进一步,所述空气动力学方程组包括:
[0022] 沿声门深度方向的空气动力学子方程组,以及喉室、假声带和声道方向所对应压 降分布的空气动力学子方程组。
[0023] 讲一步,所沭沿声门深度方向的空气动力学子方稈组包括:
[0028] 上式(5)、(6)、(7)和(8)中,
[0029] Pn、Pi2表示第i个质量块入口处、出口处的压强;
[0030] Agl表示第i个质量块所对应的静态声门隙截面积;
[0031 ] Ug表示声门波,即通过声门的气流速度;
[0032] 0.37表示由于声门入口截面积的陡降,气流产生射流紧缩现象,导致声带与气管 连接处的压力降的影响损失系数;以及
[0033] Ps表示声门下压强,p表示空气密度,μ表示切变粘滞系数,lg表示声带模型的长 度,cU表示与第i个质量块相对应的声带模型的厚度。
[0034] 进一步,所述喉室、假声带和声道方向所对应压降分布的空气动力学子方程组包 括: L〇〇39J 上式(9)、(10)、(11)和(12)中,
[0040] Pv、Av分别表示喉室内压强、喉室截面积,PfdPPf2分别表示假声带两端的压强,Af 表示假声带的截面积,Ae表示喉室入口处的截面积,Μ ^:分别表示声道入口处的截面积、压 强。
[0041] 又一方面,在上述建立声带-喉室-声道联动的物理模型的基础上,本发明还提供 了一种基于语音生成建模的压力检测方法,以解决通过语音实现精神压力测试。
[0042]所述压力检测方法包括:
[0043]步骤S1,建立声带-喉室-声道联动的物理模型;
[0044] 步骤S2,通过所述物理模型,生成在真实世界中的相应压力下的模拟语音信号;
[0045] 步骤S3,根据生理参数估计算法,估计出说话人在相应压力状态下发声时的相应 生理参数,以建立语音信号对应的生理特征关系;
[0046]步骤S4,根据生理特征关系进行精神压力的检测。
[0047] 进一步,所述步骤S3中根据生理参数估计算法包括如下步骤:
[0048] 步骤S31,通过线性预测得到真实语音的声源信息,即残差信号;
[0049] 步骤S32,对残差信号进行傅里叶变换得到真实语音的频谱;
[0050] 步骤S32,将残差信号通过带通滤波器分离出高频分量和低频分量,并对该高频分 量和低频分量分别进行一次初拟合,以及将相应初拟合获得的相应参数作为二次拟合的初 始值;
[0051] 步骤S33,执行二次拟合,即获得所述模拟语音信号的频谱,进而构造基于语音频 谱的全局性特征的成本函数;
[0052]步骤S34,不断变化声带声道生理参数,以获得最小化成本函数,使得所述物理模 型生成新的语音信号,从而通过成本函数最小化在解空间里搜索最优解,实现对生理参数 进行估计。
[0053]第三方面,本发明还提供了一种基于语音的生理参数估计算法,以通过真实语音 数据与模拟语音数据实现对生理参数进行估计。
[0054] 所述基于语音的生理参数估计算法,包括如下步骤:
[0055] 步骤S1',获得真实语音的频谱及二次拟合的初始值;
[0056] 步骤S2',执行二次拟合,以构造基于语音频谱的全局性特征的成本函数;
[0057]步骤S3',根据成本函数对生理参数进行估计。
[0058]进一步,所述步骤S1'中获得真实语音的频谱及二次拟合的初始值的方法包括如 下步骤:
[0059] 步骤S11',通过线性预测得到真实语音的声源信息,即残差信号;
[0060] 步骤S12',对残差信号进行傅里叶变换得到真实语音的频谱,并将残差信号通过 带通滤波器分离出高频分量和低频分量,并对该高频分量和低频分量分别进行一次初拟 合,以及将相应初拟合获得的相应参数作为二次拟合的初始值;
[0061] 所述步骤S2'中执行二次拟合,以构造基于语音频谱的全局性特征的成本函数的 方法包括:执行二次拟合,即通过所述物理模型产生模拟语音信号,并获得该模拟语音信号 的频谱,进而构造基于语音频谱的全局性特征的成本函数;以及
[0062]所述步骤S3'中根据成本函数对生理参数进行估计的方法包括:
[0063]为了最小化成本函数,不断变化声带声道生理参数,使得所述物理模型生成新的 语音信号,从而通过成本函数最小化在解空间里搜索最优解,实现对生理参数进行估计。
[0064] 进一步,所述成本函数爻 .各 ' 1=1
[0065] ω )为模拟语音信号的频谱,而S( ω )为真实语音信号的频谱。
[0066]本发明的有益效果是,本发明的建立声带-喉室-声道联动的物理模型,并且通过 该物理模型设计生理参数估计算法,以便于研究在压力状态下发声的生理变异机制,即提 取出说话人压力状态下发声时的声带声道以及喉室等生理特征参数,建立从真实语音信号 到生理特征的关系;并且根据估计出的生理参数,获得各发声器官及其中气流流态在压力 变异因素影响下的变化特征,最终用以精神压力的检测,提高检测识别的精度与可靠性。
【附图说明】
[0067]下面结合附图和实施例对本发明进一步说明。
[0068]图1是本发明建立的声带-喉室-声
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1