一种针对烦躁情绪的可据判的自动语音情感识别方法

文档序号:2830188阅读:291来源:国知局
专利名称:一种针对烦躁情绪的可据判的自动语音情感识别方法
技术领域
本发明涉及一种语音识别方法,特别涉及一种针对烦躁情绪的可据判的自动语音 情感识别方法。
背景技术
在人工智能中,情感计算被认为是赋予计算机更高的、全面的智能的一个关键途 径。在人机交互中,赋予计算机拟人的情感能力,使其能感知周围的环境和气氛,自适应提 供最舒适的交互环境,尽量消除人和机器之间的障碍,已经成为下一代计算机发展的目标。 语音情感识别技术运用模式识别的方法从语音信号中提取出说话人的情感状态信息,从而 使计算机能够自动的识别语音情感,是情感计算的一个重要部分,是自然人机交互的一个 重要基础。在本发明之前,语音情感识别的研究主要集中在基本情感类别论中指出的几种情 感,包括喜悦、愤怒、惊讶、悲伤和恐惧等,但对于烦躁等具有特殊意义的语音情感缺乏研 究。目前的语音情感识别方法不能对烦躁情绪进行较好的识别。对烦躁情绪状态的识别具 有很高的应用价值,特别是在航空航天等军事应用领域中,长时间的、枯燥的、高强度的任 务会使相关人员面临严酷的生理以及心理考验,引发烦躁等一些负面的情绪。烦躁情绪出 现后,如果不妥善的处理,对人员的工作能力会造成重大的影响,甚至引起人为的疏忽导致 事故。探讨烦躁等负面情绪对于人类认知活动的作用机制和影响因素,研究提高个体认知 和工作效率的方法、避免影响认知和工作能力的因素,具有重大的实际意义。目前在语音情感识别研究中,面临着情感语料真实度的问题。通过表演的方式采 集的情感语料数据,称为表演语料。目前大部分的语音情感识别研究是基于表演语料的。表 演语料的优点是容易采集,缺点是情感表现夸张,与实际的自然语音有一定的差别,因此导 致表演数据的可靠性较差。基于表演情感语料建立情感识别系统,由于用于识别模型训练 的数据与实际的数据有一定的差别,导致了在实际条件下识别性能的下降。通过诱发的方 法采集的情感语料称为诱发语料。诱发语料的特点是自然度较高,而且便于通过实验心理 学的方法控制获得所需要的特定情感的语料。在本发明之前,在中文语音情感识别中还没 有烦躁情绪的诱发语料库。人类的情感具有模糊性和多样性,在语音情感识别中,传统的识别方法是将出现 的样本硬性的划分为已知类别中的某一类,然而在现实中存在较多模糊不清的情感样本 时,分类的可信度就较差,误判的概率就较高。

发明内容
本发明目的在于填补语音情感识别技术在实际应用中的空白之处,提供一种针对 烦躁情绪的可据判的自动语音情感识别方法。本发明为实现上述目的,采用如下技术方案本发明一种针对烦躁情绪的可据判的自动语音情感识别方法,包括如下步骤
(1)建立烦躁语音数据库;(2)提取语音情感特征;(3)特征选择(3-1)采用fisher准则进行特征评价=Hsher判别准则用式(1)表示
权利要求
一种针对烦躁情绪的可据判的自动语音情感识别方法,包括如下步骤(1)建立烦躁语音数据库;(2)提取语音情感特征;其特征在于还包括如下步骤(3)特征选择(3 1)采用fisher准则进行特征评价fisher判别准则用式(1)表示 <mrow><mi>f</mi><mrow> <mo>(</mo> <mi>d</mi> <mo>)</mo></mrow><mo>=</mo><mfrac> <mn>1</mn> <msubsup><mi>C</mi><mi>m</mi><mn>2</mn> </msubsup></mfrac><munder> <mi>&Sigma;</mi> <mrow><mn>0</mn><mo>&lt;</mo><mi>i</mi><mo>&lt;</mo><mi>j</mi><mo>&lt;</mo><mi>m</mi> </mrow></munder><mfrac> <msup><mrow> <mo>(</mo> <msub><mi>&mu;</mi><mi>id</mi> </msub> <mo>-</mo> <msub><mi>&mu;</mi><mi>jd</mi> </msub> <mo>)</mo></mrow><mn>2</mn> </msup> <mrow><msubsup> <mi>&sigma;</mi> <mi>id</mi> <mn>2</mn></msubsup><mo>+</mo><msubsup> <mi>&sigma;</mi> <mi>jd</mi> <mn>2</mn></msubsup> </mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo></mrow> </mrow>其中μ为特征值的均值,σ为特征值的标准差,m为类别的总数,d为维度。(4)可据判的识别方法(4 1)采用GMM对烦躁、喜悦和平静三种情感进行建模,每种情感对应一个GMM模型,通过最大后验概率准则判决xi表示第i条语句样本,λj表示第j个情感类别,最大后验概率表示为 <mrow><mi>p</mi><mrow> <mo>(</mo> <msub><mi>&lambda;</mi><mi>j</mi> </msub> <mo>|</mo> <msub><mi>x</mi><mi>i</mi> </msub> <mo>)</mo></mrow><mo>=</mo><mfrac> <mrow><mi>p</mi><mrow> <mo>(</mo> <msub><mi>x</mi><mi>i</mi> </msub> <mo>|</mo> <msub><mi>&lambda;</mi><mi>j</mi> </msub> <mo>)</mo></mrow><mi>P</mi><mrow> <mo>(</mo> <msub><mi>&lambda;</mi><mi>j</mi> </msub> <mo>)</mo></mrow> </mrow> <mrow><mi>P</mi><mrow> <mo>(</mo> <msub><mi>x</mi><mi>i</mi> </msub> <mo>)</mo></mrow> </mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo></mrow> </mrow>待识别的样本判决为 <mrow><msup> <mi>j</mi> <mo>*</mo></msup><mo>=</mo><mi>arg</mi><munder> <mi>max</mi> <mi>j</mi></munder><mi>p</mi><mrow> <mo>(</mo> <msub><mi>x</mi><mi>i</mi> </msub> <mo>|</mo> <msub><mi>&lambda;</mi><mi>j</mi> </msub> <mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo></mrow> </mrow>其中,j*表示样本所属的类别;(4 2)采用一种基于似然概率模糊熵的拒判方法对样本与情感类别之间的符合程度进行度量,从而实现对未知类别样本的拒判对烦躁、喜悦和平静三种情感类别的GMM模型,可以得到3个GMM似然概率密度值,分别代表样本与三个情感类别的符合程度;似然概率密度值构成的判决集合的模糊熵越高表示样本属于烦躁、喜悦和平静三种情感的不确定程度越大,当模糊熵超过一定阈值Th时则发生拒判 <mrow><mfrac> <mn>1</mn> <mi>C</mi></mfrac><munderover> <mi>&Sigma;</mi> <mrow><mi>j</mi><mo>=</mo><mn>1</mn> </mrow> <mi>C</mi></munderover><mi>arctan</mi><mrow> <mo>(</mo> <mi>p</mi> <mrow><mo>(</mo><msub> <mi>x</mi> <mi>i</mi></msub><mo>|</mo><msub> <mi>&lambda;</mi> <mi>j</mi></msub><mo>)</mo> </mrow> <mo>/</mo> <mn>10</mn> <mo>)</mo></mrow><mrow> <mo>(</mo> <mi>ln</mi> <mrow><mo>(</mo><mi>&pi;</mi><mo>/</mo><mn>2</mn><mo>)</mo> </mrow> <mo>)</mo></mrow><mo>-</mo><mi>ln</mi><mi>arctan</mi><mrow> <mo>(</mo> <mi>p</mi> <mrow><mo>(</mo><msub> <mi>x</mi> <mi>i</mi></msub><mo>|</mo><msub> <mi>&lambda;</mi> <mi>j</mi></msub><mo>)</mo> </mrow> <mo>/</mo> <mn>10</mn> <mo>)</mo> <mo>)</mo></mrow><mo>></mo><mi>Th</mi><mo>-</mo><mo>-</mo><mo>-</mo><mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo></mrow><mo>.</mo> </mrow>
全文摘要
本发明公布了一种针对烦躁情绪的可据判的自动语音情感识别方法,包括如下步骤(1)建立烦躁语音数据库;(2)提取语音情感特征;(3)特征选择采用fisher准则进行特征评价;(4)可据判的识别方法(4-1)采用GMM对烦躁、喜悦和平静三种情感进行建模,每种情感对应一个GMM模型,通过最大后验概率准则判决;(4-2)采用一种基于似然概率模糊熵的拒判方法对样本与情感类别之间的符合程度进行度量,从而实现对未知类别样本的拒判。本发明具有较好的烦躁情绪的识别性能。
文档编号G10L15/02GK101937678SQ20101023051
公开日2011年1月5日 申请日期2010年7月19日 优先权日2010年7月19日
发明者余华, 王开, 赵力, 邹采荣, 黄程韦 申请人:东南大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1