实现来电情绪辨识的手机及方法

文档序号：7930445阅读：232来源：国知局

专利名称：实现来电情绪辨识的手机及方法
技术领域：
本发明涉及语音辨识技术，特别是关于一种实现来电情绪辨识的手机及方法。
背景技术：
根据研究，人类总共具有五种基本的情绪反应，包含生气(Anger)、厌倦(bored)、快乐(happy)、平常(neutral)及悲伤(sadness)。目前，忙碌的现代人与亲人、朋友、同事之间，常以电话作为沟通与连络感情的媒介，因为电话通信的非面对面性，所以时常不知对方在当前通话时的情绪状态，有时更会因为未能正确理解对方的说话含义而误解对方的情绪，从而说错话引起双方发生口角，造成不必要的误会。当今手机，如果能够在这方面提供使用者更进一步的感应数据，从而辨识出对方说话时的情绪，这样对于人与人之间感情交流的提升可以产生很好效果。

发明内容
鉴于以上内容，有必要提供一种实现来电情绪辨识的手机，能够在手机通话过程中辨识出对方的情绪状态。
此外，还有必要提供一种手机来电情绪辨识的方法，能够在手机通话过程中辨识出对方的情绪状态。
一种实现来电情绪辨识的手机，该手机包括语音录制单元，用于将对方的来电语音录制为模拟语音信号；A/D转换器，用于将模拟语音信号转换为数字语音信号；特征撷取单元，用于通过端点侦测原理切割数字语音信号中的有声语音数据和无声语音数据，并根据有声语音信号的频率大小从有声语音信号中撷取不同的特征参数；情绪分类器，用于根据有不同的特征参数读取有声语音信号对应的情绪特征数据，并对读取的情绪特征数据进行分类统计以产生情绪特征的分类统计数据；情绪输出单元，用于根据情绪分类器产生的分类统计数据产生来电对方的情绪分析报告。
一种手机来电情绪辨识的方法，该方法包括步骤将对方的来电语音录制为模拟语音信号；将模拟语音信号转换为数字语音信号；通过端点侦测原理将数字语音信号中的有声语音数据与无声语音数据切割开来；根据有声语音信号的频率大小从有声语音信号中撷取不同的特征参数；根据不同的特征参数读取有声语音信号对应的情绪特征数据；对读取的情绪特征数据进行分类统计以产生情绪特征的分类统计数据；根据所述的分类统计数据产生来电对方的情绪分析报告。
所述的实现来电情绪辨识的手机及方法，能够在手机通话过程中辨识出对方的情绪状态，从而提升通话双方之间的通话质量。

图l是本发明实现来电情绪辨识的手机较佳实施例的结构图。
图2是图1中的特征撷取单元利用端点侦测原理切割有声语音与无声语音的示意图。
图3是本发明实现手机来电情绪辨识的方法较佳实施例的流程图。
具体实施例方式
参阅图1所示，是本发明实现来电情绪辨识的手机10较佳实施例的结构图。在本实施例中，所述的手机10包括语音录制单元1、数模(A/D)转换器2、特征撷取单元3、存储器4、情绪分类器5、情绪输出单元6以及显示屏幕7。
所述的语音录制单元l用于将对方的来电语音录制为模拟语音信号，并将该模拟语音信号传送给A/D转换器2。
所述的A/D转换器2用于将模拟语音信号转换为数字语音信号。
所述的特征撷取单元3用于通过端点侦测原理将数字语音信号中的有声语音数据和无声语音数据切割开来，以便从数字语音信号中获取有声语音信号，并根据有声语音信号的频率大小从有声语音信号中撷取不同的特征参数。如何利用端点侦测原理将数字语音信号中的有声语音数据和无声语音数据进行切割将在下图2中进行详细描述。所述的特征参数是用于描述语音特征的声学参数，例如倒谱系数(Mel-Frequency C印strum Coefficients, MFCC)等。
所述的存储器4用于存储不同特征参数所对应的情绪特征数据。例如一个特征参数A与一个情绪特征数据(例如生气"angry")相对应。所述的情绪特征数据是手机制造商预先定义的，在本实施例中，该情绪特征数据直接存储在手机10的存储器4中。在其他实施例中，所述的情绪特征数据可以存储在手机运营商的网络数据库中。
所述的情绪分类器5用于根据不同的特征参数从存储器4中读取有声语音信号对应的情绪特征数据，并对读取的情绪特征数据进行分类统计以产生情绪特征的分类统计数据。情绪分类器5利用相近数据具有同类特征的原理对读取的情绪特征数据进行分类统计的，例如，若两个有声语音信号的MFCC值相差不大于一个预设值a，则该两个有声语音信号是相近的有声语音信号，且与同一个情绪特征(例如生气"angry")相对应。在本实施例中，情绪分类器5根据情绪特征的分类统计数据中统计值最高的情绪特征来判断对方当前情绪的，例如
5(sadness) =4，生气程度(angry) =2，快乐程度(happy) =1，中性程度(neutral) =1以及厌倦程度(bored) =0，则情绪分类器5判定该情绪类别就是"悲伤(sadness)"。
所述的情绪输出单元6用于根据情绪特征的分类统计数据产生来电对方的情绪分析报告，并将该情绪分析报告输出并显示在手机10的显示屏幕7上。所述的情绪分析报告包括生气程度、厌倦程度、快乐程度、平常程度及悲伤程度，从而让使用者了解对方通话时的情绪状态。
参阅图2所示，是图1中的特征撷取单元3利用端点侦测原理切割有声语音与无声语音的示意图。本实施例中，端点侦测主要目的是在切割出语音信号中的有声数据与无声数据，其依据某一个时间内语音信号中的能量和越零率。如图2所示，"Enl"表示一个能量保守值，若语音信号的能量小于等于该能量保守值"Enl"，则特征撷取单元3判定该语音信号为无声语音；若语音信号的能量大于该能量保守值"Enl"，则特征撷取单元3判定该语音信号为有声语音。"En2"表示一个比"Enl"大的开始能量值，若某一时刻"tl"的语音信号能量大于能量值"En2"，则该时刻"tl"即为该语音有声信号的开始。"EnEnd"表示一个比" Enl"小的终点能量值，若某一时刻"t2"的语音信号能量小于能量值"EnEnd"，则该时刻 "t2"即为该语音有声信号的结束。特征撷取单元3将时刻"tl"到时刻"t2"之间的按能量值的大小从语音信号中切割出声语音数据与无声语音数据。在图2中，同样可以采用越零率"ZCR"来切割出语音信号中的有声数据与无声数据，其判断依据与语音信号能量的判断原理相同，因此本实施例不再做详细地阐述。
参阅图3所示，是本发明手机来电情绪辨识的方法较佳实施例的流程图。语音录制单元 l将对方的来电语音录制为模拟语音信号，并将该模拟语音信号传送给A/D转换器2 (步骤 S31) 。 A/D转换器2将模拟语音信号转换为数字语音信号(步骤S32)。
特征撷取单元3通过端点侦测原理将数字语音信号中的有声语音数据和无声语音数据切割开来，以便从数字语音信号中获取有声语音信号(步骤S33)。特征撷取单元3根据有声语音信号的频率大小从有声语音信号中撷取不同的特征参数(步骤S34)，如何利用端点侦测原理切割数字语音信号中的有声语音数据和无声语音数据如图2描述。
情绪分类器5根据不同的特征参数从存储器4中读取有声语音信号对应的情绪特征数据( 步骤S35)。情绪分类器5对读取的情绪特征数据进行分类统计以产生情绪特征的分类统计数据(步骤S36)。情绪分类器5利用相近数据具有同类特征的原理对读取的情绪特征数据进行分类统计的。例如，特征撷取单元3撷取有声语音的MFCC参数，情绪分类器5将MFCC值进行相邻距离计算，取K个值距离最短的情绪数据定义语音的情绪特征，如果取1(=5，悲伤程度( sadness) =4，生气程度(angry) =2，快乐程度(happy) =1，中性程度(neutral) =1以及厌倦程度(bored) =0，则情绪分类器5判定该情绪类别就是"悲伤(sadness)"。
情绪输出单元6根据情绪分类器5产生的分类统计数据产生来电对方的情绪分析报告。所述的情绪分析报告描述了对方通话时的情绪状态，其包括生气程度、厌倦程度、快乐程度、平常程度以及悲伤程度(步骤S37)。最后，情绪输出单元6将该情绪分析报告输出并显示在手机10的显示屏幕7上，以供使用者了解对方通话时的情绪状态(步骤S38)。
以上实施例仅用以说明本发明的技术方案而非限制，尽管参照以上较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或等同替换都不应脱离本发明技术方案的精神和范围。
权利要求
1.一种实现来电情绪辨识的手机，其特征在于，该手机包括语音录制单元，用于将来电语音录制为模拟语音信号；A/D转换器，用于将模拟语音信号转换为数字语音信号；特征撷取单元，用于通过端点侦测原理切割数字语音信号中的有声语音数据和无声语音数据，并根据有声语音信号的频率大小从有声语音信号中撷取不同的特征参数；情绪分类器，用于根据不同的特征参数读取有声语音信号对应的情绪特征数据，并对读取的情绪特征数据进行分类统计以产生情绪特征的分类统计数据；及情绪输出单元，用于根据情绪分类器产生的分类统计数据生成来电对方的情绪分析报告。
2 如权利要求l所述的实现来电情绪辨识的手机，其特征在于，所述的情绪特征数据存储在手机的存储器中，或者存储在手机运营商的网络数据库中。
3 如权利要求l所述的实现来电情绪辨识的手机，其特征在于，所述的情绪分类器根据相近数据具有同类特征的原理对读取的情绪特征数据进行分类统计。
4 如权利要求l所述的实现来电情绪辨识的手机，其特征在于，所述的情绪输出单元还用于将所述的情绪分析报告输出并显示在手机的显示屏幕上。
5 如权利要求4所述的实现来电情绪辨识的手机，其特征在于，所述的情绪分析报告描述了对方通话时的情绪状态，包括生气程度、厌倦程度、快乐程度、平常程度以及悲伤程度。
6 一种手机来电情绪辨识的方法，其特征在于，该方法包括步骤将来电语音录制为模拟语音信号；将模拟语音信号转换为数字语音信号；通过端点侦测原理将数字语音信号中的有声语音数据与无声语音数据切割开来；根据有声语音信号的频率大小从有声语音信号中撷取不同的特征参数；根据不同的特征参数读取有声语音信号对应的情绪特征数据；对读取的情绪特征数据进行分类统计以产生情绪特征的分类统计数据；根据所述的分类统计数据产生来电对方的情绪分析报告。
7 如权利要求6所述的手机来电情绪辨识的方法，其特征在于，所述的情绪特征数据存储在手机的存储器中，或者存储在手机运营商的网络数据库中。
8 如权利要求6所述的手机来电情绪辨识的方法，其特征在于，所述的端点侦测原理依据语音信号中的能量和越零率来切割出语音信号中的有声数据与无声数据
9 如权利要求6所述的手机来电情绪辨识的方法，其特征在于，该方法还包括如下步骤将所述的情绪分析报告输出并显示在手机的显示屏幕上。
10 如权利要求9所述的手机来电情绪辨识的方法，其特征在于，所述的情绪分析报告描述了对方通话时的情绪状态，包括生气程度、厌倦程度、快乐程度、平常程度以及悲伤程度。
全文摘要
一种实现来电情绪辨识的手机包括语音录制单元，用于将来电语音录制为模拟语音信号；A/D转换器，用于将模拟语音信号转换为数字语音信号；特征撷取单元，用于切割数字语音信号中的有声语音数据，并从有声语音中撷取不同的特征参数；情绪分类器，用于根据不同的特征参数读取有声语音信号对应的情绪特征数据，并对情绪特征数据进行分类统计以产生情绪特征的分类统计数据；情绪输出单元，用于根据分类统计数据产生来电对方的情绪分析报告。本发明还提供一种手机来电情绪辨识的方法。实施本发明，能够在手机通话过程中辨识出对方的情绪状态。
文档编号H04M1/72GK101645961SQ20081030355
公开日2010年2月10日申请日期2008年8月6日优先权日2008年8月6日
发明者张唐瑜申请人:深圳富泰宏精密工业有限公司;奇美通讯股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张唐瑜
技术所有人：深圳富泰宏精密工业有限公司;奇美通讯股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。