一种基于文本信息的幸福感智能检测方法和设备的制作方法

文档序号:6547073阅读:131来源:国知局
一种基于文本信息的幸福感智能检测方法和设备的制作方法
【专利摘要】本发明公开了一种基于文本信息的幸福感智能检测方法和设备。该方法包括:对文本信息进行分词处理,并得到至少一个分词;根据至少一个分词来从情感词库中确定至少一个分词中包括的所有情感词,其中该情感词库中存储有情感词和该情感词在各个基本情感维度上的分量值;确定文本信息中的各个情感词在文本信息中的词频数;从情感词库中获取各个情感词在各个基本情感维度上的分量值;以及根据各个情感词在文本信息中的词频数、各个情感词在各个基本情感维度上的分量值、和各个基本情感在幸福感中所占的权重,来确定文本信息的幸福感值。本发明解决了由于被测者的记忆和自我感知等原因,导致被测者在过去时间段幸福感难以定量化地检测和比较的问题。
【专利说明】一种基于文本信息的幸福感智能检测方法和设备
【技术领域】
[0001]本发明涉及信息【技术领域】,具体地,涉及一种基于文本信息的幸福感智能检测方法和设备。
【背景技术】
[0002]2012年央视有关“幸福”的调查,将“幸福”这个千百年来人们一直不断追求的目标再次引入公众的视野,顿时在社会上引起了广泛而激烈的讨论。以往对于幸福感的研究中,以心理学方面居多,随着科技的进步逐渐出现了一些新的测量方法,如FMRI (功能磁共振成像)技术、PET (正电子发射型计算机断层显像)技术。在经济学领域,“可衡量的效用”一直作为经济学家们对幸福感测量的基础。现有的对于幸福感的研究方法有自我报告法(self-report)、知情者/观察者报告法、生理测量法和任务测量法。这些方法是通过问卷调查对被测者的幸福感进行测量,即制定幸福感测量的量表,然后根据量表选择被测对象,被测对象完成问题后,筛选出有效问卷,通过对数据进行分析,得出被测对象的幸福感。然而这种问卷调查的方法对被测者个人的记忆及当时的环境有很高的依赖性,基本上只能测量被测者最近一段时间的幸福感水平,难以定量化地测量个人在过去某个特定时间段的幸福感。而且,这种方法对被测者自我感知的依赖性较强,这大大降低了测量结果的可靠性和说服力,并可能导致错误的结果。

【发明内容】

[0003]本发明的目的是提供一种客观、简便的基于文本信息的幸福感定量化智能检测方法和设备。
[0004]为了实现上述目的,本发明提供一种基于文本信息的幸福感智能检测方法,该方法包括:对所述文本信息进行分词处理,并得到至少一个分词;根据所述至少一个分词来从情感词库中确定所述至少一个分词中包括的所有情感词,其中该情感词库中存储有情感词和该情感词在各个基本情感维度上的分量值;确定所述文本信息中的各个情感词在所述文本信息中的词频数;从所述情感词库中获取所述各个情感词在所述各个基本情感维度上的分量值;以及根据所述各个情感词在所述文本信息中的词频数、所述各个情感词在各个基本情感维度上的分量值、和各个基本情感在幸福感中所占的权重,来确定所述文本信息的幸福感值。
[0005]优选地,所述情感词库中还存储有情感词的词性。
[0006]优选地,对所述文本信息进行分词处理,还得到所述至少一个分词的词性;以及根据所述至少一个分词和所述至少一个分词的词性,来从所述情感词库中确定所述至少一个分词中包括的所有情感词,其中,各个情感词带有词性信息。
[0007]优选地,可以通过以下方式确定所述文本信息的幸福感值:根据所述各个情感词在所述文本信息中的词频数,确定所述各个情感词在所述文本信息中的所有情感词中的占比;根据所述各个情感词在所述文本信息中的所有情感词中的占比、以及所述各个情感词在各个基本情感维度上的分量值,确定所述文本信息在所述各个基本情感维度上的分量值;以及根据所述文本信息在所述各个基本情感维度上的分量值、以及各个基本情感在幸福感中所占的权重,确定所述文本信息的幸福感值。
[0008]优选地,可以通过以下方式确定所述各个情感词在所有情感词中的占比:
[0009]
【权利要求】
1.一种基于文本信息的幸福感智能检测方法,该方法包括: 对所述文本信息进行分词处理,并得到至少一个分词; 根据所述至少一个分词来从情感词库中确定所述至少一个分词中包括的所有情感词,其中,该情感词库中存储有情感词和该情感词在各个基本情感维度上的分量值; 确定所述文本信息中的各个情感词在所述文本信息中的词频数;从所述情感词库中获取所述各个情感词在所述各个基本情感维度上的分量值;以及根据所述各个情感词在所述文本信息中的词频数、所述各个情感词在各个基本情感维度上的分量值、和各个基本情感在幸福感中所占的权重,来确定所述文本信息的幸福感值。
2.根据权利要求1所述的方法,其特征在于,所述情感词库中还存储有情感词的词性。
3.根据权利要求2所述的方法,其特征在于,对所述文本信息进行分词处理,还得到所述至少一个分词的词性;以及 根据所述至少一个分词和所述至少一个分词的词性,来从所述情感词库中确定所述至少一个分词中包括的所有情感词,其中,各个情感词带有词性信息。
4.根据权利要求1-3中任一权利要求所述的方法,其特征在于,通过以下方式确定所述文本信息的幸福感值: 根据所述各个情感词在 所述文本信息中的词频数,确定所述各个情感词在所述文本信息中的所有情感词中的占比; 根据所述各个情感词在所述文本信息中的所有情感词中的占比、以及所述各个情感词在各个基本情感维度上的分量值,确定所述文本信息在所述各个基本情感维度上的分量值;以及 根据所述文本信息在所述各个基本情感维度上的分量值、以及各个基本情感在幸福感中所占的权重,确定所述文本信息的幸福感值。
5.根据权利要求4所述的方法,其特征在于,通过以下方式确定所述各个情感词在所有情感词中的占比:
Pk = y,?* 其中,Pk表示第k个情感词在所述文本信息中的所有情感词中的占比; fk表示第k个情感词在所述文本信息中的词频数; η表示所述文本信息中的情感词的总数。
6.根据权利要求4所述的方法,其特征在于,通过以下方式确定所述文本信息在所述各个基本情感维度上的分量值: dJ = ZllP^ 其中,dj表示所述文本信息在第j个基本情感维度上的分量值; Pk表示第k个情感词在所述文本信息中的所有情感词中的占比; eJk表示第k个情感词在第j个基本情感维度上的分量值; η表示所述文本信息中的情感词的总数。
7.根据权利要求4所述的方法,其特征在于,通过以下方式确定所述文本信息的幸福感值:
8.一种基于文本信息的幸福感智能检测设备,该设备包括: 用于对所述文本信息进行分词处理,并得到至少一个分词的装置; 用于根据所述至少一个分词来从情感词库中确定所述至少一个分词中包括的所有情感词的装置,其中该情感词库中存储有情感词和该情感词在各个基本情感维度上的分量值; 用于确定所述文本信息中的各个情感词在所述文本信息中的词频数的装置; 用于从所述情感词库中获取所述各个情感词在所述各个基本情感维度上的分量值的装置;以及 用于根据所述各个情感词在所述文本信息中的词频数、所述各个情感词在各个基本情感维度上的分量值、和 各个基本情感在幸福感中所占的权重,来确定所述文本信息的幸福感值的装置。
9.根据权利要求8所述的设备,其特征在于,所述情感词库中还存储有情感词的词性。
10.根据权利要求9所述的设备,其特征在于,对所述文本信息进行分词处理,还得到所述至少一个分词的词性;以及 根据所述至少一个分词和所述至少一个分词的词性,来从所述情感词库中确定所述至少一个分词中包括的所有情感词,其中,各个情感词带有词性信息。
11.根据权利要求8-10中任一权利要求所述的设备,其特征在于,通过以下方式确定所述文本信息的幸福感值: 根据所述各个情感词在所述文本信息中的词频数,确定所述各个情感词在所述文本信息中的所有情感词中的占比; 根据所述各个情感词在所述文本信息中的所有情感词中的占比、以及所述各个情感词在各个基本情感维度上的分量值,确定所述文本信息在所述各个基本情感维度上的分量值;以及 根据所述文本信息在所述各个基本情感维度上的分量值、以及各个基本情感在幸福感中所占的权重,确定所述文本信息的幸福感值。
12.根据权利要求11所述的设备,其特征在于,通过以下方式确定所述各个情感词在所有情感词中的占比:
13.根据权利要求11所述的设备,其特征在于,通过以下方式确定所述文本信息在所述各个基本情感维度上的分量值:
14.根据权利要求11所述的设备,其特征在于,通过以下方式确定所述文本信息的幸福感值:
【文档编号】G06F17/27GK103955452SQ201410215110
【公开日】2014年7月30日 申请日期:2014年5月21日 优先权日:2014年5月21日
【发明者】齐佳音, 傅湘玲, 陈庆, 曾丹 申请人:北京邮电大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1