文本情感识别方法、装置、存储介质及计算机设备与流程

文档序号:22931319发布日期:2020-11-13 16:30阅读:227来源:国知局
文本情感识别方法、装置、存储介质及计算机设备与流程

本发明涉及信息技术领域,尤其是涉及一种文本情感识别方法、装置、存储介质及计算机设备。



背景技术:

随着计算机技术的发展,越来越多的互联网企业致力于通过大数据分析以提高服务质量,其中,对文本进行情感识别是一项重要的工作,情感识别技术在电商评论分析、热门话题分析、舆情监控以及消费行为分析等众多任务中发挥着巨大的作用。

目前,通过对文本进行情感分析,能够得到该篇文本中文字所包含的情感倾向。然而,这种方式只能获取文本的整体情感倾向,无法从不同分析粒度对文本进行情感分析,获取该文本在不同情感分析粒度下的情感倾向,从而无法满足用户获取不同情感分析粒度下的情感倾向的需求。



技术实现要素:

本发明提供了一种文本情感识别方法、装置、存储介质及计算机设备,主要在于能够确定文本在不同情感分析粒度下的情感倾向,满足用户对文本在不同情感分析粒度下的情感倾向的需求。

根据本发明的第一个方面,提供一种文本情感识别方法,包括:

将待识别文本拆分成各个语句;

利用不同情感分析粒度对应的预设情感分值算法,计算所述各个语句在不同情感分析粒度下的情感分值;

基于计算的各个语句在不同情感分析粒度下的情感分值,确定所述待识别文本在不同情感分析粒度下的情感倾向。

根据本发明的第二个方面,提供一种文本情感识别装置,包括:

拆分单元,用于将待识别文本拆分成各个语句;

计算单元,用于利用不同情感分析粒度对应的预设情感分值算法,计算所述各个语句在不同情感分析粒度下的情感分值;

确定单元,用于基于计算的各个语句在不同情感分析粒度下的情感分值,确定所述待识别文本在不同情感分析粒度下的情感倾向。

根据本发明的第三个方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:

将待识别文本拆分成各个语句;

利用不同情感分析粒度对应的预设情感分值算法,计算所述各个语句在不同情感分析粒度下的情感分值;

基于计算的各个语句在不同情感分析粒度下的情感分值,确定所述待识别文本在不同情感分析粒度下的情感倾向。

根据本发明的第四个方面,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤:

将待识别文本拆分成各个语句;

利用不同情感分析粒度对应的预设情感分值算法,计算所述各个语句在不同情感分析粒度下的情感分值;

基于计算的各个语句在不同情感分析粒度下的情感分值,确定所述待识别文本在不同情感分析粒度下的情感倾向。

本发明提供的一种文本情感识别方法、装置、存储介质及计算机设备,与目前以单一分析粒度对文本进行情感分析的方式相比,本发明能够将待识别文本拆分成各个语句;并利用不同情感分析粒度对应的预设情感分值算法,计算所述各个语句在不同情感分析粒度下的情感分值;与此同时,基于计算的各个语句在不同情感分析粒度下的情感分值,确定所述待识别文本在不同情感分析粒度下的情感倾向,从而能够对文本进行不同粒度下的情感分析,确定文本在不同情感分析粒度下的情感倾向,能够满足用户对不同情感分析粒度下的情感倾向的需求。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1示出了本发明实施例提供的一种文本情感识别方法流程图;

图2示出了本发明实施例提供的另一种文本情感识别方法流程图;

图3示出了本发明实施例提供的一种文本情感识别装置的结构示意图;

图4示出了本发明实施例提供的另一种文本情感识别装置的结构示意图;

图5示出了本发明实施例提供的一种计算机设备的实体结构示意图。

具体实施方式

下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。

目前,只能以单一的分析粒度对文本进行情感分析,无法对文本进行不同情感分析粒度下的情感分析,从而无法获取文本在不同情感分析粒度下的情感倾向,满足用户对多情感分析粒度下的情感倾向的需求。

为了解决上述问题,本发明实施例提供了一种文本情感识别方法,如图1所示,所述方法包括:

101、将待识别文本拆分成各个语句。

其中,待识别文本为需要进行情感分析的文章、新闻报道、评论信息等,对于本发明实施例,为了能够对待识别文本进行不同情感分析粒度下的情感分析,需要将待识别文本拆分成多个语句,以便计算各个语句在不同情感分析粒度下的情感分值,基于各个语句对应的情感分值,能够确定待识别文本在不同情感分析粒度下的情感倾向,具体对待识别文本进行拆分时,识别待识别文本中的各个标点符号,基于识别的各个标点符号,将待识别文本拆分成多个语句,由于在待识别文本中可能涉及不同格式的标点符号,例如,全角标点符号、半角标点符号、中文标点符号、英文标点符号等,由此在识别待识别文本中的各个标点符号时,需要识别出不同格式下的标点符号,操作复杂,且很可能由于未识别出某一格式下的标点符号,影像文本的语句拆分,降低了文本的拆分精度,为了克服上述缺陷,利用预设序列标注模型对待识别文本进行序列标注,得到待识别文本中各个标点符号对应的词性,根据所述各个标点符号对应的词性对待识别文本进行拆分,得到待识别文本对应的各个语句。其中,该预设序列标注模型可以为但不局限于预设crf序列标注模型。

例如,利用预设crf序列标注模型对待识别文本中的各个标点符号进行词性标注,得到各个标点符号对应的词性为句号wj、问号ww、分号wf、感叹号wt和省略号ws,进一步,根据各个标点符号对应的标注词性,识别出各个标点符号,基于识别出的各个标点符号将待识别文本拆分成多个语句,由此通过对待识别文本中的各个标点符号进行词性标注,能够准确地识别出各个标点分号,从而提高了文本的拆分精度。

102、利用不同情感分析粒度对应的预设情感分值算法,计算所述各个语句在不同情感分析粒度下的情感分值。

对于本发明实施例,为了能够确定各个语句在不同情感分析粒度下的情感分值,利用不同情感分析粒度对应的预设情感分值算法,计算各个语句在不同情感分析粒度下的情感分值,其中,不同情感分析粒度包括对待识别文本进行通用型的情感分析,基于行业的情感分析,以及基于对象和/或层面描述的情感分析,基于行业的情感分析能够对待识别文本进行行业划分,确定待识别文本基于不同的行业的情感倾向,该行业具体包括体育、汽车、餐饮、时尚等,可以根据业务方的业务需求选择目标行业,对待识别文本进行基于目标行业的情感分析,此外,通过对待识别文本进行基于对象和/或层面描述的情感分析,能够确定待识别问中各个段落或者语句中所涉及的对象和/或层面描述对应的情感倾向,由此能够满足用户对不同情感分析粒度下的情感倾向的需求。

具体地,可以利用第一预设情感分值算法,计算各个语句的通用型情感分值;利用第一预设情感分值算法,计算各个语句基于行业的情感分值;利用第二预设情感分值算法,计算各个语句基于对象和/或层面描述的情感分值,由此能够确定各个语句在不同情感分析粒度下的情感分值,以便根据计算的情感分值,确定待识别文本在不同情感分析粒度下的情感倾向,需要说明的是,本发明实施例中的情感分析粒度并不局限于通用型的情感分析、基于目标行业的情感分析以及基于对象和/或层面描述的情感分析,还可以包括其他分析粒度的情感分析。

103、基于计算的各个语句在不同情感分析粒度下的情感分值,确定所述待识别文本在不同情感分析粒度下的情感倾向。

其中,情感倾向包括正面积极的情感倾向、负面消极的情感倾向以及中性的情感倾向,对于本发明实施例,针对通用型的情感分析,将计算的各个语句对应的通用型情感分值进行累加,得到待识别文本对应的通用型情感分值,根据待识别文本的通用型情感分值,确定待识别文本的通用型情感倾向;针对基于目标行业的情感分析,将计算的各个语句基于目标行业的情感分值进行累加,得到待识别文本基于目标行业的情感分值,根据待识别文本基于目标行业的情感分值,确定待识别文本基于目标行业的情感倾向;针对基于对象和/或层面描述的情感分析,根据计算的各个语句基于对象和/或层面描述的情感分值,确定待识别文本中各个语句或者段落基于对象和/或层面描述的情感倾向。

例如,若待识别文本对应的通用型情感分值为30分,则确定待识别文本的通用型情感倾向为正面积极的;若待识别文本基于目标行业的情感分值为-20分,则确定待识别文本基于目标行业的情感倾向为负面消极的;若语句1基于对象a的情感分值为0分,则确定语句1基于对象a的情感倾向为中性;若语句2基于对象b和层面描述a的情感分值为10分,则确定语句2基于对象b和层面描述a的情感倾向为正面积极的,由此能够得到待识别文本的通用型情感倾向和基于目标行业的情感倾向,以及待识别文本中各个语句或者段落基于对象和/或层面描述的情感倾向,从而能够对待识别文本进行不同情感分析粒度下的情感分析,满足用户对多分析粒度下的情感倾向的需求。

本发明实施例提供的一种文本情感识别方法,与目前人工解读文本主要内容的方式相比,与目前以单一分析粒度对文本进行情感分析的方式相比,本发明能够将待识别文本拆分成各个语句;并利用不同情感分析粒度对应的预设情感分值算法,计算所述各个语句在不同情感分析粒度下的情感分值;与此同时,基于计算的各个语句在不同情感分析粒度下的情感分值,确定所述待识别文本在不同情感分析粒度下的情感倾向,从而能够对文本进行不同粒度下的情感分析,确定文本在不同情感分析粒度下的情感倾向,能够满足用户对不同情感分析粒度下的情感倾向的需求。

进一步的,为了更好的说明上述确定文本在不同情感分析粒度下的情感倾向的过程,作为对上述实施例的细化和扩展,本发明实施例提供了另一种文本情感识别方法,如图2所示,所述方法包括:

201、将待识别文本拆分成各个语句。

对于本发明实施例,为了能够计算待识别文本中各个语句在不同情感分析粒度下的情感分值,需要先将待识别文本拆分成多个语句,待识别文本中语句的具体拆分方式与步骤101相同,在此不再赘述。

202、利用第一预设情感分值算法,分别计算所述各个语句的通用型情感分值和基于目标行业的情感分值。

对于本发明实施例,为了计算各个语句的通用型情感分值以及各个语句基于目标行业的情感分值,步骤202具体包括:利用预设分词模型对所述待识别文本进行分词处理,得到所述待识别文本对应的各个分词;分别利用预设通用型情感词典和所述目标行业情感词典,确定所述各个分词中通用型的各个情感词和基于目标行业的各个情感词;分别根据所述各个语句中出现的通用型的各个情感词和基于目标行业的各个情感词,计算所述各个语句的通用型情感分值和基于目标行业的情感分值。进一步地,所述分别根据所述各个语句中出现的通用型的各个情感词和基于目标行业的各个情感词,计算所述各个语句的通用型情感分值和基于目标行业的情感分值,包括:确定所述通用型的各个情感词在所述各个语句中的位置,并基于所述位置向前查找判断所述通用型的各个情感词在所述各个语句中是否存在相应的程度修饰词;根据所述通用型的各个情感词对应的情感倾向和第一判断结果,计算所述各个语句的通用型情感分值;确定所述基于目标行业的各个情感词在所述各个语句中的位置,并基于所述位置向前查找判断所述基于目标行业的各个情感词在所述各个语句中是否存在相应的程度修饰词;根据所述基于目标行业的各个情感词对应的情感倾向和第二判断结果,计算所述各个语句基于目标行业的情感分值。

其中,预设分词模型可以为但不局限于预设crf模型,预设通用型情感词典中收录有大量积极正面的情感词、消极负面的情感词以及中性词,该通用型的情感词典中的各个情感词对应的情感倾向以通常理解为准,不做具体行业划分,预设目标行业词典中记录有大量基于该目标行业的情感词,包括基于该目标行业的积极正面的情感词、消极负面的情感词以及中性词,具体可以预先搜集不同行业的各个情感词,并建立基于不同行业的情感词典,将建立的不同行业的情感词典存储于预设知识库中,根据后台处理的业务需求选择目标行业的情感词典,对待识别文本进行基于目标行业的情感分析。

具体地,为了计算各个语句中的通用型情感分值和基于目标行业的情感分值,首先利用预设crf模型对待识别文本进行分词处理,得到待识别文本对应的各个分词及其各个分词对应的词性,之后将各个分词分别与预设通用型情感词典中的各个情感词进行匹配,确定各个分词中通用型的各个情感词,进一步地,将确定通用型的各个情感词与各个语句进行匹配,确定通用型的各个情感词所在的各个语句及其在语句中的位置,基于确定的各个位置向前查找,判断通用型的各个情感词所在的各个语句中是否存在通用型的各个情感词对应的程度修饰词,具体查找该程度修饰词时可以依据词性查找,以便提高程度修饰词的查找精度,进一步地,根据通用型的各个情感词对应的情感倾向,确定通用型的各个情感词所在各个语句对应的情感权重,同时根据判断结果,确定通用型的各个情感词所在各个语句对应的程度权重,最终将确定的各个语句对应的情感权重和程度权重进行求和,得到通用型的各个情感词所在各个语句对应的通用型情感分值。

进一步地,在对文本进行基于目标行业的情感分析时,首先对待待识文本进行行业划分,确定待识别文本所属目标行业,基于确定的目标行业,从预设知识库中选取所述目标行业对应的预设目标行业情感词典,进一步地,所述对待识文本进行行业划分,确定待识别文本所属目标行业,具体包括:将待识别文本输入至预设文本行业预测模型对进行行业预测,输出该待识别文本所属的目标行业,该预设文本行业预测模型具体可以为但不局限于预设fasttext文本行业预测模型,由此能够确定文本所属的目标行业及其适应的目标行业情感词典,进一步,利用预设目标行业的情感词典计算各个语句基于目标行业的情感分值,该过程与上述计算各个语句的通用型情感分值的过程相同,由此能够分别根据计算的各个语句的通用型情感分值和基于目标行业的情感分值,确定待识别文本的通用型情感倾向和基于目标行业的情感倾向,即能够对待识别文本进行不同情感分析粒度下的情感分析,满足用户的需求。

例如,在语句1中出现通用型的情感词“好”,确定该语句1对应的情感权重为+1,同时该语句1中还存在“好”程度修饰词“非常”,确定该语句对应的程度权重为+10,由此确定语句1的通用型情感分值为10+1=11分,再比如,在语句2中出现通用型的情感词“不好”,确定该语句2对应的情感权重为-1,同时该语句2中还存在“不好”程度修饰词“非常”,确定该语句对应的程度权重为-10,由此确定语句2的通用型情感分值为-10-1=-11分。

203、利用第二预设情感分值算法,计算各个第一目标语句基于对象和/或层面描述的情感分值。

其中,对象为待识别文本中的公司、产品和品牌等,层面描述为对象的相关属性和描述,所述第二预设情感分值算法为预设神经网络情感分值算法,为了计算第一目标语句基于对象和/或层面描述的情感分值,步骤203具体包括:识别所述待识别文本中的各个对象和各个层面描述;根据识别的各个对象和各个层面描述,确定所述各个语句中的多个第一目标语句;利用预设神经网络情感分值算法,计算各个第一目标语句基于对象和/或层面描述的情感分值。进一步地,所述根据识别的各个对象和各个层面,确定所述各个语句中的多个第一目标语句,包括:从所述各个语句中筛选出存在所述各个对象中任一对象和/或所述各个层面描述中任一层面描述的各个第二目标语句;利用预设关联关系算法分别确定所述各个第二目标语句中对象与层面描述之间的关联关系;根据所述关联关系从所述各个第二目标语句中筛选出多个第一目标语句。

对于本发明实施例,为了识别待识别文本中的各个对象和各个层面描述,将待识别文本输入至预设序列标注模型进行序列标注,根据标注结果确定待识别文本中的各个对象和各个层面描述,该预设序列标注模型可以为但不局限于预设char+bi-lstm+crf序列标注模型,为了构建预设char+bi-lstm+crf序列标注模型,需要搜集大量语料,并对大量语料中的实体进行标注,将标注后的大量语料作为训练样本,并利用预设序列标注算法对训练样本进行训练,构建char+bi-lstm+crf序列标注模型,具体对语料进行标注时,可以使用brat系统创建需要标注的标签,并设置不同的颜色值,同时将包含txt语料的文件夹放置到安装文件下data的目录下,并对每个txt文件创建一个空的标引文件,该标引文件用于存放标注结果,标注人员具体标注时,选择需要标注的语料,同时为其选择对应的标签便可以完成标注,采用这种标注方式能够直观的看到标注结果,同时方便标注人员进行审核,进一步地,将标注后的大量语料作为训练样本,利用预设序列标注算法对训练样本进行训练,具体训练时,为了防止过拟合现象的发生,设置训练参数,embedding_dim=300;epoch=60。

进一步地,在识别出待识别文本中的各个对象和各个层面描述之后,依次查找各个语句,确定包含任一对象和/或任一层面描述的多个第二目标语句,之后利用预设关联关系算法分析各个第二目标语句中对象与层面描述之间的关联关系,根据分析结果确定各个第二目标语句中只存在对象或者层面描述的语句,以及对象与层面描述之间具有关联关系的语句,并将确定的语句作为各个第一目标语句,其中,该预设关联关系算法可以为但不局限于syntaxnet关联关系算法,进一步地,将确定的各个第一目标语句按照其在待识别文本中的顺序依次输入至预设神经网络情感分值模型进行情感分值计算,得到各个第一目标语句基于对象和/或层面描述的情感分值,其中,该预设神经网络情感分值模型可以为但不局限于预设rnn神经网络情感分值模型。

204、基于计算的各个语句在不同情感分析粒度下的情感分值,确定所述待识别文本在不同情感分析粒度下的情感倾向。

对于本发明实施例,针对待识别文本的通用型情感分析,步骤204具体包括:将所述各个语句的通用型情感分值进行累加,得到所述待识别文本对应的通用型情感分值;根据所述待识别文本对应的通用型情感分值,确定所述待识别文本的通用型情感倾向。此外,针对待识别文本基于目标行业的情感分析,步骤204具体包括:将所述各个语句基于目标行业的情感分值进行累加,得到所述待识别文本基于目标行业的情感分值;根据所述待识别文本基于目标行业的情感分值,确定所述待识别文本基于目标行业的情感倾向。与此同时,针对各个第一目标语句的情感分析,步骤204具体包括:根据所述各个第一目标语句基于对象和/或层面描述的情感分值,确定所述各个第一目标语句基于对象和/或层面描述的情感倾向。其中,根据该情感分值的正负能够确定待识别文本的情感倾向,此外,根据情感分值大小能够确定待识别文本的情感倾向程度。由此能够对待识别文本在不同情感分析粒度下进行情感分析。

本发明实施例提供的另一种文本情感识别方法,与目前人工解读文本主要内容的方式相比,与目前以单一分析粒度对文本进行情感分析的方式相比,本发明能够将待识别文本拆分成各个语句;并利用不同情感分析粒度对应的预设情感分值算法,计算所述各个语句在不同情感分析粒度下的情感分值;与此同时,基于计算的各个语句在不同情感分析粒度下的情感分值,确定所述待识别文本在不同情感分析粒度下的情感倾向,从而能够对文本进行不同粒度下的情感分析,确定文本在不同情感分析粒度下的情感倾向,能够满足用户对不同情感分析粒度下的情感倾向的需求。

进一步地,作为图1的具体实现,本发明实施例提供了一种文本情感识别装置,如图3所示,所述装置包括:拆分单元31、计算单元32和确定单元33。

所述拆分单元31,可以用于将待识别文本拆分成各个语句。所述拆分单元31是本装置中将待识别文本拆分成各个语句的主要功能模块。

所述计算单元32,可以用于利用不同情感分析粒度对应的预设情感分值算法,计算所述各个语句在不同情感分析粒度下的情感分值。所述计算单元32是本装置中利用不同情感分析粒度对应的预设情感分值算法,计算所述各个语句在不同情感分析粒度下的情感分值的主要功能模块,也是核心模块。

所述确定单元33,可以用于基于计算的各个语句在不同情感分析粒度下的情感分值,确定所述待识别文本在不同情感分析粒度下的情感倾向。所述确定单元33是本装置中基于计算的各个语句在不同情感分析粒度下的情感分值,确定所述待识别文本在不同情感分析粒度下的情感倾向的主要功能模块,也是核心模块。

进一步地,如图4所示,为了计算各个语句在不同情感分析粒度下的情感分值,所述计算单元32,具体可以用于利用第一预设情感分值算法,分别计算所述各个语句的通用型情感分值和基于目标行业的情感分值;利用第二预设情感分值算法,计算各个第一目标语句基于对象和/或层面描述的情感分值。

进一步地,为了计算所述各个语句的通用型情感分值和基于目标行业的情感分值,所述计算单元32,包括:分词模块321、确定模块322和计算模块323。

所述分词模块321,可以用于利用预设分词模型对所述待识别文本进行分词处理,得到所述待识别文本对应的各个分词。

所述确定模块322,可以用于分别利用预设通用型情感词典和所述目标行业情感词典,确定所述各个分词中通用型的各个情感词和基于目标行业的各个情感词。

所述计算模块323,可以用于分别根据所述各个语句中出现的通用型的各个情感词和基于目标行业的各个情感词,计算所述各个语句的通用型情感分值和基于目标行业的情感分值。

进一步地,所述计算模块323,包括:判断子模块和计算子模块,所述判断子模块,可以用于确定所述通用型的各个情感词在所述各个语句中的位置,并基于所述位置向前查找判断所述通用型的各个情感词在所述各个语句中是否存在相应的程度修饰词。

所述计算子模块,可以用于根据所述通用型的各个情感词对应的情感倾向和第一判断结果,计算所述各个语句的通用型情感分值。

所述判断子模块,还可以用于确定所述基于目标行业的各个情感词在所述各个语句中的位置,并基于所述位置向前查找判断所述基于目标行业的各个情感词在所述各个语句中是否存在相应的程度修饰词。

所述计算子模块,还可以用于根据所述基于目标行业的各个情感词对应的情感倾向和第二判断结果,计算所述各个语句基于目标行业的情感分值。

进一步地,为了确定待识别文本在不同情感分析粒度下的情感倾向,所述确定单元33,包括累加模块331和确定模块332。

所述累加模块331,可以用于将所述各个语句的通用型情感分值进行累加,得到所述待识别文本对应的通用型情感分值。

所述确定模块332,可以用于根据所述待识别文本对应的通用型情感分值,确定所述待识别文本的通用型情感倾向。

所述累加模块331,还可以用于将所述各个语句基于目标行业的情感分值进行累加,得到所述待识别文本基于目标行业的情感分值。

所述确定模块332,还可以用于根据所述待识别文本基于目标行业的情感分值,确定所述待识别文本基于目标行业的情感倾向。

进一步地,为了计算第一目标语句基于对象和/或层面描述的情感分值,所述计算单元32,还包括:识别模块324。

所述识别模块324,可以用于识别所述待识别文本中的各个对象和各个层面描述。

所述确定模块322,可以用于根据识别的各个对象和各个层面描述,确定所述各个语句中的多个第一目标语句。

所述计算模块323,可以用于利用预设神经网络情感分值算法,计算各个第一目标语句基于对象和/或层面描述的情感分值。

所述确定模块332,还可以用于根据所述各个第一目标语句基于对象和/或层面描述的情感分值,确定所述各个第一目标语句基于对象和/或层面描述的情感倾向。

进一步地,为了确定所述各个语句中的多个第一目标语句,所述确定模块322,包括:筛选子模块和确定子模块。

所述筛选子模块,可以用于从所述各个语句中筛选出存在所述各个对象中任一对象和/或所述各个层面描述中任一层面描述的各个第二目标语句。

所述确定子模块,可以用于利用预设关联关系算法分别确定所述各个第二目标语句中对象与层面描述之间的关联关系。

所述筛选子模块,还可以用于根据所述关联关系从所述各个第二目标语句中筛选出多个第一目标语句。

需要说明的是,本发明实施例提供的一种文本情感识别装置所涉及各功能模块的其他相应描述,可以参考图1所示方法的对应描述,在此不再赘述。

基于上述如图1所示方法,相应的,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:将待识别文本拆分成各个语句;利用不同情感分析粒度对应的预设情感分值算法,计算所述各个语句在不同情感分析粒度下的情感分值;基于计算的各个语句在不同情感分析粒度下的情感分值,确定所述待识别文本在不同情感分析粒度下的情感倾向。

基于上述如图1所示方法和如图3所示装置的实施例,本发明实施例还提供了一种计算机设备的实体结构图,如图5所示,该计算机设备包括:处理器41、存储器42、及存储在存储器42上并可在处理器上运行的计算机程序,其中存储器42和处理器41均设置在总线43上所述处理器41执行所述程序时实现以下步骤:将待识别文本拆分成各个语句;利用不同情感分析粒度对应的预设情感分值算法,计算所述各个语句在不同情感分析粒度下的情感分值;基于计算的各个语句在不同情感分析粒度下的情感分值,确定所述待识别文本在不同情感分析粒度下的情感倾向。

通过本发明的技术方案,本发明能够将待识别文本拆分成各个语句;并利用不同情感分析粒度对应的预设情感分值算法,计算所述各个语句在不同情感分析粒度下的情感分值;与此同时,基于计算的各个语句在不同情感分析粒度下的情感分值,确定所述待识别文本在不同情感分析粒度下的情感倾向,从而能够对文本进行不同粒度下的情感分析,确定文本在不同情感分析粒度下的情感倾向,能够满足用户对不同情感分析粒度下的情感倾向的需求。

显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1