一种对象情感分析方法及装置与流程

文档序号:24875151发布日期:2021-04-30 12:49阅读:111来源:国知局
一种对象情感分析方法及装置与流程

本发明涉及文本分析技术领域,特别是涉及一种对象情感分析方法及装置。



背景技术:

由于文本中对象的情感变化能够反映剧情发展、对象关系变化、情节转折等内容,所以,为了能够使得用户快速了解文本内容,服务提供商通常向用户提供文本中对象的情感变化简介。因此,需要对文本中对象的情感进行分析。

现有技术中,通常对文本整体所表达的情感进行分析,将所获得的情感分析结果确定为文本所表达对象的情感。然而,由于文本整体所表达的情感反应了文本在情感方面的整体基调,例如,悲伤的基调、热闹的基调、激动的基调等等,这样来看文本整体所表达的情感是单一情感。然而,站在文本中对象的角度而言,文本所表达的各个对象的情感往往是不同的。因此,应用上述方式对文本所表达的文本进行情感分析易导致对象情感分析的准确度较低。



技术实现要素:

本发明实施例的目的在于提供一种对象情感分析方法及装置,以提高对象情感分析的准确度。具体技术方案如下:

第一方面,本发明的实施例提供了一种对象情感分析方法,所述方法包括:

获得待分析文本;

确定所述待分析文本中待分析对象的第一对象名称;

针对所述待分析文本中的每一第一对象名称,分别提取所述待分析文本中位于第一对象名称两侧的字符所表达的所述待分析对象的情感的特征,作为第一情感特征和第二情感特征,其中,位于所述第一对象名称一侧的字符包括:沿所述待分析文本中字符的排列正向顺序、位于所述第一对象名称之前的字符,或者沿所述待分析文本中字符的排列反向顺序、位于所述第一对象名称之后的字符;

基于所提取的各第一情感特征与第二情感特征,预测所述待分析文本所表达的所述待分析对象的情感。

本发明的一个实施例中,在所述确定所述待分析文本中待分析对象的第一对象名称之后,还包括:

确定所述待分析文本中除所述待分析对象外其他对象的第二对象名称;

将所述第一对象名称替换为第一预设对象名称,并将所述第二对象名称替换为第二预设对象名称;

所述针对所述待分析文本中的每一第一对象名称,分别提取所述待分析文本中位于第一对象名称两侧的字符所表达的所述待分析对象的情感的特征,作为第一情感特征和第二情感特征,包括:

针对所述待分析文本中的每一第一预设对象名称,分别提取位于所述第一预设对象名称两侧的字符所表达的所述待分析对象的情感的特征,作为第一情感特征和第二情感特征。

本发明的一个实施例中,上述针对所述待分析文本中的每一第一对象名称,分别提取所述待分析文本中位于所述第一对象名称两侧的字符所表达的所述待分析对象的情感的特征,作为第一情感特征和第二情感特征,包括:

基于所述待分析文本中每一字符的上下文信息,对所述待分析文本中各个字符进行编码,得到各个字符分别对应的字符编码结果;

针对所述待分析文本中的每一第一对象名称,分别提取第一编码结果和第二编码结果所表达的所述待分析对象的情感的特征,作为第一情感特征和第二情感特征,其中,所述第一编码结果包括所述待分析文本中位于所述第一对象名称一侧的字符对应的字符编码结果,所述第二编码结果包括所述待分析文本中位于所述第一对象名称另一侧的字符对应的字符编码结果。

本发明的一个实施例中,上述针对所述待分析文本中的每一第一对象名称,分别提取所述待分析文本中位于所述第一对象名称两侧的字符所表达的所述待分析对象的情感的特征,作为第一情感特征和第二情感特征,包括:

提取第一类字符中第一个字符所表达情感的特征,作为第一情感特征,其中,所述第一类字符包括:所述待分析文本中位于所述第一对象名称一侧的字符,所述第一类字符中第一个字符为:所述第一类字符中按照字符在所述待分析文本中的排列顺序排列的第一个字符;

按照所述排列顺序,提取所述第一类字符中第一个字符外每一字符所表达情感的特征,并基于所提取的特征更新所述第一情感特征;

提取第二类字符中第一个字符所表达情感的特征,作为第二情感特征,其中,所述第二类字符包括:所述待分析文本中位于所述第一对象名称另一侧的字符,所述第二类字符中第一个字符为:所述第二类字符中按照字符在所述待分析文本中的所述排列顺序排列的第一个字符;

按照所述排列顺序,提取所述第二类字符中第一个字符外每一字符所表达情感的特征,并基于所提取的特征更新所述第二情感特征。

本发明的一个实施例中,上述基于所提取的各第一情感特征与第二情感特征,预测所述待分析文本所表达的所述待分析对象的情感,包括:

对所提取的各第一情感特征与第二情感特征进行特征融合;

确定融合后的情感特征与每一预设情感的特征间的匹配程度;

根据所确定的匹配程度,确定所述待分析文本所表达的所述待分析对象的情感。

本发明的一个实施例中,上述获得待分析文本,包括:

确定原始文本中描述对象动作的文本片段,作为备选文本片段;

从所述原始文本中,获得预设长度、且包含所述备选文本片段以及相邻文本片段的文本,作为待分析文本,其中,所述相邻文本片段包括:在所述备选文本片段之前相邻预设长度的文本片段、或者在所述备选文本片段之后相邻预设长度的文本片段、或者在备选文本片段前后相邻预设长度的文本片段

第二方面,本发明的实施例提供了一种对象情感分析装置,所述装置包括:

文本获得模块,用于获得待分析文本;

第一名称确定模块,用于确定所述待分析文本中待分析对象的第一对象名称;

特征提取模块,用于针对所述待分析文本中的每一第一对象名称,分别提取所述待分析文本中位于第一对象名称两侧的字符所表达的所述待分析对象的情感的特征,作为第一情感特征和第二情感特征,其中,位于所述第一对象名称一侧的字符包括:沿所述待分析文本中字符的排列正向顺序、位于所述第一对象名称之前的字符,或者沿所述待分析文本中字符的排列反向顺序、位于所述第一对象名称之后的字符;

情感预测模块,用于基于所提取的各第一情感特征与第二情感特征,预测所述待分析文本所表达的所述待分析对象的情感。

本发明的一个实施例中,上述装置还包括:

第二名称确定模块,用于在所述第一名称确定模块之后,确定所述待分析文本中除所述待分析对象外其他对象的第二对象名称;

名称替换模块,用于将所述第一对象名称替换为第一预设对象名称,并将所述第二对象名称替换为第二预设对象名称;

所述特征提取模块,具体用于针对所述待分析文本中的每一第一预设对象名称,分别提取位于所述第一预设对象名称两侧的字符所表达的所述待分析对象的情感的特征,作为第一情感特征和第二情感特征。

本发明的一个实施例中,上述特征提取模块,包括:

字符编码子模块,用于基于所述待分析文本中每一字符的上下文信息,对所述待分析文本中各个字符进行编码,得到各个字符分别对应的字符编码结果;

第一特征提取子模块,用于针对所述待分析文本中的每一第一对象名称,分别提取第一编码结果和第二编码结果所表达的所述待分析对象的情感的特征,作为第一情感特征和第二情感特征,其中,所述第一编码结果包括所述待分析文本中位于所述第一对象名称一侧的字符对应的字符编码结果,所述第二编码结果包括所述待分析文本中位于所述第一对象名称另一侧的字符对应的字符编码结果。

本发明的一个实施例中,上述特征提取模块,包括:

第二特征提取子模块,用于提取第一类字符中第一个字符所表达情感的特征,作为第一情感特征,其中,所述第一类字符包括:所述待分析文本中位于所述第一对象名称一侧的字符,所述第一类字符中第一个字符为:所述第一类字符中按照字符在所述待分析文本中的排列顺序排列的第一个字符;

第一特征更新子模块,用于按照所述排列顺序,提取所述第一类字符中第一个字符外每一字符所表达情感的特征,并基于所提取的特征更新所述第一情感特征;

第三特征提取子模块,用于提取第二类字符中第一个字符所表达情感的特征,作为第二情感特征,其中,所述第二类字符包括:所述待分析文本中位于所述第一对象名称另一侧的字符,所述第二类字符中第一个字符为:所述第二类字符中按照字符在所述待分析文本中的所述排列顺序排列的第一个字符;

第二特征更新子模块,用于按照所述排列顺序,提取所述第二类字符中第一个字符外每一字符所表达情感的特征,并基于所提取的特征更新所述第二情感特征。

本发明的一个实施例中,上述情感预测模块,包括:

特征融合子模块,用于对所提取的各第一情感特征与第二情感特征进行特征融合;

程度确定子模块,用于确定融合后的情感特征与每一预设情感的特征间的匹配程度;

情感预测子模块,用于根据所确定的匹配程度,确定所述待分析文本所表达的所述待分析对象的情感。

本发明的一个实施例中,上述文本获得模块,包括:

文本片段确定子模块,用于确定原始文本中描述对象动作的文本片段,作为备选文本片段;

文本获得子模块,用于从所述原始文本中,获得预设长度、且包含所述备选文本片段以及相邻文本片段的文本,作为待分析文本,其中,所述相邻文本片段包括:在所述备选文本片段之前相邻预设长度的文本片段、或者在所述备选文本片段之后相邻预设长度的文本片段、或者在备选文本片段前后相邻预设长度的文本片段。

第三方面,本发明提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;

存储器,用于存放计算机程序;

处理器,用于执行存储器上所存放的程序时,实现上述第一方面所述的方法步骤。

第四方面,本发明提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的方法步骤。

由以上可见,应用本发明实施例提供的方案对对象情感进行分析时,由于待分析文本所表达的待分析对象的情感的特征与待分析文本中各个字符所表达的情感的特征之间具有关联性、一致性以及完整性。而第一情感特征、第二情感特征分别为待分析文本中位于第一对象名称两侧的字符所表达的待分析对象的情感的特征,所以上述第一情感特征、第二情感特征是与待分析文本所表达的待分析对象的情感的特征之间的关联程度较高的、且具有延续性。因此,基于第一情感特征与第二情感特征,可以对待分析文本所表达的待分析对象的情感进行预测,相较于现有技术,应用本发明实施例提供的方案对对象情感进行分析时,能够提高对对象情感分析的准确度。

另外,由于待分析对象的标识,也就是对象名称会由于自身所表达的情感的特征可能会影响获得待分析对象的情感的准确度。因此,分别提取待分析文本中位于第一对象名称两侧的字符所表达的待分析对象的情感的特征,而屏蔽对象名称所表达情感的特征,这样能够进一步提高对对象进行情感分析的准确度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种对象情感分析方法的流程示意图;

图2为本发明实施例提供的第二种对象情感分析方法的流程示意图;

图3a为本发明实施例提供的一种网络结构的示意图;

图3b为本发明实施例提供的第三种对象情感分析方法的流程示意图;

图3c为本发明实施例提供的一种得到对象情感方法的流程示意图;

图4为本发明实施例提供的第四种对象情感分析方法的流程示意图;

图5为本发明实施例提供的第五种对象情感分析方法的流程示意图;

图6为本发明实施例提供的第一种对象情感分析装置的结构示意图;

图7为本发明实施例提供的第二种对象情感分析装置的结构示意图;

图8为本发明实施例提供的第三种对象情感分析装置的结构示意图;

图9为本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在对文本所表达的对象的情感进行分析时,由于现有技术中存在对象情感分析的准确度较低的问题,为解决这一技术问题,本发明实施例提供了一种对象情感分析方法及装置。

本发明的一个实施例中,提供了一种对象情感分析方法,该方法包括:

获得待分析文本;

确定待分析文本中待分析对象的第一对象名称;

针对待分析文本中的每一第一对象名称,分别提取待分析文本中位于第一对象名称两侧的字符所表达的待分析对象的情感的特征,作为第一情感特征和第二情感特征,其中,位于第一对象名称一侧的字符包括:沿待分析文本中字符的排列正向顺序、位于第一对象名称之前的字符,或者沿待分析文本中字符的排列反向顺序、位于第一对象名称之后的字符;

基于所提取的各第一情感特征与第二情感特征,预测待分析文本所表达的待分析对象的情感。

由以上可见,应用本实施例提供的方案对对象情感进行分析时,由于待分析文本所表达的待分析对象的情感的特征与待分析文本中各个字符所表达的情感的特征之间具有关联性、一致性以及完整性。而第一情感特征、第二情感特征分别为待分析文本中位于第一对象名称两侧的字符所表达的待分析对象的情感的特征,所以上述第一情感特征、第二情感特征是与待分析文本所表达的待分析对象的情感的特征之间的关联程度较高的、且具有延续性。因此,基于第一情感特征与第二情感特征,可以对待分析文本所表达的待分析对象的情感进行预测,相较于现有技术,应用本实施例提供的方案对对象情感进行分析时,能够提高对对象情感分析的准确度。

另外,由于待分析对象的标识,也就是对象名称会由于自身所表达的情感的特征可能会影响获得待分析对象的情感的准确度。因此,分别提取待分析文本中位于第一对象名称两侧的字符所表达的待分析对象的情感的特征,而屏蔽对象名称所表达情感的特征,这样能够进一步提高对对象进行情感分析的准确度。

下面通过具体实施例对本发明实施例提供的对象情感分析方法进行详细说明。

参见图1,图1为本发明实施例提供的一种对象情感分析方法的流程示意图,上述方法包括s101-s104。

s101:获得待分析文本。

上述待分析文本可以为:原始文本中一个句子或者多个句子的组合。例如:上述原始文本可以为:剧本、小说、新闻稿、文章等。

例如:当上述原始文本为小说时,待分析文本可以为小说中的一句话或者一个段落。

更为具体的,上述待分析文本可以为原始文本中描述对象动作的文本,上述描述对象动作的文本为:描述对象行为、且非对白的文本,例如:在“小明冲小红笑”这一文本中,描述了“小明”这一对象“冲…笑”的行为,且上述行为不是发出对白的行为,因此上述文本为描述对象动作的文本。

上述待分析文本还可以为描述对象对白的文本。例如:在“小明对小红说:“今天天气很好””这一文本,描述了“小明”发出对白的动作,因此上述文本为描述对象对白的文本。

上述待分析文本可以是从原始文本中进行截取获得的。例如:可以对原始文本中一句话进行截取,作为待分析文本。

上述待分析文本还可以对原始文本中一句话截取后,获得包含所截取的一句话以及与所截取的一句话相邻文本的文本,作为待分析文本。由于与所截取的一句话相邻文本通常是用于交代对象描述背景或者描述环境,在对待分析文本进行对象情感分析时,可以基于对象描述背景或者环境描述,对待分析文本所表达的情感进行分析,从而提高了情感分析的准确度。

上述待分析文本还可以是工作人员输入的文本。具体获得待分析文本的方式可以参见后续实施例,在此暂不详述。

s102:确定待分析文本中待分析对象的第一对象名称。

上述待分析对象是指待分析文本中待进行情感分析的对象。例如:待分析文本为剧本时,待分析对象可以为待分析文本中主要角色,待分析文本为小说时,待分析对象可以为待分析文本中主要人物。

上述第一对象名称用于表征待分析对象的身份信息。例如,上述待分析文本为来自小说的文本时,待分析对象可以是小说中的人物,待分析对象的第一对象名称可以为:小说中人物的名称等。上述待分析文本为来自剧本的文本时,待分析对象可以是剧本中出现的主要角色,上述待分析对象的第一对象名称可以为:主要角色的名称等。上述待分析文本为来自新闻稿的文本时,待分析对象可以是新闻稿中出现的人物,待分析对象的第一对象名称可以为:新闻稿中人物的名称。

由于待分析文本中不同对象所表达的情感也不同,因此,在采用本方案对对象的情感进行分析时,每次仅针对一个待分析对象的情感进行分析,也就是每次仅确定一个对象名称。这样,对于同一个待分析文本,能够获得待分析文本中所表达的各个待分析对象的情感。

例如:假设待分析文本中出现n个待分析对象时,需要n次采用本方案分别对n个待分析对象的情感进行分析,每次分析时针对的待分析对象是不同的对象。

在确定待分析文本中待分析对象的第一对象名称时,可以采用对象名称识别技术,例如:当上述待分析对象为人时,可以采用人名识别技术。具体的,可以采用对象名称识别技术获得原始文本内包含各个对象名称的名称列表,依据所获得的名称列表,确定待分析文本中的待分析对象的第一对象名称。这样,由于不同的待分析文本中待分析对象的第一对象名称不同,通过上述方法能够较为准确确定待分析文本中的待分析对象的第一对象名称。

在确定待分析文本中待分析对象的第一对象名称时,可以首先对所获得的待分析文本中出现的各个对象进行识别,并确定各个对象的对象名称,统计所确定的各个对象名称在原始文本中出现的频次,根据所统计的出现频次确定待分析文本中待分析对象,从而确定待分析对象的第一对象名称。

当对象的对象名称在原始文本中出现的次数较多时,可以表示上述对象是原始文本中的重要对象或者主要对象;当对象的对象名称在原始文本中出现的次数较少时,可以表示上述对象是原始文本中的边缘对象或者无关对象。

基于此,若要获得待分析文本所表达的主要对象的情感,在预先确定待分析对象的对象名称时,可以将对象的对象名称在原始文本中的出现次数大于预设次数阈值的对象的对象名称作为待分析对象的第一对象名称;若要获得待分析文本所表达的无关对象的情感,在预先确定待分析对象的对象名称时,可以将对象的对象名称在原始文本中的出现次数小于预设次数阈值的对象的对象名称作为待分析对象的第一对象名称。

例如:假设原始文本中包括对象a的对象名称1,对象b的对象名称2,其中,对象a的对象名称1在原始文本中出现的次数为100次,对象b的对象名称在原始文本中出现的次数为10次,假设预设次数阈值为90次。若要获得待分析文本所表达的主要对象的情感时,由于100>90,可以将对象a的对象名称1确定为待分析对象的第一对象名称。

s103:针对待分析文本中的每一第一对象名称,分别提取待分析文本中位于第一对象名称两侧的字符所表达的待分析对象的情感的特征,作为第一情感特征和第二情感特征。

一种情况下,位于第一对象名称一侧的字符可以包括沿待分析文本中字符的排列正向顺序、位于第一对象名称之前的字符。

上述待分析文本中字符的排列正向顺序是指:待分析文本中各个字符的排版顺序。例如:假设待分析文本中各个字符是由左到右依次进行排版,待分析文本中字符的排列正向顺序为:由左到右的顺序;假设待分析文本中各个字符是由上到下依次进行排版,待分析文本中字符的排列正向顺序为:由上到下的顺序。

在这种情况下,位于第一对象名称另一侧的字符包括:沿待分析文本中字符的排列正向顺序、位于第一对象名称之后的字符。

例如:假设待分析文本中各个字符是由左到右依次进行排版,待分析文本为“b听人说a非常高兴”,a为待分析对象的第一对象名称,位于a一侧的字符包括:“b听人说”,位于a另一侧的字符包括:“非常高兴”。

另一种情况下,位于第一对象名称一侧的字符可以包括沿待分析文本中字符的排列反向顺序、位于第一对象名称之后的字符。

沿待分析文本中字符的排列反向顺序、位于第一对象名称之后的字符是指:沿与待分析文本中各个字符的排版顺序相反的顺序、位于第一对象名称之后的字符。沿待分析文本中字符的排列反向顺序、位于第一对象名称之前的字符是指:沿与待分析文本中各个字符的排列顺序相反的顺序、位于第一对象名称之前的字符。

在这种情况下,位于第一对象名称另一侧的字符可以包括沿待分析文本中字符的排列反向顺序、位于第一对象名称之前的字符。

例如:假设待分析文本中各个字符是由左到右依次进行排版,待分析文本为“b听人说a非常高兴”,a为待分析对象的第一对象名称,位于a一侧的字符包括:“b听人说”,位于a另一侧的字符包括:“非常高兴”。

上述待分析文本中位于第一对象名称两侧的字符所表达的待分析对象的情感可以包括:喜悦、开心、惊喜、烦躁、愤怒、哀伤、忧虑、恐惧、疑惑等多种情感,并不做具体限定。

上述待分析文本中位于第一对象名称两侧的字符所表达的待分析对象的情感的特征用于反映待分析文本中位于第一对象名称两侧的字符所表达的待分析对象的情感的信息,上述信息可以为情感倾向信息、情感强烈程度信息等。

在获得待分析文本所表达的待分析对象的情感时,待分析对象的第一对象名称会由于自身所表达的情感的特征可能会影响获得待分析对象的情感的准确度。因此,分别提取待分析文本中位于第一对象名称两侧的字符所表达的待分析对象的情感的特征,而屏蔽第一对象名称所表达情感的特征,这样能够提高对对象进行情感分析的准确度。

具体的,在提取上述待分析文本中位于第一对象名称两侧的字符所表达的待分析对象的情感的特征时,可以通过网络模型中的lstm(longshort-termmemory,长短期记忆网络)层提取待分析文本中位于第一对象名称两侧的字符所表达的待分析对象的情感的特征。

另外,本发明的一个实施例中,还可以对待分析文本中位于第一对象名称两侧的字符分别进行语义分析,然后根据语义分析的结果,获得位于第一对象名称两侧的字符分别表达待分析对象的情感的特征。

例如:假设待分析文本为:“b和a一起玩耍,a和b都非常快乐”,“a”为待分析对象的对象名称。“a”在待分析文本中出现两次,按照从左到右的顺序,针对第一个“a”,第一个“a”两侧的字符为“b和”、“一起玩耍,a和b都非常快乐”,提取第一个“a”两侧的字符所表达情感的特征,作为第一个“a”对应的第一情感特征和第二情感特征;第二个“a”两侧的字符为:“b和a一起玩耍”、“和b都非常快乐”,提取第二个“a”两侧的字符所表达情感的特征,作为第二个“a”对应的第一情感特征和第二情感特征。

s104:基于所提取的各第一情感特征与第二情感特征,预测待分析文本所表达的待分析对象的情感。

由于待分析文本所表达的待分析对象的情感的特征与待分析文本中各个字符所表达的情感的特征之间具有关联性、一致性以及完整性。而第一情感特征、第二情感特征分别为待分析文本中位于第一对象名称两侧的字符所表达的待分析对象的情感的特征,所以所提取的情感特征是与待分析文本所表达的待分析对象的情感的特征之间的关联程度较高的、且具有延续性。因此,基于第一情感特征与第二情感特征,可以对待分析文本所表达的待分析对象的情感进行预测,并且所预测到的待分析对象的情感的准确度较高。

具体的,在预测待分析文本所表达的待分析对象的情感时,可以确定所提取的各第一情感特征、第二情感特征分别为每一预设情感的特征的概率,根据所确定的概率,综合确定待分析文本所表达的待分析对象的情感。

本发明的一个实施例中,可以通过神经网络模型中的全连接层预测第一情感特征、第二情感特征为每一预设情感的特征的程度。

上述第一情感特征、第二情感特征为每一预设情感的特征的程度可以用概率、分数值表示。

由以上可见,应用本实施例提供的方案对对象情感进行分析时,由于待分析文本所表达的待分析对象的情感的特征与待分析文本中各个字符所表达的情感的特征之间具有关联性、一致性以及完整性。而第一情感特征、第二情感特征分别为待分析文本中位于第一对象名称两侧的字符所表达的待分析对象的情感的特征,所以上述第一情感特征、第二情感特征是与待分析文本所表达的待分析对象的情感的特征之间的关联程度较高的、且具有延续性。因此,基于第一情感特征与第二情感特征,可以对待分析文本所表达的待分析对象的情感进行预测,相较于现有技术,应用本实施例提供的方案对对象情感进行分析时,能够提高对对象情感分析的准确度。

另外,由于待分析对象的标识,也就是对象名称会由于自身所表达的情感的特征可能会影响获得待分析对象的情感的准确度。因此,分别提取待分析文本中位于第一对象名称两侧的字符所表达的待分析对象的情感的特征,而屏蔽对象名称所表达情感的特征,这样能够进一步提高对对象进行情感分析的准确度。

参见图2,图2为本发明实施例提供的第二种对象情感分析方法的流程示意图,可以按照以下s103a1-s103a2实现上述s103中针对待分析文本中的每一第一对象名称,分别提取待分析文本中位于第一对象名称两侧的字符所表达的待分析对象的情感的特征,作为第一情感特征和第二情感特征。

s103a1:基于待分析文本中每一字符的上下文信息,对待分析文本中各个字符进行编码,得到各个字符分别对应的字符编码结果。

由于文本整体表达的信息与每一字符在文本表达的信息具有整体性、统一性,上述待分析文本中每一字符的上下文信息与待分析文本整体所表达的信息相统一的,上述信息可以为语义信息、描述环境信息、描述对象动作、心理活动信息等信息。例如:文本整体所表达的语义信息,与每一字符在文本表达的语义信息具有整体性、统一性。

上述字符对应的字符编码结果能够用于表示字符的字符结构信息、发音信息、语义信息等信息。上述字符编码结果可以用字向量的形式表征。

具体的,由于在不同文本中,相同字符的语义信息、发音信息等信息可能会有所不同。那么,在对待分析文本中各个字符进行编码时,可以结合待分析文本中每一字符的上下文信息,获得每一字符对应的字符编码结果。这样,所获得的每一字符对应的字符编码结果表达的字符的语义信息、发音信息等信息是与待分析文本中整体所表达的信息有关。从而使得每一字符分别对应的字符编码结果能够更加准确反映待分析文本中每一字符所表达的信息。

本发明的一个实施例中,在上述s103a1中基于待分析文本中每一字符的上下文信息,对待分析文本中各个字符进行编码,得到各个字符分别对应的字符编码结果时,可以采用bert(bidirectionalencoderrepresentationsfromtransformers,双向编码器)预训练模型对待分析文本中每一字符的进行编码。

上述bert预训练模型以字符为单位进行编码,并且采用了多层的transformer编码器,在对文本中每一字符进行编码时结合了文本内上下文信息。

具体的,在采用bert预训练模型时,以待分析文本的每一字符作为输入,得到每一字符分别对应的字符编码结果。

s103a2:针对待分析文本中的每一第一对象名称,分别提取第一编码结果和第二编码结果所表达的待分析对象的情感的特征,作为第一情感特征和第二情感特征。

上述第一编码结果包括待分析文本中位于第一对象名称一侧的字符对应的字符编码结果。

上述各个字符编码结果按照字符在待分析文本中的排列顺序。

上述第二编码结果包括待分析文本中位于第一对象名称另一侧的字符对应的字符编码结果。

上述各个字符编码结果按照字符在待分析文本中的排列顺序。

由于字符对应的字符编码结果可以用于表示字符对应的语义信息,在将字符编码结果按照字符在待分析文本中的顺序进行排列时,能够根据排列后的字符编码结果,也就是上述第一编码结果、第二编码结果确定待分析文本所表达的完整语义信息,而文本所表达的完整语义信息中包括文本中对象所表达的情感的特征。因此,可以分别对第一编码结果和第二编码结果所表达情感的特征进行提取,获得第一情感特征和第二情感特征,基于第一情感特征和第二情感特征确定待分析文本中待分析对象所表达的情感的特征。

具体的,在确定上述第一编码结果时,可以将上述待分析文本中位于第一对象名称之前的字符编码结果按照字符在待分析文本中的顺序进行排列,在确定上述第二编码结果时,可以将上述待分析文本中位于第一对象名称之后的字符编码结果按照字符在待分析文本中的顺序进行排列。

例如:假设待分析文本中每一字符分别对应的字符编码结果从前到后依次为:字符编码结果1、字符编码结果2、字符编码结果3、字符编码结果4、字符编码结果5、字符编码结果6,其中,字符编码结果4为第一对象名称的字符对应的字符编码结果。那么上述第一编码结果可以为:字符编码结果1-字符编码结果2-字符编码结果3,上述第二编码结果可以为字符编码结果5-字符编码结果6。

具体的,在确定上述第一编码结果时,可以将上述待分析文本中位于第一对象名称之前的字符编码结果按照字符在待分析文本中的顺序进行排列,在确定上述第二编码结果时,可以将上述待分析文本中位于第一对象名称之后的字符编码结果按照字符在待分析文本中的反向顺序进行排列。

例如:假设待分析文本中每一字符分别对应的字符编码结果从前到后依次为:字符编码结果1、字符编码结果2、字符编码结果3、字符编码结果4、字符编码结果5、字符编码结果6,其中,字符编码结果4为第一对象名称的字符对应的字符编码结果。那么上述第一编码结果可以为:字符编码结果1-字符编码结果2-字符编码结果3,上述第二编码结果可以为字符编码结果6-字符编码结果5。

在得到第一编码结果和第二编码结果后,可以分别提取第一编码结果和第二编码结果所表达情感的特征,具体的,可以通过网络模型中的lstm层提取待分析文本中位于第一对象名称两侧的字符对应的字符编码结果所表达情感的特征。

这样,由于基于待分析文本中每一字符的上下文信息,对待分析文本中各个字符进行编码,得到各个字符分别对应的字符编码结果,所获得的每一字符对应的字符编码结果与待分析文本所表达的上下文信息有关。从而使得每一字符分别对应的字符编码结果能够更加准确反映待分析文本所表达的上下文信息。进而在分别提取第一编码结果和第二编码结果所表达情感的特征时,所提取情感的特征与待分析文本所表达情感的特征相一致。

本发明的一个实施例中,可以按照以下步骤b1-步骤b4实现上述s103中针对待分析文本中的每一第一对象名称,分别提取待分析文本中位于第一对象名称两侧的字符所表达的待分析对象的情感的特征,作为第一情感特征和第二情感特征。

步骤b1:提取第一类字符中第一个字符所表达情感的特征,作为第一情感特征。

上述第一类字符包括:待分析文本中位于第一对象名称一侧的字符。具体的,上述第一类字符可以为待分析文本中位于第一对象名称之前的各个字符,还可以为待分析文本中位于第一对象名称之后的各个字符。

上述第一类字符中第一个字符为:第一类字符中按照字符在待分析文本中的排列顺序排列的第一个字符。

在确定上述第一情感特征时,可以通过网络模型中的lstm层对第一类字符中第一个字符所表达情感的特征进行提取。

步骤b2:按照排列顺序,提取第一类字符中第一个字符外每一字符所表达情感的特征,并基于所提取的特征更新第一情感特征。

具体的,在提取第一类字符中第一个字符外每一字符所表达情感的特征,并基于所提取的特征更新第一情感特征时,可以按照以下的方式对提取到的特征进行特征更新。

首先将步骤b1中所获得的第一情感特征与第一类字符中第二个字符所表达的情感的特征进行融合,获得第一次融合后的特征,从而对上述第一情感特征进行第一次更新;

然后将第一次融合后的特征与第一类字符中第三个字符所表达的情感的特征进行融合,获得第二次融合后的特征,从而对第一次更新后的第一情感特征进行更新;

按照这样的方法,获得最后一次融合后的特征,从而完成了对第一情感特征进行更新的过程,也就获得了第一情感特征。

另外,上述提取第一类字符中第一个字符外每一字符所表达情感的特征,并基于所提取的特征更新第一情感特征时,也可以通过网络模型中的lstm层中按照第一类字符中各个字符在待分析文本中的排列顺序进行提取,并对第一情感特征进行更新。

步骤b3:提取第二类字符中第一个字符所表达情感的特征,作为第二情感特征。

上述第二类字符包括:待分析文本中位于第一对象名称另一侧的字符。

上述第二类字符中第一个字符为:第二类字符中按照字符在待分析文本中的排列顺序排列的第一个字符。

具体的,当上述第一类字符为待分析文本中位于第一对象名称之前的各个字符时,上述第二类字符为待分析文本中位于第一对象名称之后的各个字符;当上述第一类字符为待分析文本中位于第一对象名称之后的各个字符时,上述第二类字符为待分析文本中位于第一对象名称之前的各个字符。

在确定上述第二情感特征时,可以通过网络模型中的lstm层对第二类字符中按照排列顺序排列的第一个字符所表达情感的特征进行提取。

步骤b4:按照排列顺序,提取第二类字符中第一个字符外每一字符所表达情感的特征,并基于所提取的特征更新第二情感特征。

具体的,在提取第二类字符中第一个字符外每一字符所表达情感的特征,并基于所提取的特征更新第二情感特征时时,可以按照以下的方式对提取到的特征进行特征更新。

首先将步骤b3中所获得的第二情感特征与第二类字符中第二个字符所表达的情感的特征进行融合,获得第一次融合后的特征,从而对上述第二情感特征进行第一次更新;

然后将第一次融合后的特征与第二类字符中第三个字符所表达的情感的特征进行融合,获得第二次融合后的特征,从而对第一次更新后的第二情感特征进行更新;

按照这样的方法,获得最后一次融合后的特征,从而完成了对第二情感特征进行更新的过程,也就获得了第二情感特征。

另外,上述提取第二类字符中第一个字符外每一字符所表达情感的特征,并给予所提取的特征更新第二情感特征时,也可以通过网络模型中的lstm层中按照第二类字符中各个字符在待分析文本中的排列顺序进行提取,并对第二情感特征进行更新。

这样,由于待分析文本所表达的情感的特征与待分析文本中各个字符的排列顺序相关的,因此,按照各个字符在待分析文本中的排列顺序依次对第一情感特征或者第二情感特征进行更新能够获得较为准确的第一情感特征或第二情感特征。

结合上述描述,可以通过网络模型对待分析文本所表达的待分析对象的情感进行分析。参见图3a,图3a为本发明实施例提供的一种网络结构的示意图。

图3a中包括输入层、lstm层、全连接层、输出层。

其中,输入层用于向lstm输入待分析文本中位于对象名称两侧的字符;

lstm层用于提取输入层输入的待分析文本中位于对象名称两侧的字符所表达情感的特征,并基于所提取的特征对当前所提取的情感的特征进行更新,并向全连接层输入所获得的情感的特征;

全连接层用于基于lstm层输入的情感的特征,对待分析文本所表达的待分析对象的情感进行预测,并将预测得到的结果输出。

参见图3b,图3b为本发明实施例提供的第三种对象情感分析方法的流程示意图。图3b中包括bert预训练模型,lstm层、全连接层。

图3b中“w1、w2、……w9”代表待分析文本中按照顺序排列的各个字符,其中,w5为第一对象名称对应的字符。

bert预训练模型用于基于待分析文本中每一字符的上下文信息,对待分析文本中每一字符进行编码。

因此,bert预训练模型的输入为:待分析文本中的每一字符。也就是“w1、w2、……w9”。

bert预训练模型的输出为:待分析文本中每一字符编码后的结果。也就是“e1、e2、……、e9”。

lstm层用于提取待分析文本中位于对象名称两侧的字符所表达的情感的特征。

具体的,对于待分析文本中位于w5一侧的字符,lstm层的输入输出如下表2所示。

表2

由于w1、w2、w3、w4为待分析文本中位于第一对象名称一侧的字符,因此上述w4对应的lstm层输出的为第三次更新后的第一情感特征h4,也就是第一情感特征。

具体的,对于待分析文本中位于w5另一侧的字符,lstm层的输入输出如下表3所示。

表3

由于w6、w7、w8、w9为待分析文本中位于第一对象名称另一侧的字符,因此上述w6对应的lstm层输出的为第三次更新后的第二情感特征h6,也就是第二情感特征。

全连接层用于基于第一情感特征以及第二情感特征,对待分析文本中所表达的待分析对象的情感进行预测。

具体的,全连接层的输入为:第一情感特征、第二情感特征。也就是上述h4、h6。

全连接层的输出为;待分析文本所表达的待分析对象的情感结果。

以图3c为例,图3c为本发明实施例提供的一种得到对象情感方法的流程示意图。

图3b中包括bert预训练模型、tclstm层、全连接层。

其中,bert预训练模型、tclstm层与图3b中bert预训练模型、tclstm层执行功能相同。

全连接层用于对tclstm层输出的情感特征进行多任务学习,得到待分析文本所表达的待分析对象的情感在综合情感、喜、怒、哀、惊、恐、忧、疑的得分。

应用图3c所示的网络结构对待分析文本中待分析对象的情感进行分析时,可以得到待分析对象的情感为综合情感、喜、怒、哀、惊、恐、忧、疑的得分情况,基于得分情况,确定待分析对象的情感。

参见图4,图4为本发明实施例提供的第四种对象情感分析方法的流程示意图,在上述s102之后,还可以包括s105-s106。

s105:确定待分析文本中除待分析对象外其他对象的第二对象名称。

由于在待分析文本中可能包含多个对象的标识,在s102中确定了待分析对象的第一对象名称,可以确定待分析文本中除待分析对象外其他对象的第二对象名称。

例如:假设待分析文本为:“小明听说小红非常生气”,“小明”为待分析对象的第一对象名称,在上述待分析文本中除待分析对象外其他对象的第二对象名称为“小红”,“小红”。

s106:将第一对象名称替换为第一预设对象名称,并将第二对象名称替换为第二预设对象名称。

由于对象的名称中可能会包含情感倾向。例如,“李寻欢”“李莫愁”“冷血”“无情”。基于此,在对对象情感进行分析时,当待分析文本中对象的对象名称包含情感倾向,对对象情感进行分析时可能产生偏差,从而导致对象情感分析的准确度较低。因此,为了能够获得更加准确的对象情感分析结果,可以对待分析文本中对象的对象名称进行替换、更新。

上述第一预设对象名称、第二预设对象名称可以是工作人员根据经验设定的。例如:上述第一预设对象名称可以为a,第二预设对象名称可以为b、c、d等。。

待分析文本中除了待分析对象的对象名称外可能包括多个其他对象的对象名称,因此,在对多个第二对象名称进行替换时,可以替换为相同的第二预设对象名称,也可以替换为不同的第二预设对象名称。

例如:假设待分析文本为:“小明弱魂不守舍地冲小红、小杨笑了笑”,第一对象名称为“小明”,第二对象名称为“小红、小杨”,第一预设对象名称为a,第二预设对象名称为b、c,替换名称后的待分析文本可以为:“a魂不守舍地冲b、c笑了笑”,还可以为“a魂不守舍地冲b、b笑了笑”。

基于此,可以按照以下方式实现上述s103中分别提取待分析文本中位于对象名称两侧的字符所表达情感的特征,作为第一情感特征和第二情感特征。

针对所述待分析文本中的每一第一预设对象名称,分别提取位于第一预设对象名称两侧的字符所表达的待分析对象的情感的特征,作为第一情感特征和第二情感特征。

一种情况下,位于第一预设对象名称一侧的字符可以包括:沿待分析文本中字符的排列正向顺序,位于第一预设对象名称之前的字符。在这种情况下,位于第一预设对象名称另一侧的字符可以包括:沿待分析文本中字符的排列正向顺序、位于第一预设对象名称之后的字符。

另一种情况下,位于第一预设对象名称一侧的字符还可以包括:沿待分析文本中字符的排列反向顺序、位于第一预设对象名称之前的字符。在这种情况下,位于第一预设对象名称另一侧的字符可以包括:沿待分析文本中字符的排列反向顺序、位于第一预设对象名称之后的字符。

由于是将第一对象名称替换为第一预设对象名称,因此,可以对替换标识后的待分析文本中第一预设对象名称两侧的字符所表达情感的特征进行提取。

具体的,在提取位于第一预设对象名称两侧的字符所表达情感的特征时,可以通过网络模型中的lstm层提取位于第一预设对象名称两侧的字符所表达情感的特征。

这样,由于将待分析对象的对象名称替换为第一预设对象名称、其他对象的对象名称替换为第二预设对象名称,从而避免了对象名称中带有情感倾向的信息对对象情感分析结果产生影响,从而能够获得较为准确对对象情感进行分析。另外,由于对替换标识后的待分析文本所表达的待分析对象的情感进行分析,与具体的待分析对象的名称无关,使得本方案更加通用化。

本发明的一个实施例中,可以按照以下步骤c1-c2实现上述s101中获得待分析文本。

步骤c1:确定原始文本中描述对象动作的文本片段,作为备选文本片段。

具体的,原始文本由各种文本类型的文本片段组成,例如:在小说中,通常由描述环境的文本片段、描述对象动作的文本片段以及描述对象对白的文本片段等组成。

上述描述对象动作的文本片段可以理解为:描述对象行为、且非对白的文本片段。

由于剧本、小说等原始文本通常通过描述对象动作的文本片段展现对象的情感,因此,可以根据原始文本中描述对象动作的文本片段对对象情感进行分析。例如:假设描述对象动作的文本片段为:“包惜弱魂不守舍地冲杨铁心笑了笑”。上述文本片段中描述了“包惜弱”这一对象的动作,即“冲杨铁心笑了笑”,从上述文本片段中可以看出“包惜弱”这一对象的情感是较为积极的情感。

在确定原始文本中描述对象动作的文本片段时,可以对原始文本中包括的各个文本片段的文本类型进行识别,从而获得描述对象动作的文本片段。

由于在剧本、小说等原始文本中,包含的对象较多。根据各个对象在原始文本中重要性程度,可以将对象分为主要对象、次要对象以及无关对象。例如:在小说《西游记》中,主要对象为:孙悟空、唐僧等,次要对象为:玉皇大帝、如来佛祖等,无关对象为:虾兵蟹将等。由于对无关对象的情感进行分析对于理解文本内容并无较大帮助,基于此,本发明的一个实施例中,在确定原始文本中描述对象动作的文本片段时,可以对原始文本中描述主要对象动作或者次要对象动作的文本片段进行确定,而对原始文本中描述无关对象动作的文本片段不进行处理。

步骤c2:从原始文本中,获得预设长度、且包含备选文本片段以及相邻文本片段的文本,作为待分析文本。

上述相邻文本片段包括:在备选文本片段之前相邻预设长度的文本片段、或者在备选文本片段之后相邻预设长度的文本片段、或者在备选文本片段前后相邻预设长度的文本片段。。

由于各个文本片段所表达的对象的情感之间可能会有所差异、甚至完全不同,若仅对单个文本片段进行分析,只能获得单个文本片段所表达的对象的情感,而上述所获得的对象的情感并不能完整表示原始文本中所表达的对象的情感。因此可以将包含备选文本片段以及相邻文本片段的文本作为待分析文本,针对待分析文本所表达的对象的情感进行分析,从而能够获得更为准确的对象的情感。

上述预设长度可以由工作人员根据经验设定的,例如:上述预设长度可以为128个字符。

由于各个文本片段的长度均不相同,可能会发生包含备选文本片段以及相邻文本片段的文本的长度较长的情况。由于电子设备的内存大小有限,在后续对待分析文本进行处理的过程中,可能会出现处理时间较长甚至无法处理等问题。因此,可以对待分析文本的长度进行限制。

例如:假设原始文本由文本片段a、文本片段b、文本片段c、文本片段d、文本片段e按照顺序依次组成,文本片段a的字符长度为10个字符,文本片段b的字符长度为20个字符,文本片段c的字符长度为80个字符,文本片段d的字符长度为10个字符,文本片段e的字符长度为20个字符,预设长度为120个字符。其中,文本片段c为备选文本文本片段,那么在确定待分析文本时,由于文本片段b和文本片段d为文本片段c相邻的文本片段,且文本片段b、文本片段c、文本片段d三个文本片段的字符长度之和为110个字符,未超过预设长度,因此,可以获得包含文本片段b、文本片段c、文本片段d的文本作为待分析文本。

这样,将预设长度、且包含备选文本片段以及相邻文本片段的文本作为待分析文本,由于包含备选文本片段以及相邻文本片段的文本更加全面展现对象的情感,因此对上述待分析文本进行分析可以获得文本中所表达的对象的情感。另外,对待分析文本的长度限制,避免了电子设备内存条件不足的情况下,难以对待分析文本进行分析。

本发明的一个实施例中,可以按照以下步骤d1-步骤d3实现上述s104中基于所提取的各第一情感特征与第二情感特征,预测待分析文本所表达的待分析对象的情感。

步骤d1:对所提取的各第一情感特征与第二情感特征进行特征融合。

具体的,在对所提取的各第一情感特征与第二情感特征进行特征融合时,可以将所提取的各第一情感特征与第二情感特征进行拼接,将拼接后的情感特征作为融合后的情感特征。

在对所提取的各第一情感特征与第二情感进行特征融合时,还可以将所提取的各第一情感特征与第二情感特征进行加权变换,将变换后的情感特征作为融合后的情感特征。

步骤d2:确定融合后的情感特征与每一预设情感的特征间的匹配程度。

上述预设情感可以为工作人员设定的,上述预设情感可以包括:喜、怒、哀、惊、恐、忧、疑以及综合情感等,并不做具体限制。上述综合情感表示情感的整体倾向,例如:正向情感和负向情感,积极情感和消极情感。

上述融合后的情感特征与每一预设情感的特征间的匹配程度可以用融合后的情感特征为每一预设情感的特征的概率或者分值表征。

本发明的一个实施例中,上述预设情感可以包括粗粒度情感,上述粗粒度情感还可以包括细粒度情感。

具体的,上述粗粒度情感可以分为正向情感与负向情感、积极情感与消极情感等。

上述细粒度情感为每一粗粒度情感中具体划分的情感。例如,若粗粒度情感为积极情感、消极情感,在积极情感中可以包括喜、乐等,在消极情感中可以包括哀、怒、悲等。

基于上述实施例,在确定融合后的情感特征与每一预设情感的特征间的匹配程度时,可以确定融合后的情感特征与每一粗粒度情感的特征间的匹配程度,并确定融合后的情感特征与每一粗粒度情感包括的每一细粒度情感间的匹配程度。

具体的,在确定上述融合后的情感特征与每一粗粒度情感的特征间的匹配程度、以及每一粗粒度情感包括的每一细粒度情感的特征间的匹配程度时,可以并行确定融合后的情感特征与上述每一粗粒度情感以及每一细粒度情感的特征间的匹配程度。还可以在确定融合后的情感特征与上述每一粗粒度情感的特征间的匹配程度后,再确定融合后的情感特征与粗粒度情感中包含的每一细粒度情感间的匹配程度。

具体的,可以通过网络模型中的全连接层确定融合后的情感特征与每一粗粒度情感的特征以及每一细粒度情感的特征间的匹配程度。

在训练上述网络模型时,以样本文本的样本情感特征为输入,以样本文本所表达的样本对象的情感为每一粗粒度情感以及每一细粒度情感的特征的真实概率为训练基准,对初始网络模型进行训练得到的,用于获得文本的情感特征与每一粗粒度情感以及每一细粒度情感的特征的匹配程度。

在训练初始网络模型的过程中,可以并行进行多个回归任务的学习,根据损失函数不断调整初始网络模型的参数,直至满足模型训练结束条件。上述损失函数可以为:

其中,wamp标识粗粒度情感任务的权重,loss粗粒度情感为粗粒度情感任务的损失值,n为细粒度情感的数量,n为细粒度情感的序号,lossn为第n个细粒度情感任务的损失值,loss为损失函数的损失值。

步骤d3:根据所确定的匹配程度,确定待分析文本所表达的待分析对象的情感。

假设用融合后的情感特征为预设情感的特征的分数值表征融合后的情感特征与每一预设情感的特征的匹配程度,当融合后的情感特征为某一预设情感的特征的分数值高于其他预设情感的特征的分数值时,可以确定待分析文本所表达的待分析对象的情感。

本发明的一个实施例中,可以根据按照以下方式根据所确定的匹配程度,确定待分析文本所表达的待分析对象的情感。

根据所确定的融合后的情感特征与每一粗粒度情感的匹配程度,确定待分析文本所表达的待分析对象的粗粒度情感;根据所确定的融合后的情感特征与所确定的粗粒度情感包括的每一细粒度情感的特征的匹配程度,确定待分析文本所表达的待分析对象的细粒度情感。

具体的,在根据所确定的融合后的情感特征与每一粗粒度情感的匹配程度,确定待分析文本所表达的待分析对象的粗粒度情感时,可以根据所确定的融合后的情感特征与每一粗粒度情感的匹配程度,将表征所确定的融合后的情感特征为每一粗粒度情感的程度大的粗粒度情感确定为待分析文本所表达的待分析对象的粗粒度情感。

例如:假设用分数值表征所确定的融合后的情感特征与每一粗粒度情感的匹配程度,预设分数值区间为[0.4],0表示程度最弱,4表示程度最强,粗粒度情感分为积极情感、消极情感。若所确定的融合后的情感特征为积极情感的分数值为3所确定的融合后的情感特征为消极情感的分数值为0,因此可以确定待分析文本所表达的待分析对象的粗粒度情感为积极情感。

在根据所确定的融合后的情感特征与所确定的粗粒度情感包括的每一细粒度情感的特征的匹配程度,确定待分析文本所表达的待分析对象的情感时,可以根据所确定的融合后的情感特征为每一细粒度情感的程度,将表征所确定的融合后的情感特征为每一粗粒度情感的程度大的细粒度情感确定为待分析文本所表达的待分析对象的细粒度情感。

例如:假设用分数值表征所确定的融合后的情感特征与每一粗粒度情感的匹配程度,预设分数值区间为[0.4],0表示程度最弱,4表示程度最强,粗粒度情感分为积极情感、消极情感,积极情感包括喜、乐,消极情感包括怒、哀,若所确定的融合后的情感特征为积极情感的分数值为4,所确定的融合后的情感特征为消极情感的分数值为0,那么待分析文本所表达的待分析对象的情感为积极情感。而所确定的融合后的情感特征为积极情感中的“喜”的分数值4,所确定的融合后的情感特征为积极情感中的“乐”的分数值为3,因此,待分析文本所表达的待分析对象的情感为“喜”。

这样,由于将第一情感特征和第二情感特征进行融合,根据融合后的情感特征能够更加准确确定待分析文本所表达的待分析对象的情感。

下面以一个具体实施例对本发明实施例提供的对象情感分析方法进行具体的解释。

参见图5,图5为本发明实施例提供的第五种对象情感分析方法的流程示意图。

第一步:获得原始剧本。

第二步:对原始剧本进行拆解,得到待分析剧本text_current,并得到与待分析剧本之前相邻的5句范围内的剧本text_previous,对得到的text_current和text_previous进行拼接,得到包含前文语境的文本text_long。

第三步:对原始剧本进行人名识别,得到原始剧本中各个角色的对象名称。

第四步:对包含前文语境的文本text_long进行截断,得到长度为128个字符文本text_truncated。

第五步:基于第三步中得到的各个角色的对象名称,对text_truncated中出现的角色的对象名称进行替换,得到匿名化文本

具体的,将待分析对象的第一对象名称替换为第一预设对象名称,将除待分析对象外的其他对象的第二对象名称替换为第二预设对象名称。

第六步:将匿名化文本输入至bert预训练模型,获得字编码后文本。

第七步:将字编码后文本输入至网络模型中的tclstm层,获得待分析剧本中第一情感特征以及第二情感特征。

第八步:tclstm层的输出结果输入至网络模型中的全连接层,从而获得待分析剧本所表达的待分析对象的8项情感得分。

与上述对象情感分析方法相对应,本发明实施例还提供了一种对象情感分析装置。

参见图6,图6为本发明实施例提供的第一种对象情感分析装置的结构示意图,上述装置包括601-604。

文本获得模块601,用于获得待分析文本;

第一名称确定模块602,用于确定所述待分析文本中待分析对象的第一对象名称;

特征提取模块603,用于针对所述待分析文本中的每一第一对象名称,分别提取所述待分析文本中位于第一对象名称两侧的字符所表达的所述待分析对象的情感的特征,作为第一情感特征和第二情感特征,其中,位于第一对象名称一侧的字符包括:沿所述待分析文本中字符的排列正向顺序、位于所述第一对象名称之前的字符,或者沿所述待分析文本中字符的排列反向顺序、位于所述第一对象名称之后的字符;

情感预测模块604,用于基于所提取的各第一情感特征与第二情感特征,预测所述待分析文本所表达的所述待分析对象的情感。

由以上可见,应用本实施例提供的方案对对象情感进行分析时,由于待分析文本所表达的待分析对象的情感的特征与待分析文本中各个字符所表达的情感的特征之间具有关联性、一致性以及完整性。而第一情感特征、第二情感特征分别为待分析文本中位于第一对象名称两侧的字符所表达的待分析对象的情感的特征,所以上述第一情感特征、第二情感特征是与待分析文本所表达的待分析对象的情感的特征之间的关联程度较高的、且具有延续性。因此,基于第一情感特征与第二情感特征,可以对待分析文本所表达的待分析对象的情感进行预测,相较于现有技术,应用本实施例提供的方案对对象情感进行分析时,能够提高对对象情感分析的准确度。

另外,由于待分析对象的标识,也就是对象名称会由于自身所表达的情感的特征可能会影响获得待分析对象的情感的准确度。因此,分别提取待分析文本中位于第一对象名称两侧的字符所表达的待分析对象的情感的特征,而屏蔽对象名称所表达情感的特征,这样能够进一步提高对对象进行情感分析的准确度。

参见图7,图7为本发明实施例提供的第二种对象情感分析装置的结构示意图,上述装置还包括:

第二名称确定模块605,用于在所述第一名称确定模块之后,确定所述待分析文本中除所述待分析对象外其他对象的第二对象名称;

名称替换模块606,用于将所述第一对象名称替换为第一预设对象名称,并将所述第二对象名称替换为第二预设对象名称;

所述特征提取模块603,具体用于针对所述待分析文本中的每一第一预设对象名称,分别提取位于所述第一预设对象名称两侧的字符所表达的所述待分析对象的情感的特征,作为第一情感特征和第二情感特征。

这样,由于将待分析对象的对象名称替换为第一预设对象名称、其他对象的对象名称替换为第二预设对象名称,从而避免了对象名称中带有情感倾向的信息对对象情感分析结果产生影响,从而能够获得较为准确对对象情感进行分析。另外,由于对替换标识后的待分析文本所表达的待分析对象的情感进行分析,与具体的待分析对象的名称无关,使得本方案更加通用化。

参见图8,图8为本发明实施例提供的第三种对象情感分析装置的结构示意图,在上述特征提取模块603中还可以包括603e1-603e2。

字符编码子模块603e1,用于基于所述待分析文本中每一字符的上下文信息,对所述待分析文本中各个字符进行编码,得到各个字符分别对应的字符编码结果;

第一特征提取子模块603e2,用于针对所述待分析文本中的每一第一对象名称,分别提取第一编码结果和第二编码结果所表达的所述待分析对象的情感的特征,作为第一情感特征和第二情感特征,其中,所述第一编码结果包括所述待分析文本中位于所述第一对象名称一侧的字符对应的字符编码结果,所述第二编码结果包括所述待分析文本中位于所述第一对象名称另一侧的字符对应的字符编码结果。

这样,由于基于待分析文本中每一字符的上下文信息,对待分析文本中各个字符进行编码,得到各个字符分别对应的字符编码结果,所获得的每一字符对应的字符编码结果与待分析文本所表达的上下文信息有关。从而使得每一字符分别对应的字符编码结果能够更加准确反映待分析文本所表达的上下文信息。进而在分别提取第一编码结果和第二编码结果所表达情感的特征时,所提取情感的特征与待分析文本所表达情感的特征相一致。

本发明的一个实施例中,上述特征提取模块,包括:

第二特征提取子模块,用于提取第一类字符中第一个字符所表达情感的特征,作为第一情感特征,其中,所述第一类字符包括:所述待分析文本中位于所述第一对象名称一侧的字符,所述第一类字符中第一个字符为:所述第一类字符中按照字符在所述待分析文本中的排列顺序排列的第一个字符;

第一特征更新子模块,用于按照所述排列顺序,提取所述第一类字符中第一个字符外每一字符所表达情感的特征,并基于所提取的特征更新所述第一情感特征;

第三特征提取子模块,用于提取第二类字符中第一个字符所表达情感的特征,作为第二情感特征,其中,所述第二类字符包括:所述待分析文本中位于所述第一对象名称另一侧的字符,所述第二类字符中第一个字符为:所述第二类字符中按照字符在所述待分析文本中的所述排列顺序排列的第一个字符;

第二特征更新子模块,用于按照所述排列顺序,提取所述第二类字符中第一个字符外每一字符所表达情感的特征,并基于所提取的特征更新所述第二情感特征。

这样,由于待分析文本所表达的情感的特征与待分析文本中各个字符的排列顺序相关的,因此,按照各个字符在待分析文本中的排列顺序依次对第一情感特征或者第二情感特征进行更新能够获得较为准确的第一情感特征或第二情感特征。

本发明的一个实施例中,上述情感预测模块604,包括:

特征融合子模块,用于对所提取的各第一情感特征与第二情感特征进行特征融合;

程度确定子模块,用于确定融合后的情感特征与每一预设情感的特征间的匹配程度;

情感预测子模块,用于根据所确定的匹配程度,确定所述待分析文本所表达的所述待分析对象的情感。

这样,由于将第一情感特征和第二情感特征进行融合,根据融合后的情感特征能够更加准确确定待分析文本所表达的待分析对象的情感。

本发明的一个实施例中,上述文本获得模块601,包括:

文本片段确定子模块,用于确定原始文本中描述对象动作的文本片段,作为备选文本片段;

文本获得子模块,用于从所述原始文本中,获得预设长度、且包含所述备选文本片段以及相邻文本片段的文本,作为待分析文本,其中,所述相邻文本片段包括:在所述备选文本片段之前相邻预设长度的文本片段、或者在所述备选文本片段之后相邻预设长度的文本片段、或者在备选文本片段前后相邻预设长度的文本片段。

这样,将预设长度、且包含备选文本片段以及相邻文本片段的文本作为待分析文本,由于包含备选文本片段以及相邻文本片段的文本更加全面展现对象的情感,因此对上述待分析文本进行分析可以获得文本中所表达的对象的情感。另外,对待分析文本的长度限制,避免了电子设备内存条件不足的情况下,难以对待分析文本进行分析。

与上述对象情感分析方法相对应,本发明实施例还提供了一种电子设备。

参见图9,图9为本发明实施例提供的一种电子设备的结构示意图,包括处理器901、通信接口902、存储器903和通信总线904,其中,处理器901,通信接口902,存储器903通过通信总线904完成相互间的通信,

存储器903,用于存放计算机程序;

处理器901,用于执行存储器903上所存放的程序时,实现本发明实施例提供的对象情感分析方法。

上述电子设备提到的通信总线可以是外设部件互连标准(peripheralcomponentinterconnect,pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(randomaccessmemory,ram),也可以包括非易失性存储器(non-volatilememory,nvm),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器,包括中央处理器(centralprocessingunit,cpu)、网络处理器(networkprocessor,np)等;还可以是数字信号处理器(digitalsignalprocessing,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现本发明实施例提供的对象情感分析方法。

在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行时实现本发明实施例提供的对象情感分析方法。

由以上可见,应用本实施例提供的方案对对象情感进行分析时,由于待分析文本所表达的待分析对象的情感的特征与待分析文本中各个字符所表达的情感的特征之间具有关联性、一致性以及完整性。而第一情感特征、第二情感特征分别为待分析文本中位于第一对象名称两侧的字符所表达的待分析对象的情感的特征,所以上述第一情感特征、第二情感特征是与待分析文本所表达的待分析对象的情感的特征之间的关联程度较高的、且具有延续性。因此,基于第一情感特征与第二情感特征,可以对待分析文本所表达的待分析对象的情感进行预测,相较于现有技术,应用本实施例提供的方案对对象情感进行分析时,能够提高对对象情感分析的准确度。

另外,由于待分析对象的标识,也就是对象名称会由于自身所表达的情感的特征可能会影响获得待分析对象的情感的准确度。因此,分别提取待分析文本中位于第一对象名称两侧的字符所表达的待分析对象的情感的特征,而屏蔽对象名称所表达情感的特征,这样能够进一步提高对对象进行情感分析的准确度。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘solidstatedisk(ssd))等。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、计算机可读存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1