计算机执行的文本情感分析方法及装置与流程

文档序号:19738195发布日期:2020-01-18 04:48阅读:197来源:国知局
计算机执行的文本情感分析方法及装置与流程
本说明书一个或多个实施例涉及计算机领域,尤其涉及计算机执行的文本情感分析方法及装置,计算机执行的图片情感分析方法及装置,计算机执行的样本类别分析方法及装置,获取标注数据的方法及装置。
背景技术
:文本情感分析,是指分析文本所表达的情感色彩,通常被应用于评估用户对某件产品或某项服务的喜好情况。例如,通过分析用户针对某件商品的所发表的评价内容,判断该用户对该件商品的满意度。又例如,通过分析用户针对某个观点所发表的意见内容,判断此用户对是否赞同此观点。随着机器学习的快速发展,建立预测模型以用于文本情感分析成为研究热点。然而,目前预测模型所预测结果的准确性不够高,难以满足实际需求,尤其是在所需要分析的情感之间差别细微,例如,需要区分生气和愤怒的情况下,很难得到置信度高的预测结果。因此,迫切需要一种改进方案,可以提高模型预测结果的准确度。技术实现要素:本说明书一个或多个实施例描述了计算机执行的文本情感分析方法及装置,可以提高文本情感分析模型的预测结果的准确度。根据第一方面,提供一种计算机执行的文本情感分析方法,该方法包括:获取对第一文本进行标注而得到的标注数据,所述标注数据包括针对第一情感方面从多个备选情感倾向中选择的第一情感倾向,以及从针对所述第一情感倾向的多个备选情感强度中选择的第一情感强度;基于预先确定的所述多个备选情感倾向和所述多个备选情感强度的备选组合与备选情感类别标签之间的映射关系,确定与所述第一情感倾向和第一情感强度的组合对应的第一情感类别标签;基于所述第一文本和第一情感类别标签,确定第一训练样本,用于训练文本情感分析模型,以对待分析的文本进行情感分析。在一个实施例中,所述第一情感方面为以下中的一种:愉快、乐观、进取、热爱、谦恭、敬畏、赞成和自责。根据第二方面,提供一种计算机执行的文本情感分析方法,该方法包括:获取对第一文本进行标注而得到的标注数据,所述标注数据包括,针对预先设定的处于多个层级的多个情感维度中的各个情感维度,从备选维度值中选择的各个选定维度值;基于预先确定的所述各个情感维度的备选维度值的各个备选组合与备选情感类别标签之间的映射关系,确定与所述各个选定维度值的组合对应的第一情感类别标签;基于所述第一文本和第一情感类别标签,确定第一训练样本,用于训练文本情感分析模型,以对待分析的文本进行情感分析。在一个实施例中,所述多个情感维度包括以下中的至少一个:情感方面、情感倾向、情感强度。根据第三方面,提供一种计算机执行的图片情感分析方法,该方法包括:获取对第一图片进行标注而得到的标注数据,所述标注数据包括针对第一情感方面从多个备选情感倾向中选择的第一情感倾向,以及从针对所述第一情感倾向的多个备选情感强度中选择的第一情感强度;基于预先确定的所述多个备选情感倾向和所述多个备选情感强度的备选组合与备选情感类别标签之间的映射关系,确定与所述第一情感倾向和第一情感强度的组合对应的第一情感类别标签;基于所述第一图片和第一情感类别标签,确定第一训练样本,用于训练图片情感分析模型,以对待分析的图片进行情感分析。根据第四方面,提供一种计算机执行的针对目标样本的分类方法,包括:获取对第一样本进行标注而得到的标注数据,所述标注数据包括,针对预先设定的多个分类层级中的各个分类层级,从各个备选类目中选择的各个选定类目;基于预先确定的所述各个分类层级的各个备选类目的备选组合与备选类别标签之间的映射关系,确定与所述各个选定类目的组合对应的第一类别标签;基于所述第一样本和第一类别标签,确定第一训练样本,用于训练分类模型,以对待分类的目标样本进行分类。根据第五方面,提供一种获取标注数据的方法,该方法包括:向标注人员提供待标注的文本或图片,以及针对第一情感方面的多个备选情感倾向和针对各个备选情感倾向的多个备选情感强度;获取所述标注人员从所述多个备选情感倾向中选择的第一情感倾向和从针对所述第一情感倾向的多个备选情感强度中选择的第一情感强度,将所述第一情感倾向和所述第一情感强度作为针对所述文本或图片的标注数据。在一个实施例中,所述向标注人员提供待标注的文本或图片,以及针对第一情感方面的多个备选情感倾向和针对各个备选情感倾向的多个备选情感强度,包括:显示交互界面,所述交互界面中包括所述待标注的文本或图片,所述多个备选情感倾向和针对各个备选情感倾向的多个备选情感强度;所述获取所述标注人员从所述多个备选情感倾向中选择的第一情感倾向和从针对所述第一情感倾向的多个备选情感强度中选择的第一情感强度,包括:接收所述标注人员基于所述交互界面选择的第一情感倾向和第一情感强度。根据第六方面,提供一种获取标注数据的方法,该方法包括:向标注人员提供待标注的文本或图片,以及预先设定的处于多个层级的多个情感维度中,各个情感维度的备选维度值;获取所述标注人员从各个情感维度的备选维度值中选择的各个选定维度值,将所述各个选定维度值作为针对所述文本或图片的标注数据。根据第七方面,提供一种获取标注数据的方法,该方法包括:向标注人员提供待标注的样本,以及预先设定的多个分类层级中各个分类层级的备选类目;获取所述标注人员从所述各个分类层级的备选类目选择的各个选定类目,将所述各个选定类目作为针对所述样本的标注数据。在一个实施例中,所述向标注人员提供待标注的样本,以及预先设定的多个分类层级中各个分类层级的备选类目,包括:显示交互界面,所述交互界面中包括所述待标注的样本,所述多个分类层级中各个分类层级的备选类目;所述获取所述标注人员从所述各个分类层级的备选类目选择的各个选定类目,包括:接收所述标注人员基于所述交互界面选择的所述各个选定类目。根据第八方面,提供一种计算机执行的文本情感分析装置,该装置包括:标注数据获取单元,配置为获取对第一文本进行标注而得到的标注数据,所述标注数据包括针对第一情感方面从多个备选情感倾向中选择的第一情感倾向,以及从针对所述第一情感倾向的多个备选情感强度中选择的第一情感强度;类别标签确定单元,配置为基于预先确定的所述多个备选情感倾向和所述多个备选情感强度的备选组合与备选情感类别标签之间的映射关系,确定与所述第一情感倾向和第一情感强度的组合对应的第一情感类别标签;训练样本确定单元,配置为基于所述第一文本和第一情感类别标签,确定第一训练样本,用于训练文本情感分析模型,以对待分析的文本进行情感分析。根据第九方面,提供一种计算机执行的文本情感分析装置,包括:标注数据获取单元,配置为获取对第一文本进行标注而得到的标注数据,所述标注数据包括,针对预先设定的处于多个层级的多个情感维度中的各个情感维度,从备选维度值中选择的各个选定维度值;类别标签确定单元,配置为基于预先确定的所述各个情感维度的备选维度值的各个备选组合与备选情感类别标签之间的映射关系,确定与所述各个选定维度值的组合对应的第一情感类别标签;训练样本确定单元,配置为基于所述第一文本和第一情感类别标签,确定第一训练样本,用于训练文本情感分析模型,以对待分析的文本进行情感分析。根据第十方面,提供一种计算机执行的图片情感分析装置,该装置包括:标注数据获取单元,配置为获取对第一图片进行标注而得到的标注数据,所述标注数据包括针对第一情感方面从多个备选情感倾向中选择的第一情感倾向,以及从针对所述第一情感倾向的多个备选情感强度中选择的第一情感强度;类别标签确定单元,配置为基于预先确定的所述多个备选情感倾向和所述多个备选情感强度的备选组合与备选情感类别标签之间的映射关系,确定与所述第一情感倾向和第一情感强度的组合对应的第一情感类别标签;训练样本确定单元,配置为基于所述第一图片和第一情感类别标签,确定第一训练样本,用于训练图片情感分析模型,以对待分析的图片进行情感分析。根据第十一方面,提供一种计算机执行的针对目标样本的分类装置,包括:标注数据获取单元,配置为获取对第一样本进行标注而得到的标注数据,所述标注数据包括,针对预先设定的多个分类层级中的各个分类层级,从各个备选类目中选择的各个选定类目;类别标签确定单元,配置为基于预先确定的所述各个分类层级的各个备选类目的备选组合与备选类别标签之间的映射关系,确定与所述各个选定类目的组合对应的第一类别标签;训练样本确定单元,配置为基于所述第一样本和第一类别标签,确定第一训练样本,用于训练分类模型,以对待分类的目标样本进行分类。根据第十二方面,提供一种获取标注数据的装置,该装置包括:提供单元,配置为向标注人员提供待标注的文本或图片,以及针对第一情感方面的多个备选情感倾向和针对各个备选情感倾向的多个备选情感强度;获取单元,配置为获取所述标注人员从所述多个备选情感倾向中选择的第一情感倾向和从针对所述第一情感倾向的多个备选情感强度中选择的第一情感强度,将所述第一情感倾向和所述第一情感强度作为针对所述文本或图片的标注数据。根据第十三方面,提供一种获取标注数据的装置,包括:提供单元,配置为向标注人员提供待标注的文本或图片,以及预先设定的处于多个层级的多个情感维度中,各个情感维度的备选维度值;获取单元,配置为获取所述标注人员从各个情感维度的备选维度值中选择的各个选定维度值,将所述各个选定维度值作为针对所述文本或图片的标注数据。根据第十四方面,提供一种获取标注数据的装置,包括:提供单元,配置为向标注人员提供待标注的样本,以及预先设定的多个分类层级中各个分类层级的备选类目;获取单元,配置为获取所述标注人员从所述各个分类层级的备选类目选择的各个选定类目,将所述各个选定类目作为针对所述样本的标注数据。根据第十五方面,提供一种计算机可读存储介质,其上存储有计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行第一方面至第七方面中任一方面的所述的方法。根据第十六方面,提供一种计算设备,包括存储器和处理器,其中,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面至第七方面中任一项所述的方法。采用本说明书实施例披露的文本情感分析方法,可以根据第一文本的标注数据,确定对应的第一情感类别标签,进而确定第一训练样本,同理可以确定出其他多个训练样本,构建训练样本集,进而训练文本情感分析模型。因其中标注数据具有较高的有效性、一致性,相应确定的标签数据也具有较高的有效性和一致性,进而使得训练出的文本情感分析模型可用性高,所得预测结果的置信度高,准确度高,具有较高的使用价值。附图说明为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1示出本说明书披露的一个实施例的实施场景示意图;图2示出根据一个实施例的文本情感分析方法的流程图;图3示出根据一个实施例的获取标注数据的方法流程图;图4示出根据一个实施例的用于获取标注数据的交互界面示意图;图5示出根据另一个实施例的用于获取标注数据的交互界面示意图;图6示出根据一个实施例的包含标注数据的excel文档局部示意图;图7示出根据一个实施例的图片情感分析方法的流程图;图8示出根据另一个实施例的文本情感分析方法的流程图;图9示出根据一个实施例的针对目标样本的分类方法流程图;图10示出根据另一个实施例的获取标注数据的方法流程图;图11示出根据又一个实施例的获取标注数据的方法流程图;图12示出根据又一个实施例的获取标注数据的方法流程图;图13示出根据一个实施例的文本情感分析装置的示意性框图;图14示出根据一个实施例的图片情感分析装置的示意性框图;图15示出根据另一个实施例的文本情感分析装置的示意性框图;图16示出根据一个实施例的针对目标样本的装置的示意性框图;图17示出根据一个实施例的获取标注数据的装置的示意性框图;图18示出根据另一个实施例的获取标注数据的装置的示意性框图;图19示出根据又一个实施例的获取标注数据的装置的示意性框图。具体实施方式下面结合附图,对本说明书实施例提供的方案进行描述。如前所述,目前尝试建立用于文本情感分析的预测模型。根据一种实施方式,对带有情感色彩的文本进行人工标注,形成标注文本,然后利用这些标注文本作为训练样本,训练文本情感分析模型。图1为本说明书披露的一个实施例的实施场景示意图。如图1所示,利用人工标注的文本形成训练样本集,然后计算平台用训练样本集训练文本情感分析模型。在训练得到文本情感分析模型之后,对于待分析的文本,如新产生的商品评价,就可以将商品评价上传到计算平台,利用该文本情感分析模型,分析出该文本的情感色彩。在以上有监督的机器学习过程中,需要基于大量的人工标注文本进行模型训练。文本的标注方式决定了获取到怎样的训练样本,进一步地决定了模型的训练效果。因此,需要考虑训练样本的标注方式的问题。在一种实施方式中,可以直接向打标人员提供一些备选的情感类别标签,让打标人员根据这些备选标签,标注出文本的情感类别标签,作为训练样本。其中这些备选标签通常是扁平化的,需要打标人员对其中的每个标签的情感语义作出清晰、明确的区分。然而在某些情况下,其中若干备选标签之间区分度小,打标人员难以实现打标的一致性。例如,在一个情感标注场景下,提供的备选情感标签包括,生气,愤怒,恼怒等。于是,对于同一个待标注样本,有可能打标人员a标注的标签是生气,而打标人员b标注的标签是愤怒。又例如,对于同一个待标注样本,打标人员a第一次标注的标签是生气,若让其再次标注,则标注的标签可能会是愤怒。显然,此种标注方式对打标人员来说,存在很大的困难,并且,如此得到的标注数据一致性差,进一步地,由此训练出的预测模型,得到的针对文本情感的预测结果的准确度和有效性都偏低。基于此,发明人提出设计一种新的标注方式,可以降低打标人员的打标难度,同时,显著提高标注数据的有效性和一致性,从而构建出可用性更强的训练样本,用于训练文本情感分析模型,进而提高模型预测结果的准确度。在一个示例中,可以不向打标人员提供备选标签,而是,提供基于备选标签预先确定的量化指标,例如,包括针对某个情感方面的情感倾向和情感强度的量化指标,进一步地,根据打标人员基于量化指标对文本标注的数据,确定该文本的情感类别标签,进而构建训练样本用于训练预测模型。下面,描述该方案构思的具体实现方式。图2示出根据一个实施例的文本情感分析方法的流程图,所述方法的执行主体可以是任何具有计算或处理能力的设备、装置、平台和设备集群等,例如图1中示出的计算平台。如图2所示,所述方法包括以下步骤:步骤s210,获取对第一文本进行标注而得到的标注数据,所述标注数据包括针对第一情感方面从多个备选情感倾向中选择的第一情感倾向,以及从针对所述第一情感倾向的多个备选情感强度中选择的第一情感强度;步骤s220,基于预先确定的所述多个备选情感倾向和所述多个备选情感强度的备选组合与备选情感类别标签之间的映射关系,确定与所述第一情感倾向和第一情感强度的组合对应的第一情感类别标签;步骤s230,基于所述第一文本和第一情感类别标签,确定第一训练样本,用于训练文本情感分析模型,以对待分析的文本进行情感分析。以上步骤中,在步骤s210中获取第一文本的标注数据,再在步骤s220中基于获取的标注数据确定第一文本的文本标签,进而在步骤s230中构建对应于第一文本的第一训练样本,用于训练文本情感分析模型。进一步地,由上述步骤s210和步骤s220可知,为了实施所述方法,需要预先确定情感方面,针对该情感方面的多个备选情感倾向和多个备选情感强度,并且,建立多个备选情感倾向和多个备选情感强度的备选组合与备选情感类别标签之间的映射关系。下面先对这部分内容进行示例性说明。在一个实施例中,文本情感分析模型的需求方可以根据实际需求,提供一些针对目标分析数据需要识别的情感标签。在一个具体的实施例中,上述需求方可以为提供某种产品或服务的线上或线下服务平台,如电商平台、选课平台、新闻咨询平台、线下实体店,等等。在一个具体的实施例中,上述目标分析数据可以为用户评价数据,用户在社交平台发布的动态数据,等等。在一个例子中,新闻资讯平台可以根据其对用户评价内容的情感分析需求,提供以下标签:高兴、兴奋、开心、惊喜、沮丧、生气、愤怒、悲伤、平静、无奈、郁闷,略微支持、绝对支持、肯定、毫无头绪、中立、质疑、抗拒、排斥,等等。进一步地,可以根据需求方提供的标签,确定一个或多个情感方面,并且,确定其中各个情感方面中包括多个备选情感类别标签。在一个具体的实施例中,确定出的情感方面可以包括:愉快、乐观、进取、热爱、谦恭、敬畏、赞成和自责,等等。在一个例子中,确定出的情感方面包括愉快和赞同,分别对应的情感类别标签如下表1所示:表1如此,基于模型需求方提供的针对目标分析数据的多个标签,可以确定出一个或多个情感方面,以及其中各个方面对应的备选情感类别标签。以下,主要以其中任意的一个情感方面(以下统称为第一情感方面)为例进行说明。更进一步地,可以根据第一情感方面对应的多个备选情感标签,确定针对该情感方面的多个备选情感倾向,以及其中各个备选情感倾向所对应的备选情感标签。在一个具体的实施例中,上述多个备选情感倾向可以包括正向、负向和无倾向中的至少两种。在一个例子中,假定第一情感方面为愉快,则备选情感倾向具体为愉快倾向、不愉快倾向,以及在愉快和不愉快上没有明显倾向。在另一个例子中,假定第一情感方面为赞同,则备选情感倾向具体为赞同倾向、不赞同倾向,以及在赞同和不赞同上没有明显倾向。在另一个具体的实施例中,上述多个备选情感倾向可以包括有倾向性和无倾向性。另一方面,在一个具体的实施例中,可以用数字或字母或其他字符表示备选情感倾向。在一个例子中,可以用1、0和-1分别表示正向、无倾向和负向。在一个具体的实施例中,可以先确定多个备选情感倾向,再确定各个备选情感标签所对应的备选情感倾向,由此得到各个备选情感倾向下的备选标签。在另一个具体的实施例中,也可以先对多个备选情感标签进行归类,再确定各类标签所对应的备选情感倾向。在一个例子中,以表1中示出的情感方面愉快为例,表2中示出的确定出的多个备选情感倾向包括正向、负向和无倾向,以及各个备选情感倾向分别对应的备选情感类别标签。表2如此可以得到多个备选情感倾向,以及其中各个倾向对应的备选情感类别标签。换言之,可以得到各个备选情感类别标签所对应的备选情感倾向。再进一步地,可以确定多个备选情感强度,并且,建立多个备选情感倾向和多个备选情感强度的备选组合与备选情感标签之间的映射关系。在一个具体的实施例中,可以先结合业务经验或生活经验,对各个备选情感倾向下对应数量的备选情感类别标签进行排序,排序结果反映对该备选情感倾向的倾向程度。再基于排序结果,设定各个备选情感类别标签对应的备选情感强度。在一个例子中,其中备选情感强度的表达形式优选选择天然带有排序含义的形式,如单个数值、或数值范围、或字母等。在一个具体的例子中,假定第一情感方面为表2中的愉快,某个备选情感倾向为正向,则排序结果反映针对愉快倾向的倾向程度,例如排序结果为:惊喜、兴奋、开心、高兴,此结果表明,惊喜相比兴奋更倾向于愉快,兴奋相比开心更倾向于愉快,以此类推。进一步,在一个更具体的例子中,可以得到表3中示出的备选类别标签与备选情感强度之间的对应关系。表3备选情感类别标签惊喜兴奋开心高兴备选情感强度abcd在另一个更具体的例子中,可以得到表4中示出的备选类别标签与备选情感强度之间的对应关系。表4备选情感类别标签惊喜兴奋开心高兴备选情感强度107-94-61-3如此,可以确定出各个备选情感标签所对应的备选情感强度,实现对情感的量化。需要理解的是,各个备选情感倾向所对应的备选情感强度的取值数目或取值范围可以完全相同,也可以完全不同,还可以部分相同。由上可以确定出各个备选情感标签所对应的备选情感倾向和备选情感强度,随之可以建立针对第一情感方面的多个备选情感倾向和多个备选情感强度的备选组合与多个备选情感标签之间的映射关系。在一个例子中,如表5所示,其中示出的映射关系包括:在针对愉快方面的情感倾向为正向,且情感强度为4的情况下,对应的备选情感标签为惊喜。表5以上,对建立多个备选情感倾向和多个备选情感强度的备选组合与备选情感类别标签之间的映射关系的过程进行示例性说明。需要理解的是,可以基于上述描述的建立流程进行一些变化,只要能建立所述映射关系即可。在确定各个备选标签对应的备选情感强度时,可以不先进行排序,而是直接设定。在一个变化示例中,可以先选取某个备选情感类别标签,如开心,将其对应的备选情感强度设定为2,然后,再选取其他某个备选情感类别标签,如高兴,并且基于已设定的开心的备选情感强度为2,将高兴对应的备选情感强度设定为1。接着对图2示出的方法所包括的步骤进行描述,具体如下:首先,步骤s210,获取对第一文本进行标注而得到的标注数据。需要说明的是,为便于描述和理解,在本说明书实施例中,将需要标注的多个文本中的任一文本称为第一文本。在一个实施例中,第一文本可以为词语或句子或篇章。在一个实施例中,步骤s210可以包括图3中示出的子步骤s31和s32。具体地,先在步骤s31,向标注人员提供待标注的文本,以及针对第一情感方面的多个备选情感倾向和针对各个备选情感倾向的多个备选情感强度。具体地,可以通过多种形式向标注人员展示上述待标注的文本,多个备选情感倾向和多个备选情感强度。在一个具体的实施例中,可以基于交互界面进行展示。在另一个具体的实施例中,可以通过电子文档,如word文档或excel文档等进行展示。在又一个具体的实施例中,还可以通过纸质文件进行展示。进一步地,再在步骤s32,获取标注人员从多个备选情感倾向中选择的第一情感倾向和从针对所述第一情感倾向的多个备选情感强度中选择的第一情感强度,并且,将所述第一情感倾向和所述第一情感强度作为所述文本或图片的标注数据。在一个具体的实施例中,可以接收标注人员基于上述交互界面选择的第一情感倾向和第一情感强度,作为上述标注数据。在另一个具体的实施例中,标注人员在电子文档中输入上述第一情感倾向和第一情感强度,相应地,可以从电子文档中读取上述第一情感倾向和第一情感强度,作为上述标注数据。根据一个例子,图4示出的交互界面中包括:待标注的文本“这功能也忒好使了吧,不错不错!”;第一情感方面,即愉快;多个备选情感倾向,即正向、负向和无倾向;多个备选情感强度,即针对正向的1、2、3和4,针对负向的1、2和3,针对无倾向的1和2。如此,可以获取标注人员选择的针对第一情感方面的第一备选情感倾向正向和第一备选情感强度4。根据另一个例子,图5示出的交互界面中包括:待标注的文本“说得对,说得对,我们的这部作品更胜一筹!”;第一情感方面,即愉快;多个备选情感倾向,即正向、负向和无倾向;多个备选情感强度,即1,2和3。第二情感方面,即赞同;多个备选情感倾向,即正向、负向和无倾向;多个备选情感强度,即1,2和3。如此,可以获取标注人员选择的针对第一情感方面的第一备选情感倾向正向和第一备选情感强度1,以及针对第二情感方面的第二备选情感倾向正向和第二备选情感强度2。根据又一个例子,图6示出打标人员通过excel表记录的标注数据。其中包括:对于编号为3的文本,情感倾向为-1,情感强度为1。如此,可以通过读取excel文档,获取其中记录的标注数据。以上,可以获取对第一文本进行标注而得到的标注数据。接着,在步骤s220,基于上述预先确定的映射关系,确定针对第一文本的标注数据对应的第一情感类别标签。在一个例子中,基于表5中示出的映射关系,假定标注数据中包括的第一情感类别倾向为负向,第一情感类别强度为5,则可以确定出对应的第一情感类别标签为生气。在另一个例子中,假定标注数据中包括的第一情感类别倾向为负向,第一情感类别强度为6,则可以确定出对应的第一情感类别标签为愤怒。如此,可以通过量化指标,精准定位到对应的情感类别标签。以上,可以确定出文本标签,进而在步骤s230,基于所述第一文本和第一情感类别标签,确定第一训练样本,用于训练文本情感分析模型,以对待分析的文本进行情感分析。在一个实施例中,上述文本情感分析模型可以为多分类模型。在另一个实施例中,上述文本情感分析模型可以包括多个二分类模型。在一个实施例中,上述文本情感分析模型所基于的算法可以包括决策树、贝叶斯、支持向量机svm等。在另一个实施例中,上述文本情感分析模型可以采用rnn、lstm、gru等神经网络模型。如此,可以根据第一文本的标注数据,确定对应的第一情感类别标签,进而确定第一训练样本,同理可以确定出其他多个训练样本,构建训练样本集,进而训练文本情感分析模型。综上,采用本说明书实施例披露的文本情感分析方法,因其中标注数据具有较高的有效性、一致性,相应确定的标签数据也具有较高的有效性和一致性,进而使得训练出的文本情感分析模型可用性高,所得预测结果的置信度高,准确度高,具有较高的使用价值。上述实施例中,主要对图2中示出的对文本进行情感分析的方法进行介绍。类似地,本说明书实施例还披露一种对图片进行情感分析的方法。具体地,图7示出根据一个实施例的图片情感分析方法的流程图,所述方法的执行主体可以是任何具有计算或处理能力的设备、装置、平台和设备集群等。如图7所示,所述方法包括以下步骤:步骤s710,获取对第一图片进行标注而得到的标注数据,所述标注数据包括针对第一情感方面从多个备选情感倾向中选择的第一情感倾向,以及从针对第一情感倾向的多个备选情感强度中选择的第一情感强度;步骤s720,基于预先确定的所述多个备选情感倾向和多个备选情感强度的备选组合与备选情感类别标签之间的映射关系,确定与所述第一情感倾向和第一情感强度的组合对应的第一情感类别标签;步骤s730,基于所述第一图片和第一情感类别标签,确定第一训练样本,用于训练图片情感分析模型,以对待分析的图片进行情感分析。针对以上步骤,需要说明的是,在本说明书实施例中,将需要标注的多张图片中的任意一张图片称为第一图片。在一个实施例中,其中多张图片可以为带有情感色彩的图片。在一个具体的实施例中,其中可以包括带有面部表情的图片。在一个例子中,可以包括多张人物自拍照。在另一个具体的实施例中,其中可以包括带有肢体语言的图片。在一个例子中,可以包括多张动物或人的全身照。在一个实施例中,上述图片情感分析模型可以为神经网络模型。在一个具体的实施例中,可以采用cnn网络、dnn网络等等。此外,对上述步骤s710-步骤s730的描述,还可以参见前述对步骤s210-步骤s230的描述。综上,采用本说明书实施例披露的图片情感分析方法,因其中标注数据具有较高的有效性、一致性,相应确定的标签数据也具有较高的有效性和一致性,进而使得训练出的图片情感分析模型可用性高,所得预测结果的置信度高,准确度高,具有较高的使用价值。从另一个角度来看,在上述实施例中,图2示出的情感分析方法中,标注数据中包括设定的第一情感方面,以及打标人员针对该情感方面选择的第一情感倾向和对应的第一情感强度。概括来说,上述提及的情感方面、情感倾向和情感强度之间具有层级关系,换言之,三者对应三个层级,分别代表对应于三个层级的三个情感维度。进一步地,可以向打标人员提供各个情感维度对应的备选维度值,包括情感倾向维度对应的备选情感倾向,情感强度维度对应的备选情感强度。基于此,标注数据中还可以包括更加丰富或具有其他层级结构的层级信息。在一个实施例中,上述第一情感方面可以不是设定的,而是由打标人员从多个备选情感方面中选定的。在另一个实施例中,多个情感维度中可以包括情感方面、情感倾向和情感强度中的一种或多种。在又一个实施例中,多个情感维度中可以包括情感真实度和情感表达欲等。在一个具体的实施例中,其中情感真实度对应的备选维度值可以包括:真实、伪装和无法区分。在另一个具体的实施例中,其中情感表达欲对应的备选维度值可以包括:克制、自然流露、宣泄等。具体地,图8示出根据另一个实施例的文本情感分析方法流程图,所述方法的执行主体可以是任何具有计算或处理能力的设备、装置、平台和设备集群等。如图8所示,所述方法包括以下步骤:步骤s810,获取对第一文本进行标注而得到的标注数据,所述标注数据包括,针对预先设定的处于多个层级的多个情感维度中的各个情感维度,从备选维度值中选择的各个选定维度值;步骤s820,基于预先确定的所述各个情感维度的备选维度值的各个备选组合与备选情感类别标签之间的映射关系,确定与所述各个选定维度值的组合对应的第一情感类别标签;步骤s830,基于所述第一文本和第一情感类别标签,确定第一训练样本,用于训练文本情感分析模型,以对待分析的文本进行情感分析。针对以上步骤,需要理解的是,多个情感维度之间具有层级关系,多个情感维度分别位于不同的层级。在一个实施例中,多个情感维度中可以包括层级由高至低的情感方面维度、情感倾向维度和情感强度维度。进一步地,情感方面维度对应多个备选情感方面;情感倾向维度对应多个备选情感倾向,其中包括对应于各个备选情感方面的备选情感倾向;情感强度维度对应多个备选情感强度,其中包括对应于各个备选情感倾向的备选情感强度。在另一个实施例中,多个情感维度中可以包括层级由高至低的情感状态维度和情感真实维度。在一个具体的实施例中,这两个维度中各个维度下的备选维度值的各个备选组合和备选情感类别标签之间的映射关系如表6所示:表6在一个例子中,基于表6,假定针对某一文本,对其进行标注得到的选定维度值包括积极和自然,根据上述映射关系可以确定出第一类别标签乐观。由此可以确定第一训练样本,用于训练针对文本的文本情感分析模型,对待分析的图片进行情感分析。在上述实施例中,图2和图8示出以文本形式的样本为目标样本的情感分析方法,图7示出以图片形式的样本为目标样本的情感分析方法。进一步地,还可以将图2、图7和图8中示出的方法进行进一步拓展,可以适用于更多形式的目标样本和更多场景。一方面,不限于情感分析的场景,还可以用于其他分类场景,尤其适用于分类标签之间的区分度低的情况,比如,对知识点所属领域的分类,对新闻内容的主观客观和观点等进行分类。另一方面,目标样本可以为文本,也可以为图片,还可以为音频、视频等。具体地,图9示出根据一个实施例的针对目标样本的分类方法流程图,所述方法的执行主体可以是任何具有计算或处理能力的设备、装置、平台和设备集群等。如图9所示,所述方法包括以下步骤:步骤s910,获取对第一样本进行标注而得到的标注数据,所述标注数据包括,针对预先设定的多个分类层级中的各个分类层级,从各个备选类目中选择的各个选定类目;步骤s920,基于预先确定的各个分类层级的各个备选类目的备选组合与备选类别标签之间的映射关系,确定与所述各个选定类目的组合对应的第一类别标签;步骤s930,基于所述第一样本和第一类别标签,确定第一训练样本,用于训练分类模型,以对待分类的目标样本进行分类。针对以上步骤,需要说明的是,对于其中提及的多个分类层级,在一个实施例中,可以对应不同的类目级别,或者说,对应不同的分类粒度。在一个具体的实施例中,多个分类层级包括一级类目和二级类目,其中一级类目中的多个备选类目包括:数学、物理和化学,二级类目下的多个备选类目包括:理论、应用、声学、粒子、激光、无机、有机。进一步地,上述预先确定的映射关系可以如表7所示:表7在一个例子中,基于表7,假定针对某一篇论文,对其进行标注得到的选定类目包括物理和粒子,则可以确定出第一类别标签为粒子物理学。由此可以确定第一训练样本,用于训练针对论文的分类模型,对待分类的目标论文进行分类。此外,对以上步骤s910-步骤s930的介绍,还可以参见前述相关内容的描述。以上,采用本说明书实施例披露的针对目标样本的分类方法,因其中标注数据具有较高的有效性、一致性,相应确定的标签数据也具有较高的有效性和一致性,进而使得训练出的分类模型可用性高,所得预测结果的置信度高,准确度高,具有较高的使用价值。另外需要说明的是,以上在图3中披露一种获取针对文本的标注数据的方法。根据另一方面的实施例,本说明书还披露一种获取针对图片的标注数据的方法。具体地,图10示出根据另一个实施例的获取标注数据的方法流程图,所述方法的执行主体可以是任何具有计算或处理能力的设备、装置、平台和设备集群等。如图10所示,所述方法包括以下步骤:步骤s1010,向标注人员提供待标注的文本或图片,以及针对第一情感方面的多个备选情感倾向和针对各个备选情感倾向的多个备选情感强度。步骤s1020,获取所述标注人员从所述多个备选情感倾向中选择的第一情感倾向和从所述多个备选情感强度中选择的第一情感强度,并且,将所述第一情感倾向和所述第一情感强度作为所述文本或图片的标注数据。针对以上步骤,在一个实施例中,上述步骤s1010可以包括:显示交互界面,所述交互界面中包括所述待标注的文本或图片,所述多个备选情感倾向和多个备选情感强度。相应地,步骤s1020可以包括:接收所述标注人员基于所述交互界面选择的第一情感倾向和第一情感强度。此外,对步骤s1010和步骤s1020的描述,还可以参见前述对步骤s31和步骤s32的描述。与图8示出的情感分析方法相对应的,本说明书还披露一种获取标注数据的方法。具体地,图11示出根据另一个实施例的获取标注数据的方法流程图,所述方法的执行主体可以是任何具有计算或处理能力的设备、装置、平台和设备集群等。如图11所示,所述方法包括以下步骤:步骤s1110,根据向标注人员提供待标注的文本或图片,以及预先设定的处于多个层级的多个情感维度中,各个情感维度的备选维度值;步骤s1120,获取所述标注人员从各个情感维度的备选维度值中选择的各个选定维度值,将所述各个选定维度值作为针对所述文本或图片的标注数据。针对以上步骤,在一个实施例中,步骤s1110可以包括:显示交互界面,所述交互界面中包括所述待标注的文本或图片,所述各个情感维度的备选维度值。相应地,步骤s1120可以包括:接收所述标注人员基于所述交互界面选择的所述各个选定维度值。此外,对步骤s1110和步骤s1120的描述,还可以参见前述对步骤s31和步骤s32的描述。根据又一方面的实施例,本说明书还披露一种适用于更多场景的,获取样本标注数据的方法。具体地,图12示出根据又一个实施例的获取标注数据的方法流程图,所述方法的执行主体可以是任何具有计算或处理能力的设备、装置、平台和设备集群等。如图12所示,所述方法包括以下步骤:步骤s1210,向标注人员提供待标注的样本,以及预先设定的多个分类层级中各个分类层级的备选类目。步骤s1220,获取所述标注人员从所述各个分类层级的备选类目选择的各个选定类目,并且,将所述各个选定类目作为所述样本的标注数据。针对以上步骤,在一个实施例中,步骤s1210可以包括:显示交互界面,所述交互界面中包括所述待标注的样本,所述多个分类层级中各个分类层级的备选类目。相应地,步骤s1220可以包括:接收所述标注人员基于所述交互界面选择的所述各个选定类目。此外,对步骤s1210和步骤s1220的描述,还可以参见前述对步骤s31和步骤s32的描述。与上述实施例中描述的方法相对应的,本说明书中还披露多种装置。具体如下:13图13示出根据一个实施例的文本情感分析装置的示意性框图。如图所示,所述装置1300包括:标注数据获取单元1310,配置为获取对第一文本进行标注而得到的标注数据,所述标注数据包括针对第一情感方面从多个备选情感倾向中选择的第一情感倾向,以及从针对所述第一情感倾向的多个备选情感强度中选择的第一情感强度。类别标签确定单元1320,配置为基于预先确定的所述多个备选情感倾向和所述多个备选情感强度的备选组合与备选情感类别标签之间的映射关系,确定与所述第一情感倾向和第一情感强度的组合对应的第一情感类别标签;训练样本确定单元1330,配置为基于所述第一文本和第一情感类别标签,确定第一训练样本,用于训练文本情感分析模型,以对待分析的文本进行情感分析。在一个实施例中,所述多个备选情感倾向包括正向、负向和无倾向。在一个实施例中,所述第一情感方面为以下中的一种:愉快、乐观、进取、热爱、谦恭、敬畏、赞成和自责。在一个实施例中,所述针对所述第一情感倾向的多个备选情感强度的数量,基于预先整理的该第一情感方面的第一情感倾向下的备选情感类别标签的数目而确定。图14示出根据一个实施例的图片情感分析装置的示意性框图。如图所示,所述装置1400包括:标注数据获取单元1410,配置为获取对第一图片进行标注而得到的标注数据,所述标注数据包括针对第一情感方面从多个备选情感倾向中选择的第一情感倾向,以及从针对所述第一情感倾向的多个备选情感强度中选择的第一情感强度;类别标签确定单元1420,配置为基于预先确定的所述多个备选情感倾向和所述多个备选情感强度的备选组合与备选情感类别标签之间的映射关系,确定与所述第一情感倾向和第一情感强度的组合对应的第一情感类别标签;训练样本确定单元1430,配置为基于所述第一图片和第一情感类别标签,确定第一训练样本,用于训练图片情感分析模型,以对待分析的图片进行情感分析。在一个实施例中,所述多个备选情感倾向包括正向、负向和无倾向。在一个实施例中,所述第一情感方面为以下中的一种:愉快、乐观、进取、热爱、谦恭、敬畏、赞成和自责。在一个实施例中,所述针对所述第一情感倾向的多个备选情感强度的数量,基于预先整理的该第一情感方面的第一情感倾向下的备选情感类别标签的数目而确定。图15示出根据另一个实施例的文本情感分析装置的示意性框图。如图15所示,所述装置1500包括:标注数据获取单元1510,配置为获取对第一文本进行标注而得到的标注数据,所述标注数据包括,针对预先设定的处于多个层级的多个情感维度中的各个情感维度,从备选维度值中选择的各个选定维度值;类别标签确定单元1520,配置为基于预先确定的所述各个情感维度的备选维度值的各个备选组合与备选情感类别标签之间的映射关系,确定与所述各个选定维度值的组合对应的第一情感类别标签;训练样本确定单元1530,配置为基于所述第一文本和第一情感类别标签,确定第一训练样本,用于训练文本情感分析模型,以对待分析的文本进行情感分析。在一个实施例中,所述多个情感维度包括以下中的至少一个:情感方面、情感倾向、情感强度。图16示出根据一个实施例的针对目标样本的分类装置的示意性框图。如图16所示,所述装置1600包括:标注数据获取单元1610,配置为获取对第一样本进行标注而得到的标注数据,所述标注数据包括,针对预先设定的多个分类层级中的各个分类层级,从各个备选类目中选择的各个选定类目;类别标签确定单元1620,配置为基于预先确定的所述各个分类层级的各个备选类目的备选组合与备选类别标签之间的映射关系,确定与所述各个选定类目的组合对应的第一类别标签;训练样本确定单元1630,配置为基于所述第一样本和第一类别标签,确定第一训练样本,用于训练分类模型,以对待分类的目标样本进行分类。图17示出根据一个实施例的获取标注数据的装置的示意性框图。如图17所示,所述装置1700包括:提供单元1710,配置为向标注人员提供待标注的文本或图片,以及针对第一情感方面的多个备选情感倾向和针对各个备选情感倾向的多个备选情感强度;获取单元1720,配置为获取所述标注人员从所述多个备选情感倾向中选择的第一情感倾向和从针对所述第一情感倾向的多个备选情感强度中选择的第一情感强度,将所述第一情感倾向和所述第一情感强度作为针对所述文本或图片的标注数据。在一个实施例中,所述提供单元1710具体配置为:显示交互界面,所述交互界面中包括所述待标注的文本或图片,所述多个备选情感倾向和针对各个备选情感倾向的多个备选情感强度;所述获取单元1720具体配置为:接收所述标注人员基于所述交互界面选择的第一情感倾向和第一情感强度。图18示出根据另一个实施例的获取标注数据的装置的示意性框图。如图18所示,所述装置1800包括:提供单元1810,配置为向标注人员提供待标注的文本或图片,以及预先设定的处于多个层级的多个情感维度中,各个情感维度的备选维度值;获取单元1820,配置为获取所述标注人员从各个情感维度的备选维度值中选择的各个选定维度值,将所述各个选定维度值作为针对所述文本或图片的标注数据。图19示出根据另一个实施例的获取标注数据的装置的示意性框图。如图19所示,所述装置1900包括:提供单元1910,配置为向标注人员提供待标注的样本,以及预先设定的多个分类层级中各个分类层级的备选类目;获取单元1920,配置为获取所述标注人员从所述各个分类层级的备选类目选择的各个选定类目,将所述各个选定类目作为针对所述样本的标注数据。在一个实施例中,所述提供单元1910具体配置为:显示交互界面,所述交互界面中包括所述待标注的样本,所述多个分类层级中各个分类层级的备选类目;所述获取单元1920具体配置为:接收所述标注人员基于所述交互界面选择的所述各个选定类目。根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图2、图3、图8、图9、图10、图11和图12所描述的方法。根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图2、图3、图8、图9、图10、图11和图12所描述的方法。本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1