一种数据处理方法、装置及电子设备与流程

文档序号:19222626发布日期:2019-11-26 02:16阅读:219来源:国知局
一种数据处理方法、装置及电子设备与流程

本申请涉及数据处理技术领域,尤其涉及一种数据处理方法、装置及电子设备。



背景技术:

目前,为了获得产品满意度,通常采用回访、问卷调查等方式进行,导致获得满意度的过程所消耗的时间较长,使得满意度调查的效率较低。

因此,亟需一种能够提高获取产品满意度的效率的技术方案。



技术实现要素:

有鉴于此,本申请提供一种数据处理方法、装置及电子设备,用以提高获取满意度的效率。

本申请提供了一种数据处理方法,包括:

获得与目标对象关联的至少一个描述数据,所述描述数据是至少一个描述者针对所述目标对象产生的;

获得对应所述至少一个描述数据的至少一个属性,所述属性能表征所述描述者对所述目标对象的满意倾向;

至少基于所述至少一个属性,获得处理结果,所述处理结果能表征所述目标对象的满意度。

上述方法,可选的,至少基于所述至少一个属性,获得处理结果,包括:

获得第一数量值,所述第一数量值为所述属性表征第一倾向的描述数据的总数量值;

获得第二数量值,所述第二数量值为所述属性表征第二倾向的描述数据的总数量值;其中,所述第一倾向与所述第二倾向相反;

至少基于所述第一数量值和所述第二数量值,获得处理结果,所述处理结果包括针对所述目标对象的满意度的值。

上述方法,可选的,至少基于所述至少一个属性,获得处理结果,包括:

获得对应所述至少一个描述数据的至少一个级别,所述级别能表征所述描述者对所述目标对象的倾向级别,其中,所述倾向级别对应有级别权重值;

获得第一数量值,所述第一数量值为:所述至少一个级别中所述级别对应的级别权重值与所述级别对应的第一描述数量值的乘积之和,所述级别对应的第一描述数量值为所述级别对应的所述属性表征第一倾向的描述数据的总数量值;

获得第二数量值,所述第二数量值为:所述至少一个级别中所述级别对应的级别权重值与所述级别对应的第二描述数量值的乘积之和,所述级别对应的第二描述数量值为所述级别对应的所述属性表征第二倾向的描述数据的总数量值;其中,所述第二倾向和所述第一倾向相反;

至少基于所述第一数量值和所述第二数量值,获得处理结果,所述处理结果包括针对所述目标对象的满意度的值。

上述方法,可选的,至少基于所述第一数量值和所述第二数量值,获得处理结果,包括:

获得所述第一数量值减去所述第二数量值得到的差值;

获得所述第一数量值加上所述第二数量值得到的和值;

获得所述差值与所述和值之间的比值;

至少基于所述比值,获得针对所述目标对象的满意度的值。

上述方法,可选的,至少基于所述比值,获得针对所述目标对象的满意度的值,包括:

将所述比值乘以预设的放大系数,得到针对所述目标对象的满意度的值。

上述方法,可选的,所述获得对应所述至少一个描述数据的至少一个属性,包括:

利用标注模型,对所述至少一个描述数据进行解析,得到所述至少一个描述数据的至少一个属性,所述属性表征第一倾向或第二倾向;

其中,所述标注模型为利用至少两个具有预设倾向标签的样本训练得到。

上述方法,可选的,所述获得对应所述至少一个描述数据的至少一个属性,包括:

获得对应所述至少一个描述数据的针对目标子对象的至少一个属性,其中,所述属性能表征所述描述者对所述目标子对象的满意倾向,所述目标子对象为所述目标对象的局部;

其中,所述目标子对象用于使得所述处理结果能表征所述描述者对所述目标对象的局部满意度。

上述方法,可选的,还包括:

对所述至少一条描述数据进行预处理;

其中,所述预处理包括:对所述描述数据按照所述目标对象的对象标识进行分类。

本申请还提供了一种数据处理装置,包括:

数据获得单元,用于获得与目标对象关联的至少一个描述数据,所述描述数据是至少一个描述者针对所述目标对象产生的;

属性获得单元,用于获得对应所述至少一个描述数据的至少一个属性,所述属性能表征所述描述者对所述目标对象的满意倾向;

结果获得单元,用于至少基于所述至少一个属性,获得处理结果,所述处理结果能表征所述目标对象的满意度。

本申请还提供了一种电子设备,包括:

存储器,用于存储应用程序及所述应用程序运行所产生的数据;

处理器,用于执行所述应用程序,用以实现功能:获得与目标对象关联的至少一个描述数据,所述描述数据是至少一个描述者针对所述目标对象产生的;获得对应所述至少一个描述数据的至少一个属性,所述属性能表征所述描述者对所述目标对象的满意倾向;至少基于所述至少一个属性,获得处理结果,所述处理结果能表征所述目标对象的满意度。

从上述技术方案可以看出,本申请公开的一种数据处理方法、装置及电子设备,在获取到描述者针对目标对象所产生的描述数据之后,通过获得表征描述者对目标对象的满意倾向的属性,来获得处理结果,以此来表征针对目标对象的满意度。可见,本申请中通过对目标对象的描述数据进行获取,进而对其能够表征描述者对目标对象的满意倾向的属性进行分析,就可以得到处理结果,以此处理结果来表征描述者对目标对象的满意度,从而减少满意度获取的耗时,由此能够有效提高获取满意度的效率。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例一提供的一种数据处理方法的流程图;

图2和图3分别为本申请实施例一提供的一种数据处理方法的部分流程图;

图4为本申请实施例二提供的一种数据处理装置的结构示意图;

图5为本申请实施例三提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

如图1所示,为本申请实施例一提供的一种数据处理方法的实现流程图,本实施例中的方法可以适用于能够进行数据处理的计算机或服务器等设备中,主要用于对描述者针对一个或某多个目标对象的满意度进行分析。

具体的,本实施例中的方法可以包括以下步骤:

步骤101:获得与目标对象关联的至少一个描述数据。

其中,描述数据是至少一个描述者针对目标对象产生的。例如,描述数据可以包括有:描述者针对目标对象进行的文字表达、图片发布、表情包使用和分数级别标记等其中的一种或多种的描述数据。描述者通过其产生的描述数据能够表征描述者针对目标对象的表达内容及情感倾向。具体的,描述数据可以为一个,相应进行后续分析能够具有针对性;描述数据也可以为多个,相应后续分析能够具有广泛应用性,也能够使得分析结果更加准确。

需要说明的是,目标对象可以为描述者所关注或使用的对象,如某个实体产品如笔记本、某种虚拟服务如游戏场景或者某种应用功能如聊天应用或购物应用等对象。本实施例中旨在对描述者对这些对象的满意度进行分析。

具体的,本实施例中可以从各种网络平台如电商、论坛或自媒体上获得与目标对象关联的描述数据。

步骤102:获得对应至少一个描述数据的至少一个属性。

其中,属性能够表征描述者对目标对象的满意倾向。本实施例中描述数据的属性可以为描述数据中体现的情感属性,如正向情感或负向情感,或者推荐情感或抵触情感等。

具体的,本实施例中可以通过描述数据中的用词内容或标点符号等按照预设的属性类型进行相似度分类,来得到对应描述数据的属性,以表征出描述者对目标对象的满意倾向;

或者,本实施例中可以通过对描述数据进行基于深度学习的语义分析来得到对应描述数据的属性,以表征出描述者对目标对象的满意倾向;

或者,本实施例中可以通过对描述数据所对应的其他信息如描述时间和/或是否追加描述等信息进行分析,以得到对应描述数据的属性,以表征描述者对目标对象的满意倾向。

需要说明的是,属性所表征的满意倾向可以理解为描述者对目标对象所提供的内容、功能或服务等是否满意或满意程度等。

步骤103:至少基于至少一个属性,获得处理结果。

其中,处理结果能表征目标对象的满意度。具体的,处理结果能表征描述者针对目标对象的满意度,如客户对笔记本的满意度或用户对聊天应用的满意度等。

具体的,本实施例中可以通过对属性中的满意倾向进行量化,以得到属性所表征的满意倾向对应的满意度值;或者,本实施例中也可以按照预设的满意度级别对属性进行分类,以得到属性所表征的满意度对应的满意度级别;或者,本实施例中可以对表征满意倾向的属性所对应的描述数据进行统计分析,以计算出属性所表征的满意倾向对应的满意度值,等等。

需要说明的是,本实施例中进行满意度分析所根据的描述数据可以是一个描述者针对目标对象产生的,相应的,所得到的处理结果即为表征该描述者针对目标对象的满意度的结果,由此可以分析出某些特定描述者针对目标对象的满意度;或者,本实施例中进行满意度分析所根据的描述数据也可以包含多个描述者针对目标对象产生的数据,相应的,所得到的处理结果即为能表征这些描述者针对该目标对象的满意度的结果,由此可以分析出多数描述者针对某些特定目标对象的满意度。

由上述方案可知,本申请实施例提供的一种数据处理方法,在获取到描述者针对目标对象所产生的描述数据之后,通过获得表征描述者对目标对象的满意倾向的属性,来获得处理结果,以此来表征针对目标对象的满意度。可见,本实施例中通过对目标对象的描述数据进行获取,进而对其能够表征描述者对目标对象的满意倾向的属性进行分析,就可以得到处理结果,以此处理结果来表征描述者对目标对象的满意度,不再依赖于问卷调查等方式,从而减少满意度获取的耗时,由此能够有效提高获取满意度的效率。

进一步的,本实施例中通过从电商、自媒体和/或论坛等方式中所获得的描述数据相对于问卷调查等方式能够具有广泛性,由此,本实施例中通过扩大用于满意度获取的描述数据的来源或范围,使得后续所得到的满意度更加准确。

需要说明的是,本实施例中的技术方案可以适用于针对一个目标对象的满意度分析,此时描述数据是针对一个目标对象的;本实施例中的技术方案也可以适用于针对多个目标对象的满意度分析,此时描述数据是针对多个不同目标对象的,在经过描述数据按照对象进行分类之后,分别针对每个目标对象执行本实施例中的方案,由此实现对每个目标对象的满意度分析。

具体的,本实施例中在得到描述数据之后,可以对描述数据进行预处理,例如,对描述数据按照目标对象的对象标识进行分类。由于描述数据可能来自不同的平台或者服务器,相应的,描述数据在不同来源所对应的目标对象的名称或表述方式并不相同,如同一产品在不同的购物平台上所使用的表述词语可能不同,但确实属于同一产品的情况,此时,本实施例中为了能够进一步提高数据处理的准确率和效率,可以在进行数据处理之前,先将描述数据按照目标对象的对象标识进行归类,将属于同一个目标对象的描述数据归到同一类中,这样就可以具有针对性的对目标对象分别进行满意度分析。

在一种实现方式中,本实施例中的步骤102在获得属性时,具体可以通过以下方式实现:

利用标注模型,对至少一个描述数据进行解析,得到至少一个描述数据的至少一个属性。

其中,属性表征第一倾向或第二倾向,第一倾向是指描述者针对目标对象的情感倾向,如正向的情感倾向,例如,用户对聊天应用的喜欢或评价积极的倾向,第二倾向是指描述者针对目标对象的与第一倾向相反的倾向,如负向的情感倾向,例如,客户对服务的厌恶或评价较差的倾向。也就是说,本实施例中利用标注模型对描述数据进行倾向标注,进而得到对应描述数据的属性,例如,对某个文字描述数据标注为正向或者负向的情感倾向。

在一种情况中,一条描述数据中可以包括一个倾向描述内容,该描述内容只描述目标对象整体或某一个维度(可以理解为目标对象中的一个子对象)上的满意倾向,如“笔记本外壳手感很好”,此时,利用标注模型对该倾向描述内容进行属性标注,得到一个属性,例如,描述数据的属性被标注为正向的情感倾向(针对目标对象整体或子对象的正向情感倾向);

在另一种情况中,一条描述数据中可以包含有两个或更多个的倾向描述内容,每个倾向描述内容分别描述目标对象整体或目标对象中某几个维度上的满意倾向,如“笔记本外壳手感很好,桌面布局也挺好,但是太卡了不好”,此时,利用标注模型分别对每个倾向描述内容进行属性标注,得到每个倾向描述内容的属性,属性表征描述数据的相应描述内容中描述者对目标对象的满意倾向,之后,在一种实现中,可以将每个倾向描述内容的属性均作为该描述数据的属性,即描述数据具有多个属性,或者,在另一种实现中,可以对这些属性进行处理,生成一个属性,作为描述数据的属性,如下:

在一种实现中,本实施例中可以按照属性所表征的第一倾向或第二倾向,对多个属性进行计数抵消,例如,将表征第一倾向的属性的数量与表征第二倾向的属性的数量进行比较,如果表征第一倾向的属性的数量大于表征第二倾向的属性的数量,那么对描述数据的属性标注为表征第一倾向的属性,如果表征第二倾向的属性的数量大于表征第一倾向的属性的数量,那么对描述数据的属性标注为表征第二倾向的属性;

例如“笔记本外壳手感很好,桌面布局也挺好,但是太卡了不好”对应的三个属性:外壳的正向属性、桌面的正向属性和内存的负向属性,经过计数抵消之后,得到描述数据的表征正向的属性;

在另一种实现中,本实施例中可以按照属性所表征的第一倾向或第二倾向,对多个属性进行加权抵消,例如,预先设置不同的描述内容的属性权值,利用这些属性权值对表征第一倾向的属性的数量进行加权求和,即将每个表征第一倾向的属性的数量分别与该属性对应的属性权值进行相乘之后加和,并将每个表征第二倾向的属性的数量分别与该属性对应的属性权值进行相乘之后加和,最后将两个和值进行比较,根据较大的和值所对应的倾向来标注描述数据的属性,即将描述数据的属性标注为较大的和值对应的属性的倾向。例如“笔记本外壳手感很好,桌面布局也挺好,但是太卡了不好”对应的三个属性:外壳的正向属性、桌面的正向属性和内存的负向属性,其中,外壳属性权值为0.1,桌面属性权值为0.2,内存属性权值0.5,经过加权求和对和值比较,确定描述数据的表征负向的属性。

具体的,本实施例中的标注模型为利用至少两个具有预设倾向标签的样本训练得到。其中,标注模型的样本可以为历史的描述数据,如至少一个描述者对至少一个目标对象所产生的多个描述样本,每个描述样本中具有预设倾向标签,例如,样本1和样本2具有正向标签,样本3、样本4和样本5具有负向标签,而样本6具有正向标签,相应的,本实施例中利用这些样本进行训练,从而得到标注模型,标注模型基于样本及其倾向标签的训练能够对未知倾向的描述数据进行标注,以得到未知倾向的描述数据的属性,使得描述数据具有相应的情感倾向,如正向或负向。

需要说明的是,本实施例中的标注模型可以为基于自然语言处理技术的机器学习网络模型,在标注模型中,首先对描述数据中的词或字符进行分词处理,再基于样本及其倾向标签的训练对经过分词得到的词段或字符串进行情感标注,从而使得标注模型所输出的结果中包括有:描述数据属于每种倾向的概率值,进而选取概率值较大的情感倾向来生成该描述数据的属性,此时属性表征描述者对目标对象的倾向为选取的概率值较大的情感倾向,如正向的第一倾向或负向的第二倾向等。

在具体实现中,步骤102中所获得的属性可以是在广义上针对目标对象的整体的满意倾向的属性,也可以是针对目标对象中的某些局部的满意倾向的属性。例如,对笔记本作为一个整体产品的正向满意倾向属性或负向满意倾向的属性,或者对笔记本中的显示器或键盘的正向满意倾向属性或负向满意倾向的属性。目标对象的局部可以理解为:目标对象中的局部零件或者方面,如笔记本上的键盘或显示,游戏应用上的运行速度或画质等。

相应的,本实施例中在步骤102中可以利用标注模型等方式对描述数据进行解析,在针对目标对象的整体满意度的层面上,获得对应描述数据的表征描述者对目标对象整体的满意倾向的属性,从而在这些属性的基础上,获得表征对目标对象整体满意度的处理结果;

或者,本实施例中在步骤102中可以利用标注模型等方式对描述数据进行解析,在针对目标对象的局部满意度的层面上,获得对应描述数据的表征描述者对目标对象中某个目标子对象或某多个目标子对象的满意倾向的属性,从而在这些属性的基础上,获得表征对目标对象中的局部满意度的处理结果。此时,目标子对象能够对表征目标对象整体满意度的处理结果进行细化,使得最终得到的处理结果为表征描述者针对目标对象的局部满意度(如目标子对象的满意度)的结果,由此实现满意度在不同维度上的细化,如通过某一个或多个产品零件的确定,在产品整体满意度上细化,得到用户对产品在不同产品零件上的满意度。

具体的,步骤102可以通过以下方式实现:

首先,对描述数据针对目标子对象进行数据筛选,将描述数据中将与目标子对象相关联的数据进行选取,而剔除描述数据中与目标子对象无关的数据,由此,能够减少数据处理的量,从而可以加快效率;

之后,对经过数据筛选的描述数据进行分析,具体可以利用标注模型对经过筛选的描述数据进行标注,以得到描述数据的能表征描述者针对目标子对象的满意倾向的属性。

后续中,再基于这些标注有属性的描述数据上的属性,来获得处理结果,此时处理结果表征描述者对目标对象的局部满意度,也就是说,此时的处理结果为能表征描述者对目标子对象的满意度的结果,可见,目标子对象的确定能够使得处理结果进行细化,细化到能够表征描述者对目标对象的局部即目标子对象的满意度。

其中,这里的标注模型可以为利用多个具有倾向标签的样本训练得到,而具有倾向标签的样本可以是所有有目标对象相关的样本,也可以是只与目标对象中的目标子对象的相关的样本,相应的,经过训练的标注模型均能够对描述数据中表征描述者对目标子对象的满意倾向的属性进行标注。

或者,步骤102也可以通过以下方式实现:

首先,对描述数据进行分析,具体可以利用标注模型对描述数据进行标注,以得到描述数据的能表征描述者针对目标对象的满意倾向的属性;

之后,对已经标注属性的描述数据进行筛选,剔除描述数据中与目标子对象无关的数据,只将描述数据中与目标子对象相关的数据进行选取,此时选取出的描述数据的属性表征描述者对目标子对象的满意倾向。

例如,可以先在对所有描述数据进行属性标注之后,在属性表征第一倾向的描述数据中筛选出与目标子对象相关的数据,在属性表征第二倾向的描述数据中筛选出与目标子对象相关的数据;或者,可以不分倾向,在所有描述数据进行属性标注之后,只按照描述数据是否与目标子对象相关进行筛选,选取出的描述数据的属性表征描述者对目标子对象的满意倾向。

后续中,再基于筛选出的这些标注有属性的描述数据上的属性,来获得处理结果,此时处理结果表征描述者对目标对象的局部满意度,也就是说,此时的处理结果为能表征描述者对目标子对象的满意度的结果,可见,目标子对象的确定能够使得处理结果进行细化,细化到能够表征描述者对目标对象的局部即目标子对象的满意度。

在一种实现方式中,本实施例中步骤103可以通过以下方式实现,如图2中所示:

步骤201:获得第一数量值。

其中,第一数量值为属性表征第一倾向的描述数据的总数量值,例如,客户对产品的评价数据中正向的评价数据的数据总量,或如用户对聊天应用的打分数据中正向的打分数据的数据总量,再如顾客对购物应用的表情包评价数据中正向的表情包的数据总量,等等。

步骤202:获得第二数量值。

其中,第二数量值为属性表征第二倾向的描述数据的总数量值。例如,客户对产品的评价数据中负向的评价数据的数据总量,或如用户对聊天应用的打分数据中负向的打分数据的数据总量,再如顾客对购物应用的表情包评价数据中负向的表情包的数据总量,等等。

步骤203:至少基于第一数量值和所述第二数量值,获得处理结果。

其中,处理结果中包括有针对目标对象的满意度的值。

具体的,步骤203中可以将第一数量值除以第二数量值所得到的比值作为处理结果中针对目标对象的满意度的值,或者,进一步的,可以将第一处理值除以第二数量值的比值再乘以预设的放大系数后作为处理结果中针对目标对象的满意度的值;

或者,步骤203中可以获得第一数量值和第二数量值的方差作为处理结果中针对目标对象的满意度的值,或者,进一步的,可以在第一数量值与第二数量值的方差的基础上乘以放大系数,将得到的乘积作为处理结果中针对目标对象的满意度的值;

或者,步骤203中也可以通过以下方式实现:

首先,获得第一数量值减去第二数量值所得到的差值,再获得第一数量值加上第二数量值所得到的和值;之后,获得差值与和值之间的比值,最后至少基于比值来获得针对目标对象的满意度的值。

例如,在比值的基础上乘以一个预设的放大系数,如10或100等,将得到的乘积作为针对目标对象的满意度的值,由此通过放大系数拉开满意度的值之间在数值上的差距,使得满意度的值之间能够在放大系数的作用更加直观比对,例如,将0.5或0.8的满意度值乘以10的放大系数,得到5或8,可以更加直观的进行满意度衡量;

或者,在比值中减去对应的基准值,再将减去基准值之后的差乘以放大系数,此时,得到的乘积再作为针对目标对象的满意度的值,由此,本实施例中首先在比值中减去基准值再进行放大,由此使得进一步拉开满意度之间的差距,使得满意度的值之间能够在基准值和放大系数的作用更加直观比对,例如,将0.5或0.8的满意度值分别减去0.3和0.2之后,再乘以10的放大系数,得到2或6,可以更加直观的进行满意度衡量,等等。

在另一种实现方式中,本实施例中步骤103可以通过以下方式实现,如图3中所示:

步骤301:获得对应至少一个描述数据的至少一个级别。

其中,级别能表征描述者对目标对象的倾向级别,例如,描述者对目标对象的情感倾向包括有多种倾向级别:第一、第二、第三、第四和第五级别,等等,甚至更多,每种倾向级别在情感倾向程度上以此递减或递增,如最强烈、非常强烈、较强烈、普通和无感的倾向级别,等等。

以用户对服务的喜好为例,正向倾向对应五种倾向级别:超级喜欢、非常喜欢、比较喜欢、普通喜欢和无感五种级别;负向倾向对应五种倾向级别:超级讨厌、非常讨厌、比较讨厌、普通讨厌和无感五种级别,此时,用户对服务的喜好描述中可以分为九种倾向级别,如:超级喜欢、非常喜欢、比较喜欢、普通喜欢、无感、普通讨厌、比较讨厌、非常讨厌、超级讨厌。

需要说明的是,每个倾向级别对应有级别权重。其中级别权重表征倾向级别在满意度分析中的重要程度,所有倾向级别对应的级别权重的和为1。该级别权重可以根据需求预先设置,例如,设置最强烈的倾向级别的级别权重为0.5,设置非常强烈的倾向级别的级别权重为0.2,设置较强烈的倾向级别的级别权重为0.15,设置普通的倾向级别的级别权重为0.1,设置无感的倾向级别的级别权重为0.05,等等。

步骤302:获得第一数量值。

其中,第一数量值为至少一个级别中各个级别所对应的级别权重值与该级别对应的第一描述数量值的乘积之和,而级别对应的第一描述数量值为级别对应的属性能表征第一倾向的描述数据的总数量值。也就是说,本实施例中所有描述数据中所涉及的所有级别中的各个级别各自对应的级别权重分别乘以每个级别下属性表征第一倾向的描述数据的总量之后,再加和,得到第一数量值。

例如,在客户对产品的评价数据中,将最强烈级别下的属性表征正向倾向的描述数据的总数量值乘以该最强烈级别的级别权重,将非常强烈级别下的属性表征正向倾向的描述数据的总数量值乘以该非常强烈级别的级别权重,将较强烈级别下的属性表征正向倾向的描述数据的总数量值乘以该较强烈级别的级别权重,将普通级别下的属性表征正向倾向的描述数据的总数量值乘以该普通级别的级别权重,将无感级别下的属性表征正向倾向的描述数据的总数量值乘以该无感级别的级别权重,最后将以上5个乘积加和,得到第一数量值。

步骤303:获得第二数量值。

其中,第二数量值为至少一个级别中级别对应的级别权重值与级别对应的第二描述数量值的乘积之和,而级别对应的第二描述数量值为级别对应的属性表征第二倾向的描述数据的总数量值。也就是说,本实施例中所有描述数据中所涉及的所有级别中的各个级别各自对应的级别权重分别乘以每个级别下属性表征第二倾向的描述数据的总量之后,再加和,得到第二数量值。

例如,在客户对产品的评价数据中,将最强烈级别下的属性表征负向倾向的描述数据的总数量值乘以该最强烈级别的级别权重,将非常强烈级别下的属性表征负向倾向的描述数据的总数量值乘以该非常强烈级别的级别权重,将较强烈级别下的属性表征负向倾向的描述数据的总数量值乘以该较强烈级别的级别权重,将普通级别下的属性表征负向倾向的描述数据的总数量值乘以该普通级别的级别权重,将无感级别下的属性表征负向倾向的描述数据的总数量值乘以该无感级别的级别权重,最后将以上5个乘积加和,得到第二数量值。

步骤304:至少基于第一数量值和所述第二数量值,获得处理结果。

其中,处理结果中包括有针对目标对象的满意度的值。

具体的,步骤304中可以将第一数量值除以第二数量值所得到的比值作为处理结果中针对目标对象的满意度的值,或者,进一步的,可以将第一处理值除以第二数量值的比值再乘以预设的放大系数后作为处理结果中针对目标对象的满意度的值;

或者,步骤304中可以获得第一数量值和第二数量值的方差作为处理结果中针对目标对象的满意度的值,或者,进一步的,可以在第一数量值与第二数量值的方差的基础上乘以放大系数,将得到的乘积作为处理结果中针对目标对象的满意度的值;

或者,步骤304中也可以通过以下方式实现:

首先,获得第一数量值减去第二数量值所得到的差值,再获得第一数量值加上第二数量值所得到的和值;之后,获得差值与和值之间的比值,最后至少基于比值来获得针对目标对象的满意度的值。

例如,在比值的基础上乘以一个预设的放大系数,将得到的乘积作为针对目标对象的满意度的值,由此通过放大系数拉开满意度的值之间的差距,使得满意度的值之间能够在放大系数的作用更加直观比对;

或者,在比值中减去对应的基准值,再将减去基准值之后的差乘以放大系数,此时,得到的乘积再作为针对目标对象的满意度的值,由此,本实施例中首先在比值中减去基准值再进行放大,由此使得进一步拉开满意度之间的差距,使得满意度的值之间能够在基准值和放大系数的作用更加直观比对。

参考图4,为本申请实施例二提供的一种数据处理装置的结构示意图,该装置可以适用于计算机或服务器等设备中,具体的,本实施例中的装置可以包括以下结构:

数据获得单元401,用于获得与目标对象关联的至少一个描述数据。

其中,描述数据是至少一个描述者针对目标对象产生的。例如,描述数据可以包括有:描述者针对目标对象进行的文字表达、图片发布、表情包使用和分数级别标记等其中的一种或多种的描述数据。描述者通过其产生的描述数据能够表征描述者针对目标对象的表达内容及情感倾向。具体的,描述数据可以为一个,相应进行后续分析能够具有针对性;描述数据也可以为多个,相应后续分析能够具有广泛应用性,也能够使得分析结果更加准确。

需要说明的是,目标对象可以为描述者所关注或使用的对象,如某个实体产品如笔记本、某种虚拟服务如游戏场景或者某种应用功能如聊天应用或购物应用等对象。本实施例中旨在对描述者对这些对象的满意度进行分析。

属性获得单元402,用于获得对应所述至少一个描述数据的至少一个属性。

其中,属性能够表征描述者对目标对象的满意倾向。本实施例中描述数据的属性可以为描述数据中体现的情感属性,如正向情感或负向情感,或者推荐情感或抵触情感等。

具体的,本实施例中可以通过描述数据中的用词内容或标点符号等按照预设的属性类型进行相似度分类,来得到对应描述数据的属性,以表征出描述者对目标对象的满意倾向;

或者,本实施例中可以通过对描述数据进行深度学习来得到对应描述数据的属性,以表征出描述者对目标对象的满意倾向;

或者,本实施例中可以通过对描述数据所对应的其他信息如描述时间和/或是否追加描述等信息进行分析,以得到对应描述数据的属性,以表征描述者对目标对象的满意倾向。

需要说明的是,属性所表征的满意倾向可以理解为描述者对目标对象所提供的内容、功能或服务等是否满意或满意程度等。

结果获得单元403,用于至少基于所述至少一个属性,获得处理结果。

其中,处理结果能表征目标对象的满意度。具体的,处理结果能表征描述者针对目标对象的满意度,如客户对笔记本的满意度或用户对聊天应用的满意度等。

具体的,本实施例中可以通过对属性中的满意倾向进行量化,以得到属性所表征的满意倾向对应的满意度值;或者,本实施例中也可以按照预设的满意度级别对属性进行分类,以得到属性所表征的满意度对应的满意度级别;或者,本实施例中可以对表征满意倾向的属性所对应的描述数据进行统计分析,以计算出属性所表征的满意倾向对应的满意度值,等等。

需要说明的是,本实施例中进行满意度分析所根据的描述数据可以是一个描述者针对目标对象产生的,相应的,所得到的处理结果即为表征该描述者针对目标对象的满意度的结果,由此可以分析出某些特定描述者针对目标对象的满意度;或者,本实施例中进行满意度分析所根据的描述数据也可以包含多个描述者针对目标对象产生的数据,相应的,所得到的处理结果即为能表征这些描述者针对该目标对象的满意度的结果,由此可以分析出多数描述者针对某些特定目标对象的满意度。

由上述方案可知,本申请实施例提供的一种数据处理装置,在获取到描述者针对目标对象所产生的描述数据之后,通过获得表征描述者对目标对象的满意倾向的属性,来获得处理结果,以此来表征针对目标对象的满意度。可见,本实施例中通过对目标对象的描述数据进行获取,进而对其能够表征描述者对目标对象的满意倾向的属性进行分析,就可以得到处理结果,以此处理结果来表征描述者对目标对象的满意度,不再依赖于问卷调查等方式,从而减少满意度获取的耗时,由此能够有效提高获取满意度的效率。

进一步的,本实施例中通过从电商、自媒体和/或论坛等方式中所获得的描述数据相对于问卷调查等方式能够具有广泛性,由此,本实施例中通过扩大用于满意度获取的描述数据的来源或范围,使得后续所得到的满意度更加准确。

在一种实现方式中,结果获得单元403具体用于:

获得第一数量值,所述第一数量值为所述属性表征第一倾向的描述数据的总数量值;获得第二数量值,所述第二数量值为所述属性表征第二倾向的描述数据的总数量值;其中,所述第一倾向与所述第二倾向相反;至少基于所述第一数量值和所述第二数量值,获得处理结果,所述处理结果包括针对所述目标对象的满意度的值。

或者,结果获得单元403具体用于:

获得对应所述至少一个描述数据的至少一个级别,所述级别能表征所述描述者对所述目标对象的倾向级别,其中,所述倾向级别对应有级别权重值;获得第一数量值,所述第一数量值为:所述至少一个级别中所述级别对应的级别权重值与所述级别对应的第一描述数量值的乘积之和,所述级别对应的第一描述数量值为所述级别对应的所述属性表征第一倾向的描述数据的总数量值;获得第二数量值,所述第二数量值为:所述至少一个级别中所述级别对应的级别权重值与所述级别对应的第二描述数量值的乘积之和,所述级别对应的第二描述数量值为所述级别对应的所述属性表征第二倾向的描述数据的总数量值;其中,所述第二倾向和所述第一倾向相反;至少基于所述第一数量值和所述第二数量值,获得处理结果,所述处理结果包括针对所述目标对象的满意度的值。

其中,结果获得单元403在至少基于所述第一数量值和所述第二数量值,获得处理结果时,可以通过以下方式实现:

获得所述第一数量值减去所述第二数量值得到的差值;获得所述第一数量值加上所述第二数量值得到的和值;获得所述差值与所述和值之间的比值;至少基于所述比值,获得针对所述目标对象的满意度的值,例如,将所述比值乘以预设的放大系数,得到针对所述目标对象的满意度的值。

在一种实现方式中,属性获得单元402具体用于:利用标注模型,对所述至少一个描述数据进行解析,得到所述至少一个描述数据的至少一个属性,所述属性表征第一倾向或第二倾向;其中,所述标注模型为利用至少两个具有预设倾向标签的样本训练得到。

在另一种实现中,属性获得单元402具体用于:获得对应所述至少一个描述数据的针对目标子对象的至少一个属性,其中,所述属性能表征所述描述者对所述目标子对象的满意倾向,所述目标子对象为所述目标对象的局部;

其中,所述目标子对象用于使得所述处理结果能表征所述描述者对所述目标对象的局部满意度。

另外,本实施例中数据获得单元401还可以先对所述至少一条描述数据进行预处理;其中,所述预处理包括:对所述描述数据按照所述目标对象的对象标识进行分类。

需要说明的是,本实施例的装置中各功能单元的具体实现方式可以参考前文中的相应描述,此处不再赘述。

参考图5,为本申请实施例三提供的一种电子设备的结构示意图,该电子设备可以为计算机或服务器等能够进行数据处理的设备。

在具体实现中,电子设备可以包括以下结构:

存储器501,用于存储应用程序及所述应用程序运行所产生的数据;

处理器502,用于执行所述应用程序,用以实现功能:获得与目标对象关联的至少一个描述数据,所述描述数据是至少一个描述者针对所述目标对象产生的;获得对应所述至少一个描述数据的至少一个属性,所述属性能表征所述描述者对所述目标对象的满意倾向;至少基于所述至少一个属性,获得处理结果,所述处理结果能表征所述目标对象的满意度。

由上述方案可知,本申请实施例提供的一种电子设备,在获取到描述者针对目标对象所产生的描述数据之后,通过获得表征描述者对目标对象的满意倾向的属性,来获得处理结果,以此来表征针对目标对象的满意度。可见,本实施例中通过对目标对象的描述数据进行获取,进而对其能够表征描述者对目标对象的满意倾向的属性进行分析,就可以得到处理结果,以此处理结果来表征描述者对目标对象的满意度,不再依赖于问卷调查等方式,从而减少满意度获取的耗时,由此能够有效提高获取满意度的效率。

在一种实现方式中,处理器502在至少基于所述至少一个属性,获得处理结果时,具体通过以下方式实现:

获得第一数量值,所述第一数量值为所述属性表征第一倾向的描述数据的总数量值;获得第二数量值,所述第二数量值为所述属性表征第二倾向的描述数据的总数量值;其中,所述第一倾向与所述第二倾向相反;至少基于所述第一数量值和所述第二数量值,获得处理结果,所述处理结果包括针对所述目标对象的满意度的值。

或者,处理器502在至少基于所述至少一个属性,获得处理结果时,具体通过以下方式实现:

获得对应所述至少一个描述数据的至少一个级别,所述级别能表征所述描述者对所述目标对象的倾向级别,其中,所述倾向级别对应有级别权重值;获得第一数量值,所述第一数量值为:所述至少一个级别中所述级别对应的级别权重值与所述级别对应的第一描述数量值的乘积之和,所述级别对应的第一描述数量值为所述级别对应的所述属性表征第一倾向的描述数据的总数量值;获得第二数量值,所述第二数量值为:所述至少一个级别中所述级别对应的级别权重值与所述级别对应的第二描述数量值的乘积之和,所述级别对应的第二描述数量值为所述级别对应的所述属性表征第二倾向的描述数据的总数量值;其中,所述第二倾向和所述第一倾向相反;至少基于所述第一数量值和所述第二数量值,获得处理结果,所述处理结果包括针对所述目标对象的满意度的值。

其中,处理器502在至少基于所述第一数量值和所述第二数量值,获得处理结果时,可以通过以下方式实现:

获得所述第一数量值减去所述第二数量值得到的差值;获得所述第一数量值加上所述第二数量值得到的和值;获得所述差值与所述和值之间的比值;至少基于所述比值,获得针对所述目标对象的满意度的值,例如,将所述比值乘以预设的放大系数,得到针对所述目标对象的满意度的值。

在一种实现方式中,处理器502在获得属性时,可以通过以下方式实现:

利用标注模型,对所述至少一个描述数据进行解析,得到所述至少一个描述数据的至少一个属性,所述属性表征第一倾向或第二倾向;其中,所述标注模型为利用至少两个具有预设倾向标签的样本训练得到。

在另一种实现中,处理器502在获得属性时,也可以通过以下方式实现:

获得对应所述至少一个描述数据的针对目标子对象的至少一个属性,其中,所述属性能表征所述描述者对所述目标子对象的满意倾向,所述目标子对象为所述目标对象的局部;

其中,所述目标子对象用于使得所述处理结果能表征所述描述者对所述目标对象的局部满意度。

另外,本实施例中处理器502在获得描述数据之后,可以先对所述至少一条描述数据进行预处理;其中,所述预处理包括:对所述描述数据按照所述目标对象的对象标识进行分类。

需要说明的是,本实施例中处理器502的具体实现方式可以参考前文中的相应描述,此处不再赘述。

以下对产品的满意度分析为了,对本实施例中的技术方案进行举例说明,如下:

首先,在原理上,本实施例中的技术方案基于大数据处理技术与人工智能算法的结合,对用户关于产品的评论数据进行情感取向(倾向)的识别,将识别后的结果进行数学计算,形成一个测量指标:产品满意度指数psi(productsatisfactionindex),该指数的计算公式如下:

psi=(正向评价数据的数量-负向评价数据的数量)/(正向评价数据的数量+负向评价数据的数量)*指标放大系数。

其中,正向评价数据的数量进一步可以根据情感强度(倾向级别)的不同给予不同的权重系数,然后再把乘以权重系数的不同强度的正向评价数量相加得到正向评价数据的数量。同理,负向评价数据的数量也可以根据情感强度的不同给予不同的权重系数,然后再把乘以权重系数的不同强度的负向评价数量相加得到负向评价数据的数量。

另外,指标放大系数根据业务需求设置,其中,考虑指标的可辨识度建议设置为10或100等数值。

具体的实施流程如下所示:

首先,收集客户的评论数据,具体可以从电商、论坛或自媒体等平台上爬取评论数据;

其次,对评论数据进行存储,同时,可以对评论数据进行清洗及对齐(按照产品标识进行分类)等处理;

之后,运用自然语言处理技术上的算法或构建的模型等对评论数据做情感标注(如正向或负向的情感倾向以及情感强度标注)和产品属性提取;

最后,根据计算公式计算产品满意度指数psi,其中,psi可以是针对产品整体(前文中的目标对象)的满意度指数,也可以是针对所提取出的某个产品属性(前文中的目标子对象)的满意度指数。

其中,产品的整体psi指标=(该产品的正向评论数据数量–该产品的负向评论数据数量)/(该产品的正向评论数据数量+该产品的负向评论数据数量)*10;

产品的某个属性的psi指标=(该产品的某属性的正向评论数据数量–该产品的某属性的负向评论数据数量)/(该产品的某属性的正向评论数据数量+该产品的某属性的负向评论数据数量)*10。

其中,正向评论数据数量也可以根据情感强度给予权重,此时正向评论数据数量计算公式如下:

其中,i=1,2,…n,n为正向情感强度的级别总数;

正向评论数据数量也可以根据情感强度给予权重,此时正向评论数据数量计算公式如下:

可见,本实施例中的技术方案,对于满意度指标的定义简单,且技术上可实现,并且能够实现持续的客户满意度的一致性评。进一步的,本实施例中能够实现客户需求分析的量化分析模型,支持多维度多层次的灵活分析。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1