用户标签获取方法、装置及设备与流程

文档序号:21880245发布日期:2020-08-18 16:35阅读:249来源:国知局
用户标签获取方法、装置及设备与流程

本发明涉及数据处理技术领域,具体而言,涉及一种用户标签获取方法、装置及设备。



背景技术:

银行、信用卡中心等金融服务公司的客服系统中累计有大量的用户语音数据,如:用户与客服的对话录音,这些语音数据中包含了大量的用户信息。随着用户要求的与日俱增,金融服务公司对用户需求进行精细化与规范化管理势在必行,而客服系统中累计的大量用户语音数据往往会成为管理用户的重要依据。

现有技术中,对用户语音数据的使用方式通常为:当用户反馈问题后,通过调取用户与客服的对话录音,并依靠人工对用户与客服的对话录音进行分析,获取用户的问题及特点,从而找出对应的解决方案。

但是,上述现有技术中,对用户与客服的对话录音进行分析的结果较为单一,往往无法较为全面地获取用户的问题及特点,导致服务质量无法提高,从而影响用户的服务体验。



技术实现要素:

本发明提供一种用户标签获取方法、装置及设备,可以根据客服系统中用户的服务语音数据获取用户的多种用户标签,全面地获取用户的问题及特点,从而可以为用户提供更好的服务质量,提高用户的服务体验。

第一方面,本发明实施例提供一种用户标签获取方法,所述方法包括:获取用户的服务语音数据;按照预设的用户标签类型,从所述服务语音数据中提取对应的特征信息;根据所述特征信息和所述用户标签类型对应的预设标签识别模型,获取所述用户的用户标签。

可选地,所述按照预设的用户标签类型,从所述服务语音数据中提取对应的特征信息,包括:按照预设的性格情绪标签类型,从所述服务语音数据中提取声纹特征;相应地,所述根据所述特征信息和所述用户标签类型对应的预设标签识别模型,获取所述用户的用户标签,包括:根据所述声纹特征和所述性格情绪标签类型对应的预设性格情绪标签识别模型,获取所述用户的性格情绪标签。

可选地,所述根据所述声纹特征和所述性格情绪标签类型对应的预设性格情绪标签识别模型,获取所述用户的性格情绪标签之前,所述方法还包括:获取第一样本集合,所述第一样本集合包括样本声纹特征,所述样本声纹特征标注有对应的性格情绪标签;采用所述第一样本集合对神经网络进行训练,获取所述预设性格情绪标签识别模型。

可选地,所述按照预设的用户标签类型,从所述服务语音数据中提取对应的特征信息,包括:将所述服务语音数据转换为文本信息;按照预设的诉求标签类型,从所述文本信息中提取第一文本特征;相应地,所述根据所述特征信息和所述用户标签类型对应的预设标签识别模型,获取所述用户的用户标签,包括:根据所述第一文本特征和所述诉求标签类型对应的预设诉求标签识别模型,获取所述用户的诉求标签。

可选地,所述根据所述第一文本特征和所述诉求标签类型对应的预设诉求标签识别模型,获取所述用户的诉求标签之前,所述方法还包括:获取第二样本集合,所述第二样本集合包括样本第一文本特征,所述样本第一文本特征标注有对应的诉求标签;采用所述第二样本集合对神经网络进行训练,获取所述预设诉求标签识别模型。

可选地,所述按照预设的用户标签类型,从所述服务语音数据中提取对应的特征信息,包括:将所述服务语音数据转换为文本信息;从所述文本信息中提取客服人员提供的用户体验问题;按照预设的评价标签类型,根据所述文本信息和所述用户体验问题,提取第二文本特征;相应地,所述根据所述特征信息和所述用户标签类型对应的预设标签识别模型,获取所述用户的用户标签,包括:根据所述第二文本特征和所述评价标签类型对应的预设评价标签识别模型,获取所述用户的评价标签。

可选地,所述根据所述第二文本特征和所述评价标签类型对应的预设评价标签识别模型,获取所述用户的评价标签之前,所述方法还包括:获取第三样本集合,所述第三样本集合包括:样本第二文本特征,所述样本第二文本特征标注有对应的评价标签;采用所述第三样本集合对神经网络进行训练,获取所述预设评价标签识别模型。

可选地,所述从所述服务语音数据中提取声纹特征,包括:将所述服务语音数据依次通过预加重、分帧、加窗、快速傅里叶变换、梅尔mel滤波分析、离散余弦变换处理,得到声纹特征向量。

第二方面,本发明实施例提供一种用户标签获取装置,所述装置包括:获取模块,用于获取用户的服务语音数据;特征提取模块,用于按照预设的用户标签类型,从所述服务语音数据中提取对应的特征信息;标签识别模块,用于根据所述特征信息和所述用户标签类型对应的预设标签识别模型,获取所述用户的用户标签。

可选地,所述特征提取模块,具体用于按照预设的性格情绪标签类型,从所述服务语音数据中提取声纹特征;相应地,所述标签识别模块,具体用于根据所述声纹特征和所述性格情绪标签类型对应的预设性格情绪标签识别模型,获取所述用户的性格情绪标签。

可选地,所述装置还包括:第一训练模块,用于在所述标签识别模块根据所述声纹特征和所述性格情绪标签类型对应的预设性格情绪标签识别模型,获取所述用户的性格情绪标签之前,获取第一样本集合,所述第一样本集合包括样本声纹特征,所述样本声纹特征标注有对应的性格情绪标签;采用所述第一样本集合对神经网络进行训练,获取所述预设性格情绪标签识别模型。

可选地,所述特征提取模块,具体用于将所述服务语音数据转换为文本信息;按照预设的诉求标签类型,从所述文本信息中提取第一文本特征;相应地,所述标签识别模块,具体用于根据所述第一文本特征和所述诉求标签类型对应的预设诉求标签识别模型,获取所述用户的诉求标签。

可选地,所述装置还包括:第二训练模块,用于在所述标签识别模块根据所述第一文本特征和所述诉求标签类型对应的预设诉求标签识别模型,获取所述用户的诉求标签之前,获取第二样本集合,所述第二样本集合包括样本第一文本特征,所述样本第一文本特征标注有对应的诉求标签;采用所述第二样本集合对神经网络进行训练,获取所述预设诉求标签识别模型。

可选地,所述特征提取模块,具体用于将所述服务语音数据转换为文本信息;从所述文本信息中提取客服人员提供的用户体验问题;按照预设的评价标签类型,根据所述文本信息和所述用户体验问题,提取第二文本特征;相应地,所述标签识别模块,具体用于根据所述第二文本特征和所述评价标签类型对应的预设评价标签识别模型,获取所述用户的评价标签。

可选地,所述装置还包括:第三训练模块,用于在所述标签识别模块根据所述第二文本特征和所述评价标签类型对应的预设评价标签识别模型,获取所述用户的评价标签之前,获取第三样本集合,所述第三样本集合包括:样本第二文本特征,所述样本第二文本特征标注有对应的评价标签;采用所述第三样本集合对神经网络进行训练,获取所述预设评价标签识别模型。

可选地,所述特征提取模块,具体用于将所述服务语音数据依次通过预加重、分帧、加窗、快速傅里叶变换、梅尔mel滤波分析、离散余弦变换处理,得到声纹特征向量。

第三方面,本发明实施例提供一种用户标签获取设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当用户标签获取设备运行时,所述处理器与所述存储介质之间通过所述总线通信,所述处理器执行所述机器可读指令,以执行如第一方面所述的用户标签获取方法。

第四方面,本发明实施例还提供一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如第一方面所述的用户标签获取方法。

本发明的有益效果是:

本发明实施例通过获取用户的服务语音数据,按照预设的用户标签类型,从服务语音数据中提取对应的特征信息,并根据特征信息和用户标签类型对应的预设标签识别模型,获取用户的用户标签,可以实现根据用户的服务语音数据,获取多种不同类型的用户标签,从而可以根据不同类型的用户标签,更加全面地获取用户的问题及特点,进而可以为用户提供更好的服务质量,以提高用户的服务体验。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1示出了本发明实施例提供的用户标签获取方法的流程示意图;

图2示出了本发明实施例提供的声纹特征提取的流程示意图;

图3示出了本发明实施例提供的用户标签获取方法的另一流程示意图;

图4示出了本发明实施例提供的dnn提取性格情绪标签的流程示意图;

图5示出了本发明实施例提供的用户标签获取方法的又一流程示意图;

图6示出了本发明实施例提供的用户标签获取方法的又一流程示意图;

图7示出了本发明实施例提供的bert模型提取诉求标签的流程示意图;

图8示出了本发明实施例提供的用户标签获取方法的又一流程示意图;

图9示出了本发明实施例提供的bert模型提取用户评价描述的流程示意图;

图10示出了本发明实施例提供的用户标签获取方法的又一流程示意图;

图11示出了本发明实施例提供的用户标签获取装置的结构示意图;

图12示出了本发明实施例提供的用户标签获取装置的另一结构示意图;

图13示出了本发明实施例提供的用户标签获取装置的另一结构示意图;

图14示出了本发明实施例提供的用户标签获取装置的另一结构示意图;

图15示出了本发明实施例提供的用户标签获取设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。在本发明的描述中,还需要说明的是,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

本发明实施例提供一种用户标签获取方法,可以根据客服系统中用户的服务语音数据获取用户的多种用户标签,全面地获取用户的问题及特点,从而可以为用户提供更好的服务质量,提高用户的服务体验。该方法的执行主体可以是计算机、服务器、一个或多个处理器等,本发明在此不作限定。

图1示出了本发明实施例提供的用户标签获取方法的流程示意图。

如图1所示,该用户标签获取方法,可以包括:

s101、获取用户的服务语音数据。

服务语音数据可以是指:用户与客服的对话录音,语音数据中包含了大量的用户信息,如:用户的性格、用户的讲话方式、用户的语言类型、用户的性别等。

s102、按照预设的用户标签类型,从服务语音数据中提取对应的特征信息。

可选地,预设的用户标签类型可以包括:性格情绪标签类型、诉求标签类型、评价标签类型等。性格情绪标签类型对应的特征信息可以是服务语音数据中的声纹特征,诉求标签类型对应的特征信息可以是转换成的文本信息的文本特征,评价标签类型对应的特征信息可以是服务语音数据中用户语音转换成的文本与客服人员提供的体验问题组合构造的文本特征。

s103、根据特征信息和用户标签类型对应的预设标签识别模型,获取用户的用户标签。

可选地,预设标签识别模型可以包括:与性格情绪标签类型、诉求标签类型、以及评价标签类型一一对应的预设性格情绪标签识别模型、预设诉求标签识别模型、以及预设评价标签识别模型;前述预设标签识别模型可以由前期经过人工标注的样本集合对神经网络进行训练所获取,将每种用户标签类型对应的特征信息输入对应的预设标签识别模型后,不同的预设标签识别模型可以输出每种用户标签类型的用户标签。例如,可以分别输出用户的性格情绪标签、诉求标签、以及评价标签。其中,性格情绪标签可以反映用户的性格情绪,诉求标签可以反映用户在服务过程中遇到的问题,评价标签可以反映用户对服务的相关评价。

由上可知,本发明实施例通过获取用户的服务语音数据,按照预设的用户标签类型,从服务语音数据中提取对应的特征信息,并根据特征信息和用户标签类型对应的预设标签识别模型,获取用户的用户标签,可以实现根据用户的服务语音数据,获取多种不同类型的用户标签,从而可以根据不同类型的用户标签,更加全面地获取用户的问题及特点,进而可以为用户提供更好的服务质量,以提高用户的服务体验。

另外,相对于现有人工对用户的服务语音数据进行分析的方式,本发明实施例还能够有效提高用户的服务语音数据的分析效率,同时节省大量的人工成本。

下面分别对性格情绪标签、诉求标签、以及评价标签的具体获取方式作以说明:

可选地,一种实施方式中,上述按照预设的用户标签类型,从服务语音数据中提取对应的特征信息的步骤,具体可以包括:按照预设的性格情绪标签类型,从所述服务语音数据中提取声纹特征。相应地,上述根据特征信息和用户标签类型对应的预设标签识别模型,获取用户的用户标签的步骤,具体可以包括:根据声纹特征和性格情绪标签类型对应的预设性格情绪标签识别模型,获取用户的性格情绪标签。

其中,声纹特征即为声纹特征向量。

图2示出了本发明实施例提供的声纹特征提取的流程示意图。

可选地,如图2所示,上述从服务语音数据中提取声纹特征的步骤,具体可以包括:将服务语音数据依次通过预加重、分帧、加窗、快速傅里叶变换(fastfouriertransform,fft)、梅尔mel滤波分析、离散余弦变换(discretecosinetransform,dct)处理,得到声纹特征向量。

具体地,服务语音数据包含相应的音频信号,为了消除发声过程中嘴唇和声带的影响,补偿被发声系统抑制的音频信号的高频部分、并突出高频共振峰,可以将一阶微分方程应用于服务语音数据以增加高频共振峰的幅度,把音频信号通过一个高通滤波器:

h(z)=1-kz-1

其中,k为预加重系数,其值在[0,1]之间,通常选用0.97;h(z)表示传递函数。

在分帧步骤中,音频信号被分成n个采样帧,为了避免两个相邻帧的过度变化,相邻帧之间存在一个重叠区域,重叠区域包含m个采样帧,且m<n。假设每帧内都是平稳的,一般采用20-30ms为一帧,25%,50%,75%的重叠率。

进一步,加窗目的是减少音频信号的不连续性,并使末端足够平滑以与起点连接。常用的窗函数就是汉明窗。假设分帧后的信号为sn,其中,n=1,…,n,表示信号帧,加窗后的信号s′n可表示为:

fft可以将n个样本从时域转换到频域,使用fft是因为它是实现离散傅里叶变换(discretefouriertransform,dft)的快速算法,公式如下:

其中,sk为输入的音频信号,n为傅里叶变换的采样点。

在mel滤波分析中,频域中有多个冗余信号,mel滤波器组可以根据人耳的听力范围,简化频域的幅度。人耳对声音的感知不是线性的,用log的非线性关系可以更好地描述它。mel频率与音频信号之间的关系如下:

其中,mel(f)为梅尔频率,f为音频信号的频率,单位为赫兹。

在进行mel滤波分析后,可以通过dct变换计算梅尔频率倒谱系数(melfrequencycepstrumcoefficient,mfcc),公式如下:

其中,n为滤波通道,mj为第j个梅尔滤波的强度。至此,则可以获取用户对应的服务语音数据中每句对话的声纹特征向量。

图3示出了本发明实施例提供的用户标签获取方法的另一流程示意图。

可选地,如图3所示,上述根据声纹特征和性格情绪标签类型对应的预设性格情绪标签识别模型,获取用户的性格情绪标签之前,该用户标签获取方法还可以包括:

s301、获取第一样本集合。

第一样本集合包括样本声纹特征,样本声纹特征标注有对应的性格情绪标签。

s302、采用第一样本集合对神经网络进行训练,获取预设性格情绪标签识别模型。

例如,训练预设性格情绪标签识别模型所使用的神经网络可以为深度神经网络(deepneuralnetworks,dnn);第一样本集合中,样本声纹特征的性格情绪标签可以预先由人工进行标注,如:可以由业务人员根据业务经验对训练数据进行标注,以获取第一样本集合。

可选地,性格情绪标签可以包括:易怒的、平和的、以及急迫的。需要说明的是,在部分实施方式中,性格情绪标签的类型还可以更多,本发明对性格情绪标签的类型数量不作限制,可根据业务人员的标注增多或减少。

图4示出了本发明实施例提供的dnn提取性格情绪标签的流程示意图。

如图4所示,以dnn网络结构为例,在dct变换之后,可以将得到2560维的声纹特征向量,经过训练好的3层dnn网络,然后得到用户的性格情绪标签。

当获取到用户的性格情绪标签后,可以根据用户的性格情绪标签,将用户分配给合适的客服人员,使得用户与客服人员之间的沟通更加舒适,提高用户的服务体验。

图5示出了本发明实施例提供的用户标签获取方法的又一流程示意图。

可选地,如图5所示,另一种实施方式中,上述按照预设的用户标签类型,从服务语音数据中提取对应的特征信息的步骤,还可以包括:

s501、将服务语音数据转换为文本信息。

例如,可以采用语音转文本引擎将服务语音数据转写成文本。

s502、按照预设的诉求标签类型,从文本信息中提取第一文本特征。

可选地,可以采用独热(one-hot)编码技术对文本信息进行预处理,得到对应的文本向量,即第一文本特征。

相应地,上述根据特征信息和用户标签类型对应的预设标签识别模型,获取用户的用户标签的步骤,具体可以包括:根据第一文本特征和诉求标签类型对应的预设诉求标签识别模型,获取用户的诉求标签。

图6示出了本发明实施例提供的用户标签获取方法的又一流程示意图。

可选地,如图6所示,上述根据第一文本特征和诉求标签类型对应的预设诉求标签识别模型,获取用户的诉求标签的步骤之前,该用户标签获取方法还可以包括:

s601、获取第二样本集合。

第二样本集合可以包括样本第一文本特征,样本第一文本特征标注有对应的诉求标签。

s602、采用第二样本集合对神经网络进行训练,获取预设诉求标签识别模型。

举例说明:上述预设诉求标签识别模型可以为变压器双向编码器表示模型(bidirectionalencoderrepresentationsfromtransformers,bert),bert通过上下文体现词的不同含义。bert模型是由双向transformer组成的一个特征抽取模型。transformer所使用的注意力机制的核心思想是去计算一句话中每个词对这句话中所有词的相互关系,然后认为词与词的相互关系在一定程度上反应了这句话中不同词之间的关联性以及重要程度。bert模型在训练过程中可以使用掩藏语言模型(maskedlanguagemodel),随机遮挡输入中的一些令牌(tokens),进行预训练,同时增加句子级任务下一句预测(nextsentenceprediction),随机替换一些句子,利用上一句进行是或非(isnext/notnext)的预测。通过这两项任务,使用大规模无标注语料进行优化,最后得到预训练好的bert模型。

本发明实施例中,bert模型可以以googlebertmultilingual预训练模型为基础,包括12-layers,768-hiddensize,12-heads,约1亿参数。问答模型利用用户的回答,对预训练模型进行做多分类任务,进行有监督训练,在预测置信度较低的语料中挑出错误标签进行重新标注,进行微调,在训练预测的平均错误率不再明显降低(约20到30epoch之后),模型停止微调,并得到问题识别模型。

图7示出了本发明实施例提供的bert模型提取诉求标签的流程示意图。

如图7所示,采用one-hot编码技术对文本信息进行预处理,得到对应的第一文本特征后,可以加上文本的位置特征与段落特征,共同组成模型输入。模型输入后,可以先通过12层注意(attention)网络,再通过一个全连接层,最后通过softmax层得到用户的问题,模型输出可以为用户诉求的概率。训练数据来自业务标注,总结的用户问题同样可以来自业务经验。

相对于传统的分类方法,bert算法由于带有丰富的先验知识,所以对对文本的表达能力更强,采用bert算法完成的分类任务也更加准确。

以信用卡服务为例,通过提取用户的诉求标签,可以实现对用户遇到的问题进行归纳,预测用户在使用信用卡的过程中还可能遇到什么问题,甚至可以主动服务用户,增加用户的好感,增强用户对卡中心的信心。

可选地,本发明实施例中,诉求标签可以包括:购物诉求、现金诉求、还款诉求、账户诉求、实名认证诉求、安全攻略诉求、销户诉求、商家代扣诉求、以及支付诉求等。需要说明的是,在部分实施方式中,诉求标签的类型还可以更多,本发明对诉求标签的类型、数量亦不作限制。

图8示出了本发明实施例提供的用户标签获取方法的又一流程示意图。

可选地,如图8所示,又一种实施方式中,上述按照预设的用户标签类型,从服务语音数据中提取对应的特征信息,还可以包括:

s801、将服务语音数据转换为文本信息。

转换方式与前述实施例中相同,在此不再赘述。

s802、从文本信息中提取客服人员提供的用户体验问题。

例如,用户体验问题可以是指:用户与客服人员在对话过程中,由客服人员向用户提出的关于用户体验描述的问题,如:对服务是否满意、对服务是否有其他要求等。

s803、按照预设的评价标签类型,根据文本信息和用户体验问题,提取第二文本特征。

相应地,上述根据特征信息和用户标签类型对应的预设标签识别模型,获取用户的用户标签的步骤,具体可以包括:根据第二文本特征和评价标签类型对应的预设评价标签识别模型,获取用户的评价标签。

可选地,本发明实施例同样可以采用bert算法抽取用户关于用户体验问题的描述,在用bert算法抽取用户描述之前,首先需将抽取的有关用户评价的用户体验问题与用户对话一起,组成新的文本。bert首先在用户评价问题前面添加特殊分类令牌(specialclassificationtoken)标记,然后将体验问题和段落连在一起,中间使用特殊令牌(specialtoken)分开,组成新的文本序列。新的文本序列通过分段嵌入和位置嵌入(segmentembeddingsandpositionalembeddings)输入到bert;最后,通过全连接层和softmax函数将bert的最终隐藏状态转换为答案跨度的概率。由于微调的bert可以捕获一个用户体验问题和一个段落之间的关系,所以可以在用户与客服人员的对话中抽取用户评价相关的用户体验问题。

图9示出了本发明实施例提供的bert模型提取用户评价描述的流程示意图。

如图9所示,模型输入先通过14层attention网络,再通过一个全连接层,最后通过softmax层可以得到用户描述的起始位置和结束位置的概率。

图10示出了本发明实施例提供的用户标签获取方法的又一流程示意图。

可选地,如图10所示,上述根据第二文本特征和评价标签类型对应的预设评价标签识别模型,获取用户的评价标签之前,该用户标签获取方法还可以包括:

s1001、获取第三样本集合。

第三样本集合可以包括:样本第二文本特征,样本第二文本特征标注有对应的评价标签。

s1002、采用第三样本集合对神经网络进行训练,获取预设评价标签识别模型。

可选地,上述预设评价标签识别模型仍然可以采用bert模型,模型结构与上述预设诉求标签识别模型的结构基本一致,将用户的描述转为词向量之后,可以加上文本位置特征与段落特征共同组成模型的输入,模型输入先通过12层attention网络,再通过一个全连接层,最后通过softmax层得到用户的情感分类,即评价标签。需要说明的是,训练前期仍然需要标注部分情感数据,情感倾向的标注仍然来自业务部门。

可选地,评价标签可以包括:正面评价、负面评价、以及中等评价。

如上所述,为了使获取的用户评价描述发挥更大的作用,本发明实施例在抽取到了用户的描述之后,可以判断用户描述的情感倾向是属于:正面评价(positive)、负面评价(negtive)、或者中等评价(confuse),以提高客服人员查找非正向描述的效率。提取用户的评价标签,可以更加便捷地看到用户对卡中心的评价是积极的、消极的、或者不知所措的(中等的),并根据这些评价更加快捷地改进业务,提升服务品质。

综上所述,本发明实施例可以通过对用户服务语音数据进行分析,获取用户对应的性格情绪标签、诉求标签、评价标签等用户标签,从而能够为业务决策提供数据依据,支持业务的合理发展。

基于前述实施例所述的用户标签获取方法,本发明实施例对应提供一种用户标签获取装置,图11示出了本发明实施例提供的用户标签获取装置的结构示意图。

如图11所示,该用户标签获取装置,可以包括:获取模块10,用于获取用户的服务语音数据;特征提取模块20,用于按照预设的用户标签类型,从服务语音数据中提取对应的特征信息;标签识别模块30,用于根据特征信息和用户标签类型对应的预设标签识别模型,获取用户的用户标签。

可选地,特征提取模块20,具体可以用于按照预设的性格情绪标签类型,从服务语音数据中提取声纹特征;相应地,标签识别模块30,具体可以用于根据声纹特征和性格情绪标签类型对应的预设性格情绪标签识别模型,获取用户的性格情绪标签。

图12示出了本发明实施例提供的用户标签获取装置的另一结构示意图。

如图12所示,该用户标签获取装置,还可以包括:第一训练模块40,可以用于在标签识别模块30根据声纹特征和性格情绪标签类型对应的预设性格情绪标签识别模型,获取用户的性格情绪标签之前,获取第一样本集合,第一样本集合包括样本声纹特征,样本声纹特征标注有对应的性格情绪标签;采用第一样本集合对神经网络进行训练,获取预设性格情绪标签识别模型。

可选地,特征提取模块20,具体可以用于将服务语音数据转换为文本信息;按照预设的诉求标签类型,从文本信息中提取第一文本特征;相应地,标签识别模块30,具体用于根据第一文本特征和诉求标签类型对应的预设诉求标签识别模型,获取用户的诉求标签。

图13示出了本发明实施例提供的用户标签获取装置的另一结构示意图。

如图13所示,该用户标签获取装置,还可以包括:第二训练模块50,用于在标签识别模块30根据第一文本特征和诉求标签类型对应的预设诉求标签识别模型,获取用户的诉求标签之前,获取第二样本集合,第二样本集合包括样本第一文本特征,样本第一文本特征标注有对应的诉求标签;采用第二样本集合对神经网络进行训练,获取预设诉求标签识别模型。

可选地,特征提取模块20,具体可以用于将服务语音数据转换为文本信息;从文本信息中提取客服人员提供的用户体验问题;按照预设的评价标签类型,根据文本信息和用户体验问题,提取第二文本特征;相应地,标签识别模块30,具体可以用于根据第二文本特征和评价标签类型对应的预设评价标签识别模型,获取用户的评价标签。

图14示出了本发明实施例提供的用户标签获取装置的另一结构示意图。

如图14所示,该用户标签获取装置,还可以包括:第三训练模块60,用于在标签识别模块30根据第二文本特征和评价标签类型对应的预设评价标签识别模型,获取用户的评价标签之前,获取第三样本集合,第三样本集合包括:样本第二文本特征,样本第二文本特征标注有对应的评价标签;采用第三样本集合对神经网络进行训练,获取预设评价标签识别模型。

可选地,特征提取模块20,具体可以用于将服务语音数据依次通过预加重、分帧、加窗、快速傅里叶变换、梅尔mel滤波分析、离散余弦变换处理,得到声纹特征向量。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法实施例中方法的对应过程,本发明中不再赘述。

本发明实施例还提供一种用户标签获取设备,该用户标签获取设备可以是计算机、服务器等,图15示出了本发明实施例提供的用户标签获取设备的结构示意图。

如图15所示,该用户标签获取设备可以包括:处理器100、存储介质200和总线(图中未标出),存储介质200存储有处理器100可执行的机器可读指令,当用户标签获取设备运行时,处理器100与存储介质200之间通过总线通信,处理器100执行机器可读指令,以执行如前述方法实施例中所述的用户标签获取方法。具体实现方式和技术效果类似,在此不再赘述。

基于此,本发明实施例还提供一种存储介质,存储介质上存储有计算机程序,计算机程序被处理器运行时执行如前述方法实施例中所述的用户标签获取方法。具体实现方式和技术效果类似,在此同样不再赘述。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1