客户需求信息识别方法、装置、电子设备及存储介质与流程

文档序号：25305340发布日期：2021-06-04 14:21阅读：255来源：国知局

1.本发明涉及人工智能技术领域，具体涉及一种客户需求信息识别方法、装置、电子设备及存储介质。

背景技术：

2.随着个性化服务的发展，企业会定期举办一些沙龙活动，以提高客户的满意度，在举办沙龙活动过程中，客户可能会提出很多需求，例如，对某些产品感兴趣，工作人员会记录客户的需求，后期会根据不同客户的不同需求，提供个性化服务。
3.现有技术是通过工作人员与每个客户进行面对面交流后识别客户的需求信息，导致识别客户需求信息的效率低下，并且在面对面交流过程中，可能出现会漏写或者错写客户需求信息的现象，识别客户需求信息效率低。

技术实现要素：

4.鉴于以上内容，有必要提出一种客户需求信息识别方法、装置、电子设备及存储介质，能够批量识别多个客户的客户需求信息，客户需求信息的识别效率高。
5.本发明的第一方面提供一种客户需求信息识别方法，所述方法包括：
6.接收第一采集设备采集到的每个客户的第一语音信息，并根据所述每个客户的第一语音信息生成每个客户的注册声纹；
7.接收第二采集设备采集到的第二语音信息，提取所述第二语音信息中的声纹特征；
8.将所述声纹特征进行分段得到多个声纹特征片段，根据所述多个声纹特征片段与所述每个客户的注册声纹，得到所述每个客户的第三语音信息；
9.识别所述每个客户的第三语音信息对应的语言类型，并将所述第三语音信息输入至所述语音类型对应的语音识别模型中；
10.识别所述语音识别模型输出的目标文本信息，并对所述目标文本信息进行实体识别得到多个实体；
11.根据所述目标文本信息生成语义特征向量，及根据所述多个实体生成实体特征向量；
12.根据所述语义特征向量及所述实体特征向量识别所述每个客户的客户需求信息。
13.可选的，所述将所述声纹特征进行分段得到多个声纹特征片段，根据所述多个声纹特征片段与所述每个客户的注册声纹，得到所述每个客户的第三语音信息包括：
14.将每个声纹特征片段与所述每个客户的注册声纹进行匹配；
15.从所述多个声纹特征片段确定出每个客户对应的声纹特征片段；
16.根据所述每个客户对应的声纹特征片段从所述第二语音信息中提取出每个客户的第三语音信息。
17.可选的，所述提取所述第二语音信息中的声纹特征包括：
18.计算所述第二语音信息的频率；
19.对所述频率采用带通滤波器进行滤波处理，得到滤波后的第二语音信息；
20.提取所述滤波后的第二语音信息中的声纹特征。
21.可选的，所述对所述频率采用带通滤波器进行滤波处理，得到滤波后的第二语音信息包括：
22.将所述频率按照从低频到高频的顺序排列得到所述第二语音信息的频带；
23.在所述频带内按照临界带宽值对一组带通滤波器由密到疏进行排列；
24.采用排列后的带通滤波器对所述第二语音信息进行滤波；
25.获取滤波后的第二语音信息。
26.可选的，所述对所述目标文本信息进行实体识别得到多个实体包括：
27.将所述目标文本信息输入至命名实体识别模型中进行实体识别得到多个实体。
28.可选的，所述根据所述目标文本信息生成语义特征向量包括：
29.根据所述目标文本信息生成包含上下文特征的第一文本向量；
30.通过卷积运算将所述第一文本向量转换为多个第二文本向量；
31.对所述多个第二文本向量进行特征提取得到语义特征向量。
32.可选的，所述根据所述多个实体生成实体特征向量包括：
33.利用词向量映射模型将所述多个实体映射为词向量集合，其中，每个实体对应一个词向量；
34.计算所述词向量集合的每个维度的均值；
35.根据所述每个维度的均值生成实体特征向量。
36.本发明的第二方面提供一种客户需求信息识别装置，所述装置包括：
37.第一接收模块，用于接收第一采集设备采集到的每个客户的第一语音信息，并根据所述每个客户的第一语音信息生成每个客户的注册声纹；
38.第二接收模块，用于接收第二采集设备采集到的第二语音信息，提取所述第二语音信息中的声纹特征；
39.分段模块，用于将所述声纹特征进行分段得到多个声纹特征片段，根据所述多个声纹特征片段与所述每个客户的注册声纹，得到所述每个客户的第三语音信息；
40.第一识别模块，用于识别所述每个客户的第三语音信息对应的语言类型，并将所述第三语音信息输入至所述语音类型对应的语音识别模型中；
41.第二识别模块，用于识别所述语音识别模型输出的目标文本信息，并对所述目标文本信息进行实体识别得到多个实体；
42.生成模块，用于根据所述目标文本信息生成语义特征向量，及根据所述多个实体生成实体特征向量；
43.第三识别模块，用于根据所述语义特征向量及所述实体特征向量识别所述每个客户的客户需求信息。
44.本发明的第三方面提供一种电子设备，所述电子设备包括处理器存储器，所述处理器用于执行所述存储器中存储的计算机程序时实现所述的客户需求信息识别方法。
45.本发明的第四方面提供一种计算机可读存储介质，所述计算机可读存储介质上
存储有计算机程序，所述计算机程序被处理器执行时实现所述的客户需求信息识别方法。
46.综上所述，本发明所述的客户需求信息识别方法、装置、电子设备及存储介质，一方面，通过将每个客户的语义特征向量及所述实体特征向量得到模板特征向量，根据所述模型特征向量转换为预设格式的结构数据后识别所述每个客户的客户需求信息，便于管理每个客户的客户需求信息，提高了识别每个客户的客户需求信息的准确性和完整性；另一方面，通过计算对实体进行训练得到的词向量集合的每个维度的均值得到对应的实体特征向量，降低了实体特征向量的维度，提高了提取得到的实体特征向量的准确率；最后，通过将所述声纹特征进行分段处理，将每个声纹特征片段与所述每个客户的注册声纹进行匹配后确定出每个客户的声纹特征片段，能够批量识别多个客户的客户需求信息，客户需求信息的识别效率高。
附图说明
47.图1是本发明实施例一提供的客户需求信息识别方法的流程图。
48.图2是本发明实施例二提供的客户需求信息识别装置的结构图。
49.图3是本发明实施例三提供的电子设备的结构示意图。
50.如下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
51.为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施例对本发明进行详细描述。需要说明的是，在不冲突的情况下，本发明的实施例及实施例中的特征可以相互组合。
52.除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本发明。
53.实施例一
54.图1是本发明实施例一提供的客户需求信息识别方法的流程图。
55.在本实施例中，所述客户需求信息识别方法可以应用于电子设备中，对于需要进行客户需求信息识别的电子设备，可以直接在电子设备上集成本发明的方法所提供的客户需求信息识别的功能，或者以软件开发工具包(softwaredevelopment kit，skd)的形式运行在电子设备中。
56.如图1所示，所述客户需求信息识别方法具体包括以下步骤，根据不同的需求，该流程图中步骤的顺序可以改变，某些可以省略。
57.s11，接收第一采集设备采集到的每个客户的第一语音信息，并根据所述每个客户的第一语音信息生成每个客户的注册声纹。
58.本实施例中，在一些特定的场合，例如，在举办沙龙活动时，为了高效的识别每个客户的客户需求信息，需要多个采集设备在不同的位置采集每个客户的语音信息，例如，在入场时，所述第一采集设备用于采集参加活动的所有客户的第一语音信息，具体地，所述第一语音信息中包括每个客户的编号、身份证号码、手机号码等，根据所述第一语音信息创建每个客户的注册声纹。
59.可选地，所述根据所述所有客户的第一语音信息生成每个客户的注册声纹包括：
60.利用声纹模型从所述第一语音信息提取每个客户的声纹特征信息，并根据所述每个客户的声纹特征信息生成每个客户的注册声纹。
61.本实施例中，所述声纹模型用于提取语音信息中的声纹特征信息，在识别所述所有客户的第一语音信息之后，采用声纹模型从所述第一语音信息中提取每个客户的声纹特征信息作为每个客户的注册声纹。
62.s12，接收第二采集设备采集到的第二语音信息，提取所述第二语音信息中的声纹特征。
63.本实施例中，所述第二采集设备用于采集活动中每个客户的发言及客户之间的交流的语音信息，将所述第二采集设备采集的语音信息作为所述所有客户的第二语音信息，并提取所述第二语音信息中的声纹特征。
64.可选地，所述提取所述第二语音信息中的声纹特征包括：
65.计算所述第二语音信息的频率；
66.对所述频率采用带通滤波器进行滤波处理，得到滤波后的第二语音信息；
67.提取所述滤波后的第二语音信息中的声纹特征。
68.本实施例中，可以识别预设采样时间t的第二语音信息，每秒从所述第二语音信息的连续信号中提取并组成离散信号的预设采样个数r，用hz表示，计算所述第二语音信息的频率等于预设采样个数r除以预设采样时间t，对所述频率采用带通滤波器进行滤波处理，得到滤波后的第二语音信息，具体地，采用带通滤波器对接收到的第二语音信息进行滤波得到滤波后的第二语音信息。
69.在其他一些实施例中，所述对所述频率采用带通滤波器进行滤波处理，得到滤波后的第二语音信息包括：
70.将所述频率按照从低频到高频的顺序排列得到所述第二语音信息的频带；
71.在所述频带内按照临界带宽值对一组带通滤波器由密到疏进行排列；
72.采用排列后的带通滤波器对所述第二语音信息进行滤波；
73.获取滤波后的第二语音信息。
74.本实施例中，所述临界带宽指的是临界频带的带宽，由于频率较低的声音在内耳蜗基底膜上行波传递的距离大于频率较高的声音，故一般来说，低音容易掩蔽高音，而高音掩蔽低音较困难，在低频处的声音掩蔽的临界带宽较高频要小。当客户在进行来电通话时，所处的环境背景不同，特别是当客户在环境背景噪音较大的环境中通话时，将影响第二语音信息的识别率。因此为了抑制输入的第二语音信息的信号中频率超过fs/2的所有分量，防止混叠，同时抑制 50hz的电源工频干扰，在所述频带内按照临界带宽值由密到疏排列一组带通滤波器进行第二语音信息的滤波。所述带通滤波器进行滤波为现有技术，本发明在此不作详细阐述。
75.本实施例中，提取所述滤波后的第二语音信息中的声纹特征，具体地，声纹是用电声学仪器显示的携带言语信息的声波频谱，通过声纹可以进行说话人识别。一般来说，影响说话人识别的因素有说话人的声学特征、词法特征、韵律特征、语种特征、方言特征和口音特征等声纹特征。因此，在识别所述第二语音信息之后，提取出第二语音信息中的声学特征、词法特征、韵律特征、语种特征、方言特征和口音特征等声纹特征。
76.本实施例中，所述第二语音信息中的声纹特征的提取方式有很多种，例如线性预测分析(linearpredictioncoefficients，lpc)、感知线性预测系数 (perceptuallinearpredictive，plp)、tandem特征和bottleneck特征、基于滤波器组的fbank特征(filterbank)、线性预测倒谱系数 (linearpredictivecepstralcoefficient，lpcc)及梅尔频率倒谱系数 (melfrequencycepstrumcoefficient，mfcc)，本发明所采用的是梅尔频率倒谱系数(melfrequencycepstrumcoefficient，mfcc)进行第二语音信息中的声纹特征的提取，通过对所述第二语音信息进行预加重、分帧、加窗后，对分帧加窗后的各帧信号进行快速傅立叶变换得到各帧的频谱，将所述频谱映射到基于听觉感知的mel非线性频谱中，然后转换到倒谱上，进行一个傅立叶变换的逆变换，得到倒谱系数，所述倒谱系数为所述第二语音信息的声纹特征。所述梅尔频率倒谱系数(melfrequencycepstrumcoefficient，mfcc)进行第二语音信息中的声纹特征的提取为现有技术，本发明在此不做详细阐述。
77.s13，将所述声纹特征进行分段得到多个声纹特征片段，根据所述多个声纹特征片段与所述每个客户的注册声纹，得到所述每个客户的第三语音信息。
78.本实施例中，由于所述声纹特征中包括所有客户的声纹特征，通过在所述声纹特征中识别每个客户的声纹特征，进而得到每个客户的目标语音信息，将所述目标语音信息作为对应客户的第三语音信息。
79.可选地，所述将所述声纹特征进行分段得到多个声纹特征片段，根据所述多个声纹特征片段与所述每个客户的注册声纹，得到所述每个客户的第三语音信息包括：
80.将每个声纹特征片段与所述每个客户的注册声纹进行匹配；
81.从所述多个声纹特征片段确定出每个客户对应的声纹特征片段；
82.根据所述每个客户对应的声纹特征片段从所述第二语音信息中提取出每个客户的第三语音信息。
83.本实施例中，通过将所述声纹特征按照预设的分段规则进行分段，获得多个声纹特征片段，具体地，将每个声纹特征片段与预先生成的每个客户的注册声纹进行匹配，从所述多个声纹特征中确定出每个客户的声纹特征片段，进而得到每个客户的第三语音信息。
84.在其他一些实施例中，若每个客户对应多个声纹特征片段，将所述多个声纹特征片段进行重组确定为每个客户对应的目标声纹特征，根据所述目标声纹特征得到所述每个客户的第三语音信息。
85.本实施例中，若直接将所述声纹特征与所有客户的注册声纹同步进行匹配，数据量大，导致数据处理缓慢，且容易引起数据出错的现象，通过将所述声纹特征进行分段处理，将每个声纹特征片段与所述每个客户的注册声纹进行匹配后确定出每个客户的声纹特征片段，不需要面对面与客户交流识别第三语音信息，能够批量识别多个客户的客户需求信息，客户需求信息的识别效率高。
86.s14，识别所述每个客户的第三语音信息对应的语言类型，并将所述第三语音信息输入至所述语音类型对应的语音识别模型中。
87.本实施例中，在确定得到每个客户的第三语音信息之后，识别每个客户对应的第三语音信息对应的语言类型，并将所述第三语音信息发送至所述语言类型对应的语音识
别模型中进行语音识别。
88.本实施例中，通过确定所述第三语音信息对应的语言类型，输入至对应的语音识别模型中进行语音识别，提高了语音识别的准确率。
89.s15，识别所述语音识别模型输出的目标文本信息，并对所述目标文本信息进行实体识别得到多个实体。
90.本实施例中，在客户需求信息识别过程中，若产品的种类比较繁多，并且产品的名称比较相近，为了避免在客户需求信息识别过程中将产品名称混淆，需要将所述目标文本信息进行实体识别得到多个实体，每个实体代表一个产品的名称，提高了客户需求信息识别的准确率。
91.可选地，所述对所述目标文本信息进行实体识别得到多个实体包括：
92.将所述目标文本信息输入至命名实体识别模型中进行实体识别得到多个实体。
93.可选的，所述命名实体识别模型的训练过程包括：
94.在预设的训练集中提取训练文本；
95.标注所述训练文本对应的训练实体，并基于所述训练实体及所述训练文本构建待训练命名实体识别模型的训练样本；
96.将所述训练样本输入所述待训练命名实体识别模型进行模型训练，获得命名实体识别模型。
97.本实施例中，可以预先训练命名实体识别模型，通过将所述目标文本信息输入至预先训练好的命名实体识别模型中输出多个实体，并且在确定新的产品时，只需要将所述新的产品作为训练文本，将所述训练文本标注成对应的训练实体进行训练，提高了识别实体的正确率。
98.s16，根据所述目标文本信息生成语义特征向量，及根据所述多个实体生成实体特征向量。
99.本实施例中，所述语义特征向量可以用于确定所述目标文本信息中的真实的意思，所述实体特征向量用于确定每个实体的具体的名称。
100.可选地，所述根据所述目标文本信息生成语义特征向量包括：
101.根据所述目标文本信息生成包含上下文特征的第一文本向量；
102.通过卷积运算将所述第一文本向量转换为多个第二文本向量；
103.对所述多个第二文本向量进行特征提取得到语义特征向量。
104.本实施例中，由于目标文本信息的多样性，转换得到的所述第一文本向量的空间分布比较分散，不利于后续的向量特征提取，通过所述卷积运算将所述第一文本向量进行转换，使所述第一文本向量集中在特定的向量空间得到第二文本向量，具体地，本实施例可以通过预先设置不同尺寸的卷积核，将不同尺寸的卷积核分别与所述第一文本向量进行卷积计算，得到多个第二文本向量，从所述多个第二文本向量进行特征提取得到语义特征向量，提高了得到语义特征向量的准确率。
105.可选地，所述根据所述多个实体生成实体特征向量包括：
106.利用词向量映射模型将所述多个实体映射为词向量集合，其中，每个实体对应一个词向量；
107.计算所述词向量集合的每个维度的均值；
108.根据所述每个维度的均值生成实体特征向量。
109.示例性地，识别目标文本信息为：“我想要购买平安银行的结构性存款类理财产品中的慧盈？”，提取所述目标文本信息中的多个实体：实体1：银行名称
‑
平安银行，实体2：产品类型
‑
结构性存款，实体3：理财产品，实体4：慧盈，将所述平安银行、所述结构性存款、所述理财产品及所述慧盈转换为实体特征向量，具体地，每个实体对应一个词向量，所有实体特征长度为15，计算所述目标文本信息的第一维度上的均值，采用相同的方法计算得到所述目标文本信息中的每个维度上的均值，根据计算得到的所述目标文本信息中的每个维度的均值，进而得到所述目标文本信息的多个实体对应的实体特征向量。
110.本实施例中，通过计算对实体进行训练得到的词向量集合的每个维度的均值得到对应的实体特征向量，降低了实体特征向量的维度，提高了提取得到的实体特征向量的准确率。
111.s17，根据所述语义特征向量及所述实体特征向量识别所述每个客户的客户需求信息。
112.本实施例中，每个客户的客户需求信息是通过采集所述客户的所有语音信息得到的。
113.可选地，所述根据所述语义特征向量及所述实体特征向量识别所述每个客户的客户需求信息包括：
114.拼接所述语义特征向量及所述实体特征向量得到模板特征向量；
115.根据所述模型特征向量识别所述每个客户的客户需求信息。
116.本实施例中，通过采集客户入场时的第一语音信息确定注册声纹，然后采集客户会场中的第二语音信息确定出每个客户的第三语音信息，对所述第三语音信息进行类型识别及实体识别，提高了第三语音信息的识别的准确率，通过将每个客户的语义特征向量及所述实体特征向量得到模板特征向量，具体地，所述模型特征向量可以将每个客户的语义特征向量及所述实体特征向量转换为预设格式的结构数据，根据所述预设的结构数据确定所述每个客户的客户需求信息，便于管理每个客户的客户需求信息，提高了识别每个客户的客户需求信息的准确性和完整性。
117.综上所述，本实施例所述的客户需求信息识别方法，通过接收第一采集设备采集到的每个客户的第一语音信息，并根据所述每个客户的第一语音信息生成每个客户的注册声纹；接收第二采集设备采集到的第二语音信息，提取所述第二语音信息中的声纹特征；将所述声纹特征进行分段得到多个声纹特征片段，根据所述多个声纹特征片段与所述每个客户的注册声纹，得到所述每个客户的第三语音信息；识别所述每个客户的第三语音信息对应的语言类型，并将所述第三语音信息输入至所述语音类型对应的语音识别模型中；识别所述语音识别模型输出的目标文本信息，并对所述目标文本信息进行实体识别得到多个实体；根据所述目标文本信息生成语义特征向量，及根据所述多个实体生成实体特征向量；根据所述语义特征向量及所述实体特征向量识别所述每个客户的客户需求信息。
118.本实施例，一方面，通过将每个客户的语义特征向量及所述实体特征向量得到模板特征向量，根据所述模型特征向量转换为预设格式的结构数据后识别所述每个客户的客户需求信息，便于管理每个客户的客户需求信息，提高了识别每个客户的客户需求信息
的准确性和完整性；另一方面，通过计算对实体进行训练得到的词向量集合的每个维度的均值得到对应的实体特征向量，降低了实体特征向量的维度，提高了提取得到的实体特征向量的准确率；最后，通过将所述声纹特征进行分段处理，将每个声纹特征片段与所述每个客户的注册声纹进行匹配后确定出每个客户的声纹特征片段，能够批量识别多个客户的客户需求信息，客户需求信息的识别效率高。
119.实施例二
120.图2是本发明实施例二提供的客户需求信息识别装置的结构图。
121.在一些实施例中，所述客户需求信息识别装置20可以包括多个由程序代码段所组成的功能模块。所述客户需求信息识别装置20中的各个程序段的程序代码可以存储于电子设备的存储器中，并由所述至少一个处理器所执行，以执行 (详见图1描述)对客户需求信息识别的功能。
122.本实施例中，所述客户需求信息识别装置20根据其所执行的功能，可以被划分为多个功能模块。所述功能模块可以包括：第一接收模块201、第二接收模块202、分段模块203、第一识别模块204、第二识别模块205、生成模块206 及第三识别模块207。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段，其存储在存储器中。在本实施例中，关于各模块的功能将在后续的实施例中详述。
123.第一接收模块201，用于接收第一采集设备采集到的每个客户的第一语音信息，并根据所述每个客户的第一语音信息生成每个客户的注册声纹。
124.本实施例中，在一些特定的场合，例如，在举办沙龙活动时，为了高效的识别每个客户的客户需求信息，需要多个采集设备在不同的位置采集每个客户的语音信息，例如，在入场时，所述第一采集设备用于采集参加活动的所有客户的第一语音信息，具体地，所述第一语音信息中包括每个客户的编号、身份证号码、手机号码等，根据所述第一语音信息创建每个客户的注册声纹。
125.可选地，所述第一接收模块201根据所述所有客户的第一语音信息生成每个客户的注册声纹包括：
126.利用声纹模型从所述第一语音信息提取每个客户的声纹特征信息，并根据所述每个客户的声纹特征信息生成每个客户的注册声纹。
127.本实施例中，所述声纹模型用于提取语音信息中的声纹特征信息，在识别所述所有客户的第一语音信息之后，采用声纹模型从所述第一语音信息中提取每个客户的声纹特征信息作为每个客户的注册声纹。
128.第二接收模块202，用于接收第二采集设备采集到的第二语音信息，提取所述第二语音信息中的声纹特征。
129.本实施例中，所述第二采集设备用于采集活动中每个客户的发言及客户之间的交流的语音信息，将所述第二采集设备采集的语音信息作为所述所有客户的第二语音信息，并提取所述第二语音信息中的声纹特征。
130.可选地，所述第二接收模块202提取所述第二语音信息中的声纹特征包括：
131.计算所述第二语音信息的频率；
132.对所述频率采用带通滤波器进行滤波处理，得到滤波后的第二语音信息；
133.提取所述滤波后的第二语音信息中的声纹特征。
134.本实施例中，可以识别预设采样时间t的第二语音信息，每秒从所述第二语音信息的连续信号中提取并组成离散信号的预设采样个数r，用hz表示，计算所述第二语音信息的频率等于预设采样个数r除以预设采样时间t，对所述频率采用带通滤波器进行滤波处理，得到滤波后的第二语音信息，具体地，采用带通滤波器对接收到的第二语音信息进行滤波得到滤波后的第二语音信息。
135.在其他一些实施例中，所述对所述频率采用带通滤波器进行滤波处理，得到滤波后的第二语音信息包括：
136.将所述频率按照从低频到高频的顺序排列得到所述第二语音信息的频带；
137.在所述频带内按照临界带宽值对一组带通滤波器由密到疏进行排列；
138.采用排列后的带通滤波器对所述第二语音信息进行滤波；
139.获取滤波后的第二语音信息。
140.本实施例中，所述临界带宽指的是临界频带的带宽，由于频率较低的声音在内耳蜗基底膜上行波传递的距离大于频率较高的声音，故一般来说，低音容易掩蔽高音，而高音掩蔽低音较困难，在低频处的声音掩蔽的临界带宽较高频要小。当客户在进行来电通话时，所处的环境背景不同，特别是当客户在环境背景噪音较大的环境中通话时，将影响第二语音信息的识别率。因此为了抑制输入的第二语音信息的信号中频率超过fs/2的所有分量，防止混叠，同时抑制 50hz的电源工频干扰，在所述频带内按照临界带宽值由密到疏排列一组带通滤波器进行第二语音信息的滤波。所述带通滤波器进行滤波为现有技术，本发明在此不作详细阐述。
141.本实施例中，提取所述滤波后的第二语音信息中的声纹特征，具体地，声纹是用电声学仪器显示的携带言语信息的声波频谱，通过声纹可以进行说话人识别。一般来说，影响说话人识别的因素有说话人的声学特征、词法特征、韵律特征、语种特征、方言特征和口音特征等声纹特征。因此，在识别所述第二语音信息之后，提取出第二语音信息中的声学特征、词法特征、韵律特征、语种特征、方言特征和口音特征等声纹特征。
142.本实施例中，所述第二语音信息中的声纹特征的提取方式有很多种，例如线性预测分析(linearpredictioncoefficients，lpc)、感知线性预测系数 (perceptuallinearpredictive，plp)、tandem特征和bottleneck特征、基于滤波器组的fbank特征(filterbank)、线性预测倒谱系数 (linearpredictivecepstralcoefficient，lpcc)及梅尔频率倒谱系数(melfrequencycepstrumcoefficient，mfcc)，本发明所采用的是梅尔频率倒谱系数(melfrequencycepstrumcoefficient，mfcc)进行第二语音信息中的声纹特征的提取，通过对所述第二语音信息进行预加重、分帧、加窗后，对分帧加窗后的各帧信号进行快速傅立叶变换得到各帧的频谱，将所述频谱映射到基于听觉感知的mel非线性频谱中，然后转换到倒谱上，进行一个傅立叶变换的逆变换，得到倒谱系数，所述倒谱系数为所述第二语音信息的声纹特征。所述梅尔频率倒谱系数(melfrequencycepstrumcoefficient，mfcc)进行第二语音信息中的声纹特征的提取为现有技术，本发明在此不做详细阐述。
143.分段模块203，用于将所述声纹特征进行分段得到多个声纹特征片段，根据所述多个声纹特征片段与所述每个客户的注册声纹，得到所述每个客户的第三语音信息。
144.本实施例中，由于所述声纹特征中包括所有客户的声纹特征，通过在所述声纹特
征中识别每个客户的声纹特征，进而得到每个客户的目标语音信息，将所述目标语音信息作为对应客户的第三语音信息。
145.可选地，所述分段模块203将所述声纹特征进行分段得到多个声纹特征片段，根据所述多个声纹特征片段与所述每个客户的注册声纹，得到所述每个客户的第三语音信息包括：
146.将每个声纹特征片段与所述每个客户的注册声纹进行匹配；
147.从所述多个声纹特征片段确定出每个客户对应的声纹特征片段；
148.根据所述每个客户对应的声纹特征片段从所述第二语音信息中提取出每个客户的第三语音信息。
149.本实施例中，通过将所述声纹特征按照预设的分段规则进行分段，获得多个声纹特征片段，具体地，将每个声纹特征片段与预先生成的每个客户的注册声纹进行匹配，从所述多个声纹特征中确定出每个客户的声纹特征片段，进而得到每个客户的第三语音信息。
150.在其他一些实施例中，若每个客户对应多个声纹特征片段，将所述多个声纹特征片段进行重组确定为每个客户对应的目标声纹特征，根据所述目标声纹特征得到所述每个客户的第三语音信息。
151.本实施例中，若直接将所述声纹特征与所有客户的注册声纹同步进行匹配，数据量大，导致数据处理缓慢，且容易引起数据出错的现象，通过将所述声纹特征进行分段处理，将每个声纹特征片段与所述每个客户的注册声纹进行匹配后确定出每个客户的声纹特征片段，不需要面对面与客户交流识别第三语音信息，能够批量识别多个客户的客户需求信息，客户需求信息的识别效率高。
152.第一识别模块204，用于识别所述每个客户的第三语音信息对应的语言类型，并将所述第三语音信息输入至所述语音类型对应的语音识别模型中。
153.本实施例中，在确定得到每个客户的第三语音信息之后，识别每个客户对应的第三语音信息对应的语言类型，并将所述第三语音信息发送至所述语言类型对应的语音识别模型中进行语音识别。
154.本实施例中，通过确定所述第三语音信息对应的语言类型，输入至对应的语音识别模型中进行语音识别，提高了语音识别的准确率。
155.第二识别模块205，用于识别所述语音识别模型输出的目标文本信息，并对所述目标文本信息进行实体识别得到多个实体。
156.本实施例中，在客户需求信息识别过程中，若产品的种类比较繁多，并且产品的名称比较相近，为了避免在客户需求信息识别过程中将产品名称混淆，需要将所述目标文本信息进行实体识别得到多个实体，每个实体代表一个产品的名称，提高了客户需求信息识别的准确率。
157.可选地，所述第二识别模块205对所述目标文本信息进行实体识别得到多个实体包括：
158.将所述目标文本信息输入至命名实体识别模型中进行实体识别得到多个实体。
159.可选的，所述命名实体识别模型的训练过程包括：
160.在预设的训练集中提取训练文本；
161.标注所述训练文本对应的训练实体，并基于所述训练实体及所述训练文本构建待训练命名实体识别模型的训练样本；
162.将所述训练样本输入所述待训练命名实体识别模型进行模型训练，获得命名实体识别模型。
163.本实施例中，可以预先训练命名实体识别模型，通过将所述目标文本信息输入至预先训练好的命名实体识别模型中输出多个实体，并且在确定新的产品时，只需要将所述新的产品作为训练文本，将所述训练文本标注成对应的训练实体进行训练，提高了识别实体的正确率。
164.生成模块206，用于根据所述目标文本信息生成语义特征向量，及根据所述多个实体生成实体特征向量。
165.本实施例中，所述语义特征向量可以用于确定所述目标文本信息中的真实的意思，所述实体特征向量用于确定每个实体的具体的名称。
166.可选地，所述生成模块206根据所述目标文本信息生成语义特征向量包括：
167.根据所述目标文本信息生成包含上下文特征的第一文本向量；
168.通过卷积运算将所述第一文本向量转换为多个第二文本向量；
169.对所述多个第二文本向量进行特征提取得到语义特征向量。
170.本实施例中，由于目标文本信息的多样性，转换得到的所述第一文本向量的空间分布比较分散，不利于后续的向量特征提取，通过所述卷积运算将所述第一文本向量进行转换，使所述第一文本向量集中在特定的向量空间得到第二文本向量，具体地，本实施例可以通过预先设置不同尺寸的卷积核，将不同尺寸的卷积核分别与所述第一文本向量进行卷积计算，得到多个第二文本向量，从所述多个第二文本向量进行特征提取得到语义特征向量，提高了得到语义特征向量的准确率。
171.可选地，所述生成模块206根据所述多个实体生成实体特征向量包括：
172.利用词向量映射模型将所述多个实体映射为词向量集合，其中，每个实体对应一个词向量；
173.计算所述词向量集合的每个维度的均值；
174.根据所述每个维度的均值生成实体特征向量。
175.示例性地，识别目标文本信息为：“我想要购买平安银行的结构性存款类理财产品中的慧盈？”，提取所述目标文本信息中的多个实体：实体1：银行名称
‑
平安银行，实体2：产品类型
‑
结构性存款，实体3：理财产品，实体4：慧盈，将所述平安银行、所述结构性存款、所述理财产品及所述慧盈转换为实体特征向量，具体地，每个实体对应一个词向量，所有实体特征长度为15，计算所述目标文本信息的第一维度上的均值，采用相同的方法计算得到所述目标文本信息中的每个维度上的均值，根据计算得到的所述目标文本信息中的每个维度的均值，进而得到所述目标文本信息的多个实体对应的实体特征向量。
176.本实施例中，通过计算对实体进行训练得到的词向量集合的每个维度的均值得到对应的实体特征向量，降低了实体特征向量的维度，提高了提取得到的实体特征向量的准确率。
177.第三识别模块207，用于根据所述语义特征向量及所述实体特征向量识别所述每个客户的客户需求信息。
178.本实施例中，每个客户的客户需求信息是通过采集所述客户的所有语音信息得到的。
179.可选地，所述根据所述语义特征向量及所述实体特征向量识别所述每个客户的客户需求信息包括：
180.拼接所述语义特征向量及所述实体特征向量得到模板特征向量；
181.根据所述模型特征向量识别所述每个客户的客户需求信息。
182.本实施例中，通过采集客户入场时的第一语音信息确定注册声纹，然后采集客户会场中的第二语音信息确定出每个客户的第三语音信息，对所述第三语音信息进行类型识别及实体识别，提高了第三语音信息的识别的准确率，通过将每个客户的语义特征向量及所述实体特征向量得到模板特征向量，具体地，所述模型特征向量可以将每个客户的语义特征向量及所述实体特征向量转换为预设格式的结构数据，根据所述预设的结构数据确定所述每个客户的客户需求信息，便于管理每个客户的客户需求信息，提高了识别每个客户的客户需求信息的准确性和完整性。
183.综上所述，本实施例所述的客户需求信息识别装置，通过接收第一采集设备采集到的每个客户的第一语音信息，并根据所述每个客户的第一语音信息生成每个客户的注册声纹；接收第二采集设备采集到的第二语音信息，提取所述第二语音信息中的声纹特征；将所述声纹特征进行分段得到多个声纹特征片段，根据所述多个声纹特征片段与所述每个客户的注册声纹，得到所述每个客户的第三语音信息；识别所述每个客户的第三语音信息对应的语言类型，并将所述第三语音信息输入至所述语音类型对应的语音识别模型中；识别所述语音识别模型输出的目标文本信息，并对所述目标文本信息进行实体识别得到多个实体；根据所述目标文本信息生成语义特征向量，及根据所述多个实体生成实体特征向量；根据所述语义特征向量及所述实体特征向量识别所述每个客户的客户需求信息。
184.本实施例，一方面，通过将每个客户的语义特征向量及所述实体特征向量得到模板特征向量，根据所述模型特征向量转换为预设格式的结构数据后识别所述每个客户的客户需求信息，便于管理每个客户的客户需求信息，提高了识别每个客户的客户需求信息的准确性和完整性；另一方面，通过计算对实体进行训练得到的词向量集合的每个维度的均值得到对应的实体特征向量，降低了实体特征向量的维度，提高了提取得到的实体特征向量的准确率；最后，通过将所述声纹特征进行分段处理，将每个声纹特征片段与所述每个客户的注册声纹进行匹配后确定出每个客户的声纹特征片段，能够批量识别多个客户的客户需求信息，客户需求信息的识别效率高。
185.实施例三
186.参阅图3所示，为本发明实施例三提供的电子设备的结构示意图。在本发明较佳实施例中，所述电子设备3包括存储器31、至少一个处理器32、至少一条通信总线33及收发器34。
187.本领域技术人员应该了解，图3示出的电子设备的结构并不构成本发明实施例的限定，既可以是总线型结构，也可以是星形结构，所述电子设备3还可以包括比图示更多或更少的其他硬件或者软件，或者不同的部件布置。
188.在一些实施例中，所述电子设备3是一种能够按照事先设定或存储的指令，自动
进行数值计算和/或信息处理的电子设备，其硬件包括但不限于微处理器、专用集成电路、可编程门阵列、数字处理器及嵌入式设备等。所述电子设备3 还可包括客户设备，所述客户设备包括但不限于任何一种可与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品，例如，个人计算机、平板电脑、智能手机、数码相机等。
189.需要说明的是，所述电子设备3仅为举例，其他现有的或今后可能出现的电子产品如可适应于本发明，也应包含在本发明的保护范围以内，并以引用方式包含于此。
190.在一些实施例中，所述存储器31用于存储程序代码和各种数据，例如安装在所述电子设备3中的客户需求信息识别装置20，并在电子设备3的运行过程中实现高速、自动地完成程序或数据的存取。所述存储器31包括只读存储器 (read
‑
only memory，rom)、可编程只读存储器(programmable read
‑
onlymemory，prom)、可擦除可编程只读存储器(erasable programmable read
‑
onlymemory，eprom)、一次可编程只读存储器(one
‑
time programmable read
‑
onlymemory，otprom)、电子擦除式可复写只读存储器(electrically
‑
erasableprogrammable read
‑
only memory，eeprom)、只读光盘(compact discread
‑
only memory，cd
‑
rom)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
191.在一些实施例中，所述至少一个处理器32可以由集成电路组成，例如可以由单个封装的集成电路所组成，也可以是由多个相同功能或不同功能封装的集成电路所组成，包括一个或者多个中央处理器(central processing unit，cpu)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述至少一个处理器32是所述电子设备3的控制核心(control unit)，利用各种接口和线路连接整个电子设备3的各个部件，通过运行或执行存储在所述存储器31内的程序或者模块，以及调用存储在所述存储器31内的数据，以执行电子设备3的各种功能和处理数据。
192.在一些实施例中，所述至少一条通信总线33被设置为实现所述存储器31 以及所述至少一个处理器32等之间的连接通信。
193.尽管未示出，所述电子设备3还可以包括给各个部件供电的电源(比如电池)，可选的，电源可以通过电源管理装置与所述至少一个处理器32逻辑相连，从而通过电源管理装置实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备3还可以包括多种传感器、蓝牙模块、wi
‑
fi模块等，在此不再赘述。
194.应该了解，所述实施例仅为说明之用，在专利申请范围上并不受此结构的限制。
195.上述以软件功能模块的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，电子设备，或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分。
196.在进一步的实施例中，结合图2，所述至少一个处理器32可执行所述电子设备3的操作装置以及安装的各类应用程序(如所述的客户需求信息识别装置 20)、程序代码等，例如，上述的各个模块。
197.所述存储器31中存储有程序代码，且所述至少一个处理器32可调用所述存储器
31中存储的程序代码以执行相关的功能。例如，图2中所述的各个模块是存储在所述存储器31中的程序代码，并由所述至少一个处理器32所执行，从而实现所述各个模块的功能以达到客户需求信息识别的目的。
198.在本发明的一个实施例中，所述存储器31存储多个指令，所述多个指令被所述至少一个处理器32所执行以实现客户需求信息识别的功能。
199.具体地，所述至少一个处理器32对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述，在此不赘述。
200.在本发明所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。
201.所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，既可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
202.另外，在本发明各个实施例中的各功能模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能模块的形式实现。
203.对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他单元或，单数不排除复数。本发明中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。
204.最后应说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或等同替换，而不脱离本发明技术方案的精神和范围。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：夏斯勇
技术所有人：平安银行股份有限公司
我是此专利的发明人

上一篇：抗干扰的方法、触控芯片及主动笔芯片与流程
上一篇：一种古建筑修复用木材做旧处理剂制备方法与流程