一种新意图类别的确定方法及装置与流程

文档序号:32661534发布日期:2022-12-23 23:43阅读:25来源:国知局
一种新意图类别的确定方法及装置与流程

1.本技术涉及自然语言处理技术领域,尤其涉及一种新意图类别的确定方法及装置。


背景技术:

2.随着人工智能的快速发展,智能语音服务广泛应用于智能家居、医疗保健、语音支付以及保险服务等各种场景。当客户有需求时,拨打相关电话热线,利用语音表达其诉求,智能语音服务系统会根据语音数据识别客户意图,进行相应地智能应答或指引操作,满足客户的需求。
3.现有技术中,通常采用基于文本分类的方法进行新意图识别,该方法具体为:首先,对大量语音数据进行标注,再提取特征训练分类模型,得到意图识别模型;然后,将待识别语音数据通过意图识别模型进行识别,若输出结果为无法将其分到已有意图类别,则对其进行人工分析,考虑是否需要确定为新意图类别;最后,若通过待识别语音数据确定新意图类别,则需标注新意图类别重新进行意图识别模型的训练。
4.然而,上述通过人工对不属于已有意图类别的语音数据进行分析,在新意图类别确定的过程中存在主观性较强,新意图类别的确定结果存在客观性不足的问题,导致新意图类别确定结果的准确性较低。


技术实现要素:

5.有鉴于此,本技术实施例提供了一种新意图类别的确定方法及装置,旨在提高新意图类别确定结果的准确性。。
6.第一方面,本技术实施例提供了一种新意图类别的确定方法,所述方法包括:
7.将待识别语音数据通过双层实体识别模型进行识别,获得目标实体组合;
8.若所述目标实体组合不属于实体库,将所述目标实体组合输入至预训练语言模型,获得所述目标实体组合对应的目标实体向量;
9.将所述目标实体向量与多个已有意图类别向量分别进行距离计算,获得多个向量距离,所述多个已有意图类别向量由所述实体库中多个已有实体组合对应的多个已有实体向量聚类得到;
10.若所述多个向量距离均大于预设阈值,根据所述待识别语音数据确定新意图类别。
11.可选地,所述将待识别语音数据通过双层实体识别模型进行识别,获得目标实体组合,包括:
12.将待识别语音数据通过所述双层实体识别模型中基于多个第一预设实体类别的第一层模型进行识别,获得所述待识别语音数据对应的第一目标实体类别和所述第一目标实体类别对应的实体;
13.将待识别语音数据通过所述双层实体识别模型中基于多个第二预设实体类别的
第二层模型进行识别,获得所述待识别语音数据对应的第二目标实体类别、所述第二目标实体类别对应的实体和未识别实体,所述多个第二预设实体类别是所述多个第一预设实体类别的子类别;
14.根据所述第二目标实体类别、所述第二目标实体类别对应的实体和所述未识别实体,获得目标实体组合。
15.可选地,所述根据所述第二目标实体类别、所述第二目标实体类别对应的实体和所述未识别实体,获得目标实体组合,包括:
16.若所述未识别实体在所述第一目标实体类别对应的实体中,将所述未识别实体确定为新的第二预设实体类别;
17.根据所述新的第二预设实体类别,对所述第二目标实体类别、所述第二目标实体类别对应的实体和所述未识别实体进行更新,获得更新后的第二目标实体类别和所述更新后的第二目标实体类别对应的实体;
18.将所述更新后的第二目标实体类别与所述更新后的第二目标实体类别对应的实体进行叠加,获得所述目标实体组合。
19.可选地,所述双层实体识别模型的训练步骤,包括:
20.获取多个语音样本数据和每个语音样本数据的第一标注数据和第二标注数据,所述第一标注数据用于标注所述多个第一预设实体类别,所述第二标注数据用于标注所述多个第二预设实体类别;
21.将所述语音样本数据输入双层识别网络进行识别,获得所述语音样本数据的第一识别数据和第二识别数据,所述第一识别数据包括基于所述多个第一预设实体类别的识别数据,所述第二识别数据包括基于所述多个第二预设实体类别的识别数据;
22.根据所述第一识别数据、所述第二识别数据、所述第一标注数据、所述第二标注数据以及所述双层识别网络的损失函数,训练所述双层识别网络的模型参数;
23.将训练完成的所述双层识别网络确定为所述双层实体识别模型。
24.可选地,所述实体库的构建步骤,包括:
25.根据所述第二识别数据,获得所述多个已有实体组合;
26.根据所述多个已有实体组合构建所述实体库。
27.可选地,所述根据所述多个已有实体组合构建所述实体库,包括:
28.将所述多个已有实体组合通过关联规则挖掘算法进行挖掘,获得目标关联规则;
29.根据所述目标关联规则对所述多个已有实体组合进行加工,获得加工后的多个已有实体组合;
30.根据所述加工后的多个已有实体组合构建所述实体库。
31.可选地,所述多个第一预设实体类别包括:动作词,专有名词,疑问词以及待处理的问题词。
32.可选地,所述若所述目标实体组合不属于实体库之后,还包括:
33.按照预设规则对所述目标实体组合进行加工,获得加工后的目标实体组合;
34.所述将所述目标实体组合输入至预训练语言模型,获得所述目标实体组合对应的目标实体向量,包括:
35.将所述加工后的目标实体组合输入至所述预训练语言模型,获得所述目标实体向
量。
36.可选地,所述多个已有意图类别向量的聚类步骤,包括:
37.对每个已有实体向量分别与所述多个已有实体向量中剩余实体向量之间的相近关系进行标注,获得多个标注实体向量;
38.根据所述多个标注实体向量的标注数量对所述多个标注实体向量进行排序,获得实体向量序列;
39.根据所述实体向量序列的顺序依次对标注相近关系的已有实体向量进行聚类,获得多个已有意图类别向量。
40.第二方面,本技术实施例提供了一种新意图类别的确定装置,所述装置包括:
41.识别模块,用于将待识别语音数据通过双层实体识别模型进行识别,获得目标实体组合;
42.获得模块,用于若所述目标实体组合不属于实体库,将所述目标实体组合输入至预训练语言模型,获得所述目标实体组合对应的目标实体向量;
43.计算模块,用于将所述目标实体向量与多个已有意图类别向量分别进行距离计算,获得多个向量距离,所述多个意图类别向量由所述实体库中多个已有实体组合对应的多个已有实体向量聚类得到;
44.确定模块,用于若所述多个向量距离均大于预设阈值,根据所述待识别语音数据确定新意图类别。
45.第三方面,本技术实施例提供了一种新意图类别的确定设备,所述设备包括:
46.存储器,用于存储计算机程序;
47.处理器,用于执行所述计算机程序,以使所述设备执行前述第一方面所述的新意图类别的确定方法。
48.第四方面,本技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,当所述计算机程序被运行时,运行所述计算机程序的设备实现前述第一方面所述的新意图类别的确定方法。
49.相较于现有技术,本技术实施例具有以下有益效果:
50.本技术实施例提供了一种新意图类别的确定方法,将待识别语音数据通过双层实体识别模型进行识别,获得目标实体组合;若目标实体组合不属于实体库,将目标实体组合输入至预训练语言模型,获得目标实体组合对应的目标实体向量;将目标实体向量与多个已有意图类别向量分别进行距离计算,获得多个向量距离,多个意图类别向量由实体库中多个已有实体组合对应的多个已有实体向量聚类得到;若多个向量距离均大于预设阈值,根据待识别语音数据确定新意图类别。可见,该方法在判断待识别语音数据的实体组合不属于实体库时,将待识别语音数据的实体向量与已有意图类别向量分别进行距离计算,得到多个向量距离,根据多个向量距离与预设阈值的比较结果,判断是否基于待识别语音数据确定新意图类别,避免进行人工分析,以避免新意图类别确定的过程中存在主观性的问题,使得新意图类别的确定结果更加客观,从而提高新意图类别确定结果的准确性。
附图说明
51.为更清楚地说明本实施例或现有技术中的技术方案,下面将对实施例或现有技术
描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
52.图1为本技术实施例提供的一种新意图类别的确定方法的应用场景;
53.图2为本技术实施例提供的一种新意图类别的确定方法的流程图;
54.图3为本技术实施例提供的一种新意图类别的确定装置的结构示意图。
具体实施方式
55.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
56.目前,现有技术中新意图类别的确定方法为,首先,对大量语音数据进行标注,再提取特征训练分类模型,得到意图识别模型;然后,将待识别语音数据通过意图识别模型进行识别,若输出结果为无法将其分到已有意图类别,则对其进行人工分析,考虑是否需要确定为新意图类别;最后,若通过待识别语音数据确定新意图类别,则需标注新意图类别重新进行意图识别模型的训练。然而,上述通过人工对不属于已有意图类别的语音数据进行分析,在新意图类别确定的过程中存在主观性较强,新意图类别的确定结果存在客观性不足的问题,导致新意图类别确定结果的准确性较低。
57.基于此,为了解决上述问题,提高新意图类别确定结果的准确性,本技术实施例提供了一种新意图类别的确定方法及装置,在该方法中,将待识别语音数据通过双层实体识别模型进行识别,获得目标实体组合;若目标实体组合不属于实体库,将目标实体组合输入至预训练语言模型,获得目标实体组合对应的目标实体向量;将目标实体向量与多个已有意图类别向量分别进行距离计算,获得多个向量距离,多个意图类别向量由实体库中多个已有实体组合对应的多个已有实体向量聚类得到;若多个向量距离均大于预设阈值,根据待识别语音数据确定新意图类别。可见,该方法在判断待识别语音数据的实体组合不属于实体库时,将待识别语音数据的实体向量与已有意图类别向量分别进行距离计算,得到多个向量距离,根据多个向量距离与预设阈值的比较结果,判断是否基于待识别语音数据确定新意图类别,避免进行人工分析,以避免新意图类别确定的过程中存在主观性的问题,使得新意图类别的确定结果更加客观,从而提高新意图类别确定结果的准确性。
58.举例来说,本技术实施例的场景之一,可以是应用到如图1所示的场景中。该场景包括数据库101和服务器102,其中,数据库101包括多个已有意图类别向量,服务器102采用本技术实施例提供的实施方式,从实体库101获取多个已有意图类别向量。
59.首先,在上述应用场景中,虽然将本技术实施例提供的实施方式的动作描述由服务器102执行;但是,本技术实施例在执行主体方面不受限制,只要执行了本技术实施例提供的实施方式所公开的动作即可。
60.其次,上述场景仅是本技术实施例提供的一个场景示例,本技术实施例并不限于此场景。
61.下面结合附图,通过实施例来详细说明本技术实施例中新意图类别的确定方法及
装置的具体实现方式。
62.参见图2,该图为本技术实施例提供的一种新意图类别的确定方法的流程图,结合图2所示,具体可以包括:
63.s201:将待识别语音数据通过双层实体识别模型进行识别,获得目标实体组合。
64.将待识别语音数据输入至双层实体识别模型,对待识别语音数据中包含的多个实体词进行识别,得到双层实体识别模型预设类别对应的目标实体,获得目标实体组合。其中,基于双层实体识别模型对待识别语音数据进行预处理,可以抽出双层实体识别模型预设类别对应的目标实体,或者可以抽出不与预设类别对应的新实体,得到目标实体组合;使用获得的目标实体组合替代待识别语音数据进行后续的新意图类别的确定步骤,可以从一定程度上减小待识别语音数据的长度,也可以放大待识别语音数据的语义特征,同时去除待识别语音数据中的一些非重点文本,有利于为后续新意图识别的确定步骤输入更为优质的文本,进一步提高新意图类别确定结果的准确性。
65.其中,双层实体识别模型包括输入层、编码层和解码层。输入层将待识别语音数据转换为可以输入至编码层的分布式序列,举例来说,可以采用word2vec模型;编码层对待识别语音数据转换成的分布式序列进行编码,获得编码特征,举例来说,可以采用预训练模型bert,也可以采用transformer编码器;解码层是用于预测实体的边界以及实体的类型,通过编码层对实体上下文的抽象语义表示,生成目标实体组合,可以采用efficient-globalpointer解码器,也可以采用conditional random field解码器。当然,以上所述也可以采用其他方式,并不影响本技术实施例的实现。
66.s202:若目标实体组合不属于实体库,将目标实体组合输入至预训练语言模型,获得目标实体组合对应的目标实体向量。
67.将通过双层实体识别模型得到的目标实体组合,与实体库中的多个已有实体组合进行对比,若多个已有实体组合中存在与目标实体组合相符的实体组合,则待识别语音数据的意图类别属于多个已有意图类别,不需要确定新意图类别;若多个已有实体组合中不存在与目标实体组合相符的实体组合,则需要将目标实体组合输入至预训练语言模型,获得目标实体组合对应的目标实体向量。其中,预训练语言模型是指已经通过一些任务进行预先训练,得到一套模型参数,再用这套参数对模型进行初始化得到的模型,其模型参数不再是随机初始化的,同时预先训练好的语言模型包括很多语义语法知识,对于后续训练任务的效果会有非常明显的提升。举例来说,预训练语言模型可以是bert模型,也可以是gpt模型,当然,也可以采用其他预训练语言模型,并不影响本技术实施例的实现。
68.s203:将目标实体向量与多个已有意图类别向量分别进行距离计算,获得多个向量距离,多个已有意图类别向量由实体库中多个已有实体组合对应的多个已有实体向量聚类得到。
69.将通过预训练语言模型得到的目标实体向量,与多个已有意图类别向量分别进行距离计算得到多个向量距离,以判断待识别语音数据的意图类别是否属于多个已有意图类别,实体库中多个已有实体组合对应的多个已有实体向量,通过聚类得到多个已有意图类别。其中,距离计算是指对目标实体向量与多个已有意图类别向量的相似度进行计算。举例来说,可以采用欧氏距离相似度计算方法、余弦相似度计算方法或者马氏距离相似度计算方法进行距离计算,当然,也可以采用其他向量相似度计算方法,并不影响本技术实施例的
实现。
70.s204:若多个向量距离均大于预设阈值,根据待识别语音数据确定新意图类别。
71.将目标实体向量与多个已有意图类别向量,分别通过向量相似度计算得到的多个向量距离与预设阈值进行比较,若多个向量距离中存在比预设阈值小的向量距离,则表明待识别语音数据属于该向量距离对应的意图类别;若多个向量距离均大于预设阈值,则表明待识别语音数据不属于多个已有意图类别,需要根据该待识别语音数据确定新意图类别。其中,预设阈值是指预先设置好的向量距离值,举例来说,可以是研究人员根据多次实验结果调整得到的阈值,在新意图类别的确定方法中预先设置好,当然,也可以采用其他方式预设阈值,并不影响本技术实施例的实现。
72.基于上述s201-s204的相关内容可知,本技术实施例中,将待识别语音数据通过双层实体识别模型进行识别,获得目标实体组合;若目标实体组合不属于实体库,将目标实体组合输入至预训练语言模型,获得目标实体组合对应的目标实体向量;将目标实体向量与多个已有意图类别向量分别进行距离计算,获得多个向量距离,多个意图类别向量由实体库中多个已有实体组合对应的多个已有实体向量聚类得到;若多个向量距离均大于预设阈值,根据待识别语音数据确定新意图类别。可见,该方法在判断待识别语音数据的实体组合不属于实体库时,将待识别语音数据的实体向量与已有意图类别向量分别进行距离计算,得到多个向量距离,根据多个向量距离与预设阈值的比较结果,判断是否基于待识别语音数据确定新意图类别,避免进行人工分析,以避免新意图类别确定的过程中存在主观性的问题,使得新意图类别的确定结果更加客观,从而提高新意图类别确定结果的准确性。
73.在本技术实施例中,s201具体可以包括如下s2021-s2023:
74.s2021:将待识别语音数据通过双层实体识别模型中基于多个第一预设实体类别的第一层模型进行识别,获得待识别语音数据对应的第一目标实体类别和第一目标实体类别对应的实体。
75.将待识别语音数据通过双层实体识别模型的第一层模型进行识别,第一层模型基于多个第一预设实体类别构建,获得待识别语音数据中与多个第一预设实体类别对应的第一目标实体类别,以及第一目标实体类别对应的待识别语音数据中的实体。
76.其中,第一预设实体类别是指预先设置好的实体类别,举例来说,可以在双层实体识别模型的第一层模型预先设置四个实体类别,具体可以包括:动作词,专有名词,疑问词以及待处理的问题词。当然,也可以设置其他多个第一预设实体类别,并不影响本技术实施例的实现。
77.s2022:将待识别语音数据通过双层实体识别模型中基于多个第二预设实体类别的第二层模型进行识别,获得待识别语音数据对应的第二目标实体类别、第二目标实体类别对应的实体和未识别实体,多个第二预设实体类别是多个第一预设实体类别的子类别;
78.将待识别语音数据通过双层实体识别模型的第二层模型进行识别,第二层模型基于多个第二预设实体类别构建,获得待识别语音数据中与多个第二预设实体类别对应的第二目标实体类别、第二目标实体类别对应的待识别语音数据中的实体以及待识别语音数据中不属于第二预设实体类别的未识别实体,多个第二预设实体类别分别是多个第一预设实体类别的子类别。
79.举例来说,若该新意图类别的确定方法应用于保险领域,第一预设实体类别具体
包括如上所述的四个实体类别,则第二预设实体类别具体可以包括如下,动作词的子类别可以是催促、续保、投诉以及查询等;专有名词的子类别可以是财产险险名、责任险险名、费用以及增值服务等;疑问词的子类别可以是怎么做、为什么、什么时候以及是什么等;待处理的问题词的子类别可以是操作失败、支付失败以及无法联系等。当然,也可以设置其他多个第二预设实体类别,并不影响本技术实施例的实现。
80.其中,步骤s2021和步骤s2022的执行顺序可以互换,也可以同时执行上述两个步骤,本技术实施例对于步骤s2021和步骤s2022的执行顺序不作限定。
81.s2023:根据第二目标实体类别、第二目标实体类别对应的实体和未识别实体,获得目标实体组合。
82.根据通过双层实体识别模型的第二层模型得到的第二目标实体类别、第二目标实体类别对应的实体和未识别实体,获得目标实体组合。
83.其中,本技术实施例可不具体限定目标实体组合的获得过程,为了便于理解,下面结合一种可能的实施方式进行说明。
84.在一种可能的实施方式中,先判断未识别实体是否属于第一目标实体类别对应的多个实体中,若未识别实体在第一目标实体类别对应的实体中,则将该未识别实体确定为新的实体类别,并将该新的实体类别加入到第二预设实体类别中,得到新的第二预设实体类别,最后,根据更新后的第二预设实体类别,得到更新后的第二目标实体类别和更新后的第二目标实体类别对应的实体并进行叠加,获得目标实体组合。
85.因此,s2023具体可以包括:若未识别实体在第一目标实体类别对应的实体中,将未识别实体确定为新的第二预设实体类别;根据新的第二预设实体类别,对第二目标实体类别、第二目标实体类别对应的实体和未识别实体进行更新,获得更新后的第二目标实体类别和更新后的第二目标实体类别对应的实体;将更新后的第二目标实体类别与更新后的第二目标实体类别对应的实体进行叠加,获得目标实体组合。
86.在本技术实施例中,可不具体限定双层实体识别模型的训练过程,为了便于理解,下面结合一种可能的实施方式进行说明。
87.在一种可能的实施方式中,首先,获取多个语音样本数据,每个语音样本数据已标注与多个第一预设实体类别对应的第一标注数据,同时也已标注与多个第二预设实体类别对应的第二标注数据;然后,将标注好第一标注数据和第二标注数据的多个语音样本输入至双层识别网络,得到每个语音样本数据中与多个第一预设实体类别对应的第一识别数据,以及每个语音样本数据中与多个第二预设实体类别对应的第二识别数据;再根据标注的第一标注数据和第二标注数据分别与得到的第一识别数据和第二识别数据的比较结果,以及双层识别网络的损失函数值,训练双层识别网络的模型参数;最后,把训练好的双层识别网络确定为双层实体识别模型。
88.因此,双层实体识别模型具体可以通过如下步骤训练:获取多个语音样本数据和每个语音样本数据的第一标注数据和第二标注数据,第一标注数据用于标注多个第一预设实体类别,第二标注数据用于标注多个第二预设实体类别;将语音样本数据输入双层识别网络进行识别,获得语音样本数据的第一识别数据和第二识别数据,第一识别数据包括基于多个第一预设实体类别的识别数据,第二识别数据包括基于多个第二预设实体类别的识别数据;根据第一识别数据、第二识别数据、第一标注数据、第二标注数据以及双层识别网
络的损失函数,训练双层识别网络的模型参数;将训练完成的双层识别网络确定为双层实体识别模型。
89.在本技术实施例中,可不具体限定实体库的构建过程,为了便于理解,下面结合一种可能的实施方式进行说明。
90.在一种可能的实施方式中,先根据每个语音样本数据中与多个第二预设实体类别对应的第二识别数据,得到多个语音样本数据中的多个已有实体组合,再将多个已有实体组合构建成实体库。因此,实体库具体可以通过如下步骤构建:根据第二识别数据,获得多个已有实体组合;根据多个已有实体组合构建实体库。
91.在本技术实施例中,还可以提供实体库的另一种构建过程。
92.在一种可能的实施方式中,先通过关联规则挖掘算法对得到的多个已有实体组合进行挖掘,得到多个已有实体组合的目标关联规则;再根据目标关联规则对多个已有实体组合进行加工得到加工后的多个已有实体组合;最后,根据加工后的多个已有实体组合构建实体库。因此,实体库具体还可以通过如下步骤构建:将多个已有实体组合通过关联规则挖掘算法进行挖掘,获得目标关联规则;根据目标关联规则对多个已有实体组合进行加工,获得加工后的多个已有实体组合;根据加工后的多个已有实体组合构建实体库。举例来说,关联规则挖掘算法可以是apriori算法、eclat算法或者fp-tree算法,当然,也可以采用其他关联规则挖掘算法,并不影响本技术实施例的实现。
93.另外,在将目标实体组合输入至预训练语言模型之前,可以按照预设规则对该目标实体组合进行加工,以便得到更为优质的目标实体组合,进一步提高新意图类别确定结果的准确性。因此,在本技术可选实施例中,方法还可以包括s1:按照预设规则对目标实体组合进行加工,获得加工后的目标实体组合。相应地,s202具体可以包括:将加工后的目标实体组合输入至预训练语言模型,获得目标实体向量。
94.举例来说,预设规则可以是限定目标实体组合中第二目标实体类别对应的实体个数,对实体个数过多的目标实体组合进行切割;预设规则也可以是对目标实体组合中不存在意义的实体进行删除;预设规则还可以是对目标实体组合中相互排斥的实体词中选择一个进行删除;当然,也可以是其他预设规则,并不影响本技术实施例的实现。
95.在本技术实施例中,可不具体限定多个已有实体向量的聚类过程,为了便于理解,下面结合一种可能的实施方式进行说明。
96.在一种可能的实施方式中,可以先对实体库中多个已有实体组合对应的多个已有实体向量之间的关系进行标注,当其中两个已有实体向量存在相近关系时,对这两个已有实体向量进行标注,直至每个已有向量与多个已有实体向量中剩余实体向量之间的相近关系均完成标注;然后,根据每个已有向量已经标注好的标注数量对多个已有实体向量进行排序,得到实体向量序列;最后,从该实体向量序列的第一个已有实体向量开始向最后一个已有实体向量进行扫描,扫描到某一个已有实体向量时,将与其标注相近关系的已有实体向量分为一类,直至该实体向量序列的多个已有实体向量均已分类,得到多个已有意图类别向量。
97.因此,多个已有实体向量具体可以通过如下步骤聚类:对每个已有实体向量分别与多个已有实体向量中剩余实体向量之间的相近关系进行标注,获得多个标注实体向量;根据多个标注实体向量的标注数量对多个标注实体向量进行排序,获得实体向量序列;根
据实体向量序列的顺序依次对标注相近关系的已有实体向量进行聚类,获得多个已有意图类别向量。
98.以上为本技术实施例提供的新意图类别的确定方法的一些具体实现方式,基于此,本技术还提供了对应的装置。下面将从功能模块化的角度对本技术实施例提供的装置进行介绍。
99.参见图3,该图为本技术实施例提供的一种新意图类别的确定装置300的结构示意图,该装置300包括:
100.识别模块301,用于将待识别语音数据通过双层实体识别模型进行识别,获得目标实体组合;
101.获得模块302,用于若目标实体组合不属于实体库,将目标实体组合输入至预训练语言模型,获得目标实体组合对应的目标实体向量;
102.计算模块303,用于将目标实体向量与多个已有意图类别向量分别进行距离计算,获得多个向量距离,多个意图类别向量由实体库中多个已有实体组合对应的多个已有实体向量聚类得到;
103.确定模块304,用于若多个向量距离均大于预设阈值,根据待识别语音数据确定新意图类别。
104.在本技术实施例中,通过识别模块301、获得模块302、计算模块303、以及确定模块304这四个模块的配合,使得在判断待识别语音数据的实体组合不属于实体库时,将待识别语音数据的实体向量与已有意图类别向量分别进行距离计算,得到多个向量距离,根据多个向量距离与预设阈值的比较结果,判断是否基于待识别语音数据确定新意图类别。通过这种方式避免进行人工分析,以避免新意图类别确定的过程中存在主观性的问题,使得新意图类别的确定结果更加客观,从而提高新意图类别确定结果的准确性。
105.作为一种实施方式,识别模块301,具体可以包括:
106.第一识别单元,用于将待识别语音数据通过双层实体识别模型中基于多个第一预设实体类别的第一层模型进行识别,获得待识别语音数据对应的第一目标实体类别和第一目标实体类别对应的实体;
107.第二识别单元,用于将待识别语音数据通过双层实体识别模型中基于多个第二预设实体类别的第二层模型进行识别,获得待识别语音数据对应的第二目标实体类别、第二目标实体类别对应的实体和未识别实体,多个第二预设实体类别是多个第一预设实体类别的子类别;
108.第一获得单元,用于根据第二目标实体类别、第二目标实体类别对应的实体和未识别实体,获得目标实体组合。
109.作为一种实施方式,第一获得单元,具体可以用于:
110.若未识别实体在第一目标实体类别对应的实体中,将未识别实体确定为新的第二预设实体类别;
111.根据新的第二预设实体类别,对第二目标实体类别、第二目标实体类别对应的实体和未识别实体进行更新,获得更新后的第二目标实体类别和更新后的第二目标实体类别对应的实体;
112.将更新后的第二目标实体类别与更新后的第二目标实体类别对应的实体进行叠
加,获得目标实体组合。
113.作为一种实施方式,该双层实体识别模型具体可以通过如下单元训练:
114.获取单元,用于获取多个语音样本数据和每个语音样本数据的第一标注数据和第二标注数据,第一标注数据用于标注多个第一预设实体类别,第二标注数据用于标注多个第二预设实体类别;
115.第三识别单元,用于将语音样本数据输入双层识别网络进行识别,获得语音样本数据的第一识别数据和第二识别数据,第一识别数据包括基于多个第一预设实体类别的识别数据,第二识别数据包括基于多个第二预设实体类别的识别数据;
116.训练单元,用于根据第一识别数据、第二识别数据、第一标注数据、第二标注数据以及双层识别网络的损失函数,训练双层识别网络的模型参数;
117.确定单元,用于将训练完成的双层识别网络确定为双层实体识别模型。
118.作为一种实施方式,该实体库具体可以通过如下单元训练:
119.第二获得单元,用于根据第二识别数据,获得多个已有实体组合;
120.构建单元,用于根据多个已有实体组合构建实体库。
121.作为一种实施方式,构建单元,具体可以用于:
122.将多个已有实体组合通过关联规则挖掘算法进行挖掘,获得目标关联规则;
123.根据目标关联规则对多个已有实体组合进行加工,获得加工后的多个已有实体组合;
124.根据加工后的多个已有实体组合构建实体库。
125.作为一种实施方式,第一识别单元的多个第一预设实体类别具体可以包括:动作词,专有名词,疑问词以及待处理的问题词。
126.作为一种实施方式,该新意图类别的确定装置300,还可以包括:
127.加工模块,用于按照预设规则对目标实体组合进行加工,获得加工后的目标实体组合;
128.相应地,获得模块302,具体可以用于:
129.将加工后的目标实体组合输入至预训练语言模型,获得目标实体向量。
130.作为一种实施方式,多个已有意图类别具体可以通过如下单元聚类:
131.标注单元,用于对每个已有实体向量分别与多个已有实体向量中剩余实体向量之间的相近关系进行标注,获得多个标注实体向量;
132.排序单元,用于根据多个标注实体向量的标注数量对多个标注实体向量进行排序,获得实体向量序列;
133.聚类单元,用于根据实体向量序列的顺序依次对标注相近关系的已有实体向量进行聚类,获得多个已有意图类别向量。
134.本技术实施例还提供了对应的设备以及计算机存储介质,用于实现本技术实施例提供的方案。
135.其中,所述设备包括存储器和处理器,所述存储器用于存储指令或代码,所述处理器用于执行所述指令或代码,以使所述设备执行本技术任一实施例所述的新意图类别的确定方法。
136.所述计算机存储介质中存储有代码,当所述代码被运行时,运行所述代码的设备
实现本技术任一实施例所述的新意图类别的确定方法。
137.本技术实施例中提到的“第一”、“第二”(若存在)等名称中的“第一”、“第二”只是用来做名字标识,并不代表顺序上的第一、第二。
138.通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加通用硬件平台的方式来实现。基于这样的理解,本技术的技术方案可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如只读存储器(英文:read-only memory,rom)/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者诸如路由器等网络通信设备)执行本技术各个实施例或者实施例的某些部分所述的方法。
139.需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元提示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
140.以上所述,仅为本技术的一种具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应该以权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1