本说明书涉及计算机,尤其涉及一种对话意图识别方法、装置、存储介质及电子设备。
背景技术:
1、随着ai技术的发展,社会上涌现了很多对话机器人,比如微软小冰,谷歌助手等。对话机器人通常是基于大量样本对神经网络模型经过迭代训练后得到,在此过程中需要大量训练样本使得模型收敛。
2、然而,在某些需要对话的场景中,由于场景存在时间较短,场景活跃用户较少,可能不存在较多的训练样本供模型进行训练,此时对话机器人就无法在此类场景中进行对话。
技术实现思路
1、本说明书实施例提供的一种对话意图识别方法、装置、存储介质及电子设备,通过对话意图匹配表、小样本子模型和主分类子模型分别对对话数据进行对话意图识别,可以在零样本训练数据、少量样本训练数据、大量样本训练数据场景下,实现对对话数据的对话意图识别,实现对话意图识别的全场景覆盖,提升用户使用体验。所述技术方案如下:
2、第一方面,本说明书实施例提供了一种对话意图识别方法,应用于对话意图匹配表和对话意图识别模型,所述对话意图识别模型包括小样本子模型以及主分类子模型,所述对话意图匹配表包括指定对话数据和对话意图的对应关系,所述小样本子模型为基于少量样本训练数据训练的识别模型,所述主分类子模型为基于大量样本训练数据训练的识别模型,所述方法包括:
3、实时采集用户输入的对话数据;
4、基于所述对话意图匹配表、所述小样本子模型以及所述主分类子模型分别对所述对话数据进行对话意图识别,得到所述对话意图匹配表、所述小样本子模型以及所述主分类子模型分别对应的对话意图识别结果;
5、基于所述对话意图匹配表、所述小样本子模型对应的第一识别范围以及所述主分类子模型对应的第二识别范围从各所述对话意图识别结果中确定所述对话数据对应的对话意图,所述第一识别范围包括所述小样本子模型可识别的对话意图,所述第二识别范围包括所述主分类子模型可识别的对话意图。
6、第二方面,本说明书实施例提供了一种对话意图识别模型训练方法,所述对话意图识别模型包括小样本子模型以及主分类子模型,所述方法包括:
7、当对话日志中新记录的对话数据达到预设数量后,从对话日志中提取所述预设数量的对话数据以及各所述对话数据分别对应的对话意图,所述对话数据为用户在会话系统中输入的文本数据;
8、基于所述对话数据以及所述对话数据分别对应的对话意图生成样本训练数据;
9、基于各所述样本训练数据训练所述小样本子模型,得到训练结束的小样本子模型,并确定训练结束的所述小样本子模型对应的第一识别范围,所述第一识别范围包括所述小样本子模型可识别的对话意图;
10、基于各所述样本训练数据训练所述主分类子模型,得到训练结束的主分类子模型,并确定训练结束的所述主分类子模型对应的第二识别范围,所述第二识别范围包括所述主分类子模型可识别的对话意图。
11、第三方面,本说明书实施例提供了一种对话意图识别装置,所述装置包括:
12、对话数据采集模块,用于实时采集用户输入的对话数据;
13、对话意图识别模块,用于基于所述对话意图匹配表、所述小样本子模型以及所述主分类子模型分别对所述对话数据进行对话意图识别,得到所述对话意图匹配表、所述小样本子模型以及所述主分类子模型分别对应的对话意图识别结果;
14、对话意图确定模块,用于基于所述对话意图匹配表、所述小样本子模型对应的第一识别范围以及所述主分类子模型对应的第二识别范围从各所述对话意图识别结果中确定所述对话数据对应的对话意图,所述第一识别范围包括所述小样本子模型可识别的对话意图,所述第二识别范围包括所述主分类子模型可识别的对话意图。
15、第四方面,本说明书实施例提供了一种对话意图识别模型训练装置,所述装置包括:
16、对话数据提取模块,用于当对话日志中新记录的对话数据达到预设数量后,从对话日志中提取所述预设数量的对话数据以及各所述对话数据分别对应的对话意图,所述对话数据为用户在会话系统中输入的文本数据;
17、训练数据生成模块,用于基于所述对话数据以及所述对话数据分别对应的对话意图生成样本训练数据;
18、第一模型训练模块,用于基于各所述样本训练数据训练所述小样本子模型,得到训练结束的小样本子模型,并确定训练结束的所述小样本子模型对应的第一识别范围,所述第一识别范围包括所述小样本子模型可识别的对话意图;
19、第二模型训练模块,用于基于各所述样本训练数据训练所述主分类子模型,得到训练结束的主分类子模型,并确定训练结束的所述主分类子模型对应的第二识别范围,所述第二识别范围包括所述主分类子模型可识别的对话意图。
20、第五方面,本说明书实施例提供一种计算机程序产品,所述计算机程序产品存储有至少一条指令,所述至少一条指令适于由处理器加载并执行上述的方法步骤。
21、第六方面,本说明书实施例提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序适于由处理器加载并执行上述的方法步骤。
22、第七方面,本说明书实施例提供一种电子设备,可包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行上述的方法步骤。
23、本说明书一些实施例提供的技术方案带来的有益效果至少包括:
24、采用本说明书实施例提供的对话意图识别方法,首先实时采集用户输入的对话数据,基于对话意图匹配表、小样本子模型以及主分类子模型分别对对话数据进行对话意图识别,得到对话意图匹配表、小样本子模型以及主分类子模型分别对应的对话意图识别结果,然后基于对话意图匹配表、小样本子模型对应的第一识别范围以及主分类子模型对应的第二识别范围从各对话意图识别结果中确定对话数据对应的对话意图,通过对话意图匹配表、小样本子模型和主分类子模型分别对对话数据进行对话意图识别,可以在零样本训练数据、少量样本训练数据、大量样本训练数据场景下,实现对对话数据的对话意图识别,实现对话意图识别的全场景覆盖,提升用户使用体验。
1.一种对话意图识别方法,应用于对话意图匹配表和对话意图识别模型,所述对话意图识别模型包括小样本子模型以及主分类子模型,所述对话意图匹配表包括指定对话数据和对话意图的对应关系,所述小样本子模型为基于少量样本训练数据训练的识别模型,所述主分类子模型为基于大量样本训练数据训练的识别模型,所述方法包括:
2.根据权利要求1所述的方法,若所述小样本子模型不存在第一识别范围且所述主分类子模型不存在第二识别范围,在所述基于所述对话意图匹配表、所述小样本子模型以及所述主分类子模型分别对所述对话数据进行对话意图识别之前,还包括:
3.根据权利要求1所述的方法,所述基于所述对话意图匹配表、所述小样本子模型对应的第一识别范围以及所述主分类子模型对应的第二识别范围从各所述对话意图识别结果中确定所述对话数据对应的对话意图,包括:
4.根据权利要求3所述的方法,所述基于所述第一识别范围以及所述第二识别范围从所述小样本子模型、所述主分类子模型分别对应的对话意图识别结果中确定所述对话数据对应的对话意图,包括:
5.一种对话意图识别模型训练方法,所述对话意图识别模型包括小样本子模型以及主分类子模型,包括:
6.根据权利要求5所述的方法,所述基于各所述样本训练数据训练所述小样本子模型,得到训练结束的小样本子模型,并确定训练结束的所述小样本子模型对应的第一识别范围,包括:
7.根据权利要求6所述的方法,所述将各所述样本训练数据集合分别输入至所述小样本子模型中进行训练,并确定训练结束的小样本子模型对各所述对话意图的识别性能指标,包括:
8.根据权利要求5所述的方法,所述基于各所述样本训练数据训练所述主分类子模型,得到训练结束的主分类子模型,并确定训练结束的所述主分类子模型对应的第二识别范围,包括:
9.根据权利要求8所述的方法,所述将各所述样本训练数据集合分别输入至所述小样本子模型中进行训练,并确定训练结束的小样本子模型对各所述对话意图的识别性能指标,包括:
10.一种对话意图识别装置,包括:
11.一种对话意图识别模型训练装置,包括:
12.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1~4或5~9中任意一项所述方法的步骤。
13.一种电子设备,其特征在于,包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行如权利要求1~4或5~9中任意一项所述方法的步骤。
14.一种计算机程序产品,其上存储有至少一条指令,其特征在于,所述至少一条指令被处理器执行时实现权利要求1~4或5~9中任意一项所述方法的步骤。