本发明涉及nlu对话,具体涉及一种语言大模型融合nlu的槽位信息抽取。
背景技术:
1、目前,由于传统nlu方法缺少上下文的理解,所以在复杂对话系统中,当遇到有上下文指代关系的语义格式化输出的时候,进行槽位信息抽取的过程会出错。对于语言大模型而言,由于语言大模型是生成式模型,格式化文本输出不稳定,即不能稳定的输出意图和槽位信息。有必要研发一种能够解决复杂对话系统中槽位信息抽取困难的技术方案。
技术实现思路
1、为此,本发明提供一种语言大模型融合nlu的槽位信息抽取方法及装置,解决传统nlu在复杂上下文理解中的槽位信息抽取难的问题。
2、为了实现上述目的,本发明提供如下技术方案:一种语言大模型融合nlu的槽位信息抽取方法,包括:
3、获取用户的语音对话输入信息,将所述语音对话输入信息输送到nlu的意图槽位抽取单元得到意图输出结果和第一槽位信息输出结果;
4、将所述意图输出结果输入到业务对话管理系统,选择所述意图输出结果的对应业务;将所述第一槽位信息输出结果输入到业务对话管理系统,得到所述意图输出结果的对应业务缺失的槽位信息;
5、将缺失的所述槽位信息的提示词和用户对话历史输入到语言大模型的意图槽位抽取单元,进行缺失的所述槽位信息的查询,得到所述语言大模型的第二槽位信息输出结果;
6、将所述第一槽位信息输出结果和所述第二槽位信息输出结果进行组合,生成最终意图槽位信息。
7、作为语言大模型融合nlu的槽位信息抽取方法优选方案,所述语言大模型为定制化模型,定制化的方式为:
8、根据业务需求进行业务数据采集,得到预设数量的业务数据;
9、采用所述业务数据,通过sft算法对通用的大语言模型进行调整,使通用的大语言模型符合业务对话管理系统槽位抽取任务的需求。
10、作为语言大模型融合nlu的槽位信息抽取方法优选方案,所述业务数据的格式包括:数据用途介绍、数据输入信息和数据输出信息。
11、作为语言大模型融合nlu的槽位信息抽取方法优选方案,将缺少的所述槽位信息输入到prompt生成器里面,生成缺少的所述槽位信息的提示词。
12、作为语言大模型融合nlu的槽位信息抽取方法优选方案,用于查询天气、查找火车票的对话业务场景。
13、本发明还提供一种语言大模型融合nlu的槽位信息抽取装置,包括:
14、nlu处理模块,用于获取用户的语音对话输入信息,将所述语音对话输入信息输送到nlu的意图槽位抽取单元得到意图输出结果和第一槽位信息输出结果;
15、意图业务选择模块,用于将所述意图输出结果输入到业务对话管理系统,选择所述意图输出结果的对应业务;
16、缺失槽位信息生成模块,用于将所述第一槽位信息输出结果输入到业务对话管理系统,得到所述意图输出结果的对应业务缺失的槽位信息;
17、大模型处理模块,用于将缺失的所述槽位信息的提示词和用户对话历史输入到语言大模型的意图槽位抽取单元,进行缺失的所述槽位信息的查询,得到所述语言大模型的第二槽位信息输出结果;
18、槽位信息组合模块,用于将所述第一槽位信息输出结果和所述第二槽位信息输出结果进行组合,生成最终意图槽位信息。
19、作为语言大模型融合nlu的槽位信息抽取装置优选方案,所述语言大模型为定制化模型,定制化的方式为:
20、根据业务需求进行业务数据采集,得到预设数量的业务数据;
21、采用所述业务数据,通过sft算法对通用的大语言模型进行调整,使通用的大语言模型符合业务对话管理系统槽位抽取任务的需求。
22、作为语言大模型融合nlu的槽位信息抽取装置优选方案,所述业务数据的格式包括:数据用途介绍、数据输入信息和数据输出信息。
23、作为语言大模型融合nlu的槽位信息抽取装置优选方案,还包括提示词生成模块,用于将缺少的所述槽位信息输入到prompt生成器里面,生成缺少的所述槽位信息的提示词。
24、作为语言大模型融合nlu的槽位信息抽取装置优选方案,用于查询天气、查找火车票的对话业务场景。
25、本发明具有如下优点:获取用户的语音对话输入信息,将所述语音对话输入信息输送到nlu的意图槽位抽取单元得到意图输出结果和第一槽位信息输出结果;将所述意图输出结果输入到业务对话管理系统,选择所述意图输出结果的对应业务;将所述第一槽位信息输出结果输入到业务对话管理系统,得到所述意图输出结果的对应业务缺失的槽位信息;将缺失的所述槽位信息的提示词和用户对话历史输入到语言大模型的意图槽位抽取单元,进行缺失的所述槽位信息的查询,得到所述语言大模型的第二槽位信息输出结果;将所述第一槽位信息输出结果和所述第二槽位信息输出结果进行组合,生成最终意图槽位信息。本发明融合语言大模型对上下文进行理解给出缺失槽位信息,从而解决传统nlu在复杂上下文理解中的槽位信息抽取难的问题,准确度高,稳定性强。
1.一种语言大模型融合nlu的槽位信息抽取方法,其特征在于,包括:
2.根据权利要求1所述的一种语言大模型融合nlu的槽位信息抽取方法,其特征在于,所述语言大模型为定制化模型,定制化的方式为:
3.根据权利要求2所述的一种语言大模型融合nlu的槽位信息抽取方法,其特征在于,所述业务数据的格式包括:数据用途介绍、数据输入信息和数据输出信息。
4.根据权利要求1所述的一种语言大模型融合nlu的槽位信息抽取方法,其特征在于,将缺少的所述槽位信息输入到prompt生成器里面,生成缺少的所述槽位信息的提示词。
5.根据权利要求1至4任一项所述的一种语言大模型融合nlu的槽位信息抽取方法,其特征在于,用于查询天气、查找火车票的对话业务场景。
6.一种语言大模型融合nlu的槽位信息抽取装置,其特征在于,包括:
7.根据权利要求6所述的一种语言大模型融合nlu的槽位信息抽取装置,其特征在于,所述语言大模型为定制化模型,定制化的方式为:
8.根据权利要求7所述的一种语言大模型融合nlu的槽位信息抽取装置,其特征在于,所述业务数据的格式包括:数据用途介绍、数据输入信息和数据输出信息。
9.根据权利要求6所述的一种语言大模型融合nlu的槽位信息抽取装置,其特征在于,还包括提示词生成模块,用于将缺少的所述槽位信息输入到prompt生成器里面,生成缺少的所述槽位信息的提示词。
10.根据权利要求6至9任一项所述的一种语言大模型融合nlu的槽位信息抽取装置,其特征在于,用于查询天气、查找火车票的对话业务场景。