意图槽位识别模型的生成方法、装置、及电子设备与流程

文档序号:37014394发布日期:2024-02-09 13:04阅读:15来源:国知局
意图槽位识别模型的生成方法、装置、及电子设备与流程

本申请涉及计算机,尤其涉及一种意图槽位识别模型的生成方法、装置、电子设备及计算机可读存储介质。


背景技术:

1、自然语言处理(natural language processing,nlp)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理技术可以应用在智能对话领域,通过训练的意图槽位模型可以识别用户的意图(intent),以及确定该意图下的槽位(slot),进而根据意图和槽位完成各种业务操作指令。

2、目前的意图槽位识别模型,主要采用大语言模型(例如chatgpt)和判别式模型(例如jointbert)。大语言模型由于需要输入较长的提示信息,且参数计算量较大,导致处理耗时较长。判别式模型虽然处理速度较快,但在诸如指代消解等功能上有所欠缺,不能准确地提取对话语句中相关的槽位。


技术实现思路

1、鉴于此,为解决上述部分或全部技术问题,本申请实施例提供一种意图槽位识别模型的生成方法、装置、电子设备及计算机可读存储介质。

2、第一方面,本申请实施例提供一种意图槽位识别模型的生成方法,该方法包括:获取样本对话信息和标注生成提示信息;基于样本对话信息和标注生成提示信息,由预设的生成式语言模型,生成样本对话信息对应的意图槽位标注信息;将样本对话信息作为预设的初始意图槽位识别模型的输入,将意图槽位标注信息作为初始意图槽位识别模型的期望输出,调整初始意图槽位识别模型的参数;响应于调整参数后的初始意图槽位识别模型符合预设的训练结束条件,将调整参数后的初始意图槽位识别模型确定为训练后的意图槽位识别模型。

3、在一个可能的实施方式中,获取样本对话信息,包括:获取样本对话起始信息和对话生成提示信息;利用生成式语言模型和对话生成提示信息,对样本对话起始信息进行续写处理,得到样本对话信息。

4、在一个可能的实施方式中,获取样本对话起始信息,包括:从预设的多轮对话信息集合中,提取目标多轮对话信息;将目标多轮对话信息中的第一对话信息确定为样本对话起始信息。

5、在一个可能的实施方式中,利用生成式语言模型和对话生成提示信息,对样本对话起始信息进行续写处理,得到样本对话信息,包括:将样本对话起始信息和对话生成提示信息输入生成式语言模型,得到初始样本对话信息;基于预设的对话规则,对初始样本对话信息进行清洗操作,得到样本对话信息。

6、在一个可能的实施方式中,对话生成提示信息包括用于指示生成式语言模型生成的对话信息的轮次数;以及利用生成式语言模型和对话生成提示信息,对样本对话起始信息进行续写处理,得到样本对话信息,包括:将对话起始信息和对话生成提示信息输入预设的生成式语言模型,得到多轮对话信息;将多轮对话信息确定为样本对话信息。

7、在一个可能的实施方式中,基于样本对话信息和标注生成提示信息,由预设的生成式语言模型,生成样本对话信息对应的意图槽位标注信息,包括:将样本对话信息和标注生成提示信息输入生成式语言模型,得到初始意图槽位标注信息;确定初始意图槽位标注信息是否符合预设的意图槽位规则;若不符意图槽位规则,对初始意图槽位标注信息进行修正,得到样本对话信息对应的意图槽位标注信息。

8、在一个可能的实施方式中,确定初始意图槽位标注信息是否符合预设的意图槽位规则,包括:对样本对话信息和初始意图槽位标注信息包括的意图信息进行语义匹配处理,以确定样本对话信息和意图信息是否匹配,若不匹配,确定初始意图槽位标注信息不符合意图槽位规则;和/或,确定初始意图槽位标注信息包括的槽位信息中是否存在无效槽位信息,若存在,确定初始意图槽位标注信息不符合意图槽位规则;对初始意图槽位标注信息进行修正,得到样本对话信息对应的意图槽位标注信息,包括:

9、若样本对话信息与意图信息不匹配,对意图信息进行修正,和/或,若槽位信息中存在无效槽位信息,对无效槽位信息进行修正;将对意图信息进行修正后的初始意图槽位标注信息和/或对无效槽位信息进行修正后的初始意图槽位标注信息确定为样本对话信息对应的意图槽位标注信息。

10、第二方面,本申请实施例提供一种意图槽位识别模型的生成装置,该装置包括:获取模块,用于获取样本对话信息和标注生成提示信息;生成模块,用于基于样本对话信息和标注生成提示信息,由预设的生成式语言模型,生成样本对话信息对应的意图槽位标注信息;训练模块,用于将样本对话信息作为预设的初始意图槽位识别模型的输入,将意图槽位标注信息作为初始意图槽位识别模型的期望输出,调整初始意图槽位识别模型的参数;确定模块,用于响应于调整参数后的初始意图槽位识别模型符合预设的训练结束条件,将调整参数后的初始意图槽位识别模型确定为训练后的意图槽位识别模型。

11、第三方面,本申请实施例提供一种电子设备,包括:存储器,用于存储计算机程序;处理器,用于执行存储器中存储的计算机程序,且计算机程序被执行时,实现本申请上述第一方面的意图槽位识别模型的生成方法中任一实施例的方法。

12、第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时,实现如上述第一方面的意图槽位识别模型的生成方法中任一实施例的方法。

13、第五方面,本申请实施例提供一种计算机程序,计算机程序包括计算机可读代码,当计算机可读代码在设备上运行时,使得该设备中的处理器实现如上述第一方面的意图槽位识别模型的生成方法中任一实施例的方法。

14、本申请实施例提供的意图槽位识别模型的生成方法、装置、电子设备及计算机可读存储介质,通过利用样本对话信息和标注生成提示信息,由预设的生成式语言模型,生成样本对话信息对应的意图槽位标注信息,然后将样本对话信息作为预设的初始意图槽位识别模型的输入,将意图槽位标注信息作为初始意图槽位识别模型的期望输出,训练得到意图槽位识别模型,从而实现了由生成式语言模型自动生成对话信息对应的意图槽位标注信息,提高生成训练样本的效率,同时为训练意图槽位识别模型提供高质量的训练样本,提高了训练后的意图槽位识别模型从对话信息中识别意图槽位的精度。



技术特征:

1.一种意图槽位识别模型的生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述获取样本对话信息,包括:

3.根据权利要求2所述的方法,其特征在于,所述获取样本对话起始信息,包括:

4.根据权利要求2所述的方法,其特征在于,所述利用所述生成式语言模型和所述对话生成提示信息,对所述样本对话起始信息进行续写处理,得到所述样本对话信息,包括:

5.根据权利要求2所述的方法,其特征在于,所述对话生成提示信息包括用于指示所述生成式语言模型生成的对话信息的轮次数;以及

6.根据权利要求1-5任一项所述的方法,其特征在于,所述基于所述样本对话信息和所述标注生成提示信息,由预设的生成式语言模型,生成所述样本对话信息对应的意图槽位标注信息,包括:

7.根据权利要求6所述的方法,其特征在于,所述确定所述初始意图槽位标注信息是否符合预设的意图槽位规则,包括:

8.一种意图槽位识别模型的生成装置,其特征在于,所述装置包括:

9.一种电子设备,其特征在于,包括:

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现上述权利要求1-7任一所述的方法。


技术总结
本申请实施例涉及一种意图槽位识别模型的生成方法、装置、电子设备及存储介质,该方法包括:获取样本对话信息和标注生成提示信息;基于样本对话信息和标注生成提示信息,由预设的生成式语言模型,生成意图槽位标注信息;将样本对话信息作为预设的初始意图槽位识别模型的输入,将意图槽位标注信息作为初始意图槽位识别模型的期望输出,调整初始意图槽位识别模型的参数;响应于调整参数后的初始意图槽位识别模型符合训练结束条件,将调整参数后的初始意图槽位识别模型确定为意图槽位识别模型。本申请实施例提高了生成训练样本的效率,同时为提供高质量的训练样本,提高了训练后的意图槽位识别模型从对话信息中识别意图槽位的精度。

技术研发人员:钱泽
受保护的技术使用者:北京奇艺世纪科技有限公司
技术研发日:
技术公布日:2024/2/8
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1