意图识别方法、装置、电子设备及存储介质与流程

文档序号:35826802发布日期:2023-10-22 12:05阅读:26来源:国知局
意图识别方法、装置、电子设备及存储介质与流程

本说明书中实施方式关于计算机应用,具体地说,涉及计算机应用技术下的自然语言处理技术,更具体地说,涉及意图识别方法、装置、电子设备及存储介质。


背景技术:

1、在自然语言处理(natural language processing,nlp)领域中,对用户语句的意图识别是一项重要技术。例如在人机对话系统中,准确的识别语句意图,才能保障后续对用户操作的准确响应,从而提高人机交互的效率。

2、在进行语句的意图识别时,会将语音语句转成文本语句后输入至意图识别模型中进行处理,由意图识别模型输出对应的意图识别结果。例如是询问天气还是播放音乐等。目前各类意图识别方法普遍存在意图误触(例如将用户的闲聊为某一特定意图)的问题,有必要提高意图识别的准确率。


技术实现思路

1、本说明书中多个实施方式提供一种意图识别方法、装置、电子设备及存储介质,以实现提高意图识别方法的准确率的目的。

2、第一方面,本说明书的一个实施方式提供了一种意图识别方法,包括:

3、将获取的原始文本中属于目标领域的关键词,替换为所述目标领域中与所述关键词对应的类别标签,生成替换文本;

4、将待匹配文本与规则模板进行匹配,若所述待匹配文本与所述规则模板相匹配,则将所述规则模板对应的模板意图作为所述原始文本的目标意图;所述待匹配文本包括所述原始文本和/或所述替换文本;

5、若不匹配,且所述替换文本属于所述目标领域的文本,则通过已训练的意图识别模型对所述原始文本和所述替换文本进行意图识别,基于得到的所述原始文本和所述替换文本对应的识别结果,确定所述原始文本的目标意图。

6、第二方面,本说明书的一个实施方式提供了一种意图识别装置,包括:

7、文本替换模块,用于将获取的原始文本中属于目标领域的关键词,替换为所述目标领域中与所述关键词对应的类别标签,生成替换文本;

8、意图匹配模块,用于将待匹配文本与规则模板进行匹配,若所述待匹配文本与所述规则模板相匹配,则将所述规则模板对应的模板意图作为所述原始文本的目标意图;所述待匹配文本包括所述原始文本和/或所述替换文本;

9、意图识别模块,用于若所述待匹配文本与所述规则模板不匹配,且所述替换文本属于所述目标领域的文本,则通过已训练的意图识别模型对所述原始文本和所述替换文本进行意图识别,基于得到的所述原始文本和所述替换文本对应的识别结果,确定所述原始文本的目标意图。

10、可选地,所述意图匹配模块,具体用于:

11、将所述原始文本与所述规则模板匹配,若所述原始文本与所述规则模板相匹配,则将与所述原始文本相匹配的所述规则模板对应的模板意图作为所述原始文本的目标意图;

12、若所述原始文本与所述规则模板不匹配,则将所述替换文本与所述规则模板匹配,若所述替换文本与所述规则模板相匹配,则将与所述替换文本相匹配的所述规则模板对应的模板意图作为所述原始文本的目标意图。

13、可选地,在所述通过已训练的意图识别模型对所述原始文本和所述替换文本进行意图识别,基于得到的所述原始文本和所述替换文本对应的识别结果,确定所述原始文本的目标意图时,意图识别模块,具体可以用于:

14、将所述原始文本和所述替换文本输入意图识别模型,以获得第一识别结果和第二识别结果,所述第一识别结果为所述意图识别模型对所述原始文本的意图识别结果,所述第二识别结果为所述意图识别模型对所述替换文本的意图识别结果;

15、若所述第一识别结果与所述第二识别结果不一致,则根据所述第一识别结果和所述第二识别结果的意图类型,将所述第一识别结果或所述第二识别结果作为所述原始文本的意图;

16、若所述第一识别结果与所述第二识别结果一致,则将所述第一识别结果或所述第二识别结果,作为所述原始文本的意图。

17、可选地,所述意图识别装置还包括模型训练模块,模型训练模块用于:

18、获取训练样本,所述训练样本包括原始样本文本、对所述原始样本文本中目标领域的关键词进行替换生成的样本替换文本、以及表征所述原始样本文本和所述样本替换文本的意图的样本标签;

19、通过待训练的意图识别模型,对所述原始样本文本和所述样本替换文本进行意图识别,分别得到对应的样本意图;

20、基于所述样本意图与所述样本标签的差异,调整所述待训练的意图识别模型的模型参数,并继续进行训练,直到满足训练条件则停止训练,得到已训练的意图识别模型。

21、可选地,所述意图识别装置还包括确定模块,所述确定模块可以用于:

22、若所述替换文本中除类别标签外的目标字符的占比,大于或等于占比阈值,则确定所述替换文本属于所述目标领域的文本;所述目标字符为表征所述目标领域的字符。

23、其中,所述目标字符在所述目标领域的字符中的重要程度大于重要程度阈值。

24、可选地,所述目标字符在所述目标领域的字符中的重要程度等于目标频率和目标逆文本频率的乘积;

25、所述目标频率为所述目标字符在所述目标领域的字符中出现的频率,所述目标逆文本频率为所述目标字符在所述目标领域的字符中出现的逆文本频率。

26、可选地,所述意图识别装置还包括执行模块,所述执行模块用于:

27、基于所述原始文本所属的目标领域和所述目标意图,执行所述目标领域下的与所述原始文本对应的目标指令。

28、第三方面,本说明书的一个实施方式提供了一种电子设备,包括处理器和存储器,所述存储器存储有计算机程序;其特征在于,所述处理器执行所述计算机程序时实现如本申请的第一方面所述的意图识别方法。

29、第四方面,本说明书的一个实施方式提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如本说明书的第一方面所述的意图识别方法的步骤。

30、第五方面,本说明书的一个实施方式提供了一种计算机程序产品或计算机程序,所述计算机程序产品包括计算机程序,所述计算机程序存储在计算机可读存储介质中;所述计算机设备的处理器从所述计算机可读存储介质读取所述计算机程序,所述处理器执行所述计算机程序时实现上述的意图识别方法的步骤。

31、上述意图识别方法、装置、电子设备及存储介质,通过首先将原始文本中属于目标领域的关键词,替换为目标领域中与关键词对应的类别标签,以生成替换文本,之后在规则模板匹配不成功,且替换文本属于目标领域的文本的情况下,才通过已训练的意图识别模型对原始文本和替换文本进行意图识别,基于得到的原始文本和替换文本对应的识别结果,确定原始文本的目标意图,如此,可以避免直接将标签化的替换文本输入到意图识别模型后可能导致的意图误触的问题,提高了意图识别方法的准确率。



技术特征:

1.一种意图识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述将待匹配文本与规则模板进行匹配,若所述待匹配文本与所述规则模板相匹配,则将所述规则模板对应的模板意图作为所述原始文本的目标意图包括:

3.根据权利要求1所述的方法,其特征在于,所述通过已训练的意图识别模型对所述原始文本和所述替换文本进行意图识别,基于得到的所述原始文本和所述替换文本对应的识别结果,确定所述原始文本的目标意图包括:

4.根据权利要求3所述的方法,其特征在于,所述意图识别模型通过模型训练步骤获得;所述模型训练步骤包括:

5.根据权利要求1所述的方法,其特征在于,所述方法还包括:

6.根据权利要求5所述的方法,其特征在于,所述目标字符在所述目标领域的字符中的重要程度大于重要程度阈值。

7.根据权利要求6所述的方法,其特征在于,所述目标字符在所述目标领域的字符中的重要程度等于目标频率和目标逆文本频率的乘积;

8.根据权利要求1至7任意一项所述的方法,其特征在于,所述方法还包括:

9.一种意图识别装置,其特征在于,包括:

10.一种电子设备,包括处理器和存储器,所述存储器存储有计算机程序;其特征在于,所述处理器执行所述计算机程序时实现如权利要求1~8任一项所述的意图识别方法。

11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1~8任一项所述的意图识别方法的步骤。


技术总结
本申请涉及一种意图识别方法、装置、电子设备及存储介质,意图识别方法包括:将获取的原始文本中属于目标领域的关键词,替换为目标领域中与关键词对应的类别标签,生成替换文本;将待匹配文本与规则模板进行匹配,若待匹配文本与规则模板相匹配,则将规则模板对应的模板意图作为原始文本的目标意图;待匹配文本包括原始文本和/或替换文本;若不匹配,且替换文本属于目标领域的文本,则通过已训练的意图识别模型对原始文本和替换文本进行意图识别,基于得到的原始文本和替换文本对应的识别结果,确定原始文本的目标意图。如此,可以避免直接将标签化的替换文本输入到意图识别模型后可能导致的意图误触的问题,提高了意图识别方法的准确率。

技术研发人员:王艳东,张龙
受保护的技术使用者:深圳绿米联创科技有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1