中文对话文本意图识别方法、装置、设备及存储介质与流程

文档序号:36958554发布日期:2024-02-07 13:02阅读:21来源:国知局
中文对话文本意图识别方法、装置、设备及存储介质与流程

本发明涉及深度学习领域,尤其涉及一种中文对话文本意图识别方法、装置、设备及存储介质。


背景技术:

1、近年来,随着深度学习的快速发展,人机对话系统越来越智能化。在保险业务领域中,为了准确地对用户进行服务指引,通常需要通过人机对话系统对用户进行意图识别,获取意图识别结果,便于根据意图识别结果,帮助用户进行对应的服务指引。现有技术中,通常将人机对话系统中的对话转录为文本,通过对文本进行意图分类,实现对人机对话系统中用户的意图识别。例如,现有技术中,在保险业务领域的人机对话系统中,获取对用户的对话转录后的文本:“我要为我的父母进行投保,你有什么推荐吗”,对该文本进行意图识别,获取“投保推荐”这一意图识别结果,便于在保险业务领域的实际操作中,对用户进行对应的保险业务推荐,帮助用户较为准确地进行与意图识别结果对应的服务指引。

2、但是,由于用户的对话语言通常比较口语化并且对话文本内容较少,仅仅通过现有技术对用户的对话文本进行意图识别,会使最终识别得到的意图识别结果具有较低的意图识别准确率。因此,如何提高对话文本意图识别的准确率是亟待解决的问题。


技术实现思路

1、本发明实施例提供一种中文对话文本意图识别方法、装置、设备及存储介质,以解决如何提高对话文本意图识别的准确率的问题。

2、一种中文对话文本意图识别方法,包括:

3、获取中文对话文本,将所述中文对话文本输入至ernie预训练模型中,输出所述中文对话文本对应的语义增强表示;

4、采用特征提取网络对所述语义增强表示进行特征提取,获取第一特征向量;

5、采用自注意力网络对所述语义增强表示进行特征提取,获取第二特征向量;

6、将所述第一特征向量和所述第二特征向量进行特征融合,获取目标融合向量;

7、将所述目标融合向量输入至胶囊网络进行意图识别,获取所述中文对话文本的目标意图。

8、优选地,所述采用特征提取网络对所述语义增强表示进行特征提取,获取第一特征向量,包括:

9、将所述语义增强表示输入至第一卷积层,获取第一卷积向量;

10、采用特征提取网络对所述第一卷积向量进行前向遍历和后向遍历,分别获取前向上下文信息和后向上下文信息;

11、对所述前向上下文信息和所述后向上下文信息进行拼接,获取第一特征向量。

12、优选地,所述采用自注意力网络对所述语义增强表示进行特征提取,获取第二特征向量,包括:

13、采用自注意力网络对所述语义增强表示进行识别,获取语义增强表示中,每一词向量对应的第一自注意力向量、第二自注意力向量和第三自注意力向量;

14、将每一所述词向量对应的所述第一自注意力向量输入至第二卷积层中,获取第一自注意力向量对应的第四自注意力向量;

15、将每一所述词向量对应的所述第二自注意力向量输入至第三卷积层中,获取第二自注意力向量对应的第五自注意力向量;

16、将每一词向量对应的所述第四自注意力向量和所有词向量对应的第五自注意力向量的点积,作为每一词向量与所有词向量之间的关联度,对所述关联度进行激活处理,获取每一词向量对应的权重值;

17、采用每一词向量对应的权重值对每一词向量对应的第三自注意力向量加权处理,获取第二特征向量。

18、优选地,所述将所述第一特征向量和第二特征向量进行特征融合,获取目标融合向量,包括:

19、采用第一权重对所述第一特征向量进行修正,获取第一目标向量;

20、采用第二权重对所述第二特征向量进行修正,获取第二目标向量;

21、将所述第一目标向量和所述第二目标向量的和值,作为目标融合向量。

22、优选地,所述将所述目标融合向量输入至胶囊网络进行意图识别,获取所述中文对话文本的目标意图,包括:

23、将所述目标融合向量分别输入至胶囊网络的每个初始化胶囊层,获取所述目标融合向量对应的初始胶囊向量;

24、对所述初始胶囊向量进行动态路由,获取目标胶囊向量;

25、计算所述目标胶囊向量与每一候选意图向量之间的意图相似度,将最大意图相似度对应的候选意图向量作为目标意图向量,将所述目标意图向量对应的意图,作为目标意图。

26、优选地,所述初始胶囊向量的数量为n,n≥2;

27、所述对所述初始胶囊向量进行动态路由,获取目标胶囊向量,包括:

28、获取每一初始胶囊向量对应的初始权重,根据n个所述初始胶囊向量及其对应的所述初始权重,获取第一中间向量;

29、分别计算n个初始胶囊向量与所述第一中间向量之间的向量相似度,将所述向量相似度确定为所述初始胶囊向量的目标权重,根据n个初始胶囊向量和n个所述目标权重,获取第二中间向量;

30、若所述第二中间向量为预设迭代次数中最后一次的迭代结果,则将所述第二中间向量确定为目标胶囊向量;

31、若所述第二中间向量不为预设迭代次数中最后一次的迭代结果,则将所述第二中间向量更新为第一中间向量,继续执行分别计算n个初始胶囊向量与所述第一中间向量之间的向量相似度。

32、优选地,所述根据n个所述初始胶囊向量及其对应的所述初始权重,获取第一中间向量,包括:

33、将每一所述初始胶囊向量及其对应的所述初始权重的乘积,确定为每一所述初始胶囊向量对应的第一初始向量;

34、将n个所述初始胶囊向量对应的第一初始向量之和,确定为第二初始向量;

35、采用squash压缩激活函数对所述第二初始向量进行压缩激活处理,获取第一中间向量。

36、一种中文对话文本意图识别装置,包括:

37、语义增强表示获取模块,用于获取中文对话文本,将所述中文对话文本输入至ernie预训练模型中,输出所述中文对话文本对应的语义增强表示;

38、第一特征向量获取模块,用于采用特征提取网络对所述语义增强表示进行特征提取,获取第一特征向量;

39、第二特征向量获取模块,用于采用自注意力网络对所述语义增强表示进行特征提取,获取第二特征向量;

40、目标融合向量获取模块,用于将所述第一特征向量和所述第二特征向量进行特征融合,获取目标融合向量;

41、目标意图获取模块,用于将所述目标融合向量输入至胶囊网络进行意图识别,获取所述中文对话文本的目标意图。

42、一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述中文对话文本意图识别方法。

43、一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述中文对话文本意图识别方法。

44、上述中文对话文本意图识别方法、装置、设备及存储介质,使用ernie预训练模型对中文对话文本进行语义信息提取,获取语义增强表示,增强中文对话文本的语义表示能力,提高语义增强表示的质量;特征提取网络可以充分学习到语义增强表示中上下文信息之间的关系,对于比较口语化的中文对话文本对应的语义增强表示,也能获取到较为精确的第一特征向量;自注意力网络对语义增强表示进行特征提取,使得到的第二特征向量减少特征提取时对外部信息的依赖,更贴合语义增强表示的内部信息;将第一特征向量和第二特征向量进行融合获取目标融合向量,便于融合特征提取网络和自注意力网络进行特征提取的优势,使获取到的目标融合向量更加精确;使用胶囊网络对目标融合向量进行意图识别,得到目标意图,在中文对话文本为小样本的情况下,具有较为准确的意图识别结果,能够有效提高意图识别的准确率。针对保险业务领域中,意图识别对应的应用场景,该中文对话文本意图识别方法能够克服用户语言过于口语化和对话文本内容较少导致意图识别准确率较低的问题,获取较为准确的意图识别结果,实现有效提高意图识别准确率的目的,便于在保险业务领域的实际操作中,根据意图识别结果对用户进行较为准确的服务指引。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1