本说明书涉及计算机,尤其涉及一种模型训练的方法、装置、存储介质及电子设备。
背景技术:
1、在人机对话的场景中,与用户进行对话的人工智能(artificial intelligence,ai)是否能够理解用户表达的含义是至关重要的。通常情况下,在投入应用前会对与用户进行对话的ai进行大量的训练来确保ai具备足量的知识去理解用户表述的每一句话。
2、但实际上,在训练过程中很难保证能够让ai学习到所有的词汇;并且随着时间的推移,新的词汇也在不断产生。这导致ai在与用户进行对话时,有时可能会无法理解用户输入的个别词汇的含义。同时,在人机对话的过程中,需要保护用户的隐私数据。在这种情况下,为ai补充新的知识储备十分关键。
3、因此,如何向人机对话所使用的模型中补充新的知识是一个亟待解决的问题。
技术实现思路
1、本说明书提供一种模型训练方法及模型训练装置,以部分的解决现有技术存在的上述问题。
2、本说明书采用下述技术方案:
3、本说明书提供了一种模型训练的方法,包括:
4、获取目标对话;
5、从所述目标对话中选择出现次数不小于指定次数的词汇,作为候选词汇;
6、将所述候选词汇输入意图识别模型中,确定所述意图识别模型输出的所述候选词汇的意图识别结果;
7、将所述意图识别结果为未识别出意图的候选词汇,作为目标词汇;
8、将所述目标词汇作为训练样本,确定所述目标词汇的实际意图作为所述训练样本对应的标注;
9、将所述目标词汇输入所述意图识别模型中,确定所述意图识别模型的输出结果;
10、以所述输出结果与所述标注之前的差异最小为优化目标,对所述意图识别模型进行训练。
11、可选地,将所述意图识别结果为未识别出意图的候选词汇,作为目标词汇,具体包括:
12、将所述意图识别结果为未识别出意图的候选词汇作为待定词汇;
13、对所述待定词汇与预设的词汇库中的标准词汇进行匹配;
14、当所述词汇库中不包含所述待定词汇时,将所述待定词汇确定为目标词汇。
15、可选地,将所述意图识别结果为未识别出意图的候选词汇,作为目标词汇,具体包括:
16、将所述意图识别结果为未识别出意图的候选词汇作为待定词汇;
17、根据预先获取的历史对话的总数量以及包含所述待定词汇的历史对话的数量,确定所述待定词汇的逆文本频率,所述逆文本频率用于表征所述待定词汇的独特程度;
18、当所述逆文本频率不小于第一指定阈值时,将所述待定词汇确定为目标词汇。
19、可选地,当所述逆文本频率不小于第一指定阈值时,将所述待定词汇确定为目标词汇,具体包括:
20、当所述逆文本频率不小于第一指定阈值,且不大于第二指定阈值时,将所述待定词汇确定为目标词汇,其中,所述第二指定阈值大于所述第一指定阈值。
21、可选地,将所述待定词汇确定为目标词汇,具体包括:
22、将所述待定词汇,按照所述逆文本频率从低到高的顺序进行排序,构成待定词汇队列;
23、将所述待定词汇队列中的前指定数量个待定词汇确定为目标词汇。
24、可选地,将所述目标词汇作为训练样本,确定所述目标词汇的实际意图作为所述训练样本对应的标注,具体包括:
25、从所述目标词汇中确定至少部分可用目标词汇作为训练样本,并确定所述可用目标词汇的实际意图作为所述训练样本对应的标注。
26、可选地,从所述目标词汇中确定至少部分可用目标词汇作为训练样本,并确定所述可用目标词汇的实际意图作为所述训练样本对应的标注,具体包括:
27、向训练人员展示所述目标词汇,使所述训练人员从所述目标词汇中选择至少部分可用目标词汇,并确定所述可用目标词汇的实际意图作为所述训练样本对应的标注。
28、本说明书提供了一种模型训练装置,包括:
29、获取模块,用于获取目标对话;
30、第一筛选模块,用于从所述目标对话中选择出现次数不小于指定次数的词汇,作为候选词汇;
31、第一输入模块,用于将所述候选词汇输入意图识别模型中,确定所述意图识别模型输出的所述候选词汇的意图识别结果;
32、第二筛选模块,用于将所述意图识别结果为未识别出意图的候选词汇,作为目标词汇;
33、标注确定模块,用于将所述目标词汇作为训练样本,确定所述目标词汇的实际意图作为所述训练样本对应的标注;
34、第二输入模块,用于将所述目标词汇输入所述意图识别模型中,确定所述意图识别模型的输出结果;
35、训练模块,用于以所述输出结果与所述标注之前的差异最小为优化目标,对所述意图识别模型进行训练。
36、本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述模型训练的方法。
37、本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述模型训练的方法。
38、本说明书采用的上述至少一个技术方案能够达到以下有益效果:
39、在本说明书提供的模型训练方法中,获取目标对话;从目标对话中选择出现次数不小于指定次数的词汇,作为候选词汇;将候选词汇输入意图识别模型中,确定意图识别模型输出的候选词汇的意图识别结果;将意图识别结果为未识别出意图的候选词汇,作为目标词汇;将目标词汇作为训练样本,确定目标词汇的实际意图作为训练样本对应的标注;将目标词汇输入意图识别模型中,确定意图识别模型的输出结果;以输出结果与标注之前的差异最小为优化目标,对意图识别模型进行训练。
1.一种模型训练的方法,包括:
2.如权利要求1所述的方法,将所述意图识别结果为未识别出意图的候选词汇,作为目标词汇,具体包括:
3.如权利要求1所述的方法,将所述意图识别结果为未识别出意图的候选词汇,作为目标词汇,具体包括:
4.如权利要求3所述的方法,当所述逆文本频率不小于第一指定阈值时,将所述待定词汇确定为目标词汇,具体包括:
5.如权利要求3或4中任一项所述的方法,将所述待定词汇确定为目标词汇,具体包括:
6.如权利要求1所述的方法,将所述目标词汇作为训练样本,确定所述目标词汇的实际意图作为所述训练样本对应的标注,具体包括:
7.如权利要求6所述的方法,从所述目标词汇中确定至少部分可用目标词汇作为训练样本,并确定所述可用目标词汇的实际意图作为所述训练样本对应的标注,具体包括:
8.一种模型训练装置,包括:
9.如权利要求8所述的装置,所述第二筛选模块,具体用于将所述意图识别结果为未识别出意图的候选词汇作为待定词汇;对所述待定词汇与预设的词汇库中的标准词汇进行匹配;当所述词汇库中不包含所述待定词汇时,将所述待定词汇确定为目标词汇。
10.如权利要求8所述的装置,所述第二筛选模块,具体用于将所述意图识别结果为未识别出意图的候选词汇作为待定词汇;根据预先获取的历史对话的总数量以及包含所述待定词汇的历史对话的数量,确定所述待定词汇的逆文本频率,所述逆文本频率用于表征所述待定词汇的独特程度;当所述逆文本频率不小于第一指定阈值时,将所述待定词汇确定为目标词汇。
11.如权利要求10所述的装置,所述第二筛选模块,具体用于当所述逆文本频率不小于第一指定阈值,且不大于第二指定阈值时,将所述待定词汇确定为目标词汇,其中,所述第二指定阈值大于所述第一指定阈值。
12.如权利要求10或11中任一项所述的装置,所述第二筛选模块,具体用于将所述待定词汇,按照所述逆文本频率从低到高的顺序进行排序,构成待定词汇队列;将所述待定词汇队列中的前指定数量个待定词汇确定为目标词汇。
13.如权利要求8所述的装置,所述标注确定模块,具体用于从所述目标词汇中确定至少部分可用目标词汇作为训练样本,并确定所述可用目标词汇的实际意图作为所述训练样本对应的标注。
14.如权利要求13所述的装置,所述标注确定模块,具体用于向训练人员展示所述目标词汇,使所述训练人员从所述目标词汇中选择至少部分可用目标词汇,并确定所述可用目标词汇的实际意图作为所述训练样本对应的标注。
15.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~7任一项所述的方法。
16.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述权利要求1~7任一项所述的方法。