对话生成方法、装置、设备及存储介质与流程

文档序号:31963175发布日期:2022-10-28 23:49阅读:56来源:国知局
对话生成方法、装置、设备及存储介质与流程

1.本技术涉及到人工智能技术领域,特别是涉及到一种对话生成方法、装置、设备及存储介质。


背景技术:

2.在智能问答应用场景中,典型的包括:闲聊式问答和任务导向型问答。闲聊式问答一般基于生成式模型,用于开发域闲聊,比如问天气及寒暄等应用场景;任务导向型问答一般基于意图识别模型,用于特定场景下一问一答,比如咨询、售前及售后服务等应用场景。以生成式模型为基础的闲聊式问答具有会话灵活的优点,但是无法根据意图进行对话;而以意图识别模型为基础的任务导向型问答具有固定的意图-话术对,但是回话灵活性比较差。


技术实现要素:

3.本技术的主要目的为提供一种对话生成方法、装置、设备及存储介质,旨在解决现有技术中以生成式模型为基础的闲聊式问答具有会话灵活的优点,但是无法根据意图进行对话,而以意图识别模型为基础的任务导向型问答具有固定的意图-话术对,但是回话灵活性比较差的技术问题。
4.为了实现上述发明目的,本技术提出一种对话生成方法,所述方法包括:
5.获取待生成对话的文本数据;
6.将所述待生成对话的文本数据输入预设的文本特征抽取器进行序列向量转换,得到待分析的序列向量;
7.将所述待分析的序列向量输入预设的对话生成模型进行对话生成,得到待判断的回复文本;
8.基于所述待生成对话的文本数据,将所述待判断的回复文本输入预设的判别模型进行合理性判断,得到合理性判断结果;
9.当所述合理性判断结果为合理时,将所述待判断的回复文本确定为目标回复文本;
10.当所述合理性判断结果为不合理时,获取兜底话术文本,将所述兜底话术文本作为所述目标回复文本,其中,获取预设的意图识别模型和意图与话术对应数据库,根据所述待分析的序列向量、所述预设的意图识别模型和所述意图与话术对应数据库进行回复文本生成,得到所述兜底话术文本。
11.进一步的,所述将所述待分析的序列向量输入预设的对话生成模型进行对话生成,得到待判断的回复文本的步骤,包括:
12.获取所述待生成对话的文本数据对应的客户属性信息;
13.将所述客户属性信息输入预设的第一编码器进行编码,得到待分析的属性信息编码;
14.将所述待生成对话的文本数据输入预设的第二编码器进行编码,得到待分析的内容编码;
15.将所述待分析的属性信息编码和所述待分析的内容编码输入预设的特征融合模型进行特征融合,得到待处理的特征融合结果;
16.将所述待分析的序列向量和所述待处理的特征融合结果输入所述预设的对话生成模型进行对话生成,得到所述待判断的回复文本。
17.进一步的,所述基于所述待生成对话的文本数据,将所述待判断的回复文本输入预设的判别模型进行合理性判断,得到合理性判断结果的步骤,包括:
18.通过所述预设的判别模型,对所述待判断的回复文本进行流畅度判断,得到流畅度判断结果;
19.通过所述预设的判别模型,根据所述待生成对话的文本数据和所述待判断的回复文本进行当前对话意图的关联度判断,得到当前对话意图的关联度判断结果;
20.通过所述预设的判别模型,根据所述待生成对话的文本数据和所述待判断的回复文本进行历史对话意图的关联度判断,得到历史对话意图的关联度判断结果;
21.通过所述预设的判别模型,对所述待判断的回复文本进行合规性判断,得到合规性判断结果;
22.通过所述预设的判别模型,对所述待判断的回复文本进行合法性判断,得到合法性判断结果;
23.当所述流畅度判断结果、所述当前对话意图的关联度判断结果、所述历史对话意图的关联度判断结果、所述合规性判断结果和所述合法性判断结果全部为通过时,确定所述合理性判断结果为合理,否则,确定所述合理性判断结果为不合理。
24.进一步的,所述通过所述预设的判别模型,对所述待判断的回复文本进行流畅度判断,得到流畅度判断结果的步骤,包括:
25.将所述待判断的回复文本输入所述预设的判别模型进行困惑度计算,得到困惑度计算结果;
26.获取困惑度阈值;
27.当所述困惑度计算结果小于所述困惑度阈值时,确定所述流畅度判断结果为通过,否则,确定所述流畅度判断结果为不通过;
28.其中,所述困惑度计算结果的计算公式pp(w)为:
[0029][0030]
p(w1,w2,

,wn)=p(w1)p(w2|w1)p(w3|w2,w1)

p(wn|w
n-1
,

,w2,w1)
[0031]
其中,n为所述待判断的回复文本的长度,p(wn|w
n-1
,

,w2,w1)是在出现w
n-1
,

,w2,w1的情况下wn出现的概率。
[0032]
进一步的,所述通过所述预设的判别模型,根据所述待生成对话的文本数据和所述待判断的回复文本进行当前对话意图的关联度判断,得到当前对话意图的关联度判断结果的步骤,包括:
[0033]
通过所述预设的判别模型,根据所述待判断的回复文本进行意图向量生成,得到
回复文本的意图向量;
[0034]
通过所述预设的判别模型,根据所述待生成对话的文本数据进行意图向量生成,得到问话文本的意图向量;
[0035]
对所述回复文本的意图向量和所述问话文本的意图向量进行向量距离计算,得到第一向量距离计算结果;
[0036]
获取第一向量距离阈值;
[0037]
当所述第一向量距离计算结果小于所述第一向量距离阈值时,确定所述当前对话意图的关联度判断结果为通过,否则确定所述当前对话意图的关联度判断结果为不通过。
[0038]
进一步的,所述通过所述预设的判别模型,对所述待判断的回复文本进行合规性判断,得到合规性判断结果的步骤,包括:
[0039]
获取合规内容库;
[0040]
通过所述预设的判别模型,采用正则表达式,根据所述合规内容库对所述待判断的回复文本进行合规性判断,当所述待判断的回复文本中包含所述合规内容库中的内容时,则确定所述合规性判断结果为通过,否则确定所述合规性判断结果为不通过;
[0041]
所述通过所述预设的判别模型,对所述待判断的回复文本进行合法性判断,得到合法性判断结果的步骤,包括:
[0042]
获取不合法内容库;
[0043]
通过所述预设的判别模型,采用所述正则表达式,根据所述不合法内容库对所述待判断的回复文本进行合法性判断,当所述待判断的回复文本中不包含所述不合法内容库中的内容时,则确定所述合法性判断结果为通过,否则确定所述合法性判断结果为不通过。
[0044]
进一步的,所述根据所述待分析的序列向量、所述预设的意图识别模型和所述意图与话术对应数据库进行回复文本生成,得到所述兜底话术文本的步骤,包括:
[0045]
将所述待分析的序列向量输入所述预设的意图识别模型进行意图识别,得到待分析的意图识别结果;
[0046]
将所述待分析的意图识别结果在所述意图与话术对应数据库中进行匹配,得到所述兜底话术文本。
[0047]
本技术还提出了一种对话生成装置,所述装置包括:
[0048]
数据获取模块,用于获取待生成对话的文本数据;
[0049]
待分析的序列向量确定模块,用于将所述待生成对话的文本数据输入预设的文本特征抽取器进行序列向量转换,得到待分析的序列向量;
[0050]
待判断的回复文本确定模块,用于将所述待分析的序列向量输入预设的对话生成模型进行对话生成,得到待判断的回复文本;
[0051]
合理性判断结果确定模块,用于基于所述待生成对话的文本数据,将所述待判断的回复文本输入预设的判别模型进行合理性判断,得到合理性判断结果;
[0052]
目标回复文本确定模块,用于当所述合理性判断结果为合理时,将所述待判断的回复文本确定为目标回复文本,当所述合理性判断结果为不合理时,获取兜底话术文本,将所述兜底话术文本作为所述目标回复文本,其中,获取预设的意图识别模型和意图与话术对应数据库,根据所述待分析的序列向量、所述预设的意图识别模型和所述意图与话术对应数据库进行回复文本生成,得到所述兜底话术文本。
[0053]
本技术还提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
[0054]
本技术还提出了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
[0055]
本技术的对话生成方法、装置、设备及存储介质,通过首先将待分析的序列向量输入预设的对话生成模型进行对话生成,得到待判断的回复文本,然后基于待生成对话的文本数据,将待判断的回复文本输入预设的判别模型进行合理性判断,得到合理性判断结果,最后当合理性判断结果为合理时,将待判断的回复文本确定为目标回复文本,当合理性判断结果为不合理时,获取兜底话术文本,将兜底话术文本作为目标回复文本,其中,获取预设的意图识别模型和意图与话术对应数据库,根据待分析的序列向量、预设的意图识别模型和意图与话术对应数据库进行回复文本生成,得到兜底话术文本,从而实现通过对话生成模型灵活的生成回复文本,通过预设的判别模型对回复文本进行合理性判断,从而使灵活生成的符合合理性判断的回复文本作为最终的回复文本,在灵活生成的回复文本不符合合理性判断时将基于意图得到的回复文本作为兜底的最终的回复文本,在确保灵活性和合理性的情况下,确保了确定最终的回复文本的效率。
附图说明
[0056]
图1为本技术一实施例的对话生成方法的流程示意图;
[0057]
图2为本技术一实施例的对话生成装置的结构示意框图;
[0058]
图3为本技术一实施例的计算机设备的结构示意框图。
[0059]
本技术目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0060]
为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
[0061]
为了解决现有技术中以生成式模型为基础的闲聊式问答具有会话灵活的优点,但是无法根据意图进行对话,而以意图识别模型为基础的任务导向型问答具有固定的意图-话术对,但是回话灵活性比较差的技术问题,本技术提出了一种对话生成方法,所述方法应用于人工智能技术领域。所述一种对话生成方法,通过对话生成模型灵活的生成回复文本,通过预设的判别模型对回复文本进行合理性判断,从而使灵活生成的符合合理性判断的回复文本作为最终的回复文本,在灵活生成的回复文本不符合合理性判断时将基于意图得到的回复文本作为兜底的最终的回复文本,在确保灵活性和合理性的情况下,确保了确定最终的回复文本的效率。
[0062]
参照图1,本技术实施例中提供一种对话生成方法,所述方法包括:
[0063]
s1:获取待生成对话的文本数据;
[0064]
s2:将所述待生成对话的文本数据输入预设的文本特征抽取器进行序列向量转换,得到待分析的序列向量;
[0065]
s3:将所述待分析的序列向量输入预设的对话生成模型进行对话生成,得到待判
断的回复文本;
[0066]
s4:基于所述待生成对话的文本数据,将所述待判断的回复文本输入预设的判别模型进行合理性判断,得到合理性判断结果;
[0067]
s5:当所述合理性判断结果为合理时,将所述待判断的回复文本确定为目标回复文本;
[0068]
s6:当所述合理性判断结果为不合理时,获取兜底话术文本,将所述兜底话术文本作为所述目标回复文本,其中,获取预设的意图识别模型和意图与话术对应数据库,根据所述待分析的序列向量、所述预设的意图识别模型和所述意图与话术对应数据库进行回复文本生成,得到所述兜底话术文本。
[0069]
本实施例通过首先将待分析的序列向量输入预设的对话生成模型进行对话生成,得到待判断的回复文本,然后基于待生成对话的文本数据,将待判断的回复文本输入预设的判别模型进行合理性判断,得到合理性判断结果,最后当合理性判断结果为合理时,将待判断的回复文本确定为目标回复文本,当合理性判断结果为不合理时,获取兜底话术文本,将兜底话术文本作为目标回复文本,其中,获取预设的意图识别模型和意图与话术对应数据库,根据待分析的序列向量、预设的意图识别模型和意图与话术对应数据库进行回复文本生成,得到兜底话术文本,从而实现通过对话生成模型灵活的生成回复文本,通过预设的判别模型对回复文本进行合理性判断,从而使灵活生成的符合合理性判断的回复文本作为最终的回复文本,在灵活生成的回复文本不符合合理性判断时将基于意图得到的回复文本作为兜底的最终的回复文本,在确保灵活性和合理性的情况下,确保了确定最终的回复文本的效率。
[0070]
对于s1,可以获取用户输入的待生成对话的文本数据,也可以是根据用户输入的语音数据进行语音识别后得到的待生成对话的文本数据。
[0071]
待生成对话的文本数据,可以是一句话,也可以是多句话组成的一段话。
[0072]
对于s2,将所述待生成对话的文本数据输入预设的文本特征抽取器进行序列向量转换,将转换得到的序列向量作为待分析的序列向量。可以理解的是,待分析的序列向量是一个序列。
[0073]
可选的,预设的文本特征抽取器,是基于embedding层(嵌入层)和序列向量生成模块训练得到的模型,用于将所述待生成对话的文本数据转换为包含所述待生成对话的文本数据中的上下文语义的序列向量。
[0074]
可选的,序列向量生成模块可以是单层,也可以是多层。
[0075]
序列向量生成模块可以是循环神经网络(rnn、lstm、gru),也可以是基于注意力机制的transformer。rnn,也就是循环神经网络。lstm,也就是长短期记忆人工神经网络。gru,也就是门控循环单元,是在lstm上进行简化而得到的网络。transformer,也就是nlp(自然语言处理的ai分支)中的transformer。
[0076]
对于s3,将所述待分析的序列向量输入预设的对话生成模型进行对话生成,将生成的对话文本作为待判断的回复文本。
[0077]
预设的对话生成模型,可以是基于seq2seq模型(全称为sequence to sequence模型)训练得到的模型,也可以是基于生成式预训练模型训练得到的模型。生成式预训练模型包括但不限于:gpt模型。gpt是一种半监督学习方法,它致力于用大量无标注数据让模型学
习“常识”,以缓解标注信息不足的问题。
[0078]
对于s4,将所述待判断的回复文本输入所述预设的判别模型进行流畅度、当前对话意图的关联度、历史通话意图的关联度、合规性、合法性的判断,当流畅度、当前对话意图的关联度、历史通话意图的关联度、合规性、合法性都满足要求时,确定所述合理性判断结果为合理,当流畅度、当前对话意图的关联度、历史通话意图的关联度、合规性、合法性中任一个不满足要求时,确定所述合理性判断结果为不合理。
[0079]
对于s5,当所述合理性判断结果为合理时,意味着所述待判断的回复文本在流畅度、当前对话意图的关联度、历史通话意图的关联度、合规性、合法性都满足要求,此时的所述待判断的回复文本符合合理性判断,因此可以将所述待判断的回复文本确定为目标回复文本。
[0080]
对于s6,可以获取用户输入的预设的意图识别模型,也可以从数据库中获取预设的意图识别模型,还可以获取第三方应用系统发送的预设的意图识别模型。
[0081]
其中,当所述合理性判断结果为不合理时,意味着所述待判断的回复文本在流畅度、当前对话意图的关联度、历史通话意图的关联度、合规性、合法性中至少一个不满足要求,此时的所述待判断的回复文本不符合合理性判断,因此需要将所述兜底话术文本作为所述目标回复文本。
[0082]
其中,根据预设的意图识别模型识别所述待分析的序列向量中的意图,根据识别的意图从话术对应数据库中获取话术数据,将获取的话术数据作为所述兜底话术文本。
[0083]
预设的意图识别模型,是基于fasttext(快速文本分类器)、bi-lstm(双向长短时记忆网络)、bert(一种nlp模型)中任一种训练得到的模型,用于识别所述待分析的序列向量中的意图。
[0084]
其中,可以获取用户输入的意图与话术对应数据库,也可以从数据库中获取意图与话术对应数据库,还可以获取第三方应用系统发送的意图与话术对应数据库。
[0085]
所述意图与话术对应数据库包括:意图数据、话术数据,意图数据和话术数据一一对应。意图数据中包括至少一种意图。
[0086]
可以理解的是,可以将步骤s1至步骤s6封装成一个模型,将封装得到的模型作为具有评判纠正的生成式智能问答模型。
[0087]
可以理解的是,所述获取预设的意图识别模型和意图与话术对应数据库,根据所述待分析的序列向量、所述预设的意图识别模型和所述意图与话术对应数据库进行回复文本生成,得到所述兜底话术文本的步骤可以和步骤s3至步骤s5中任一步骤同步执行,也可以和步骤s3至步骤s5的所有步骤异步执行。从而在确定合理性判断结果后快速给出目标回复文本,缩短了确定目标回复文本的总时长,提高了用户体验。
[0088]
在一个实施例中,上述将所述待分析的序列向量输入预设的对话生成模型进行对话生成,得到待判断的回复文本的步骤,包括:
[0089]
s31:获取所述待生成对话的文本数据对应的客户属性信息;
[0090]
s32:将所述客户属性信息输入预设的第一编码器进行编码,得到待分析的属性信息编码;
[0091]
s33:将所述待生成对话的文本数据输入预设的第二编码器进行编码,得到待分析的内容编码;
[0092]
s34:将所述待分析的属性信息编码和所述待分析的内容编码输入预设的特征融合模型进行特征融合,得到待处理的特征融合结果;
[0093]
s35:将所述待分析的序列向量和所述待处理的特征融合结果输入所述预设的对话生成模型进行对话生成,得到所述待判断的回复文本。
[0094]
本实施例实现了将客户属性信息和待生成对话的文本数据进行融合后输入预设的对话生成模型进行对话生成,从而使生成的回复文本更符合待生成对话的文本数据对应的场景,提高了回复文本的准确性。
[0095]
对于s31,可以获取用户输入的所述待生成对话的文本数据对应的客户属性信息,也可以从数据库中获取所述待生成对话的文本数据对应的客户属性信息,还可以获取第三方应用系统发送的所述待生成对话的文本数据对应的客户属性信息。
[0096]
客户属性信息包括但不限于:性别、年龄、职业、客户类别。
[0097]
对于s32,预设的第一编码器可以采用文本编码器。
[0098]
其中,将所述客户属性信息输入预设的第一编码器进行编码,将编码得到的数据作为待分析的属性信息编码。
[0099]
对于s33,预设的第二编码器可以采用文本编码器。
[0100]
其中,将所述待生成对话的文本数据输入预设的第二编码器进行编码,将编码得到的数据作为待分析的内容编码。
[0101]
对于s34,将所述待分析的属性信息编码和所述待分析的内容编码输入预设的特征融合模型进行向量相加,将向量相加得到的向量作为待处理的特征融合结果。
[0102]
可选的,预设的第一编码器和预设的第二编码器采用相同类型的编码器,从而有利于提高特征融合的准确性。
[0103]
对于s35,将所述待分析的序列向量和所述待处理的特征融合结果一起输入预设的对话生成模型进行对话生成,将生成的对话文本作为所述待判断的回复文本。
[0104]
在一个实施例中,上述基于所述待生成对话的文本数据,将所述待判断的回复文本输入预设的判别模型进行合理性判断,得到合理性判断结果的步骤,包括:
[0105]
s41:通过所述预设的判别模型,对所述待判断的回复文本进行流畅度判断,得到流畅度判断结果;
[0106]
s42:通过所述预设的判别模型,根据所述待生成对话的文本数据和所述待判断的回复文本进行当前对话意图的关联度判断,得到当前对话意图的关联度判断结果;
[0107]
s43:通过所述预设的判别模型,根据所述待生成对话的文本数据和所述待判断的回复文本进行历史对话意图的关联度判断,得到历史对话意图的关联度判断结果;
[0108]
s44:通过所述预设的判别模型,对所述待判断的回复文本进行合规性判断,得到合规性判断结果;
[0109]
s45:通过所述预设的判别模型,对所述待判断的回复文本进行合法性判断,得到合法性判断结果;
[0110]
s46:当所述流畅度判断结果、所述当前对话意图的关联度判断结果、所述历史对话意图的关联度判断结果、所述合规性判断结果和所述合法性判断结果全部为通过时,确定所述合理性判断结果为合理,否则,确定所述合理性判断结果为不合理。
[0111]
本实施例实现了从流畅度、当前对话意图的关联度、历史通话意图的关联度、合规
性、合法性进行合理性判断,同时对话意图的关联度、历史通话意图的关联度提高了回复文本的针对性,同时合规性、合法性的要求提高了回复文本的针对性的合法性和合规性,满足流畅度有利于用户能准确的理解回复文本表述的含义,提高了用户体验。
[0112]
对于s41,将所述待判断的回复文本输入所述预设的判别模型进行流畅度判断,当满足预设的流畅度条件时确定流畅度判断结果为通过,当不满足预设的流畅度条件时确定流畅度判断结果为不通过。
[0113]
对于s42,将所述待生成对话的文本数据和所述待判断的回复文本输入所述预设的判别模型进行当前对话意图的关联度判断,当所述待判断的回复文本的意图和所述待生成对话的文本数据的意图一致时确定所述当前对话意图的关联度判断结果为通过,当所述待判断的回复文本的意图和所述待生成对话的文本数据的意图不一致时确定所述当前对话意图的关联度判断结果为不通过。
[0114]
对于s43,获取所述待生成对话的文本数据对应的历史对话数据;将所述历史对话数据和所述待判断的回复文本输入所述预设的判别模型进行历史对话意图的关联度判断,当所述待判断的回复文本的意图和所述历史对话数据的意图一致时确定所述历史对话意图的关联度判断结果为通过,当所述待判断的回复文本的意图和所述历史对话数据的意图不一致时确定所述历史对话意图的关联度判断结果为不通过。
[0115]
其中,所述通过所述预设的判别模型,根据所述待生成对话的文本数据和所述待判断的回复文本进行历史对话意图的关联度判断,得到历史对话意图的关联度判断结果的步骤,包括:获取所述待生成对话的文本数据对应的历史对话数据;通过所述预设的判别模型,根据所述待判断的回复文本进行意图向量生成,得到回复文本的意图向量;通过所述预设的判别模型,根据所述历史对话数据进行意图向量生成,得到历史意图向量;对所述回复文本的意图向量和所述历史意图向量进行向量距离计算,得到第二向量距离计算结果;获取第二向量距离阈值;当所述第二向量距离计算结果小于所述第二向量距离阈值时,确定所述历史对话意图的关联度判断结果为通过,否则确定所述历史对话意图的关联度判断结果为不通过。
[0116]
其中,对所述回复文本的意图向量和所述历史意图向量进行向量距离计算的方法可以采用欧式距离算法,也可以采用余玄相似度算法。第二向量距离阈值是一个具体数值。
[0117]
对于s44,获取合规内容库;基于所述合规内容库,将所述待判断的回复文本输入所述预设的判别模型进行合规性判断,当所述待判断的回复文本中包含所述合规内容库中的内容时,则确定所述合规性判断结果为通过,否则确定所述合规性判断结果为不通过。
[0118]
对于s45,获取不合法内容库;基于所述不合法内容库,将所述待判断的回复文本输入所述预设的判别模型进行合法性判断,当所述待判断的回复文本中不包含所述不合法内容库中的内容时,则确定所述合法性判断结果为通过,否则确定所述合法性判断结果为不通过。
[0119]
对于s46,当所述流畅度判断结果、所述当前对话意图的关联度判断结果、所述历史对话意图的关联度判断结果、所述合规性判断结果和所述合法性判断结果全部为通过时,此时意味着所述待判断的回复文本在流畅度、当前对话意图的关联度、历史通话意图的关联度、合规性、合法性都符合要求,因此可以确定所述合理性判断结果为合理;当所述流畅度判断结果、所述当前对话意图的关联度判断结果、所述历史对话意图的关联度判断结
果、所述合规性判断结果和所述合法性判断结果在任一个为不通过时,此时意味着所述待判断的回复文本在流畅度、当前对话意图的关联度、历史通话意图的关联度、合规性、合法性都不符合要求,因此可以确定所述合理性判断结果为不合理。
[0120]
可以理解的是,步骤s41至步骤s45可以同步执行,也可以全部异步执行,可以部分异步执行和部分同步执行,在此不做限定。
[0121]
在一个实施例中,上述通过所述预设的判别模型,对所述待判断的回复文本进行流畅度判断,得到流畅度判断结果的步骤,包括:
[0122]
s411:将所述待判断的回复文本输入所述预设的判别模型进行困惑度计算,得到困惑度计算结果;
[0123]
s412:获取困惑度阈值;
[0124]
s413:当所述困惑度计算结果小于所述困惑度阈值时,确定所述流畅度判断结果为通过,否则,确定所述流畅度判断结果为不通过;
[0125]
其中,所述困惑度计算结果的计算公式pp(w)为:
[0126][0127]
p(w1,w2,

,wn)=p(w1)p(w2|w1)p(w3|w2,w1)

p(wn|w
n-1
,

,w2,w1)
[0128]
其中,n为所述待判断的回复文本的长度,p(wn|w
n-1
,

,w2,w1)是在出现w
n-1
,

,w2,w1的情况下wn出现的概率。
[0129]
本实施例采用评估困惑度进行流畅度判断,因困惑度是用来度量一个概率分布的好坏程度,从而有效的评估了句子的流畅度。
[0130]
对于s411,将所述待判断的回复文本输入所述预设的判别模型进行困惑度计算,将计算得到的数值作为困惑度计算结果。
[0131]
可以理解的是,p(wn|w
n-1
,

,w2,w1)是在出现w
n-1
,

,w2,w1的情况下wn出现的概率可以从现有技术中选择,在此不做赘述。
[0132]
对于s412,可以获取用户输入的困惑度阈值,也可以从数据库中获取困惑度阈值,还可以获取第三方应用系统发送的困惑度阈值,还可以将困惑度阈值写入实现本技术的程序文件中。
[0133]
困惑度阈值,是一个具体数值。
[0134]
对于s413,当所述困惑度计算结果小于所述困惑度阈值时,意味着所述待判断的回复文本的流畅度满足要求,此时可以确定所述流畅度判断结果为通过;当所述困惑度计算结果大于或等于所述困惑度阈值时,意味着所述待判断的回复文本的流畅度不满足要求,此时可以确定所述流畅度判断结果为不通过。
[0135]
在一个实施例中,上述通过所述预设的判别模型,根据所述待生成对话的文本数据和所述待判断的回复文本进行当前对话意图的关联度判断,得到当前对话意图的关联度判断结果的步骤,包括:
[0136]
s421:通过所述预设的判别模型,根据所述待判断的回复文本进行意图向量生成,得到回复文本的意图向量;
[0137]
s422:通过所述预设的判别模型,根据所述待生成对话的文本数据进行意图向量
生成,得到问话文本的意图向量;
[0138]
s423:对所述回复文本的意图向量和所述问话文本的意图向量进行向量距离计算,得到第一向量距离计算结果;
[0139]
s424:获取第一向量距离阈值;
[0140]
s425:当所述第一向量距离计算结果小于所述第一向量距离阈值时,确定所述当前对话意图的关联度判断结果为通过,否则确定所述当前对话意图的关联度判断结果为不通过。
[0141]
本实施例实现了根据意图向量的距离进行当前对话意图的关联度判断,从而有效的评估了待判断的回复文本与当前对话意图的关联度。
[0142]
对于s421,将所述待判断的回复文本输入所述预设的判别模型的意图识别子模块进行意图识别,根据意图识别结果进行意图向量生成,将生成的意图向量作为回复文本的意图向量。
[0143]
对于s422,将所述待生成对话的文本数据输入所述预设的判别模型的意图识别子模块进行意图识别,根据意图识别结果进行意图向量生成,将生成的意图向量作为问话文本的意图向量。
[0144]
对于s423,可选的,采用欧式距离算法,对所述回复文本的意图向量和所述问话文本的意图向量进行欧式距离计算,将计算得到的欧氏距离作为第一向量距离计算结果。
[0145]
可选的,采用余玄相似度算法,对所述回复文本的意图向量和所述问话文本的意图向量进行余玄相似度计算,将计算得到的余玄相似度作为第一向量距离计算结果。
[0146]
对于s424,可以获取用户输入的第一向量距离阈值,也可以从数据库中获取第一向量距离阈值,还可以获取第三方应用系统发送的第一向量距离阈值,还可以将第一向量距离阈值写入实现本技术的程序文件中。
[0147]
第一向量距离阈值是一个具体数值。
[0148]
s425:当所述第一向量距离计算结果小于所述第一向量距离阈值时,意味着此时所述待生成对话的文本数据和所述待判断的回复文本之间的意图的关联度符合要求,此时可以确定所述当前对话意图的关联度判断结果为通过;当所述第一向量距离计算结果大于或等于所述第一向量距离阈值时,意味着此时所述待生成对话的文本数据和所述待判断的回复文本之间的意图的关联度不符合要求,此时可以确定所述当前对话意图的关联度判断结果为不通过。
[0149]
在一个实施例中,上述通过所述预设的判别模型,对所述待判断的回复文本进行合规性判断,得到合规性判断结果的步骤,包括:
[0150]
s441:获取合规内容库;
[0151]
s442:通过所述预设的判别模型,采用正则表达式,根据所述合规内容库对所述待判断的回复文本进行合规性判断,当所述待判断的回复文本中包含所述合规内容库中的内容时,则确定所述合规性判断结果为通过,否则确定所述合规性判断结果为不通过;
[0152]
所述通过所述预设的判别模型,对所述待判断的回复文本进行合法性判断,得到合法性判断结果的步骤,包括:
[0153]
s451:获取不合法内容库;
[0154]
s452:通过所述预设的判别模型,采用所述正则表达式,根据所述不合法内容库对
所述待判断的回复文本进行合法性判断,当所述待判断的回复文本中不包含所述不合法内容库中的内容时,则确定所述合法性判断结果为通过,否则确定所述合法性判断结果为不通过。
[0155]
本实施例通过合规内容库和正则表达式进行合规性判断,通过不合法内容库和正则表达式进行合法性判断,从而有效的评估了待判断的回复文本的合规性和合法性。
[0156]
对于s441,可以获取用户输入的合规内容库,也可以从数据库中获取合规内容库,还可以获取第三方应用系统发送的合规内容库。
[0157]
合规内容库,是根据待生成对话的文本数据对应的对话场景的行业规范和/或公司规范提取的内容。
[0158]
对于s442,通过所述预设的判别模型,根据所述合规内容库和正则表达式生成正则匹配公式,根据生成的正则匹配公式对所述待判断的回复文本进行匹配,当匹配结果为所述待判断的回复文本中包含所述合规内容库中的全部内容时,则确定所述合规性判断结果为通过,否则确定所述合规性判断结果为不通过。
[0159]
可选的,通过所述预设的判别模型,根据所述待判断的回复文本的属性信息在所述合规内容库中进行查找,得到合规内容子库;通过所述预设的判别模型,根据所述合规内容子库和正则表达式生成正则匹配公式,根据生成的正则匹配公式对所述待判断的回复文本进行匹配,当匹配结果为所述待判断的回复文本中包含所述合规内容子库中的全部内容时,则确定所述合规性判断结果为通过,否则确定所述合规性判断结果为不通过。
[0160]
对于s451,可以获取用户输入的不合法内容库,也可以从数据库中获取不合法内容库,还可以获取第三方应用系统发送的不合法内容库。
[0161]
不合法内容库,是根据待生成对话的文本数据对应的对话场景对应的法律法规提取的不符合法律法规的内容。
[0162]
对于s452,通过所述预设的判别模型,根据所述不合法内容库和正则表达式生成正则匹配公式,根据生成的正则匹配公式对所述待判断的回复文本进行匹配,当匹配结果为所述待判断的回复文本中不包含所述不合法内容库中的任一内容时,则确定所述不合法性判断结果为通过,否则确定所述不合法性判断结果为不通过。
[0163]
可选的,通过所述预设的判别模型,根据所述待判断的回复文本的属性信息在所述不合法内容库中进行查找,得到不合法内容子库;通过所述预设的判别模型,根据所述不合法内容子库和正则表达式生成正则匹配公式,根据生成的正则匹配公式对所述待判断的回复文本进行匹配,当所述待判断的回复文本中不包含所述不合法内容子库中的任一内容时,则确定所述不合法性判断结果为通过,否则确定所述不合法性判断结果为不通过。
[0164]
在一个实施例中,上述根据所述待分析的序列向量、所述预设的意图识别模型和所述意图与话术对应数据库进行回复文本生成,得到所述兜底话术文本的步骤,包括:
[0165]
s61:将所述待分析的序列向量输入所述预设的意图识别模型进行意图识别,得到待分析的意图识别结果;
[0166]
s62:将所述待分析的意图识别结果在所述意图与话术对应数据库中进行匹配,得到所述兜底话术文本。
[0167]
本实施例实现了根据所述待分析的序列向量、所述预设的意图识别模型和所述意图与话术对应数据库进行回复文本生成,从而在所述合理性判断结果为不合理时,仍然会
采用兜底的回复文本作为目标回复文本,从而使用户的对话总会得到回复,提高了用户体验。
[0168]
对于s61,将所述待分析的序列向量输入所述预设的意图识别模型进行意图识别,将意图识别得到的数据作为待分析的意图识别结果。
[0169]
对于s62,将所述待分析的意图识别结果在所述意图与话术对应数据库中进行匹配,将在所述意图与话术对应数据库中查找到的话术数据作为所述兜底话术文本。
[0170]
参照图2,本技术还提出了一种对话生成装置,所述装置包括:
[0171]
数据获取模块100,用于获取待生成对话的文本数据;
[0172]
待分析的序列向量确定模块200,用于将所述待生成对话的文本数据输入预设的文本特征抽取器进行序列向量转换,得到待分析的序列向量;
[0173]
待判断的回复文本确定模块300,用于将所述待分析的序列向量输入预设的对话生成模型进行对话生成,得到待判断的回复文本;
[0174]
合理性判断结果确定模块400,用于基于所述待生成对话的文本数据,将所述待判断的回复文本输入预设的判别模型进行合理性判断,得到合理性判断结果;
[0175]
目标回复文本确定模块500,用于当所述合理性判断结果为合理时,将所述待判断的回复文本确定为目标回复文本,当所述合理性判断结果为不合理时,获取兜底话术文本,将所述兜底话术文本作为所述目标回复文本,其中,获取预设的意图识别模型和意图与话术对应数据库,根据所述待分析的序列向量、所述预设的意图识别模型和所述意图与话术对应数据库进行回复文本生成,得到所述兜底话术文本。
[0176]
本实施例通过首先将待分析的序列向量输入预设的对话生成模型进行对话生成,得到待判断的回复文本,然后基于待生成对话的文本数据,将待判断的回复文本输入预设的判别模型进行合理性判断,得到合理性判断结果,最后当合理性判断结果为合理时,将待判断的回复文本确定为目标回复文本,当合理性判断结果为不合理时,获取兜底话术文本,将兜底话术文本作为目标回复文本,其中,获取预设的意图识别模型和意图与话术对应数据库,根据待分析的序列向量、预设的意图识别模型和意图与话术对应数据库进行回复文本生成,得到兜底话术文本,从而实现通过对话生成模型灵活的生成回复文本,通过预设的判别模型对回复文本进行合理性判断,从而使灵活生成的符合合理性判断的回复文本作为最终的回复文本,在灵活生成的回复文本不符合合理性判断时将基于意图得到的回复文本作为兜底的最终的回复文本,在确保灵活性和合理性的情况下,确保了确定最终的回复文本的效率。
[0177]
参照图3,本技术实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于储存对话生成方法等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种对话生成方法。所述对话生成方法,包括:获取待生成对话的文本数据;将所述待生成对话的文本数据输入预设的文本特征抽取器进行序列向量转换,得到待分析的序列向量;将所述待分析的序列向量
输入预设的对话生成模型进行对话生成,得到待判断的回复文本;基于所述待生成对话的文本数据,将所述待判断的回复文本输入预设的判别模型进行合理性判断,得到合理性判断结果;当所述合理性判断结果为合理时,将所述待判断的回复文本确定为目标回复文本;当所述合理性判断结果为不合理时,获取兜底话术文本,将所述兜底话术文本作为所述目标回复文本,其中,获取预设的意图识别模型和意图与话术对应数据库,根据所述待分析的序列向量、所述预设的意图识别模型和所述意图与话术对应数据库进行回复文本生成,得到所述兜底话术文本。
[0178]
本实施例通过首先将待分析的序列向量输入预设的对话生成模型进行对话生成,得到待判断的回复文本,然后基于待生成对话的文本数据,将待判断的回复文本输入预设的判别模型进行合理性判断,得到合理性判断结果,最后当合理性判断结果为合理时,将待判断的回复文本确定为目标回复文本,当合理性判断结果为不合理时,获取兜底话术文本,将兜底话术文本作为目标回复文本,其中,获取预设的意图识别模型和意图与话术对应数据库,根据待分析的序列向量、预设的意图识别模型和意图与话术对应数据库进行回复文本生成,得到兜底话术文本,从而实现通过对话生成模型灵活的生成回复文本,通过预设的判别模型对回复文本进行合理性判断,从而使灵活生成的符合合理性判断的回复文本作为最终的回复文本,在灵活生成的回复文本不符合合理性判断时将基于意图得到的回复文本作为兜底的最终的回复文本,在确保灵活性和合理性的情况下,确保了确定最终的回复文本的效率。
[0179]
本技术一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种对话生成方法,包括步骤:获取待生成对话的文本数据;将所述待生成对话的文本数据输入预设的文本特征抽取器进行序列向量转换,得到待分析的序列向量;将所述待分析的序列向量输入预设的对话生成模型进行对话生成,得到待判断的回复文本;基于所述待生成对话的文本数据,将所述待判断的回复文本输入预设的判别模型进行合理性判断,得到合理性判断结果;当所述合理性判断结果为合理时,将所述待判断的回复文本确定为目标回复文本;当所述合理性判断结果为不合理时,获取兜底话术文本,将所述兜底话术文本作为所述目标回复文本,其中,获取预设的意图识别模型和意图与话术对应数据库,根据所述待分析的序列向量、所述预设的意图识别模型和所述意图与话术对应数据库进行回复文本生成,得到所述兜底话术文本。
[0180]
上述执行的对话生成方法,通过首先将待分析的序列向量输入预设的对话生成模型进行对话生成,得到待判断的回复文本,然后基于待生成对话的文本数据,将待判断的回复文本输入预设的判别模型进行合理性判断,得到合理性判断结果,最后当合理性判断结果为合理时,将待判断的回复文本确定为目标回复文本,当合理性判断结果为不合理时,获取兜底话术文本,将兜底话术文本作为目标回复文本,其中,获取预设的意图识别模型和意图与话术对应数据库,根据待分析的序列向量、预设的意图识别模型和意图与话术对应数据库进行回复文本生成,得到兜底话术文本,从而实现通过对话生成模型灵活的生成回复文本,通过预设的判别模型对回复文本进行合理性判断,从而使灵活生成的符合合理性判断的回复文本作为最终的回复文本,在灵活生成的回复文本不符合合理性判断时将基于意图得到的回复文本作为兜底的最终的回复文本,在确保灵活性和合理性的情况下,确保了确定最终的回复文本的效率。
[0181]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双速据率sdram(ssrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
[0182]
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
[0183]
以上所述仅为本技术的优选实施例,并非因此限制本技术的专利范围,凡是利用本技术说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本技术的专利保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1