答案生成方法、装置、设备及存储介质与流程

文档序号:37263156发布日期:2024-03-12 20:44阅读:14来源:国知局
答案生成方法、装置、设备及存储介质与流程

本技术涉及信息处理,更具体地,涉及一种答案生成方法、装置、设备及存储介质。


背景技术:

1、随着神经网络技术的快速发展,如何实现快速且准确地从文本中提取人们所需获知的信息,受到越来越多的关注。在从文本中提取所需获知的信息时,通常需要先获得针对文本提出的问题,之后,将问题和文本转化为计算机可以理解和处理的形式后从文本中获取问题的答案。为了实现这一目标,通常使用深度学习技术,例如循环神经网络(recurrentneural network rnn)、卷积神经网络(convolutional neural network,cnn)和注意力机制(attention mechanism)等。

2、但是,相关技术中在利用上述的深度学习技术在从文本中获取与问题对应的答案时,受到机器学习模型的输入限制及模型结构限制等,存在利用机器学习模型提取的文本特征不完整或不准确,从而导致生成的答案不够准确的问题。


技术实现思路

1、有鉴于此,本技术实施例提出了一种答案生成方法、装置、设备及存储介质,可以实现对文本中的长文本片段进行准确的理解,从而基于长文本片段的理解准确确定出问题的答案所在长文本片段,以基于确定的长文本片段和问题准确获得问题的答案。

2、第一方面,本技术实施例提供了一种答案生成方法,方法包括:获取目标文本和针对目标文本提出的问题,所述目标文本中包括m个段落,所述m为正整数;基于各段落在所述目标文本中的位置,确定n个文本片段,一个文本片段包括所述目标文本中至少两个连续的段落,n为正整数;基于预设长度对每个所述段落进行划分,得到每个段落对应的至少一个子片段,每个所述子片段对应的文本长度小于预设长度;由第一编码器提取所述问题的向量表示;由第二编码器提取每个所述子片段的向量表示,所述预设长度不超过所述第二编码器的最大输入长度;基于所述n个文本片段中各文本片段中子片段的向量表示和所述问题的向量表示,从所述n个文本片段中确定所述问题的答案所在的候选文本片段;通过生成式语言模型基于所述候选文本片段和所述问题进行答案生成,得到所述问题的答案。

3、第二方面,本技术实施例提供了一种答案生成装置,装置包括:获取模块、片段确定模块、片段划分模块、第一向量提取模块、第二向量提取模块、片段选取模块以及答案生成模块;获取模块,用于获取目标文本和针对目标文本提出的问题,所述目标文本中包括m个段落,所述m为正整数;片段确定模块,用于基于各段落在所述目标文本中的位置,确定n个文本片段,一个文本片段包括所述目标文本中至少两个连续的段落,n为正整数;片段划分模块,用于基于预设长度对每个所述段落进行划分,得到每个段落对应的至少一个子片段,每个所述子片段对应的文本长度小于预设长度;第一向量提取模块,用于利用第一编码器提取所述问题的向量表示;第二向量提取模块,用于利用第二编码器提取每个所述子片段的向量表示,所述预设长度不超过所述第二编码器的最大输入长度;片段选取模块,用于基于所述n个文本片段中各文本片段中子片段的向量表示和所述问题的向量表示,从所述n个文本片段中确定所述问题的答案所在的候选文本片段;答案生成模块,用于通过生成式语言模型基于所述候选文本片段和所述问题进行答案生成,得到所述问题的答案。

4、在一种可实施方式中,所述片段选取子模块包括:向量组合子模块、相似度确定子模块以及片段选取子模块,向量组合子模块,用于将位于同一文本片段中的子片段的向量表示进行组合,得到各文本片段的语义特征序列;相似度确定子模块,用于根据各文本片段的语义特征序列和所述问题的向量表示,确定各文本片段与所述问题之间的语义相似度;片段选取子模块,用于根据所述各文本片段与所述问题之间的语义相似度,从所述n个文本片段中确定与所述问题之间的语义相似度最高的k个文本片段,作为所述候选文本片段;k为不超过n的正整数。

5、在一种可实施方式中,所述问题的向量表示包括所述问题中每个问题词的向量表示,所述子片段的向量表示包括所述子片段中每个词的向量表示;所述文本片段的语义特征序列包括所述文本片段中每个词的向量表示;相似度确定子模块,用于基于各问题词的向量表示和各所述文本片段中各词的向量表示,确定各问题词与各所述文本片段中各词之间的词粒度相似度;根据各问题词与各所述文本片段中各词之间的词粒度相似度,确定各所述文本片段与各所述问题词之间的最大词粒度相似度;基于各所述文本片段与各所述问题词之间的最大词粒度相似度,确定所述问题与各所述文本片段之间的语义相似度。

6、在一种可实施方式中,相似度确定子模块,还用于针对各文本片段,将所述问题中每个问题词与该文本片段之间的最大词粒度相似度相加,得到所述问题与该文本片段之间的语义相似度。

7、在一种可实施方式中,所述第一编码器和第二编码器为检索模型中的编码器,所述装置还包括第一预测模块、第二预测模块、模型损失获得模块以及模型训练模块;获取模块,还用于获取样本集,所述样本集包括多个样本组,每个样本组包括一个针对样本文本提出的样本问题和所述样本文本中的样本文本片段,所述样本文本片段包括样本文本中至少两个连续的样本段落,所述样本段落中各样本子片段的文本长度小于所述预设长度;第一预测模块,用于利用训练后的参考检索模型基于所述样本问题和所述样本文本中的所述样本文本片段进行答案位置预测,确定所述样本问题对应的答案位于各所述样本文本片段的第一预测概率;所述参考检索模型的网络规模大于所述检索模型的网络规模;第二预测模块,用于利用所述检索模型基于所述样本问题和各所述样本文本片段中的样本子片段进行答案位置预测,确定所述样本问题对应的答案位于各所述样本文本片段的第二预测概率;模型损失获得模块,用于基于所述样本问题对应的答案位于各所述样本文本片段的第一预测概率和所述样本问题对应的答案位于各所述样本文本片段的第二预测概率,获得模型损失;模型训练模块,用于基于所述模型损失调整所述第一编码器和第二编码器的参数,得到训练后的第一编码器和第二编码器。

8、在一种可实施方式中,第一预测模块,还用于对所述样本问题和各所述样本文本片段分别进行拼接,得到各样本文本片段对应的拼接文本;由所述训练后的参考检索模型对各所述拼接文本中的样本问题和样本文本片段进行交叉编码,得到各所述拼接文本中样本问题的向量表示和样本文本片段的向量表示之间的匹配度;基于各所述拼接文本中样本问题的向量表示和样本文本片段的向量表示之间的匹配度,确定所述样本问题对应的答案位于各所述样本文本片段的第一预测概率。

9、在一种可实施方式中,所述样本组还包括各所述样本文本片段的答案标签;模型损失获得模块,还用于基于各所述样本文本片段的答案标签和所述样本问题对应的答案位于各所述样本文本片段的第一预测概率,确定第一损失;计算第一预测概率与第二预测概率之间的第二损失;基于所述第一损失和所述第二损失,获得模型损失。

10、在一种可实施方式中,所述训练后的参考检索模型为语言模型,第一预测模块,还用于将样本问题和所述样本文本中的样本文本片段进行组合,生成包括样本问题和所述样本文本片段的提示信息;利用所述语言模型基于提示信息进行答案位置预测,输出所述样本问题对应的答案位于各所述样本文本片段的第一预测概率。

11、第三方面,本技术实施例提供了一种电子设备,包括处理器以及存储器;一个或多个程序被存储在所述存储器中并被配置为由所述处理器执行以实现上述的方法。

12、第四方面,本技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有程序代码,其中,在所述程序代码被处理器运行时执行上述的方法。

13、第五方面,本技术实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质获取该计算机指令,处理器执行该计算机指令,使得该电子设备执行上述的方法。

14、本技术实施例提供的一种答案生成方法、装置、设备及存储介质,方法包括:获取目标文本和针对目标文本提出的问题,目标文本中包括m个段落,m为正整数;基于各段落在目标文本中的位置,确定n个文本片段,一个文本片段包括目标文本中至少两个连续的段落,n为正整数;基于预设长度对每个段落进行划分,得到每个段落对应的至少一个子片段,每个子片段对应的文本长度小于预设长度;由第一编码器提取问题的向量表示;由第二编码器提取每个子片段的向量表示,预设长度不超过第二编码器的最大输入长度;基于n个文本片段中各文本片段中子片段的向量表示和问题的向量表示,从n个文本片段中确定问题的答案所在的候选文本片段;通过生成式语言模型基于候选文本片段和问题进行答案生成,得到问题的答案。通过采用上述方法,将段落划分为不超过第二编码器的最大输入长度的子片段后,可以使利用第二编码器对子片段提取到的向量表示不会出现特征丢失的情况,之后,从n个文本片段中确定问题的答案所在的候选文本片段时,充分使用了n文本片段中的各个子片段的准确的向量表示,从而保障了确定出的候选文本片段的准确性,最后,在利用生成式语言模型基于候选文本片段生成问题的答案时,由于候选文本片段通常远低于目标文本的长度,且通过采用上述方法获得候选文本片段相比于目标文本而言,候选文本片段的长度更符合生成式语言模型的输入长度,且每个文本片段中包括至少两个连续的段落,因此,在问题的答案在出现在跨段落的文本片段中时,通过利用生成式语言模型基于候选文本片段和问题可以得到更准确且更自然连贯的答案。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1