文本匹配方法、装置、计算机可读存储介质和计算机设备与流程

文档序号:24931082发布日期:2021-05-04 11:20阅读:来源:国知局

技术特征:

1.一种文本匹配方法,其特征在于,包括如下步骤:

获取第一文本的第一词向量序列,以及,获取第二文本的第二词向量序列;

分别计算所述第一词向量序列与所述第二词向量序列之间的词向量相似度,得到相似度矩阵;

获取所述相似度矩阵中的行向量序列与列向量序列,并基于所述行向量序列与所述列向量序列的双向关联信息,构建双向关联信息编码向量矩阵;

提取所述双向关联信息编码向量矩阵中的文本匹配特征,并根据所述文本匹配特征生成文本匹配度标识;所述文本匹配度标识用于标记所述第一文本与所述第二文本之间的匹配度。

2.根据权利要求1所述的方法,其特征在于,所述获取第一文本的第一词向量序列,以及,获取第二文本的第二词向量序列,包括:

获取第一文本与第二文本;

分别对所述第一文本与所述第二文本进行分词,得到所述第一文本的第一词序列与所述第二文本的第二词序列;

根据预存的数据向量映射关系,确定所述第一词序列的映射向量作为所述第一词向量序列,以及,确定所述第二词序列的映射向量作为所述第二词向量序列。

3.根据权利要求1所述的方法,其特征在于,所述分别计算所述第一词向量序列与所述第二词向量序列之间的词向量相似度,得到相似度矩阵,包括:

确定所述第一词向量序列中至少两个的第一词向量,以及,确定所述第二词向量序列中至少两个的第二词向量;

分别将所述至少两个的第一词向量与所述至少两个的第二词向量进行相乘,得到至少两个的词向量相似度;

根据所述至少两个的词向量相似度进行矩阵构建,得到所述相似度矩阵。

4.根据权利要求1所述的方法,其特征在于,所述获取所述相似度矩阵中的行向量序列与列向量序列,并基于所述行向量序列与所述列向量序列的双向关联信息,构建双向关联信息编码向量矩阵,包括:

将所述相似度矩阵进行向量行列分割,得到行向量序列与列向量序列;

通过双向长短期记忆网络,获取所述行向量序列与所述列向量序列的双向关联信息;

对所述双向关联信息进行编码,并根据编码后的双向关联信息,获取所述双向关联信息编码向量矩阵。

5.根据权利要求4所述的方法,其特征在于,所述通过双向长短期记忆网络,获取所述行向量序列与所述列向量序列的双向关联信息,包括:

将所述行向量序列与所述列向量序列分别输入至所述双向长短期记忆网络;

获取所述双向长短期记忆网络输出的第一双向关联信息与第二双向关联信息,作为所述双向关联信息;所述第一双向关联信息与所述第二双向关联信息为所述双向长短期记忆网络根据所述行向量序列与所述列向量序列分别进行双向关联信息挖掘的信息。

6.根据权利要求4所述的方法,其特征在于,所述双向关联信息包括第一双向关联信息与第二双向关联信息,所述对所述双向关联信息进行编码,并根据编码后的双向关联信息,获取所述双向关联信息编码向量矩阵,包括:

分别对所述第一双向关联信息与所述第二双向关联信息进行编码,得到第一双向关联信息编码与第二双向关联信息编码;

将所述第一双向关联信息编码与所述行向量序列进行组合,得到第一信息编码向量矩阵,以及,将所述第二双向关联信息编码与所述列向量序列进行组合,得到第二信息编码向量矩阵;

确定所述第一信息编码向量矩阵与所述第二信息编码向量矩阵,作为所述双向关联信息编码向量矩阵。

7.根据权利要求1所述的方法,其特征在于,所述提取所述双向关联信息编码向量矩阵中的文本匹配特征,并根据所述文本匹配特征生成文本匹配度标识,包括:

将所述双向关联信息编码向量矩阵输入至卷积神经网络模型;

获取所述卷积神经网络模型输出的特征信息,作为所述文本匹配特征;

将所述文本匹配特征输入至所述卷积神经网络模型的全连接层;

获取所述全连接层的输出结果,得到所述文本匹配度标识;所述输出结果为所述全连接层根据所述文本匹配特征进行匹配的结果;所述文本匹配度标识包括文本匹配标识、文本不匹配标识。

8.一种文本匹配装置,其特征在于,所述装置包括:

词向量序列获取模块,用于获取第一文本的第一词向量序列,以及,获取第二文本的第二词向量序列;

相似度矩阵获取模块,用于分别计算所述第一词向量序列与所述第二词向量序列之间的词向量相似度,得到相似度矩阵;

向量矩阵构建模块,用于获取所述相似度矩阵中的行向量序列与列向量序列,并基于所述行向量序列与所述列向量序列的双向关联信息,构建双向关联信息编码向量矩阵;

匹配度标识生成模块,用于提取所述双向关联信息编码向量矩阵中的文本匹配特征,并根据所述文本匹配特征生成文本匹配度标识;所述文本匹配度标识用于标记所述第一文本与所述第二文本之间的匹配度。

9.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述方法的步骤。

10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。


技术总结
本申请涉及一种文本匹配方法、装置、计算机可读存储介质和计算机设备,所述方法包括:获取第一文本的第一词向量序列,以及,获取第二文本的第二词向量序列;分别计算所述第一词向量序列与所述第二词向量序列之间的词向量相似度,得到相似度矩阵;获取所述相似度矩阵中的行向量序列与列向量序列,并基于所述行向量序列与所述列向量序列的双向关联信息,构建双向关联信息编码向量矩阵;提取所述双向关联信息编码向量矩阵中的文本匹配特征,并根据所述文本匹配特征生成文本匹配度标识;所述文本匹配度标识用于标记所述第一文本与所述第二文本之间的匹配度。采用本方法,可有效提升文本匹配的准确率。

技术研发人员:梁涛;李振阳;张晗;李超;马连洋;衡阵
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:2020.01.20
技术公布日:2021.05.04
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1