本发明主要涉及语言处理,具体涉及一种文本匹配方法、装置、系统以及存储介质。
背景技术:
1、文本匹配是自然语言处理领域中一项重要且富有挑战性的任务,旨在描述两段文本之间的关系,可以应用于搜索引擎、推荐系统、问答系统等场景。在现有的文本匹配方法中,大多数的文本编码器主要实现文本的通用向量表示,仅仅利用了文本对的纯语义信息,这样的做法忽略了其他可利用的丰富信息,因此导致文本匹配的准确率不够高。
技术实现思路
1、本发明所要解决的技术问题是针对现有技术的不足,提供一种文本匹配方法、装置、系统以及存储介质。
2、本发明解决上述技术问题的技术方案如下:一种文本匹配方法,包括如下步骤:
3、导入多个句子对以及与各个所述句子对一一对应的关键字信息对和意图信息对,并对各个所述句子对、各个所述句子对所对应的关键字信息对以及意图信息对进行编码,得到各个所述句子对的句子原始向量对、各个所述句子对所对应的关键字向量对以及意图向量对;
4、根据各个所述句子对的句子原始向量对、各个所述句子对所对应的关键字向量对以及意图向量对进行交互向量的分析,得到各个所述句子对的交互向量;
5、根据各个所述句子对的交互向量进行得分向量的计算,得到各个所述句子对的多个得分向量;
6、根据各个所述句子对的多个得分向量进行文本匹配准确率的分析,得到文本匹配准确率,并将所述文本匹配准确率作为文本匹配的结果。
7、本发明解决上述技术问题的另一技术方案如下:一种文本匹配装置,包括:
8、编码模块,用于导入多个句子对以及与各个所述句子对一一对应的关键字信息对和意图信息对,并对各个所述句子对、各个所述句子对所对应的关键字信息对以及意图信息对进行编码,得到各个所述句子对的句子原始向量对、各个所述句子对所对应的关键字向量对以及意图向量对;
9、交互向量分析模块,用于根据各个所述句子对的句子原始向量对、各个所述句子对所对应的关键字向量对以及意图向量对进行交互向量的分析,得到各个所述句子对的交互向量;
10、得分向量计算模块,用于根据各个所述句子对的交互向量进行得分向量的计算,得到各个所述句子对的多个得分向量;
11、文本匹配结果获得模块,用于根据各个所述句子对的多个得分向量进行文本匹配准确率的分析,得到文本匹配准确率,并将所述文本匹配准确率作为文本匹配的结果。
12、基于上述一种文本匹配方法,本发明还提供一种文本匹配系统。
13、本发明解决上述技术问题的另一技术方案如下:一种文本匹配系统,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,当所述处理器执行所述计算机程序时,实现如上所述的文本匹配方法。
14、基于上述一种文本匹配方法,本发明还提供一种计算机可读存储介质。
15、本发明解决上述技术问题的另一技术方案如下:一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被处理器执行时,实现如上所述的文本匹配方法。
16、本发明的有益效果是:通过对句子对、关键字信息对以及意图信息对的编码得到句子原始向量对、关键字向量对以及意图向量对,根据句子原始向量对、关键字向量对以及意图向量对的交互向量分析得到交互向量,根据交互向量的得分向量计算得到得分向量,根据得分向量的文本匹配准确率分析得到文本匹配的结果,不仅提取了句子的纯语义信息,同时还将句子的关键字、意图的附加信息对句子文本进行补充,实现了不同视角下的文本匹配,相对现有技术,实现了比仅靠纯语义信息更强的性能,同时能够从不同视角判断文本匹配,显著地提升文本匹配的准确性。
1.一种文本匹配方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的文本匹配方法,其特征在于,所述句子对包括第一句子和第二句子,所述关键字信息对包括与所述第一句子对应的关键字信息以及与所述第二句子对应的关键字信息,所述意图信息对包括与所述第一句子对应的意图信息以及与所述第二句子对应的意图信息;
3.根据权利要求2所述的文本匹配方法,其特征在于,所述根据各个所述句子对的句子原始向量对、各个所述句子对所对应的关键字向量对以及意图向量对进行交互向量的分析,得到各个所述句子对的交互向量的过程包括:
4.根据权利要求3所述的文本匹配方法,其特征在于,所述根据各个所述第一句子的句子原始向量、各个所述第二句子的句子原始向量、各个所述第一句子所对应的关键字向量和意图向量以及各个所述第二句子所对应的关键字向量和意图向量进行聚合分析,得到各个所述第一句子的聚合向量以及各个所述第二句子的聚合向量的过程包括:
5.根据权利要求4所述的文本匹配方法,其特征在于,所述根据各个所述第一句子的句子原始向量、各个所述第二句子的句子原始向量、各个所述第一句子所对应的关键字向量和意图向量以及各个所述第二句子所对应的关键字向量和意图向量进行相关系数的计算,得到各个所述第一句子的关键字信息相关系数和意图信息相关系数以及各个所述第二句子的关键字信息相关系数和意图信息相关系数的过程包括:
6.根据权利要求1所述的文本匹配方法,其特征在于,所述根据各个所述句子对的交互向量进行得分向量的计算,得到各个所述句子对的多个得分向量的过程包括:
7.根据权利要求1所述的文本匹配方法,其特征在于,所述根据各个所述句子对的多个得分向量进行文本匹配准确率的分析,得到文本匹配准确率的过程包括:
8.一种文本匹配装置,其特征在于,包括:
9.一种文本匹配系统,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,当所述处理器执行所述计算机程序时,实现如权利要求1至7任一项所述的文本匹配方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,当所述计算机程序被处理器执行时,实现如权利要求1至7任一项所述的文本匹配方法。