文本相关性的确定方法、装置、计算机设备和存储介质与流程

文档序号:35927693发布日期:2023-11-04 21:07阅读:44来源:国知局
文本相关性的确定方法、装置、计算机设备和存储介质与流程

本申请涉及自然语言处理,特别是涉及一种文本相关性的确定方法、装置、计算机设备和存储介质。


背景技术:

1、随着计算机技术与人工智能(artificial intelligence,ai)技术的发展,出现了自然语言处理(nature language processing,nlp)技术,自然语言处理研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。

2、目前,可以通过将搜索文本以及文档文本输入至文本相关性预测模型,文本相关性预测模型分别对搜索文本以及文档文本抽取相关性特征,然后计算搜索文本与服务数据库中各文档文本之间的文本相关性。然而,发明人在实践中发现:目前在对文本相关性进行预测时,常常会遇到所预测的文本相关性与文本间真实的相关性不匹配的情况,即所预测的文本相关性不准确。因此,如何提升文本相关性确定的准确性是亟需解决的问题。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种能够提升文本相关性确定的准确性的文本相关性的确定方法、装置、计算机设备和存储介质。

2、第一方面,本申请提供了一种文本相关性的确定方法。所述方法包括:

3、获取搜索文本、以及与搜索文本匹配的候选文档文本;

4、对候选文档文本进行信息提取处理,以得到候选文档文本的文档描述信息,文档描述信息包文档标题以及关键描述信息,关键描述信息由至少两个关键信息组成,关键信息包括文档关键词或文档关键句;

5、基于搜索文本的搜索文本特征、以及文档描述信息的文档描述信息特征,通过文本相关性预测模型获取目标文本相关性,目标文本相关性用于描述搜索文本与候选文档文本之间的文本相关性。

6、第二方面,本申请还提供了一种文本相关性的确定装置。所述装置包括:

7、文本获取模块,用于获取搜索文本、以及与搜索文本匹配的候选文档文本;

8、信息提取模块,用于对候选文档文本进行信息提取处理,以得到候选文档文本的文档描述信息,文档描述信息包文档标题以及关键描述信息,关键描述信息由至少两个关键信息组成,关键信息包括文档关键词或文档关键句;

9、相关性预测模块,用于基于搜索文本的搜索文本特征、以及文档描述信息的文档描述信息特征,通过文本相关性预测模型获取目标文本相关性,目标文本相关性用于描述搜索文本与候选文档文本之间的文本相关性。

10、第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

11、获取搜索文本、以及与搜索文本匹配的候选文档文本;

12、对候选文档文本进行信息提取处理,以得到候选文档文本的文档描述信息,文档描述信息包文档标题以及关键描述信息,关键描述信息由至少两个关键信息组成,关键信息包括文档关键词或文档关键句;

13、基于搜索文本的搜索文本特征、以及文档描述信息的文档描述信息特征,通过文本相关性预测模型获取目标文本相关性,目标文本相关性用于描述搜索文本与候选文档文本之间的文本相关性。

14、第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:

15、获取搜索文本、以及与搜索文本匹配的候选文档文本;

16、对候选文档文本进行信息提取处理,以得到候选文档文本的文档描述信息,文档描述信息包文档标题以及关键描述信息,关键描述信息由至少两个关键信息组成,关键信息包括文档关键词或文档关键句;

17、基于搜索文本的搜索文本特征、以及文档描述信息的文档描述信息特征,通过文本相关性预测模型获取目标文本相关性,目标文本相关性用于描述搜索文本与候选文档文本之间的文本相关性。

18、第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:

19、获取搜索文本、以及与搜索文本匹配的候选文档文本;

20、对候选文档文本进行信息提取处理,以得到候选文档文本的文档描述信息,文档描述信息包文档标题以及关键描述信息,关键描述信息由至少两个关键信息组成,关键信息包括文档关键词或文档关键句;

21、基于搜索文本的搜索文本特征、以及文档描述信息的文档描述信息特征,通过文本相关性预测模型获取目标文本相关性,目标文本相关性用于描述搜索文本与候选文档文本之间的文本相关性。

22、上述文本相关性的确定方法、装置、计算机设备、存储介质和计算机程序产品,获取搜索文本、以及与搜索文本匹配的候选文档文本,并对候选文档文本进行信息提取处理,以得到候选文档文本的文档描述信息,文档描述信息包文档标题以及关键描述信息,关键描述信息由至少两个关键信息组成,关键信息包括文档关键词或文档关键句,再基于搜索文本的搜索文本特征、以及文档描述信息的文档描述信息特征,通过文本相关性预测模型获取目标文本相关性,目标文本相关性用于描述搜索文本与候选文档文本之间的文本相关性。通过对候选文档文本的文档描述信息进行信息提取处理,并具体确定候选文档文本的文档标题,以及对候选文档文本的关键描述信息进行提取,能够从多维度的关键信息中更为精准的表达候选文档文本所表达的语义,也能够避免候选文档文本所存在的冗余信息影响对文本相关性的预测,从而保证所得到的搜索文本与候选文档文本之间的文本相关性的准确性以及可靠性,即提升文本相关性确定的准确性。



技术特征:

1.一种文本相关性的确定方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述搜索文本特征、所述文档描述信息特征、以及所述文本交互特征,通过所述文本相关性预测模型获取所述目标文本相关性,包括:

4.根据权利要求1所述的方法,其特征在于,所述对所述候选文档文本进行信息提取处理,以得到所述候选文档文本的文档描述信息,包括:

5.根据权利要求1所述的方法,其特征在于,所述对所述候选文档文本进行信息提取处理,以得到所述候选文档文本的文档描述信息,包括:

6.根据权利要求5所述的方法,其特征在于,所述确定各所述文档分句的文档分句特征,包括:

7.根据权利要求1所述的方法,其特征在于,所述对所述候选文档文本进行信息提取处理,以得到所述候选文档文本的文档描述信息,包括:

8.根据权利要求1所述的方法,其特征在于,所述基于所述搜索文本的搜索文本特征、以及所述文档描述信息的文档描述信息特征,通过文本相关性预测模型获取目标文本相关性,包括:

9.根据权利要求8所述的方法,其特征在于,所述基于所述搜索文本的搜索文本特征、以及所述文档描述信息的文档描述信息特征,通过文本相关性预测模型获取目标文本相关性,还包括:

10.根据权利要求1所述的方法,其特征在于,所述关键信息还包括文档主题;

11.根据权利要求10所述的方法,其特征在于,所述方法还包括:

12.根据权利要求11所述的方法,其特征在于,所述基于所述搜索文本特征、所述文本主题特征、以及所述文档描述信息特征,通过所述文本相关性预测模型获取所述目标文本相关性,包括:

13.一种文本相关性的确定装置,其特征在于,所述装置包括:

14.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至12中任一项所述的方法的步骤。

15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至12中任一项所述的方法的步骤。


技术总结
本申请涉及一种文本相关性的确定方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取搜索文本、以及与搜索文本匹配的候选文档文本;对候选文档文本进行信息提取处理,以得到候选文档文本的文档描述信息,文档描述信息包文档标题以及关键描述信息,关键描述信息由至少两个关键信息组成,关键信息包括文档关键词或文档关键句;基于搜索文本的搜索文本特征、以及文档描述信息的文档描述信息特征,通过文本相关性预测模型获取目标文本相关性,目标文本相关性用于描述搜索文本与候选文档文本之间的文本相关性。采用本方法能够提升文本相关性确定的准确性。

技术研发人员:邓亚平
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1